modelagem termodinÂmica do equilÍbrio sÓlido...

Post on 23-Jan-2019

215 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

LUIacuteS FERNANDO MERCIER FRANCO

MODELAGEM TERMODINAcircMICA DO EQUILIacuteBRIO

SOacuteLIDO-LIacuteQUIDO EM SISTEMAS CONTENDO PROTEIacuteNAS EFEITO DO pH

Professor Orientador Doutor Pedro de Alcacircntara Pessocirca Filho

Satildeo Paulo

2010

Trabalho de Conclusatildeo de Curso em Engenharia Quiacutemica Apresentado ao Departamento de Engenharia Quiacutemica da Escola Politeacutecnica da Universidade de Satildeo Paulo

Agradecimentos

Ao Professor Doutor Pedro de Alcacircntara Pessocirca Filho orientador deste trabalho

que aleacutem de ter sido incansaacutevel no intuito de me levar a compreender os

fundamentos baacutesicos para o desenvolvimento deste projeto tem me ensinado o que

eacute ciecircncia e como se daacute a sua aplicaccedilatildeo em Engenharia Quiacutemica

Aos amigos e colegas do Laboratoacuterio de Engenharia Bioquiacutemica da Escola

Politeacutecnica pelo carinho e pela acolhida Em especial a doutoranda Kelly Cristina

Nascimento Alves por toda a gentileza e auxiacutelio na obtenccedilatildeo dos dados

experimentais

E a Fundaccedilatildeo de Amparo agrave Pesquisa do Estado de Satildeo Paulo ndash FAPESP ndash que me

concedeu uma bolsa de iniciaccedilatildeo cientiacutefica sem a qual seria inviaacutevel levar a diante

este trabalho

ii

RESUMO

Neste trabalho eacute apresentado um modelo para a curva de solubilidade de proteiacutenas

em soluccedilatildeo aquosa em funccedilatildeo do pH da soluccedilatildeo baseado em ferramentas da

termodinacircmica claacutessica e considerando os diferentes estados de ionizaccedilatildeo que

moleacuteculas proteacuteicas podem assumir Tambeacutem foi estudada a modelagem descrita

por Groumlnwall em seu artigo publicado no iniacutecio da deacutecada de 1940 e deste estudo

resultou uma extensatildeo agrave sua teoria que se provou ser idecircntica agrave modelagem

proposta inicialmente Para efeito de comparaccedilatildeo foram modeladas curvas de

solubilidade utilizando o modelo de atividade estendido de Debye-Huumlckel para

soluccedilotildees eletroliacuteticas

Foram obtidos dados experimentais da solubilidade da lisozima de clara de ovo de

galinha para alguns valores de pH na regiatildeo do ponto isoeleacutetrico Tanto para a

insulina suiacutena como para lisozima de clara de ovo de galinha o modelo

desenvolvido descreveu com grande precisatildeo o fenocircmeno observado

experimentalmente A aplicaccedilatildeo do modelo permite concluir que a utilizaccedilatildeo de

caacutelculos de estados de ionizaccedilatildeo eacute uma ferramenta eficaz na modelagem

termodinacircmica de soluccedilotildees proteacuteicas

iii

ABSTRACT

In this work it is presented a model for the protein solubility curve in aqueous

solutions as a function of the solution pH based on classical thermodynamic tools

and considering the different ionization states that protein molecules may assume It

was also studied the model described by Groumlnwall in his article published in the early

1940rsquos and from this study it was developed an extension of his theory which as

proved in this work is identical to the initially proposed modeling For comparison

solubility curves were modeled using the Debye-Huumlckel extended activity model for

electrolytic solutions

It was obtained experimental hen egg white lysozyme solubility data for some pH

values in the region of the isoelectric point So much for porcine insulin as for the hen

egg white lysozyme the developed model describes with high accuracy the

phenomenon experimentally observed The model application allows us to conclude

that the utilization of the ionization states calculus is an effective tool in the

thermodynamic modeling of protein solutions

Sumaacuterio

1 Introduccedilatildeo 1

2 Materiais e Meacutetodos 7

21 Meacutetodos computacionais 7

22 Curva de solubilidade da lisozima da clara de ovo de galinha 9

221 Reagentes 9

222 Equipamentos 9

223 Preparaccedilatildeo das soluccedilotildees-tampatildeo 9

224 Procedimento experimental 10

3 Modelo Estendido de Debye-Huumlckel 11

31 Introduccedilatildeo 11

32 Desenvolvimento teoacuterico 12

4 Modelagem Termodinacircmica Proposta 16

41 Introduccedilatildeo 16

42 Caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras 18

5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall 21

51 Introduccedilatildeo 21

52 Desenvolvimento teoacuterico 21

53 Soluccedilatildeo Paraboacutelica da Curva de Solubilidade 26

6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall 28

7 Aplicaccedilatildeo dos Modelos Expostos 31

71 Solubilidade da Insulina Suiacutena 31

72 Solubilidade da Lisozima de clara de ovo de galinha 36

8 Conclusotildees 40

9 Referecircncias Bibliograacuteficas 41

Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach 44

Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos 47

1 Introduccedilatildeo

Dentre as etapas de um processo biotecnoloacutegico aquela dedicada a purificaccedilatildeo de

bioprodutos tende a ser determinante em geral para o custo do processo seguindo

a tendecircncia dos processos de separaccedilatildeo da induacutestria quiacutemica tradicional A

produccedilatildeo de proteiacutenas tem lugar de destaque no rol de bioprodutos de interesse

pois muitos antibioacuteticos hormocircnios e enzimas pertencem a esta classe de

biomoleacuteculas e possuem notoacuterio interesse industrial por suas propriedades

terapecircuticas e aplicaccedilotildees na induacutestria alimentiacutecia No entanto proteiacutenas a serem

comercializadas para estes fins exigem altos graus de pureza que somente satildeo

obtidos pelas etapas de purificaccedilatildeo Como afirmado por Bončina et al (2008)

estudos de separaccedilatildeo de proteiacutenas especificamente tecircm sido motivados por um

aumento da demanda por proteiacutenas puras nas induacutestrias farmacecircutica e correlatas

Muitas moleacuteculas bioloacutegicas ndash ou comumente chamadas biomoleacuteculas - e

particularmente proteiacutenas satildeo destruiacutedas pelo calor natildeo podem ser destiladas satildeo

geradas a baixas concentraccedilotildees e tecircm uma estrutura tridimensional que pode ser

alterada durante a purificaccedilatildeo resultando na perda da atividade bioloacutegica Por isso

bioprodutos tais como proteiacutenas devem ser recuperados purificados e

concentrados em operaccedilotildees com membranas etapas de adsorccedilatildeo cromatografia

cristalizaccedilatildeo e outras teacutecnicas que natildeo requerem calor ou pH extremo para alcanccedilar

o fracionamento (Ladisch 2001)

Em geral nos processos biotecnoloacutegicos as correntes de saiacuteda dos biorreatores

seguem para as operaccedilotildees de downstream (etapas de separaccedilatildeo que visam

concentrar e dispor o produto final) As primeiras operaccedilotildees de downstream por

exemplo a clarificaccedilatildeo e a centrifugaccedilatildeo tecircm por objetivo isolar a proteiacutena de

2 1 Introduccedilatildeo

interesse das ceacutelulas que a produziram Apoacutes estas primeiras etapas de purificaccedilatildeo

seguem-se as operaccedilotildees de baixa resoluccedilatildeo A precipitaccedilatildeo e a extraccedilatildeo em

sistemas de duas fases aquosas satildeo exemplos destas operaccedilotildees que tendem a

concentrar a proteiacutena-alvo preparando-a para os proacuteximos estaacutegios de separaccedilatildeo

Por fim a proteiacutena ora na concentraccedilatildeo obtida pelas operaccedilotildees anteriores eacute tratada

por operaccedilotildees de alta resoluccedilatildeo caracterizadas principalmente pela teacutecnica de

cromatografia a fim de concentrar a proteiacutena agrave pureza especificada para seu uso

Vale ressaltar que esta uacuteltima etapa eacute extremamente dispendiosa e quanto mais

eficientes forem as etapas precedentes no que tange a pureza da proteiacutena-alvo

menos custosa seraacute a etapa posterior

O escopo deste trabalho estaacute centrado na operaccedilatildeo de precipitaccedilatildeo de proteiacutenas

cujos fundamentos satildeo as relaccedilotildees do equiliacutebrio soacutelido-liacutequido (ESL) destes

sistemas A solubilidade de uma proteiacutena em soluccedilatildeo eacute governada pelos mesmos

princiacutepios fundamentais ou seja condiccedilotildees de equiliacutebrio termodinacircmico que regem

o comportamento de qualquer substacircncia no ESL Contudo algumas diferenccedilas

devem ser levadas em conta na descriccedilatildeo deste fenocircmeno e no projeto destas

operaccedilotildees

Proteiacutenas satildeo formadas por cadeias de aminoaacutecidos atraveacutes de ligaccedilotildees peptiacutedicas

cada aminoaacutecido pode ser considerado um monocircmero que ao possuir um grupo

ionizaacutevel natildeo ligado tal como ocorre em alguns aminoaacutecidos naturais tirosina (Tyr)

lisina (Lys) cisteiacutena (Cys) histidina (His) arginina (Arg) aacutecido aspaacutertico (Asp) e

aacutecido glutacircmico (Glu) e tambeacutem em resiacuteduos terminais confere a proteiacutena uma

caracteriacutestica de polieletroacutelito Eacute importante entatildeo considerar a definiccedilatildeo de

polieletroacutelitos tal qual definida por Pessocirca Filho e Maurer (2008) polieletroacutelitos satildeo

3 1 Introduccedilatildeo

poliacutemeros com muitas unidades monomeacutericas eletroliacuteticas ndash neste caso

aminoaacutecidos que possuem grupos ionizaacuteveis natildeo ligados

Para muitos processos industriais e mesmo naturais informaccedilotildees a respeito de

equiliacutebrios de fases de soluccedilotildees eletroliacuteticas satildeo necessaacuterias e necessaacuterias tambeacutem

satildeo modificaccedilotildees nos modelos tradicionais de coeficiente de atividade quando se

trata de descrever equiliacutebrios de fases em sistemas que conteacutem eletroacutelitos (Prausnitz

et al 1999)

Sendo assim tendo que a pressatildeo do sistema natildeo influencia de modo significativo o

ESL tem-se que trecircs variaacuteveis o influenciam diretamente a temperatura o pH e a

forccedila iocircnica estas duas uacuteltimas tornam-se importantes devido agrave caracteriacutestica

eletroliacutetica das proteiacutenas

Na verdade a forccedila iocircnica natildeo eacute uma variaacutevel que represente de modo abrangente

os possiacuteveis efeitos de iacuteons em soluccedilotildees proteacuteicas Isto se deve ao fato de que a

forccedila iocircnica do modo como eacute definida natildeo contempla uma diferenciaccedilatildeo entre os

equiliacutebrios que se estabelecem entre os iacuteons e alguns resiacuteduos ionizaacuteveis da cadeia

proteacuteica De fato a variaccedilatildeo da forccedila iocircnica de uma soluccedilatildeo proteacuteica altera o valor

da solubilidade da proteiacutena em soluccedilatildeo mas natildeo da mesma forma para qualquer

espeacutecie de iacuteon Portanto seria mais prudente acrescer ao conjunto de variaacuteveis que

influenciam o ESL a espeacutecie quiacutemica dos iacuteons presentes em soluccedilatildeo

O objetivo deste trabalho eacute estabelecer um modelo capaz de prever a influecircncia do

pH no ESL de proteiacutenas mantendo-se temperatura e forccedila iocircnica constantes

Sabe-se por observaccedilotildees experimentais que a variaccedilatildeo do pH de um sistema altera

o valor da solubilidade de proteiacutenas em soluccedilatildeo e a solubilidade de proteiacutenas por

sua vez atinge seu valor miacutenimo em um pH denominado ponto isoeleacutetrico (pI) no

qual a carga liacutequida da proteiacutena eacute nula

4 1 Introduccedilatildeo

Os primeiros trabalhos relacionados agrave modelagem da curva de solubilidade de

proteiacutenas em funccedilatildeo do pH datam do iniacutecio do seacuteculo XX Green (1931) propocircs um

modelo para a curva de solubilidade da carboxihemoglobina equumlina considerando

que esta proteiacutena se comportaria tanto como um aacutecido bivalente quanto uma base

bivalente Jaacute Groumlnwall (1941) atribuiu a Linderstroslashm-Lang o desenvolvimento de um

modelo capaz de predizer a curva de solubilidade a partir da integraccedilatildeo do perfil de

carga da proteiacutena Este trabalho de Groumlnwall apesar de esquecido pelo tempo eacute de

extrema importacircncia e relevacircncia tanto para o trabalho aqui apresentado quanto e

aqui um motivo muito mais nobre para o desenvolvimento de modelos a partir das

ferramentas da termodinacircmica claacutessica Quando da exposiccedilatildeo da modelagem aqui

tratada retornar-se-aacute a este trabalho que muito contribuiu ao entendimento do

fenocircmeno estudado

Eacute digno de nota o trabalho de Fredericq e Neurath (1950) no qual uma proposta de

equacionamento para uma correlaccedilatildeo semi-empiacuterica da curva de solubilidade de

insulina eacute apresentada Natildeo haacute de fato algo novo em relaccedilatildeo agrave modelagem do

efeito do pH na curva de solubilidade neste trabalho no entanto apesar de natildeo

haver qualquer menccedilatildeo ou referecircncia quanto agrave origem da equaccedilatildeo proposta nota-se

que eacute uma aplicaccedilatildeo direta da equaccedilatildeo descrita por Groumlnwall (1941) Haacute uma

hipoacutetese impliacutecita no trabalho de que o perfil de carga liacutequida da insulina seja linear

na regiatildeo do ponto isoeleacutetrico o que eacute bastante plausiacutevel para muitas proteiacutenas

Assim pela integraccedilatildeo da equaccedilatildeo diferencial proposta por Groumlwall (1941) uma

correlaccedilatildeo semi-empiacuterica quadraacutetica eacute obtida Reforccedila-se o uso da expressatildeo semi-

empiacuterica devido agrave natureza dual da equaccedilatildeo em parte advinda de um

desenvolvimento teoacuterico descrito por Groumlnwall (1941) e atribuiacutedo a Linderstroslashm-

Lang e em parte pela necessidade de se obter paracircmetros a partir de um ajuste de

5 1 Introduccedilatildeo

um conjunto de dados experimentais Vale observar que resultados expressivos

foram alcanccedilados neste trabalho de modo particular o fato de que a presenccedila do

acircnion tiocianato natildeo altera a forma da curva de solubilidade da insulina mas a

desloca em direccedilatildeo a menores valores de pH e de solubilidade

Contudo os trabalhos mais recentes se concentraram na modelagem da curva de

solubilidade de aminoaacutecidos em funccedilatildeo do pH dando maior enfoque aos modelos

termodinacircmicos para soluccedilotildees natildeo-ideais tanto atraveacutes de equaccedilotildees de estado

como de modelos de energia livre de Gibbs excedente

Destaca-se neste grupo o trabalho de Pinho et al (1994) que aplicaram o modelo

UNIFAC associado ao termo de Debye-Huumlckel para aminoaacutecidos como glicina D-

alanina L-serina e DL-valina Tambeacutem o trabalho de Khoshkbarchi e Vera (1996)

no qual foi desenvolvido um modelo simplificado de esfera riacutegida perturbada para

calcular o coeficiente de atividade de aminoaacutecidos e de peptiacutedeos permite prever a

curva de solubilidade destes em funccedilatildeo do pH Jaacute o modelo NRTL foi aplicado tanto

por Pradhan e Vera (1998) quanto Tseng et al (2009) para aminoaacutecidos Jaacute Seyfi et

al (2009) aplicaram a equaccedilatildeo de estado SAFT para a prediccedilatildeo da curva de

solubilidade da DL-metionina

Entretanto o primeiro trabalho dedicado exclusivamente agrave modelagem e prediccedilatildeo da

curva de solubilidade de proteiacutena propriamente dita em funccedilatildeo do pH foi publicado

por Tjong e Zhou (2008) Neste trabalho a solubilidade foi calculada a partir da

energia livre de transferecircncia da fase soacutelida para a fase liacutequida Para a execuccedilatildeo

deste caacutelculo a energia livre de transferecircncia foi dividida em duas contribuiccedilotildees

uma de natureza eletrostaacutetica calculada pela meacutedia de 100 conformaccedilotildees proteacuteicas

advindas da aplicaccedilatildeo de dinacircmica molecular a pH constante e outra de natureza

natildeo-eletrostaacutetica baseada na aacuterea superficial acessiacutevel ao solvente Poreacutem o

6 1 Introduccedilatildeo

esforccedilo computacional requerido pelo modelo por eles proposto para calcular

apenas alguns pontos da curva natildeo apresenta uma aplicabilidade razoaacutevel Aleacutem

deste trabalho Tashima et al (2009) propuseram uma modelagem termodinacircmica

para prever a curva de solubilidade especificamente da insulina suiacutena aplicando o

modelo de Pitzer truncado apoacutes o segundo coeficiente do virial

No presente trabalho propomos um novo modelo baseado no caacutelculo de estados de

ionizaccedilatildeo e em ferramentas de termodinacircmica claacutessica bem como uma extensatildeo agrave

teoria de Linderstroslashm-Lang e Groumlnwall Vale ressaltar de antematildeo que tanto este

novo modelo proposto quanto a extensatildeo desenvolvida resultam na mesma equaccedilatildeo

para o fenocircmeno apesar das distintas abordagens

2 Materiais e Meacutetodos

21 Meacutetodos computacionais

O coacutedigo-fonte do programa em linguagem C estaacute apresentado no Apecircndice B Os

meacutetodos numeacutericos utilizados se resumem a interpolaccedilatildeo linear o meacutetodo de

Newton-Raphson cujo uso seraacute apresentado na proacutexima seccedilatildeo quando se deduziraacute

o algoritmo do modelo de Debye-Huumlckel e o meacutetodo de busca unidirecional de

miacutenimos de funccedilatildeo pela Seccedilatildeo Aacuteurea

As Tabelas 211 e 212 apresentam os resiacuteduos considerados para cada proteiacutena

considerada bem como os seus valores de pKA que foram obtidos a partir da

literatura e satildeo indispensaacuteveis para execuccedilatildeo dos caacutelculos mais rigorosos

Tabela 211 ndash Resiacuteduos ionizaacuteveis considerados e valores de pKA da insulina suiacutena

Valores extraiacutedos de Kaarsholm et al (1990)

Aminoaacutecido Grupo Ionizaacutevel pKA

A1 ndash Gly -NH2 738 A4 ndash Glu -COOH 437 A14 ndash Tyr Fenol-OH 1020 A17 ndash Glu -COOH 437 A19 ndash Tyr Fenol-OH 1020 A21 ndash Asn -COOH 345

B1 ndash Phe -NH2 738 B5 ndash His Imidazol-NH 598 B10 ndash His Imidazol-NH 598 B 13 ndash Glu -COOH 437 B16 ndash Tyr Fenol-OH 1020 B21 ndash Glu -COOH 437

B22 ndash Arg Guaniacutedio-NH2 1110 B26 ndash Tyr Fenol-OH 1020

B29 ndash Lys -NH2 852 B30 ndashAla -COOH 345

8 2 Materiais e Meacutetodos

Tabela 212 ndash Resiacuteduos ionizaacuteveis considerados e valores de pKA a 25 ordmC da lisozima

de clara de ovo de galinha Valores extraiacutedos de Kuramitsu e Hamaguchi (1980)

Aminoaacutecido Grupo Ionizaacutevel pKA α-NH2 α-NH2 79

Lys1 ε-NH2 108

Arg5 Guaniacutedio-NH2 120 Glu7 -COOH 26

Lys13 ε-NH2 105

Arg14 Guaniacutedio-NH2 120 His15 Imidazol-NH 58 Asp18 -COOH 20 Tyr20 Fenol-OH 103

Arg21 Guaniacutedio-NH2 120 Tyr23 Fenol-OH 98

Lys33 ε-NH2 106 Glu35 -COOH 61

Arg45 Guaniacutedio-NH2 120 Asp48 -COOH 43 Asp52 -COOH 34 Tyr53 Fenol-OH 121

Arg61 Guaniacutedio-NH2 120 Asp66 -COOH 16

Arg68 Guaniacutedio-NH2 120

Arg73 Guaniacutedio-NH2 120 Asp87 -COOH 21

Lys96 ε-NH2 108

Lys97 ε-NH2 103 Asp101 -COOH 45

Arg112 Guaniacutedio-NH2 120

Arg114 Guaniacutedio-NH2 120

Lys116 ε-NH2 104 Asp119 -COOH 25

Arg125 Guaniacutedio-NH2 120

Arg128 Guaniacutedio-NH2 120 α-COOH α-COOH 31

9 2 Materiais e Meacutetodos

22 Curva de solubilidade da lisozima da clara de ovo de galinha

221 Reagentes

Neste experimento de determinaccedilatildeo da curva de solubilidade da lisozima da clara de

ovo de galinha os reagentes utilizados foram cloreto de soacutedio (Reatec P A)

bicarbonato de soacutedio (Research Becto Chemical P A) Na2HPO4 7H2O (Reagen

P A) aacutegua destilada deionizada Milli-Q (Millipore) e lisozima de clara de ovo de

galinha (Sigma min 99)

222 Equipamentos

Neste experimento os equipamentos utilizados foram espectrofotocircmetro UV-Visiacutevel

(Beckman DU-530) centriacutefuga (Eppendorf) banho-teacutermico (Laacutectea) com controlador

de temperatura (Julabo) pHmetro (Micronal) e balanccedila (Mettler Toledo AB204S)

223 Preparaccedilatildeo das soluccedilotildees-tampatildeo

Foram preparadas soluccedilotildees-tampatildeo com valores de pH=96 pH = 98 pH = 100

pH = 102 pH = 104 pH = 106 pH = 108 pH = 110 pH = 112 pH = 114 pH =

116 e pH = 118 a partir de quatro soluccedilotildees uma de hidroacutexido de soacutedio 01 M uma

de cloreto de soacutedio 1 M (para equalizar a forccedila iocircnica) uma de bicarbonato de soacutedio

005 M e outra de Na2HPO4 005 M

A Tabela 2231 apresenta os valores de volume usados no preparo de cada uma

das soluccedilotildees-tampatildeo

10 2 Materiais e Meacutetodos

Tabela 2231 ndash Volumes de hidroacutexido de soacutedio a 01 M adicionados no preparo das

soluccedilotildees-tampatildeo

Tampatildeo pH V NaOH mL

NaHCO3 96 100 005 M 98 152

(para cada soluccedilatildeo-tampatildeo 100 mL 100 214

desta soluccedilatildeo foram adicionados) 102 276

104 330 106 382

108 424

110 454

112 530 114 583

Na2HPO4 110 82

005 M 112 126

(para cada soluccedilatildeo-tampatildeo 100 mL 114 182 desta soluccedilatildeo foram adicionados) 116 270

118 388

224 Procedimento experimental

Foram adicionadas quantidades natildeo definidas de lisozima de clara de ovo de galinha

a 13 mL de cada soluccedilatildeo-tampatildeo em tubos Eppendorf de 2 mL Colocaram-se

entatildeo as amostras apoacutes agitaccedilatildeo vigorosa em banho teacutermico a 250 plusmn 01 ordmC por 24

horas para que os sistemas atingissem o equiliacutebrio termodinacircmico Caso natildeo

houvesse a formaccedilatildeo de precipitado lisozima era adicionada e o procedimento

repetido Ao se observar a formaccedilatildeo de precipitado o sistema era centrifugado a

13000 rpm por 15 minutos Uma aliacutequota do sobrenadante era retirada e sua

concentraccedilatildeo proteacuteica determinada por medida de absorbacircncia a 280 nm Cada

sistema foi feito ao menos em duplicata

3 Modelo Estendido de Debye-Huumlckel

31 Introduccedilatildeo

De fato como descrito por Pessocirca Filho (2002) a equaccedilatildeo de Debye-Huumlckel natildeo

deve ser aplicada agrave modelagem de polieletroacutelitos tais como proteiacutenas porque nestas

moleacuteculas as cargas satildeo distribuiacutedas ao longo da cadeia e portanto natildeo satildeo cargas

pontuais como suposto por Debye-Huumlckel

Contudo nesta modelagem considera-se uma regiatildeo de pH em torno do ponto

isoeleacutetrico (pI) na qual satildeo inerentes duas condiccedilotildees favoraacuteveis a aplicaccedilatildeo da

equaccedilatildeo de Debye-Huumlckel carga liacutequida proacutexima a zero pois Z(pI) = 0 e regiatildeo de

miacutenima solubilidade que significa baixas concentraccedilotildees de proteiacutenas em soluccedilatildeo

Isto significa em primeiro lugar que os efeitos da carga tais como ldquodesnovelamentordquo

da cadeia proteacuteica com exposiccedilatildeo de resiacuteduos outrora blindados podem ser

desprezados em uma regiatildeo proacutexima ao ponto isoeleacutetrico e em segundo lugar

baixas concentraccedilotildees de proteiacutena em soluccedilatildeo significam que os termos de curto

alcance podem ser desprezados e portanto haacute prevalecircncia do termo de longo

alcance que no caso de soluccedilotildees eletroliacuteticas pode ser descrito por uma equaccedilatildeo

estendida de Debye-Huumlckel

Assim o modelo de Debye-Huumlckel foi utilizado natildeo para verificar sua aplicabilidade agrave

modelagem de soluccedilotildees proteacuteicas mas sim para confrontar o modelo proposto com

um modelo usual em modelagem de soluccedilotildees eletroliacuteticas e seraacute referido no texto

sempre como abordagem claacutessica

12 3 Modelo Estendido de Debye-Huumlckel

32 Desenvolvimento teoacuterico

Pode-se escrever a atividade da proteiacutena como o produto entre a solubilidade e o

coeficiente de atividade da mesma como mostrado na equaccedilatildeo (32 - 1)

푎 = 훾푠

(32 - 1)

Na qual pode-se calcular o coeficiente de atividade atraveacutes da equaccedilatildeo estendida

de Debye-Huumlckel (Pitzer 1973)

ln 훾 = minus퐴 푍radic퐼

1 + 푏radic퐼+

2푏

ln 1 + 푏radic퐼

(32 - 2)

Sendo que a constante universal empiacuterica b = 12 kg12 mol-12 eacute usada para todos os

eletroacutelitos Jaacute AΦ eacute o paracircmetro de Debye-Huumlckel para o coeficiente osmoacutetico e eacute

dado por

퐴 =13

(2휋푁 휌 ) frasl 푒4휋휀 휀 푘푇

frasl

(32 - 3)

Em que NA eacute a constante de Avogadro ρs eacute a densidade do solvente em g cm-3 e eacute

a carga eletrocircnica (e = 160218 x 10-19 C) ε0 eacute a permissividade do espaccedilo livre (ε0 =

885419 x 10-12 C2 N-1 m-2) εr eacute a constante dieleacutetrica do solvente k aacute constante de

Boltzmann e T eacute a temperatura absoluta Jaacute a carga liacutequida em funccedilatildeo do pH pode

ser calculada como

푍 = 훼 minus 훼

(32 - 4)

Sendo que α+ e α- satildeo dados pelas equaccedilotildees (A - 10) e (A - 16) do Apecircndice A

13 3 Modelo Estendido de Debye-Huumlckel

E a forccedila iocircnica eacute dada pela equaccedilatildeo (32 - 5) descrita abaixo

퐼 = 12

푚 푍

(32 - 5)

Contudo no ponto isoeleacutetrico a carga meacutedia da proteiacutena eacute nula portanto o termo de

Debye-Huumlckel se anula e o coeficiente de atividade se torna unitaacuterio

ln푎 (푝퐼) = ln 푠 (푝퐼)

(32 - 6)

Considerando que a atividade da proteiacutena seja constante com a variaccedilatildeo de pH isto

implica que esta eacute sempre igual agrave solubilidade da proteiacutena no ponto isoeleacutetrico e

portanto vale que

ln푎 (푝퐻) = ln 푠 (푝퐻) + ln 훾(푝퐻) = ln 푠 (푝퐼)

(32 - 7)

Assim

ln 푠 (푝퐻) = ln 푠 (푝퐼) + 퐴휙푍푝퐻2 radic퐼1 + 푏radic퐼

+2푏

ln 1 + 푏radic퐼

(32 - 8)

Esta equaccedilatildeo prevecirc a curva de solubilidade em funccedilatildeo do pH atraveacutes do caacutelculo da

atividade da proteiacutena na fase liacutequida pela equaccedilatildeo estendida de Debye-Huumlckel Para

resolvecirc-la eacute necessaacuterio se utilizar de um meacutetodo numeacuterico pois a forccedila iocircnica

depende da solubilidade naquele pH Optou-se neste trabalho pelo Meacutetodo de

Newton-Raphson para executar o meacutetodo iterativo que eacute exigido pela equaccedilatildeo (32

ndash 8) Para aplicar este meacutetodo arbitrou-se uma funccedilatildeo f(sp) definida aqui como

푓 푠 = minus ln 푠 (푝퐻) + ln 푠 (푝퐼) + 퐴휙푍푝퐻2 radic퐼

1 + 푏radic퐼+

2푏

ln 1 + 푏radic퐼

(32 - 9)

14 3 Modelo Estendido de Debye-Huumlckel

Assim ao calcular o sp que zera esta funccedilatildeo f(sp) saber-se-aacute que eacute a proacutepria

solubilidade que se deseja calcular Para aplicar o Meacutetodo de Newton-Raphson

basta derivar a funccedilatildeo f(sp) e aplicar o seguinte algoritmo de resoluccedilatildeo

푠 = 푠 minus푓(푠 )푓 (푠 )

(32 - 10)

Para calcular frsquo(s) deve-se considerar que a forccedila iocircnica depende da solubilidade

Para isto observando a equaccedilatildeo (32 - 5) vecirc-se que a forccedila iocircnica eacute dada pelo

somatoacuterio das contribuiccedilotildees de todos os iacuteons presentes na soluccedilatildeo por isso aqui

cabe um artifiacutecio de dividir estas contribuiccedilotildees em duas macro-contribuiccedilotildees aquela

devida a todos os iacuteons presentes na soluccedilatildeo exclusive os grupos ionizaacuteveis

presentes nas moleacuteculas da proteiacutena em questatildeo (I0) e que se considera constante

com o pH e aquela que engloba apenas os grupos ionizaacuteveis presentes nas

moleacuteculas da proteiacutena (IP)

퐼 = 퐼 + 퐼 = 퐼 +12푍 푠

(32 - 11)

Considerando a funccedilatildeo w tal que

푤 = radic퐼 = 퐼 +12푍 푠

(32 - 12)

Sendo

푤 =14푍 퐼

(32 - 13)

Entatildeo aplicando-se as devidas regras de derivaccedilatildeo tem-se

15 3 Modelo Estendido de Debye-Huumlckel

푓 (푠 ) = minus1푠 + 퐴 푍

3푤 + 2푤 푏푤(1 + 푏푤)

(32 - 14)

Substituindo as equaccedilotildees (32 - 12) e (32 - 13) na equaccedilatildeo (32 - 14) tem-se que

푓 (푠 ) = minus1푠 + 퐴 푍

15 + 푏radic퐼2radic퐼(1 + 푏radic퐼)

(32 - 15)

Entatildeo o algoritmo deve ser

푠 = 푠 minus

⎜⎛ln 푠 (푝퐼)

푠 + 퐴휙푍푝퐻2 radic퐼

1 + 푏radic퐼+ 2푏 ln 1 + 푏radic퐼

minus 1푠 + 퐴휙푍

15 + 푏radic퐼2radic퐼(1 + 푏radic퐼) ⎠

⎟⎞

(32 - 16)

4 Modelagem Termodinacircmica Proposta

41 Introduccedilatildeo

A condiccedilatildeo de equiliacutebrio entre duas fases (α e β) com m componentes eacute dada por

(Prausnitz et al 1999)

푝 = 푝

(41 ndash 1)

푇 = 푇

(41 ndash 2)

휇 = 휇⋮

휇 = 휇

(41 ndash 3)

Considerando o equiliacutebrio soacutelido-liacutequido (ESL) de sistemas contendo proteiacutenas

sendo que os efeitos da pressatildeo podem ser desprezados que as temperaturas nas

duas fases satildeo iguais e que na fase soacutelida soacute haacute proteiacutena tem-se que para a

proteiacutena a relaccedilatildeo de equiliacutebrio pode ser descrita por

휇 (푇푥) = 휇 (푇)

(41 ndash 4)

Contudo adotando-se a lei de Henry que eacute vaacutelida para baixas concentraccedilotildees de

soluto hipoacutetese que natildeo eacute distante dos valores observados da solubilidade de

proteiacutenas pode se escrever o potencial quiacutemico na fase liacutequida por

휇 (푇푥) = 휇 (푇 푥 ) + 푅푇푙푛푥

(41 ndash 5)

17 4 Modelagem Termodinacircmica Proposta

Entretanto variaccedilotildees de pH natildeo alteram o potencial quiacutemico da fase soacutelida o que

resulta pela relaccedilatildeo (41 ndash 4) que o mesmo natildeo altera tambeacutem o potencial quiacutemico

da fase liacutequida Com isso pela relaccedilatildeo (41 ndash 5) sendo o potencial quiacutemico de

referecircncia constante com o pH uma contradiccedilatildeo emerge a variaccedilatildeo do pH natildeo

poderia alterar o valor da solubilidade poreacutem a observaccedilatildeo experimental mostra o

contraacuterio Assim deve-se lembrar que pelo princiacutepio da eletroneutralidade a fase

soacutelida soacute possui moleacuteculas proteacuteicas eletricamente neutras e portanto o equiliacutebrio

de fases deve se estabelecer apenas entre as moleacuteculas presentes na fase soacutelida e

as moleacuteculas eletricamente neutras em soluccedilatildeo Ou seja como soacute moleacuteculas

eletricamente neutras podem estar na fase soacutelida o equiliacutebrio de fases depende

exclusivamente da fraccedilatildeo de moleacuteculas eletricamente neutras em soluccedilatildeo pois soacute

estas podem precipitar Assim tanto a equaccedilatildeo (41 ndash 4) quanto a equaccedilatildeo (41 ndash

5) devem ser aplicadas natildeo ao conjunto de todas as moleacuteculas de proteiacutena em

soluccedilatildeo mas somente as moleacuteculas proteacuteicas eletricamente neutras Portanto a

concentraccedilatildeo das moleacuteculas de proteiacutena eletricamente neutras em soluccedilatildeo eacute

constante com o pH e pode ser interpretada como a multiplicaccedilatildeo da fraccedilatildeo de

moleacuteculas eletricamente neutras pela concentraccedilatildeo total de proteiacutenas que eacute a

proacutepria solubilidade Assim uma relaccedilatildeo de inversa proporcionalidade eacute definida

quanto maior a fraccedilatildeo de moleacuteculas neutras menor seraacute a solubilidade de uma

proteiacutena em soluccedilatildeo Portanto no ponto isoeleacutetrico no qual haacute o miacutenimo de

solubilidade tem-se o ponto maacuteximo de fraccedilatildeo de moleacuteculas eletricamente neutras

A partir disto eacute possiacutevel escrever a equaccedilatildeo que rege o comportamento da

solubilidade de uma proteiacutena em funccedilatildeo do pH da soluccedilatildeo

휙(푝퐻)푆 (푝퐻) = 휆 = 푐표푛푠푡푎푛푡푒

(41 ndash 6)

18 4 Modelagem Termodinacircmica Proposta

Na equaccedilatildeo (41 ndash 6) o paracircmetro λ pode ser um paracircmetro de ajuste do modelo a

um conjunto de valores experimentais tendo se estabelecido uma funccedilatildeo objetivo ou

ainda dado pelo produto entre a solubilidade no ponto isoeleacutetrico e a fraccedilatildeo de

moleacuteculas eletricamente neutras em soluccedilatildeo tambeacutem no pI neste caso vale a

seguinte equaccedilatildeo

푠 (푝퐻) =휙(푝퐼)푠 (푝퐼)휙(푝퐻)

(41 ndash 7)

Sendo a equaccedilatildeo do modelo ndash equaccedilatildeo (41 ndash 7) ndash extremamente simples a uacutenica

dificuldade reside no caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras

(휙(푝퐻))

42 Caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras

Dentre os aminoaacutecidos que formam atraveacutes de ligaccedilotildees peptiacutedicas as proteiacutenas haacute

aqueles que possuem resiacuteduos com grupos ionizaacuteveis aleacutem dos grupos amina e

aacutecido carboxiacutelico terminais na cadeia Todos estes participam de equiliacutebrios

quiacutemicos com iacuteons H+ presentes na soluccedilatildeo entatildeo ao se alterar o pH da soluccedilatildeo

estes equiliacutebrios satildeo alterados

Assim haacute vaacuterias possibilidades de combinaccedilotildees de estados ionizados destes grupos

ionizaacuteveis que resultam em uma moleacutecula de proteiacutena eletricamente neutra Eacute

importante notar que dada a fraccedilatildeo de uma configuraccedilatildeo de uma moleacutecula neutra

todas as outras fraccedilotildees de configuraccedilotildees possiacuteveis que tambeacutem resultem em

moleacuteculas neutras satildeo proporcionais agrave fraccedilatildeo da configuraccedilatildeo dada pois todas as

configuraccedilotildees participam de equiliacutebrios entre si

19 4 Modelagem Termodinacircmica Proposta

Desta observaccedilatildeo implica-se que basta identificar uma configuraccedilatildeo proteacuteica cuja

soma dos estados ionizados resulte em carga nula para se descrever o equiliacutebrio de

fases em relaccedilatildeo ao pH na regiatildeo do ponto isoeleacutetrico onde esta consideraccedilatildeo eacute

predominante em relaccedilatildeo a outros possiacuteveis fenocircmenos

Contudo eacute necessaacuterio contabilizar a contribuiccedilatildeo de cada grupo ionizaacutevel via

equaccedilatildeo de Henderson-Hasselbach equaccedilatildeo (42 ndash 1)

훼 (푝퐻) =

⎩⎪⎨

⎪⎧ 10

1 + 10 푠푒 휈 = minus1

11 + 10

푠푒 휈 = +1

(42 ndash 1)

Na qual pKAj eacute o co-logaritmo da constante de equiliacutebrio do grupo ionizaacutevel do

resiacuteduo j j eacute estado carregado potencial do resiacuteduo j (-1 para grupos aacutecidos e +1

para grupos baacutesicos) e j eacute a fraccedilatildeo ionizada para o pH dado Para grupos cujo

estado de ionizaccedilatildeo na dada configuraccedilatildeo seja neutro a sua fraccedilatildeo eacute calculada tal

que a soma de sua fraccedilatildeo e da fraccedilatildeo ionizada tenha como resultado o valor

unitaacuterio

Assim a funccedilatildeo Pn pode ser escrita como o produto de cada fraccedilatildeo de cada grupo

ionizaacutevel j naquele estado (-1 0 ou +1) na configuraccedilatildeo neutra k em uma proteiacutena

com n grupos ionizaacuteveis Uma representaccedilatildeo matemaacutetica possiacutevel para esta funccedilatildeo

pode ser escrita como

휙 (푝퐻) = 훼 (푝퐻)

(42 ndash 2)

Na qual a fraccedilatildeo jrsquo(pH) eacute dada por

20 4 Modelagem Termodinacircmica Proposta

훼 (푝퐻) =훼 (푝퐻) 푠푒 휀 = 11 minus 훼 (푝퐻) 푠푒 휀 = 0

(42 ndash 3)

Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (42 ndash 3) e a resultante na equaccedilatildeo

(42 ndash 2) pode-se escrever que

휙 (푝퐻) =1

1 + 10

1 + 휈2 minus 휈 휀 10

minus휈 minus 1

2 minus 휈 휀 푐표푚 휀 = 0

(42 ndash 4)

A equaccedilatildeo (42 ndash 4) junto agrave equaccedilatildeo (41 ndash 7) constituem o modelo termodinacircmico

capaz de predizer a razatildeo entre as fraccedilotildees de moleacuteculas neutras de uma proteiacutena

em funccedilatildeo do pH na regiatildeo do ponto isoeleacutetrico mantendo fixas temperatura e forccedila

iocircnica Substituindo a equaccedilatildeo (42 ndash 4) na equaccedilatildeo (41 ndash 7) obteacutem-se para a

curva de solubilidade

푠 (푝퐻)푠 (푝퐼) =

1 + 101 + 10

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

푐표푚 휀 = 0

(42 ndash 8)

5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

51 Introduccedilatildeo

Segundo Groumlnwall (1941) na fase liacutequida haacute moleacuteculas de proteiacutenas com muitas

configuraccedilotildees k distintas que possuem carga liacutequida i e tambeacutem haacute certas

configuraccedilotildees que tem carga liacutequida nula e satildeo chamadas configuraccedilotildees neutras

Aleacutem disso estas uacuteltimas satildeo aquelas que determinam o equiliacutebrio de fases jaacute que

elas estatildeo em equiliacutebrio com a fase soacutelida na qual soacute haacute moleacuteculas neutras pelo

princiacutepio da eletroneutralidade Eacute tambeacutem afirmado que dado este equiliacutebrio a

atividade das moleacuteculas neutras natildeo se altera com a variaccedilatildeo do pH e eacute

proporcional agraves atividades de qualquer tipo de configuraccedilatildeo neutra

Neste mesmo trabalho eacute atribuiacuteda a Linderstroslashm-Lang o desenvolvimento de uma

teoria de prediccedilatildeo da solubilidade de proteiacutenas com a variaccedilatildeo do pH na regiatildeo do

ponto isoeleacutetrico Este desenvolvimento apresenta um balanccedilo de cargas de um

modo impliacutecito contudo como atestado por Groumlnwall o escasso conhecimento

sobre as estruturas proteacuteicas impediram agravequele tempo uma formulaccedilatildeo mais

pormenorizada do problema

52 Desenvolvimento teoacuterico

A base desta abordagem descrita por Groumlnwall e atribuiacuteda a Linderstroslashm-Lang

reside na hipoacutetese de que a moleacutecula de proteiacutena de configuraccedilatildeo k e carga nula

participa do seguinte equiliacutebrio com os iacuteons H+ e com sua forma de carga i

22 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

푃 + 푖퐻 푃 lowast

(52 ndash 1)

Note-se que o valor de i pode ser negativo A constante do equiliacutebrio quiacutemico

descrita pela equaccedilatildeo (52 ndash 1) pode ser expressa como

퐾 =푎

lowast

푎 푎

(52 ndash 2)

Sabendo que a atividade da moleacutecula de proteiacutena de configuraccedilatildeo k e carga i eacute dada

pelo produto entre sua concentraccedilatildeo e seu coeficiente de atividade tem-se que

푥lowast

= 푎 푎퐾훾

lowast

(52 ndash 3)

Entretanto a solubilidade da proteiacutena eacute soma das concentraccedilotildees de todas as

moleacuteculas de carga i Poreacutem a concentraccedilatildeo das moleacuteculas de carga i eacute a soma das

concentraccedilotildees das moleacuteculas de configuraccedilatildeo k Assim a solubilidade pode ser

escrita como

푠 (푝퐻) = 푎 푎퐾훾

lowast

(52 ndash 4)

Derivando a equaccedilatildeo (52 ndash 4) com respeito agrave atividade do iacuteon H+ considerando

que atividade da moleacutecula neutra eacute constante para qualquer configuraccedilatildeo k e ainda

que o coeficiente de atividade da proteiacutena de carga i independe da atividade do iacuteon

H+ tem-se que

푑푠푑푎 = 푖 ∙ 푎 푎

퐾훾

lowast

(52 ndash 5)

23 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

Sendo

푑 log 푠 (푝퐻)푑(푝퐻) = minus

푎푠 (푝퐻)

푑푠푑푎

(52 ndash 6)

Substituindo as equaccedilotildees (52 ndash 4) e (52 ndash 5) na equaccedilatildeo (52 ndash 6) e

reescrevendo em termos de pH e das concentraccedilotildees das proteiacutenas de carga i tem-

se que

푑 log 푠푑(푝퐻) = minus

sum (푖 ∙ 푥 )sum 푥

(52 ndash 7)

Contudo o termo do lado direito da equaccedilatildeo (52 ndash 7) estaacute associado ao conceito

de valecircncia meacutedia estabelecido por Linderstroslashm-Lang (1924)

횤 =sum (푖 ∙ 푥 )sum 푥

(52 ndash 8)

Os autores natildeo possuiacuteam um modo mais adequado de construir a curva de

solubilidade dada pela equaccedilatildeo (52 ndash 7) do que aproximar por uma funccedilatildeo linear o

perfil de carga liacutequida da proteiacutena obtido experimentalmente e integraacute-lo valendo-se

da analogia entre o conceito de carga liacutequida (Z) e de valecircncia meacutedia ( i ) Entretanto

hoje jaacute se tem uma descriccedilatildeo analiacutetica do perfil de carga liacutequida de proteiacutenas que

pode ser escrita como

푍(푝퐻) = 휈 훼

(52 ndash 9)

Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (52 ndash 9) e a resultante na equaccedilatildeo

(52 ndash 7) tem-se que

24 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

푑 log 푠푑(푝퐻) = minus

12

11 + 10

1 + 휈 + 휈 1 minus 휈 10

(52 ndash 10)

Integrando a equaccedilatildeo (52 ndash 10) de um ponto de referecircncia por exemplo do ponto

isoeleacutetrico (pI) ateacute um pH qualquer tem-se a seguinte relaccedilatildeo

푑 log 푠

( )

( )

= minus12

1

1 + 101 + 휈 + 휈 1 minus 휈 10 푑(푝퐻)

(52 ndash 11)

log푠 (푝퐻)푠 (푝퐼) = minus

12 1 + 휈

11 + 10

푑(푝퐻)

+ 휈 1 minus 휈10

1 + 10푑(푝퐻)

(52 ndash 12)

Fazendo a seguinte substituiccedilatildeo

푢 = 10 푡푎푙 푞푢푒 푑푢푢 = ln 10푑(푝퐻)

(52 ndash 13)

Tem-se que

log푠 (푝퐻)푠 (푝퐼) = minus

12

1 + 휈ln 10

1푢(1 + 푢) 푑푢 +

휈 1 minus 휈ln 10

1(1 + 푢) 푑푢

(52 ndash 14)

log푠 (푝퐻)푠 (푝퐼) = minus

12

1 + 휈ln 10

1푢 푑푢 minus

11 + 푢 푑푢 +

휈 1 minus 휈ln 10

1(1 + 푢) 푑푢

(52 ndash 15)

25 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐼) = minus

12 1 + 휈 log

1010

minus 휈 1 minus 휈 minus 1 + 휈 log1 + 101 + 10

(52 ndash 16)

Sendo

휈 1 minus 휈 minus 1 + 휈 = 휈 minus 휈 minus 1 minus 휈 = minus 1 + 휈 = minus2

(52 ndash 17)

Resultando em

log푠 (푝퐻)푠 (푝퐼) = log

1 + 101 + 10

minus1 + 휈

2 (푝퐻 minus 푝퐼)

(52 ndash 18)

Ainda eacute possiacutevel reescrever a equaccedilatildeo (52 ndash 18) como

log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log

1 + 101 + 10

(52 ndash 19)

Na qual n+ representa o nuacutemero de resiacuteduos ionizaacuteveis que na sua forma carregada

apresentam carga positiva A equaccedilatildeo (52 ndash 19) eacute uma expressatildeo analiacutetica que a

partir de dados da estrutura proteacuteica e de um dado de solubilidade permite predizer

a curva de solubilidade de uma dada proteiacutena em funccedilatildeo do pH na regiatildeo do ponto

isoeleacutetrico mantendo fixas a temperatura e a forccedila iocircnica do sistema

Eacute possiacutevel provar que as equaccedilotildees (42 ndash 8) e (52 ndash 19) satildeo idecircnticas - a prova

disso eacute descrita na seccedilatildeo 6 ndash e assim tem-se que apesar das distintas abordagens

a descriccedilatildeo do fenocircmeno eacute a mesma Note-se que um passo fundamental no

desenvolvimento da Equaccedilatildeo (52 ndash 5) eacute admitir que por hipoacutetese a atividade da

26 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

forma neutra natildeo depende do pH essa hipoacutetese tambeacutem eacute a base da equaccedilatildeo (41

ndash 7) Deve-se registrar o fato de que pelo melhor do nosso conhecimento esta eacute a

primeira vez que uma expressatildeo analiacutetica para o caacutelculo da solubilidade de

proteiacutenas em funccedilatildeo do pH eacute descrita mesmo no limite em que se considera vaacutelida

a lei de Henry

53 Soluccedilatildeo Paraboacutelica da Curva de Solubilidade

Tanto Groumlnwall (1941) quanto Fredericq e Neurath (1950) adotaram a hipoacutetese de

que os perfis de carga liacutequida da -lactoglobulina para um e da insulina para os

outros dois eram lineares na regiatildeo do ponto isoeleacutetrico Esta hipoacutetese eacute bastante

plausiacutevel e simplificadora principalmente a eacutepoca na qual estes trabalhos foram

desenvolvidos em que a estrutura proteacuteica bem como as constantes de ionizaccedilatildeo

dos resiacuteduos com grupos ionizaacuteveis era pouco conhecida De fato ainda hoje a falta

de dados das constantes de ionizaccedilatildeo na cadeia proteacuteica eacute o maior desafio no uso

do modelo rigoroso ndash equaccedilatildeo (52 ndash 18) Por isso o valor desta hipoacutetese de perfil

de carga liacutequida linear eacute notaacutevel

Supondo entatildeo que o perfil de carga seja linear eacute possiacutevel escrevecirc-lo como

푍(푝퐻) = minus퐴(푝퐻 minus 푝퐼) 푐표푚 퐴 gt 0

(53 ndash 1)

Substituindo (53 ndash 1) em (52 ndash 6)

푑 log 푠 (푝퐻)푑(푝퐻) = 퐴(푝퐻 minus 푝퐼)

(53 ndash 2)

Integrando (53 ndash 2) de um pH0 de referecircncia ateacute pH tem-se que

27 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐻 ) = 퐾[푝퐻 minus 2푝퐼(푝퐻 minus 푝퐻 ) minus 푝퐻 ] 푐표푚 퐾 =

퐴2

(53 ndash 3)

Ao se adotar como ponto de referecircncia o ponto isoeleacutetrico a equaccedilatildeo (53 ndash 3)

reduz-se agrave

log푠 (푝퐻)푠 (푝퐼) = 퐾(푝퐻 minus 푝퐼)

(53 ndash 4)

Contudo apesar da soluccedilatildeo quadraacutetica ou paraboacutelica para a equaccedilatildeo estendida de

Linderstroslashm-lang e Groumlnwall expressa na equaccedilatildeo (53 ndash 3) natildeo requerer os dados

das constantes de ionizaccedilatildeo dos resiacuteduos com grupos ionizaacuteveis ela exige a

definiccedilatildeo do paracircmetro A que fisicamente representa a inclinaccedilatildeo da reta de

aproximaccedilatildeo da curva de carga liacutequida e que pode ser calculado por correlaccedilatildeo a

partir de um conjunto de dados experimentais de solubilidade ou de carga liacutequida

6 Identidade entre o Modelo Proposto e a Equaccedilatildeo

Estendida de Linderstroslashm-Lang e Groumlnwall

A equaccedilatildeo final da modelagem termodinacircmica proposta apresentada na seccedilatildeo 4 eacute a

equaccedilatildeo (42 ndash 8) dada por

푠 (푝퐻)푠 (푝퐼) =

1 + 101 + 10

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 1)

Aplicando-se o logaritmo decimal nos dois termos da equaccedilatildeo (6 ndash 1) tem-se que

log푠 (푝퐻)푠 (푝퐼) = log

1 + 101 + 10

+ log

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 2)

Pelo bem da simplificaccedilatildeo desta deduccedilatildeo adotar-se-atildeo as seguintes funccedilotildees

휂 (푝퐻) = log

(6 ndash 3)

휃 (푝퐻) = log

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 4)

Assim pode-se reescrever a equaccedilatildeo (6 ndash 2) por

29 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐼) = 휂 (푝퐻) + 휃 (푝퐻)

(6 ndash 5)

Observando-se a equaccedilatildeo (6 ndash 5) tem-se que a funccedilatildeo j independe do estado de

ionizaccedilatildeo do resiacuteduo j poreacutem a funccedilatildeo jk depende Por isso deve-se analisar esta

funccedilatildeo para cada estado de ionizaccedilatildeo possiacutevel como mostrado na Tabela 61

Tabela 6 1 ndash Anaacutelise da funccedilatildeo jk para cada estado de ionizaccedilatildeo possiacutevel

j jk jk Quantidade de resiacuteduos neste estado

-1 -1 푝퐼 minus 푝퐻 na

0 0 nb

+1 +1 0 nc

0 푝퐼 minus 푝퐻 nd

Pela anaacutelise da Tabela 61 e considerando uma proteiacutena com n resiacuteduos com

grupos ionizaacuteveis infere-se que a equaccedilatildeo (6 ndash 5) pode ser reescrita como

log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)

(6 ndash 6)

Contudo as equaccedilotildees acima descritas satildeo vaacutelidas apenas para configuraccedilotildees

neutras pois apenas as configuraccedilotildees neutras da fase liacutequida estatildeo em equiliacutebrio

com as moleacuteculas de proteiacutena da fase soacutelida Para que uma configuraccedilatildeo seja

neutra vale a seguinte restriccedilatildeo

휀 = 0 hArr 푛 = 푛

(6 ndash 7)

30 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall

Substituindo a restriccedilatildeo dada pela equaccedilatildeo (6 ndash 7) na equaccedilatildeo (6 ndash 6) tem-se que

log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)

(6 ndash 8)

Ora mas a soma de nc e de nd natildeo resulta em outra coisa senatildeo no nuacutemero de

resiacuteduos com grupos ionizaacuteveis da estrutura proteacuteica cujo j seja +1 Assim

substituindo nc mais nd por n+ e substituindo a equaccedilatildeo (6 ndash 3) na equaccedilatildeo (6 ndash 8)

tem-se que

log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log

1 + 101 + 10

(6 ndash 9)

Ao se analisar a equaccedilatildeo (6 ndash 9) observa-se que ela eacute idecircntica a equaccedilatildeo estendida

de Linderstroslashm-Lang e Groumlnwall apresentada pela equaccedilatildeo (52 ndash 19) Com isso

tem-se que apesar das distintas formulaccedilotildees tanto a modelagem termodinacircmica aqui

proposta quanto a extensatildeo a teoria de Linderstroslashm-Lang e Groumlnwall resultam na

mesma descriccedilatildeo do fenocircmeno Aleacutem disso a equaccedilatildeo final dos modelos eacute

extremamente simples e depende apenas de um ponto de referecircncia e dos dados da

estrutura da moleacutecula de proteiacutena cuja solubilidade se deseja estudar

7 Aplicaccedilatildeo dos Modelos Expostos

Para validar o modelo comparando-o com o caacutelculo feito a partir da teoria de Debye-

Huumlckel o criteacuterio que relaciona os pontos calculados pelo modelo com os pontos

experimentais foi estabelecido a partir da seguinte funccedilatildeo objetivo (FO)

퐹푂 =1푁

푠 minus 푠푠

(7 ndash 1)

Contudo a equaccedilatildeo (7 ndash 1) natildeo eacute a melhor definiccedilatildeo de funccedilatildeo objetivo neste caso

pois a derivada da curva de solubilidade eacute razoavelmente grande nos dois lados do

ponto isoeleacutetrico e isso permite que pequenos desvios na direccedilatildeo horizontal

resultem em um grande aumento no valor da funccedilatildeo objetivo Uma soluccedilatildeo possiacutevel

seria substituir essa funccedilatildeo objetivo por uma funccedilatildeo definida pela soma do quadrado

da distacircncia do ponto experimental agrave curva do modelo principalmente se fosse

necessaacuterio calcular algum paracircmetro do modelo via otimizaccedilatildeo da funccedilatildeo objetivo

estipulada Natildeo sendo este o escopo deste trabalho optou-se pelo uso da FO

definida na equaccedilatildeo (7 ndash 1)

71 Solubilidade da Insulina Suiacutena

As Figuras 711 712 e 713 apresentam os graacuteficos da curva de solubilidade

dada pelos pontos experimentais pelo modelo proposto pela abordagem claacutessica e

tambeacutem a curva obtida pela soluccedilatildeo paraboacutelica da Equaccedilatildeo de Linderstroslashm-Lang e

Groumlnwall em trecircs temperaturas distintas

32 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 711 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 25 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

Figura 712 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 15 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

00

40

80

120

160

200

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

00

50

100

150

200

250

300

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

33 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 713 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 5 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

Os desvios da curva obtida pelo modelo proposto para valores de pH distantes do pI

podem ser explicados por ao menos trecircs importantes motivos dois devidos a

hipoacuteteses do modelo e um devido a fenocircmenos intriacutensecos a proteiacutena Sabendo que

no pI a solubilidade eacute miacutenima para valores de pH distantes do pI pode-se ter

solubilidades suficientemente grandes para que a validade da lei de Henry ndash adotada

na formulaccedilatildeo do modelo - seja questionada pois quanto mais distante do pI maior

a solubilidade e menor a validade da lei de Henry jaacute que haacute um aumento da

concentraccedilatildeo do soluto (proteiacutena) na soluccedilatildeo e tambeacutem ao fato do modelo prever

solubilidade infinita quando a fraccedilatildeo de moleacuteculas eletricamente neutras tende a

zero

limrarr푠 = lim

rarr

Φ(푝퐼)푠 (푝퐼)Φ(푝퐻) = +infin

(711 ndash 1)

00

50

100

150

200

250

300

350

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

34 7 Aplicaccedilatildeo dos Modelos Expostos

Todavia ainda haacute um fator de ordem natural que justifica o desvio apresentado para

valores de pH distantes do pI o desnovelamento da cadeia proteacuteica Este fenocircmeno

pode ocorrer de maneira a expor grupos hidroacutefobos resiacuteduos antes natildeo expostos

acrescentando relaccedilotildees de equiliacutebrio quiacutemico natildeo existentes na regiatildeo do pI

alterando o equiliacutebrio de fases e portanto alterando o valor da solubilidade

A Tabela 711 apresenta os valores obtidos para a funccedilatildeo objetivo definida em (7 ndash

1) tanto para o modelo proposto quanto para a abordagem claacutessica para trecircs

diferentes temperaturas

Tabela 711 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada

abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para insulina

suiacutena

T ordmC Abordagem FO

25 P 01857 C 02535

15 P 01981 C 05056

5 P 03595 C 03064

Observando-se a Tabela 711 vecirc-se que o modelo apresentou melhores resultados

do que o caacutelculo efetuado atraveacutes da abordagem claacutessica no que tange a

minimizaccedilatildeo da funccedilatildeo objetivo exceto para os dados a 5 ordmC

Tambeacutem eacute possiacutevel observar que a funccedilatildeo objetivo sofreu aumento com a

diminuiccedilatildeo da temperatura Isto ocorreu principalmente devido agrave dificuldade de

obter dados experimentais de solubilidade a temperaturas baixas o que aumenta o

desvio experimental fazendo com que se tenha um aumento do valor da funccedilatildeo

objetivo como a definida em (5 ndash 1) Um efeito secundaacuterio que tambeacutem pressiona a

35 7 Aplicaccedilatildeo dos Modelos Expostos

funccedilatildeo objetivo eacute o fato dos dados de pKA terem sido obtidos a uma temperatura

especiacutefica o que tende a acrescentar erro no caacutelculo de solubilidades a temperaturas

diferentes ainda que o pKA natildeo varie de forma ab-rupta com a temperatura

Outra observaccedilatildeo que deve ser registrada eacute o fato da funccedilatildeo objetivo para a

abordagem claacutessica na temperatura de 15 ordmC divergir a um valor tatildeo elevado em

relaccedilatildeo aos demais Isto se deve a um ponto experimental especiacutefico a um pH de

45 a solubilidade da insulina suiacutena obtida experimentalmente eacute 230 x 10-5 mol kg-1

enquanto a calculada pelo modelo proposto eacute 230 x 10-5 mol kg-1 e a calculada pela

abordagem claacutessica eacute 520 x 10-5 mol kg-1 Por conta do desvio deste ponto a funccedilatildeo

objetivo para a abordagem claacutessica nesta temperatura tem um aumento significativo

A Tabela 712 apresenta os valores do paracircmetro K da soluccedilatildeo paraboacutelica obtidos

neste trabalho para a insulina suiacutena comparados ao encontrado na literatura

Tabela 712 ndash Valores do paracircmetro K da soluccedilatildeo paraboacutelica para a insulina suiacutena

Referecircncias T ordmC K Fredericq e Neurath (1950) - 081 Neste trabalho 25 104 Neste trabalho 15 101 Neste trabalho 5 145

Pela Tabela 712 pode-se observar que haacute uma diferenccedila pequena entre os

valores do paracircmetro K obtidos neste trabalho e por Fredericq e Neurath (1950) Por

isso natildeo se pode afirmar a que se deve esta diferenccedila se eacute devido a diferenccedilas entre

procedimentos experimentais ou se eacute devido agrave diferenccedila de meacutetodo de caacutelculo do

paracircmetro Apesar de no experimento realizado por Fredericq e Neurath (1950)

haver a presenccedila do acircnion tiocianato e este acircnion interagir com grupos ionizaacuteveis

da cadeia proteacuteica como observado pelos autores do trabalho tambeacutem estes

36 7 Aplicaccedilatildeo dos Modelos Expostos

proacuteprios autores afirmam que a presenccedila deste acircnion natildeo altera a forma da curva

que eacute basicamente determinada pelo paracircmetro K De qualquer modo eacute interessante

observar a proximidade dos valores encontrados neste trabalho com o obtido por

Fredericq e Neurath (1950) pelo menos no que diz respeito agrave ordem de grandeza do

paracircmetro em questatildeo

72 Solubilidade da Lisozima de clara de ovo de galinha

Um modelo para ser validado necessita correlacionar dados experimentais de modo

satisfatoacuterio ou seja um modelo deve buscar fidelidade ao fenocircmeno fiacutesico

observado Assim na procura de dados de solubilidade de proteiacutenas poucos dados

na regiatildeo do pI foram encontrados Este eacute o caso da lisozima de clara de ovo de

galinha que apesar de ter muitos estudos de solubilidade nenhum deles se

encontra na regiatildeo do pI Surgiu assim a necessidade de se obter estes dados

experimentais para poder validar o modelo proposto A escolha da lisozima de clara

de ovo de galinha se deu em parte pela sua importacircncia mas tambeacutem em parte por

ter os valores de pKA conhecidos

A curva de solubilidade da lisozima de clara de ovo de galinha levantada neste

trabalho estaacute apresentada na Figura 721

37 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em

soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e

dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()

Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento

esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH

isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de

soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se

comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto

isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da

soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos

ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente

neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a

solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e

00

10

20

30

40

50

60

70

80

90

100

95 100 105 110 115 120

Solu

bilid

ade

(mg

mL)

pH

38 7 Aplicaccedilatildeo dos Modelos Expostos

alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado

em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo

Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo

a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo

Por conta de falta de dados a este respeito modelou-se apenas a curva de

solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura

722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de

galinha em funccedilatildeo do pH da soluccedilatildeo

Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)

00

10

20

30

40

50

60

70

80

90

96 99 102 105 108 111 114 117 120

Solu

bilid

ade

(mg

mL)

pH

39 7 Aplicaccedilatildeo dos Modelos Expostos

O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721

Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada

abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima

de clara de ovo de galinha

T ordmC Abordagem FO

25 P 4650 C gt7919a

a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado

Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta

aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a

abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca

de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos

anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao

efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de

clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a

variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A

proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de

cargas pontuais de Debye-Huumlckel

8 Conclusotildees

A modelagem termodinacircmica proposta neste trabalho apresentou expressivos

resultados quando comparada a abordagem claacutessica de Debye-Huumlckel

Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o

modelo aproximou melhor os pontos experimentais do que a referida abordagem

comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima

ao ponto isoeleacutetrico

Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica

para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua

construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo

lugar por sua aplicabilidade

Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis

da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva

em regiotildees distantes do ponto isoeleacutetrico

9 Referecircncias Bibliograacuteficas

BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene

Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects

Biophys J 95 1285-1294 2008

FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and

other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72

2684 - 26911950

GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v

93 p 517-542 1931

GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab

Carlsberg v 24 p 185-200 1941

KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native

and mutant insulins pK perturbation of B13-Glu in aggregated species Arch

Biochem Biophys v 283 p 496-502 1990

KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for

the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng

Chem Res v 35 p 4319-4327 1996

42 9 Referecircncias Bibliograacuteficas

KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen

lysozyme J Biochem v 87 p 1215-1219 1980

LADISCH M R Bioseparations Engineering principles practice and

economics John Wiley amp Sons 2001 pp1 116 ndash 117 133

LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab

Carlsberg v 15 p 1-29 1924

PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da

particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas

2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP

PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the

excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte

solutions Fluid Phase Equilib v 269 p 25ndash35 2008

PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-

contribution model involving phase and chemical equilibrium Ind Eng Chem Res

v 33 p 1341-1347 1994

PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277

1973

PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino

acids Fluid Phase Equilib v 152 p 121-132 1998

43 9 Referecircncias Bibliograacuteficas

PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular

Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999

SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of

equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte

solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009

TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J

R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with

carbon dioxide Biotech Bioeng v103 p 909-919 2009

TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer

free energy Biophys J v 95 p 2601-2609 2008

TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in

water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95

2009

Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na

cadeia proteacuteica

Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo

de ionizaccedilatildeo

퐻퐴 퐴 + 퐻

(A ndash 1)

Assim considerando que a constante de equiliacutebrio

퐾 = 푎

(A ndash 2)

Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que

퐾 =[퐴 ][퐻 ]

[퐻퐴]

(A ndash 3)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que

log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]

(A ndash 4)

Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado

por

minus log[휑] = 푝휑

(A ndash 5)

Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que

45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

푝퐾 = log[퐻퐴][퐴 ] + 푝퐻

(A ndash 6)

Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por

훼 =[퐴 ]

[퐻퐴] + [퐴 ]

(A ndash 7)

Reescrevendo (A ndash 7) tem-se que

훼 =[퐴 ] [퐻퐴frasl ]

1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =

훼1 minus 훼

(A ndash 8)

Substituindo (A ndash 8) em (A ndash 6) tem-se que

푝퐾 = log훼

1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10

(A ndash 9)

Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos

훼 =1

1 + 10

(A ndash 10)

Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio

퐴 + 퐻 퐻퐴

(A ndash 11)

Pode se escrever a constante de equiliacutebrio como

퐾 =[퐻퐴 ]

[퐴][퐻 ]

(A ndash 12)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que

46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

log퐾 = minus log[퐴]

[퐻퐴 ] minus log[퐻 ]

(A -13)

Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por

훼 =[퐻퐴 ]

[퐴] + [퐻퐴 ]

(A ndash 14)

Assim a equaccedilatildeo (A ndash 13) fica

훼1 minus 훼 = 10

(A ndash 15)

Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo

훼 =10

1 + 10

(A ndash 16)

Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos

modelos expostos

Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]

48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]

49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)

50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])

51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]

52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])

53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)

54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2

55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO

Agradecimentos

Ao Professor Doutor Pedro de Alcacircntara Pessocirca Filho orientador deste trabalho

que aleacutem de ter sido incansaacutevel no intuito de me levar a compreender os

fundamentos baacutesicos para o desenvolvimento deste projeto tem me ensinado o que

eacute ciecircncia e como se daacute a sua aplicaccedilatildeo em Engenharia Quiacutemica

Aos amigos e colegas do Laboratoacuterio de Engenharia Bioquiacutemica da Escola

Politeacutecnica pelo carinho e pela acolhida Em especial a doutoranda Kelly Cristina

Nascimento Alves por toda a gentileza e auxiacutelio na obtenccedilatildeo dos dados

experimentais

E a Fundaccedilatildeo de Amparo agrave Pesquisa do Estado de Satildeo Paulo ndash FAPESP ndash que me

concedeu uma bolsa de iniciaccedilatildeo cientiacutefica sem a qual seria inviaacutevel levar a diante

este trabalho

ii

RESUMO

Neste trabalho eacute apresentado um modelo para a curva de solubilidade de proteiacutenas

em soluccedilatildeo aquosa em funccedilatildeo do pH da soluccedilatildeo baseado em ferramentas da

termodinacircmica claacutessica e considerando os diferentes estados de ionizaccedilatildeo que

moleacuteculas proteacuteicas podem assumir Tambeacutem foi estudada a modelagem descrita

por Groumlnwall em seu artigo publicado no iniacutecio da deacutecada de 1940 e deste estudo

resultou uma extensatildeo agrave sua teoria que se provou ser idecircntica agrave modelagem

proposta inicialmente Para efeito de comparaccedilatildeo foram modeladas curvas de

solubilidade utilizando o modelo de atividade estendido de Debye-Huumlckel para

soluccedilotildees eletroliacuteticas

Foram obtidos dados experimentais da solubilidade da lisozima de clara de ovo de

galinha para alguns valores de pH na regiatildeo do ponto isoeleacutetrico Tanto para a

insulina suiacutena como para lisozima de clara de ovo de galinha o modelo

desenvolvido descreveu com grande precisatildeo o fenocircmeno observado

experimentalmente A aplicaccedilatildeo do modelo permite concluir que a utilizaccedilatildeo de

caacutelculos de estados de ionizaccedilatildeo eacute uma ferramenta eficaz na modelagem

termodinacircmica de soluccedilotildees proteacuteicas

iii

ABSTRACT

In this work it is presented a model for the protein solubility curve in aqueous

solutions as a function of the solution pH based on classical thermodynamic tools

and considering the different ionization states that protein molecules may assume It

was also studied the model described by Groumlnwall in his article published in the early

1940rsquos and from this study it was developed an extension of his theory which as

proved in this work is identical to the initially proposed modeling For comparison

solubility curves were modeled using the Debye-Huumlckel extended activity model for

electrolytic solutions

It was obtained experimental hen egg white lysozyme solubility data for some pH

values in the region of the isoelectric point So much for porcine insulin as for the hen

egg white lysozyme the developed model describes with high accuracy the

phenomenon experimentally observed The model application allows us to conclude

that the utilization of the ionization states calculus is an effective tool in the

thermodynamic modeling of protein solutions

Sumaacuterio

1 Introduccedilatildeo 1

2 Materiais e Meacutetodos 7

21 Meacutetodos computacionais 7

22 Curva de solubilidade da lisozima da clara de ovo de galinha 9

221 Reagentes 9

222 Equipamentos 9

223 Preparaccedilatildeo das soluccedilotildees-tampatildeo 9

224 Procedimento experimental 10

3 Modelo Estendido de Debye-Huumlckel 11

31 Introduccedilatildeo 11

32 Desenvolvimento teoacuterico 12

4 Modelagem Termodinacircmica Proposta 16

41 Introduccedilatildeo 16

42 Caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras 18

5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall 21

51 Introduccedilatildeo 21

52 Desenvolvimento teoacuterico 21

53 Soluccedilatildeo Paraboacutelica da Curva de Solubilidade 26

6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall 28

7 Aplicaccedilatildeo dos Modelos Expostos 31

71 Solubilidade da Insulina Suiacutena 31

72 Solubilidade da Lisozima de clara de ovo de galinha 36

8 Conclusotildees 40

9 Referecircncias Bibliograacuteficas 41

Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach 44

Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos 47

1 Introduccedilatildeo

Dentre as etapas de um processo biotecnoloacutegico aquela dedicada a purificaccedilatildeo de

bioprodutos tende a ser determinante em geral para o custo do processo seguindo

a tendecircncia dos processos de separaccedilatildeo da induacutestria quiacutemica tradicional A

produccedilatildeo de proteiacutenas tem lugar de destaque no rol de bioprodutos de interesse

pois muitos antibioacuteticos hormocircnios e enzimas pertencem a esta classe de

biomoleacuteculas e possuem notoacuterio interesse industrial por suas propriedades

terapecircuticas e aplicaccedilotildees na induacutestria alimentiacutecia No entanto proteiacutenas a serem

comercializadas para estes fins exigem altos graus de pureza que somente satildeo

obtidos pelas etapas de purificaccedilatildeo Como afirmado por Bončina et al (2008)

estudos de separaccedilatildeo de proteiacutenas especificamente tecircm sido motivados por um

aumento da demanda por proteiacutenas puras nas induacutestrias farmacecircutica e correlatas

Muitas moleacuteculas bioloacutegicas ndash ou comumente chamadas biomoleacuteculas - e

particularmente proteiacutenas satildeo destruiacutedas pelo calor natildeo podem ser destiladas satildeo

geradas a baixas concentraccedilotildees e tecircm uma estrutura tridimensional que pode ser

alterada durante a purificaccedilatildeo resultando na perda da atividade bioloacutegica Por isso

bioprodutos tais como proteiacutenas devem ser recuperados purificados e

concentrados em operaccedilotildees com membranas etapas de adsorccedilatildeo cromatografia

cristalizaccedilatildeo e outras teacutecnicas que natildeo requerem calor ou pH extremo para alcanccedilar

o fracionamento (Ladisch 2001)

Em geral nos processos biotecnoloacutegicos as correntes de saiacuteda dos biorreatores

seguem para as operaccedilotildees de downstream (etapas de separaccedilatildeo que visam

concentrar e dispor o produto final) As primeiras operaccedilotildees de downstream por

exemplo a clarificaccedilatildeo e a centrifugaccedilatildeo tecircm por objetivo isolar a proteiacutena de

2 1 Introduccedilatildeo

interesse das ceacutelulas que a produziram Apoacutes estas primeiras etapas de purificaccedilatildeo

seguem-se as operaccedilotildees de baixa resoluccedilatildeo A precipitaccedilatildeo e a extraccedilatildeo em

sistemas de duas fases aquosas satildeo exemplos destas operaccedilotildees que tendem a

concentrar a proteiacutena-alvo preparando-a para os proacuteximos estaacutegios de separaccedilatildeo

Por fim a proteiacutena ora na concentraccedilatildeo obtida pelas operaccedilotildees anteriores eacute tratada

por operaccedilotildees de alta resoluccedilatildeo caracterizadas principalmente pela teacutecnica de

cromatografia a fim de concentrar a proteiacutena agrave pureza especificada para seu uso

Vale ressaltar que esta uacuteltima etapa eacute extremamente dispendiosa e quanto mais

eficientes forem as etapas precedentes no que tange a pureza da proteiacutena-alvo

menos custosa seraacute a etapa posterior

O escopo deste trabalho estaacute centrado na operaccedilatildeo de precipitaccedilatildeo de proteiacutenas

cujos fundamentos satildeo as relaccedilotildees do equiliacutebrio soacutelido-liacutequido (ESL) destes

sistemas A solubilidade de uma proteiacutena em soluccedilatildeo eacute governada pelos mesmos

princiacutepios fundamentais ou seja condiccedilotildees de equiliacutebrio termodinacircmico que regem

o comportamento de qualquer substacircncia no ESL Contudo algumas diferenccedilas

devem ser levadas em conta na descriccedilatildeo deste fenocircmeno e no projeto destas

operaccedilotildees

Proteiacutenas satildeo formadas por cadeias de aminoaacutecidos atraveacutes de ligaccedilotildees peptiacutedicas

cada aminoaacutecido pode ser considerado um monocircmero que ao possuir um grupo

ionizaacutevel natildeo ligado tal como ocorre em alguns aminoaacutecidos naturais tirosina (Tyr)

lisina (Lys) cisteiacutena (Cys) histidina (His) arginina (Arg) aacutecido aspaacutertico (Asp) e

aacutecido glutacircmico (Glu) e tambeacutem em resiacuteduos terminais confere a proteiacutena uma

caracteriacutestica de polieletroacutelito Eacute importante entatildeo considerar a definiccedilatildeo de

polieletroacutelitos tal qual definida por Pessocirca Filho e Maurer (2008) polieletroacutelitos satildeo

3 1 Introduccedilatildeo

poliacutemeros com muitas unidades monomeacutericas eletroliacuteticas ndash neste caso

aminoaacutecidos que possuem grupos ionizaacuteveis natildeo ligados

Para muitos processos industriais e mesmo naturais informaccedilotildees a respeito de

equiliacutebrios de fases de soluccedilotildees eletroliacuteticas satildeo necessaacuterias e necessaacuterias tambeacutem

satildeo modificaccedilotildees nos modelos tradicionais de coeficiente de atividade quando se

trata de descrever equiliacutebrios de fases em sistemas que conteacutem eletroacutelitos (Prausnitz

et al 1999)

Sendo assim tendo que a pressatildeo do sistema natildeo influencia de modo significativo o

ESL tem-se que trecircs variaacuteveis o influenciam diretamente a temperatura o pH e a

forccedila iocircnica estas duas uacuteltimas tornam-se importantes devido agrave caracteriacutestica

eletroliacutetica das proteiacutenas

Na verdade a forccedila iocircnica natildeo eacute uma variaacutevel que represente de modo abrangente

os possiacuteveis efeitos de iacuteons em soluccedilotildees proteacuteicas Isto se deve ao fato de que a

forccedila iocircnica do modo como eacute definida natildeo contempla uma diferenciaccedilatildeo entre os

equiliacutebrios que se estabelecem entre os iacuteons e alguns resiacuteduos ionizaacuteveis da cadeia

proteacuteica De fato a variaccedilatildeo da forccedila iocircnica de uma soluccedilatildeo proteacuteica altera o valor

da solubilidade da proteiacutena em soluccedilatildeo mas natildeo da mesma forma para qualquer

espeacutecie de iacuteon Portanto seria mais prudente acrescer ao conjunto de variaacuteveis que

influenciam o ESL a espeacutecie quiacutemica dos iacuteons presentes em soluccedilatildeo

O objetivo deste trabalho eacute estabelecer um modelo capaz de prever a influecircncia do

pH no ESL de proteiacutenas mantendo-se temperatura e forccedila iocircnica constantes

Sabe-se por observaccedilotildees experimentais que a variaccedilatildeo do pH de um sistema altera

o valor da solubilidade de proteiacutenas em soluccedilatildeo e a solubilidade de proteiacutenas por

sua vez atinge seu valor miacutenimo em um pH denominado ponto isoeleacutetrico (pI) no

qual a carga liacutequida da proteiacutena eacute nula

4 1 Introduccedilatildeo

Os primeiros trabalhos relacionados agrave modelagem da curva de solubilidade de

proteiacutenas em funccedilatildeo do pH datam do iniacutecio do seacuteculo XX Green (1931) propocircs um

modelo para a curva de solubilidade da carboxihemoglobina equumlina considerando

que esta proteiacutena se comportaria tanto como um aacutecido bivalente quanto uma base

bivalente Jaacute Groumlnwall (1941) atribuiu a Linderstroslashm-Lang o desenvolvimento de um

modelo capaz de predizer a curva de solubilidade a partir da integraccedilatildeo do perfil de

carga da proteiacutena Este trabalho de Groumlnwall apesar de esquecido pelo tempo eacute de

extrema importacircncia e relevacircncia tanto para o trabalho aqui apresentado quanto e

aqui um motivo muito mais nobre para o desenvolvimento de modelos a partir das

ferramentas da termodinacircmica claacutessica Quando da exposiccedilatildeo da modelagem aqui

tratada retornar-se-aacute a este trabalho que muito contribuiu ao entendimento do

fenocircmeno estudado

Eacute digno de nota o trabalho de Fredericq e Neurath (1950) no qual uma proposta de

equacionamento para uma correlaccedilatildeo semi-empiacuterica da curva de solubilidade de

insulina eacute apresentada Natildeo haacute de fato algo novo em relaccedilatildeo agrave modelagem do

efeito do pH na curva de solubilidade neste trabalho no entanto apesar de natildeo

haver qualquer menccedilatildeo ou referecircncia quanto agrave origem da equaccedilatildeo proposta nota-se

que eacute uma aplicaccedilatildeo direta da equaccedilatildeo descrita por Groumlnwall (1941) Haacute uma

hipoacutetese impliacutecita no trabalho de que o perfil de carga liacutequida da insulina seja linear

na regiatildeo do ponto isoeleacutetrico o que eacute bastante plausiacutevel para muitas proteiacutenas

Assim pela integraccedilatildeo da equaccedilatildeo diferencial proposta por Groumlwall (1941) uma

correlaccedilatildeo semi-empiacuterica quadraacutetica eacute obtida Reforccedila-se o uso da expressatildeo semi-

empiacuterica devido agrave natureza dual da equaccedilatildeo em parte advinda de um

desenvolvimento teoacuterico descrito por Groumlnwall (1941) e atribuiacutedo a Linderstroslashm-

Lang e em parte pela necessidade de se obter paracircmetros a partir de um ajuste de

5 1 Introduccedilatildeo

um conjunto de dados experimentais Vale observar que resultados expressivos

foram alcanccedilados neste trabalho de modo particular o fato de que a presenccedila do

acircnion tiocianato natildeo altera a forma da curva de solubilidade da insulina mas a

desloca em direccedilatildeo a menores valores de pH e de solubilidade

Contudo os trabalhos mais recentes se concentraram na modelagem da curva de

solubilidade de aminoaacutecidos em funccedilatildeo do pH dando maior enfoque aos modelos

termodinacircmicos para soluccedilotildees natildeo-ideais tanto atraveacutes de equaccedilotildees de estado

como de modelos de energia livre de Gibbs excedente

Destaca-se neste grupo o trabalho de Pinho et al (1994) que aplicaram o modelo

UNIFAC associado ao termo de Debye-Huumlckel para aminoaacutecidos como glicina D-

alanina L-serina e DL-valina Tambeacutem o trabalho de Khoshkbarchi e Vera (1996)

no qual foi desenvolvido um modelo simplificado de esfera riacutegida perturbada para

calcular o coeficiente de atividade de aminoaacutecidos e de peptiacutedeos permite prever a

curva de solubilidade destes em funccedilatildeo do pH Jaacute o modelo NRTL foi aplicado tanto

por Pradhan e Vera (1998) quanto Tseng et al (2009) para aminoaacutecidos Jaacute Seyfi et

al (2009) aplicaram a equaccedilatildeo de estado SAFT para a prediccedilatildeo da curva de

solubilidade da DL-metionina

Entretanto o primeiro trabalho dedicado exclusivamente agrave modelagem e prediccedilatildeo da

curva de solubilidade de proteiacutena propriamente dita em funccedilatildeo do pH foi publicado

por Tjong e Zhou (2008) Neste trabalho a solubilidade foi calculada a partir da

energia livre de transferecircncia da fase soacutelida para a fase liacutequida Para a execuccedilatildeo

deste caacutelculo a energia livre de transferecircncia foi dividida em duas contribuiccedilotildees

uma de natureza eletrostaacutetica calculada pela meacutedia de 100 conformaccedilotildees proteacuteicas

advindas da aplicaccedilatildeo de dinacircmica molecular a pH constante e outra de natureza

natildeo-eletrostaacutetica baseada na aacuterea superficial acessiacutevel ao solvente Poreacutem o

6 1 Introduccedilatildeo

esforccedilo computacional requerido pelo modelo por eles proposto para calcular

apenas alguns pontos da curva natildeo apresenta uma aplicabilidade razoaacutevel Aleacutem

deste trabalho Tashima et al (2009) propuseram uma modelagem termodinacircmica

para prever a curva de solubilidade especificamente da insulina suiacutena aplicando o

modelo de Pitzer truncado apoacutes o segundo coeficiente do virial

No presente trabalho propomos um novo modelo baseado no caacutelculo de estados de

ionizaccedilatildeo e em ferramentas de termodinacircmica claacutessica bem como uma extensatildeo agrave

teoria de Linderstroslashm-Lang e Groumlnwall Vale ressaltar de antematildeo que tanto este

novo modelo proposto quanto a extensatildeo desenvolvida resultam na mesma equaccedilatildeo

para o fenocircmeno apesar das distintas abordagens

2 Materiais e Meacutetodos

21 Meacutetodos computacionais

O coacutedigo-fonte do programa em linguagem C estaacute apresentado no Apecircndice B Os

meacutetodos numeacutericos utilizados se resumem a interpolaccedilatildeo linear o meacutetodo de

Newton-Raphson cujo uso seraacute apresentado na proacutexima seccedilatildeo quando se deduziraacute

o algoritmo do modelo de Debye-Huumlckel e o meacutetodo de busca unidirecional de

miacutenimos de funccedilatildeo pela Seccedilatildeo Aacuteurea

As Tabelas 211 e 212 apresentam os resiacuteduos considerados para cada proteiacutena

considerada bem como os seus valores de pKA que foram obtidos a partir da

literatura e satildeo indispensaacuteveis para execuccedilatildeo dos caacutelculos mais rigorosos

Tabela 211 ndash Resiacuteduos ionizaacuteveis considerados e valores de pKA da insulina suiacutena

Valores extraiacutedos de Kaarsholm et al (1990)

Aminoaacutecido Grupo Ionizaacutevel pKA

A1 ndash Gly -NH2 738 A4 ndash Glu -COOH 437 A14 ndash Tyr Fenol-OH 1020 A17 ndash Glu -COOH 437 A19 ndash Tyr Fenol-OH 1020 A21 ndash Asn -COOH 345

B1 ndash Phe -NH2 738 B5 ndash His Imidazol-NH 598 B10 ndash His Imidazol-NH 598 B 13 ndash Glu -COOH 437 B16 ndash Tyr Fenol-OH 1020 B21 ndash Glu -COOH 437

B22 ndash Arg Guaniacutedio-NH2 1110 B26 ndash Tyr Fenol-OH 1020

B29 ndash Lys -NH2 852 B30 ndashAla -COOH 345

8 2 Materiais e Meacutetodos

Tabela 212 ndash Resiacuteduos ionizaacuteveis considerados e valores de pKA a 25 ordmC da lisozima

de clara de ovo de galinha Valores extraiacutedos de Kuramitsu e Hamaguchi (1980)

Aminoaacutecido Grupo Ionizaacutevel pKA α-NH2 α-NH2 79

Lys1 ε-NH2 108

Arg5 Guaniacutedio-NH2 120 Glu7 -COOH 26

Lys13 ε-NH2 105

Arg14 Guaniacutedio-NH2 120 His15 Imidazol-NH 58 Asp18 -COOH 20 Tyr20 Fenol-OH 103

Arg21 Guaniacutedio-NH2 120 Tyr23 Fenol-OH 98

Lys33 ε-NH2 106 Glu35 -COOH 61

Arg45 Guaniacutedio-NH2 120 Asp48 -COOH 43 Asp52 -COOH 34 Tyr53 Fenol-OH 121

Arg61 Guaniacutedio-NH2 120 Asp66 -COOH 16

Arg68 Guaniacutedio-NH2 120

Arg73 Guaniacutedio-NH2 120 Asp87 -COOH 21

Lys96 ε-NH2 108

Lys97 ε-NH2 103 Asp101 -COOH 45

Arg112 Guaniacutedio-NH2 120

Arg114 Guaniacutedio-NH2 120

Lys116 ε-NH2 104 Asp119 -COOH 25

Arg125 Guaniacutedio-NH2 120

Arg128 Guaniacutedio-NH2 120 α-COOH α-COOH 31

9 2 Materiais e Meacutetodos

22 Curva de solubilidade da lisozima da clara de ovo de galinha

221 Reagentes

Neste experimento de determinaccedilatildeo da curva de solubilidade da lisozima da clara de

ovo de galinha os reagentes utilizados foram cloreto de soacutedio (Reatec P A)

bicarbonato de soacutedio (Research Becto Chemical P A) Na2HPO4 7H2O (Reagen

P A) aacutegua destilada deionizada Milli-Q (Millipore) e lisozima de clara de ovo de

galinha (Sigma min 99)

222 Equipamentos

Neste experimento os equipamentos utilizados foram espectrofotocircmetro UV-Visiacutevel

(Beckman DU-530) centriacutefuga (Eppendorf) banho-teacutermico (Laacutectea) com controlador

de temperatura (Julabo) pHmetro (Micronal) e balanccedila (Mettler Toledo AB204S)

223 Preparaccedilatildeo das soluccedilotildees-tampatildeo

Foram preparadas soluccedilotildees-tampatildeo com valores de pH=96 pH = 98 pH = 100

pH = 102 pH = 104 pH = 106 pH = 108 pH = 110 pH = 112 pH = 114 pH =

116 e pH = 118 a partir de quatro soluccedilotildees uma de hidroacutexido de soacutedio 01 M uma

de cloreto de soacutedio 1 M (para equalizar a forccedila iocircnica) uma de bicarbonato de soacutedio

005 M e outra de Na2HPO4 005 M

A Tabela 2231 apresenta os valores de volume usados no preparo de cada uma

das soluccedilotildees-tampatildeo

10 2 Materiais e Meacutetodos

Tabela 2231 ndash Volumes de hidroacutexido de soacutedio a 01 M adicionados no preparo das

soluccedilotildees-tampatildeo

Tampatildeo pH V NaOH mL

NaHCO3 96 100 005 M 98 152

(para cada soluccedilatildeo-tampatildeo 100 mL 100 214

desta soluccedilatildeo foram adicionados) 102 276

104 330 106 382

108 424

110 454

112 530 114 583

Na2HPO4 110 82

005 M 112 126

(para cada soluccedilatildeo-tampatildeo 100 mL 114 182 desta soluccedilatildeo foram adicionados) 116 270

118 388

224 Procedimento experimental

Foram adicionadas quantidades natildeo definidas de lisozima de clara de ovo de galinha

a 13 mL de cada soluccedilatildeo-tampatildeo em tubos Eppendorf de 2 mL Colocaram-se

entatildeo as amostras apoacutes agitaccedilatildeo vigorosa em banho teacutermico a 250 plusmn 01 ordmC por 24

horas para que os sistemas atingissem o equiliacutebrio termodinacircmico Caso natildeo

houvesse a formaccedilatildeo de precipitado lisozima era adicionada e o procedimento

repetido Ao se observar a formaccedilatildeo de precipitado o sistema era centrifugado a

13000 rpm por 15 minutos Uma aliacutequota do sobrenadante era retirada e sua

concentraccedilatildeo proteacuteica determinada por medida de absorbacircncia a 280 nm Cada

sistema foi feito ao menos em duplicata

3 Modelo Estendido de Debye-Huumlckel

31 Introduccedilatildeo

De fato como descrito por Pessocirca Filho (2002) a equaccedilatildeo de Debye-Huumlckel natildeo

deve ser aplicada agrave modelagem de polieletroacutelitos tais como proteiacutenas porque nestas

moleacuteculas as cargas satildeo distribuiacutedas ao longo da cadeia e portanto natildeo satildeo cargas

pontuais como suposto por Debye-Huumlckel

Contudo nesta modelagem considera-se uma regiatildeo de pH em torno do ponto

isoeleacutetrico (pI) na qual satildeo inerentes duas condiccedilotildees favoraacuteveis a aplicaccedilatildeo da

equaccedilatildeo de Debye-Huumlckel carga liacutequida proacutexima a zero pois Z(pI) = 0 e regiatildeo de

miacutenima solubilidade que significa baixas concentraccedilotildees de proteiacutenas em soluccedilatildeo

Isto significa em primeiro lugar que os efeitos da carga tais como ldquodesnovelamentordquo

da cadeia proteacuteica com exposiccedilatildeo de resiacuteduos outrora blindados podem ser

desprezados em uma regiatildeo proacutexima ao ponto isoeleacutetrico e em segundo lugar

baixas concentraccedilotildees de proteiacutena em soluccedilatildeo significam que os termos de curto

alcance podem ser desprezados e portanto haacute prevalecircncia do termo de longo

alcance que no caso de soluccedilotildees eletroliacuteticas pode ser descrito por uma equaccedilatildeo

estendida de Debye-Huumlckel

Assim o modelo de Debye-Huumlckel foi utilizado natildeo para verificar sua aplicabilidade agrave

modelagem de soluccedilotildees proteacuteicas mas sim para confrontar o modelo proposto com

um modelo usual em modelagem de soluccedilotildees eletroliacuteticas e seraacute referido no texto

sempre como abordagem claacutessica

12 3 Modelo Estendido de Debye-Huumlckel

32 Desenvolvimento teoacuterico

Pode-se escrever a atividade da proteiacutena como o produto entre a solubilidade e o

coeficiente de atividade da mesma como mostrado na equaccedilatildeo (32 - 1)

푎 = 훾푠

(32 - 1)

Na qual pode-se calcular o coeficiente de atividade atraveacutes da equaccedilatildeo estendida

de Debye-Huumlckel (Pitzer 1973)

ln 훾 = minus퐴 푍radic퐼

1 + 푏radic퐼+

2푏

ln 1 + 푏radic퐼

(32 - 2)

Sendo que a constante universal empiacuterica b = 12 kg12 mol-12 eacute usada para todos os

eletroacutelitos Jaacute AΦ eacute o paracircmetro de Debye-Huumlckel para o coeficiente osmoacutetico e eacute

dado por

퐴 =13

(2휋푁 휌 ) frasl 푒4휋휀 휀 푘푇

frasl

(32 - 3)

Em que NA eacute a constante de Avogadro ρs eacute a densidade do solvente em g cm-3 e eacute

a carga eletrocircnica (e = 160218 x 10-19 C) ε0 eacute a permissividade do espaccedilo livre (ε0 =

885419 x 10-12 C2 N-1 m-2) εr eacute a constante dieleacutetrica do solvente k aacute constante de

Boltzmann e T eacute a temperatura absoluta Jaacute a carga liacutequida em funccedilatildeo do pH pode

ser calculada como

푍 = 훼 minus 훼

(32 - 4)

Sendo que α+ e α- satildeo dados pelas equaccedilotildees (A - 10) e (A - 16) do Apecircndice A

13 3 Modelo Estendido de Debye-Huumlckel

E a forccedila iocircnica eacute dada pela equaccedilatildeo (32 - 5) descrita abaixo

퐼 = 12

푚 푍

(32 - 5)

Contudo no ponto isoeleacutetrico a carga meacutedia da proteiacutena eacute nula portanto o termo de

Debye-Huumlckel se anula e o coeficiente de atividade se torna unitaacuterio

ln푎 (푝퐼) = ln 푠 (푝퐼)

(32 - 6)

Considerando que a atividade da proteiacutena seja constante com a variaccedilatildeo de pH isto

implica que esta eacute sempre igual agrave solubilidade da proteiacutena no ponto isoeleacutetrico e

portanto vale que

ln푎 (푝퐻) = ln 푠 (푝퐻) + ln 훾(푝퐻) = ln 푠 (푝퐼)

(32 - 7)

Assim

ln 푠 (푝퐻) = ln 푠 (푝퐼) + 퐴휙푍푝퐻2 radic퐼1 + 푏radic퐼

+2푏

ln 1 + 푏radic퐼

(32 - 8)

Esta equaccedilatildeo prevecirc a curva de solubilidade em funccedilatildeo do pH atraveacutes do caacutelculo da

atividade da proteiacutena na fase liacutequida pela equaccedilatildeo estendida de Debye-Huumlckel Para

resolvecirc-la eacute necessaacuterio se utilizar de um meacutetodo numeacuterico pois a forccedila iocircnica

depende da solubilidade naquele pH Optou-se neste trabalho pelo Meacutetodo de

Newton-Raphson para executar o meacutetodo iterativo que eacute exigido pela equaccedilatildeo (32

ndash 8) Para aplicar este meacutetodo arbitrou-se uma funccedilatildeo f(sp) definida aqui como

푓 푠 = minus ln 푠 (푝퐻) + ln 푠 (푝퐼) + 퐴휙푍푝퐻2 radic퐼

1 + 푏radic퐼+

2푏

ln 1 + 푏radic퐼

(32 - 9)

14 3 Modelo Estendido de Debye-Huumlckel

Assim ao calcular o sp que zera esta funccedilatildeo f(sp) saber-se-aacute que eacute a proacutepria

solubilidade que se deseja calcular Para aplicar o Meacutetodo de Newton-Raphson

basta derivar a funccedilatildeo f(sp) e aplicar o seguinte algoritmo de resoluccedilatildeo

푠 = 푠 minus푓(푠 )푓 (푠 )

(32 - 10)

Para calcular frsquo(s) deve-se considerar que a forccedila iocircnica depende da solubilidade

Para isto observando a equaccedilatildeo (32 - 5) vecirc-se que a forccedila iocircnica eacute dada pelo

somatoacuterio das contribuiccedilotildees de todos os iacuteons presentes na soluccedilatildeo por isso aqui

cabe um artifiacutecio de dividir estas contribuiccedilotildees em duas macro-contribuiccedilotildees aquela

devida a todos os iacuteons presentes na soluccedilatildeo exclusive os grupos ionizaacuteveis

presentes nas moleacuteculas da proteiacutena em questatildeo (I0) e que se considera constante

com o pH e aquela que engloba apenas os grupos ionizaacuteveis presentes nas

moleacuteculas da proteiacutena (IP)

퐼 = 퐼 + 퐼 = 퐼 +12푍 푠

(32 - 11)

Considerando a funccedilatildeo w tal que

푤 = radic퐼 = 퐼 +12푍 푠

(32 - 12)

Sendo

푤 =14푍 퐼

(32 - 13)

Entatildeo aplicando-se as devidas regras de derivaccedilatildeo tem-se

15 3 Modelo Estendido de Debye-Huumlckel

푓 (푠 ) = minus1푠 + 퐴 푍

3푤 + 2푤 푏푤(1 + 푏푤)

(32 - 14)

Substituindo as equaccedilotildees (32 - 12) e (32 - 13) na equaccedilatildeo (32 - 14) tem-se que

푓 (푠 ) = minus1푠 + 퐴 푍

15 + 푏radic퐼2radic퐼(1 + 푏radic퐼)

(32 - 15)

Entatildeo o algoritmo deve ser

푠 = 푠 minus

⎜⎛ln 푠 (푝퐼)

푠 + 퐴휙푍푝퐻2 radic퐼

1 + 푏radic퐼+ 2푏 ln 1 + 푏radic퐼

minus 1푠 + 퐴휙푍

15 + 푏radic퐼2radic퐼(1 + 푏radic퐼) ⎠

⎟⎞

(32 - 16)

4 Modelagem Termodinacircmica Proposta

41 Introduccedilatildeo

A condiccedilatildeo de equiliacutebrio entre duas fases (α e β) com m componentes eacute dada por

(Prausnitz et al 1999)

푝 = 푝

(41 ndash 1)

푇 = 푇

(41 ndash 2)

휇 = 휇⋮

휇 = 휇

(41 ndash 3)

Considerando o equiliacutebrio soacutelido-liacutequido (ESL) de sistemas contendo proteiacutenas

sendo que os efeitos da pressatildeo podem ser desprezados que as temperaturas nas

duas fases satildeo iguais e que na fase soacutelida soacute haacute proteiacutena tem-se que para a

proteiacutena a relaccedilatildeo de equiliacutebrio pode ser descrita por

휇 (푇푥) = 휇 (푇)

(41 ndash 4)

Contudo adotando-se a lei de Henry que eacute vaacutelida para baixas concentraccedilotildees de

soluto hipoacutetese que natildeo eacute distante dos valores observados da solubilidade de

proteiacutenas pode se escrever o potencial quiacutemico na fase liacutequida por

휇 (푇푥) = 휇 (푇 푥 ) + 푅푇푙푛푥

(41 ndash 5)

17 4 Modelagem Termodinacircmica Proposta

Entretanto variaccedilotildees de pH natildeo alteram o potencial quiacutemico da fase soacutelida o que

resulta pela relaccedilatildeo (41 ndash 4) que o mesmo natildeo altera tambeacutem o potencial quiacutemico

da fase liacutequida Com isso pela relaccedilatildeo (41 ndash 5) sendo o potencial quiacutemico de

referecircncia constante com o pH uma contradiccedilatildeo emerge a variaccedilatildeo do pH natildeo

poderia alterar o valor da solubilidade poreacutem a observaccedilatildeo experimental mostra o

contraacuterio Assim deve-se lembrar que pelo princiacutepio da eletroneutralidade a fase

soacutelida soacute possui moleacuteculas proteacuteicas eletricamente neutras e portanto o equiliacutebrio

de fases deve se estabelecer apenas entre as moleacuteculas presentes na fase soacutelida e

as moleacuteculas eletricamente neutras em soluccedilatildeo Ou seja como soacute moleacuteculas

eletricamente neutras podem estar na fase soacutelida o equiliacutebrio de fases depende

exclusivamente da fraccedilatildeo de moleacuteculas eletricamente neutras em soluccedilatildeo pois soacute

estas podem precipitar Assim tanto a equaccedilatildeo (41 ndash 4) quanto a equaccedilatildeo (41 ndash

5) devem ser aplicadas natildeo ao conjunto de todas as moleacuteculas de proteiacutena em

soluccedilatildeo mas somente as moleacuteculas proteacuteicas eletricamente neutras Portanto a

concentraccedilatildeo das moleacuteculas de proteiacutena eletricamente neutras em soluccedilatildeo eacute

constante com o pH e pode ser interpretada como a multiplicaccedilatildeo da fraccedilatildeo de

moleacuteculas eletricamente neutras pela concentraccedilatildeo total de proteiacutenas que eacute a

proacutepria solubilidade Assim uma relaccedilatildeo de inversa proporcionalidade eacute definida

quanto maior a fraccedilatildeo de moleacuteculas neutras menor seraacute a solubilidade de uma

proteiacutena em soluccedilatildeo Portanto no ponto isoeleacutetrico no qual haacute o miacutenimo de

solubilidade tem-se o ponto maacuteximo de fraccedilatildeo de moleacuteculas eletricamente neutras

A partir disto eacute possiacutevel escrever a equaccedilatildeo que rege o comportamento da

solubilidade de uma proteiacutena em funccedilatildeo do pH da soluccedilatildeo

휙(푝퐻)푆 (푝퐻) = 휆 = 푐표푛푠푡푎푛푡푒

(41 ndash 6)

18 4 Modelagem Termodinacircmica Proposta

Na equaccedilatildeo (41 ndash 6) o paracircmetro λ pode ser um paracircmetro de ajuste do modelo a

um conjunto de valores experimentais tendo se estabelecido uma funccedilatildeo objetivo ou

ainda dado pelo produto entre a solubilidade no ponto isoeleacutetrico e a fraccedilatildeo de

moleacuteculas eletricamente neutras em soluccedilatildeo tambeacutem no pI neste caso vale a

seguinte equaccedilatildeo

푠 (푝퐻) =휙(푝퐼)푠 (푝퐼)휙(푝퐻)

(41 ndash 7)

Sendo a equaccedilatildeo do modelo ndash equaccedilatildeo (41 ndash 7) ndash extremamente simples a uacutenica

dificuldade reside no caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras

(휙(푝퐻))

42 Caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras

Dentre os aminoaacutecidos que formam atraveacutes de ligaccedilotildees peptiacutedicas as proteiacutenas haacute

aqueles que possuem resiacuteduos com grupos ionizaacuteveis aleacutem dos grupos amina e

aacutecido carboxiacutelico terminais na cadeia Todos estes participam de equiliacutebrios

quiacutemicos com iacuteons H+ presentes na soluccedilatildeo entatildeo ao se alterar o pH da soluccedilatildeo

estes equiliacutebrios satildeo alterados

Assim haacute vaacuterias possibilidades de combinaccedilotildees de estados ionizados destes grupos

ionizaacuteveis que resultam em uma moleacutecula de proteiacutena eletricamente neutra Eacute

importante notar que dada a fraccedilatildeo de uma configuraccedilatildeo de uma moleacutecula neutra

todas as outras fraccedilotildees de configuraccedilotildees possiacuteveis que tambeacutem resultem em

moleacuteculas neutras satildeo proporcionais agrave fraccedilatildeo da configuraccedilatildeo dada pois todas as

configuraccedilotildees participam de equiliacutebrios entre si

19 4 Modelagem Termodinacircmica Proposta

Desta observaccedilatildeo implica-se que basta identificar uma configuraccedilatildeo proteacuteica cuja

soma dos estados ionizados resulte em carga nula para se descrever o equiliacutebrio de

fases em relaccedilatildeo ao pH na regiatildeo do ponto isoeleacutetrico onde esta consideraccedilatildeo eacute

predominante em relaccedilatildeo a outros possiacuteveis fenocircmenos

Contudo eacute necessaacuterio contabilizar a contribuiccedilatildeo de cada grupo ionizaacutevel via

equaccedilatildeo de Henderson-Hasselbach equaccedilatildeo (42 ndash 1)

훼 (푝퐻) =

⎩⎪⎨

⎪⎧ 10

1 + 10 푠푒 휈 = minus1

11 + 10

푠푒 휈 = +1

(42 ndash 1)

Na qual pKAj eacute o co-logaritmo da constante de equiliacutebrio do grupo ionizaacutevel do

resiacuteduo j j eacute estado carregado potencial do resiacuteduo j (-1 para grupos aacutecidos e +1

para grupos baacutesicos) e j eacute a fraccedilatildeo ionizada para o pH dado Para grupos cujo

estado de ionizaccedilatildeo na dada configuraccedilatildeo seja neutro a sua fraccedilatildeo eacute calculada tal

que a soma de sua fraccedilatildeo e da fraccedilatildeo ionizada tenha como resultado o valor

unitaacuterio

Assim a funccedilatildeo Pn pode ser escrita como o produto de cada fraccedilatildeo de cada grupo

ionizaacutevel j naquele estado (-1 0 ou +1) na configuraccedilatildeo neutra k em uma proteiacutena

com n grupos ionizaacuteveis Uma representaccedilatildeo matemaacutetica possiacutevel para esta funccedilatildeo

pode ser escrita como

휙 (푝퐻) = 훼 (푝퐻)

(42 ndash 2)

Na qual a fraccedilatildeo jrsquo(pH) eacute dada por

20 4 Modelagem Termodinacircmica Proposta

훼 (푝퐻) =훼 (푝퐻) 푠푒 휀 = 11 minus 훼 (푝퐻) 푠푒 휀 = 0

(42 ndash 3)

Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (42 ndash 3) e a resultante na equaccedilatildeo

(42 ndash 2) pode-se escrever que

휙 (푝퐻) =1

1 + 10

1 + 휈2 minus 휈 휀 10

minus휈 minus 1

2 minus 휈 휀 푐표푚 휀 = 0

(42 ndash 4)

A equaccedilatildeo (42 ndash 4) junto agrave equaccedilatildeo (41 ndash 7) constituem o modelo termodinacircmico

capaz de predizer a razatildeo entre as fraccedilotildees de moleacuteculas neutras de uma proteiacutena

em funccedilatildeo do pH na regiatildeo do ponto isoeleacutetrico mantendo fixas temperatura e forccedila

iocircnica Substituindo a equaccedilatildeo (42 ndash 4) na equaccedilatildeo (41 ndash 7) obteacutem-se para a

curva de solubilidade

푠 (푝퐻)푠 (푝퐼) =

1 + 101 + 10

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

푐표푚 휀 = 0

(42 ndash 8)

5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

51 Introduccedilatildeo

Segundo Groumlnwall (1941) na fase liacutequida haacute moleacuteculas de proteiacutenas com muitas

configuraccedilotildees k distintas que possuem carga liacutequida i e tambeacutem haacute certas

configuraccedilotildees que tem carga liacutequida nula e satildeo chamadas configuraccedilotildees neutras

Aleacutem disso estas uacuteltimas satildeo aquelas que determinam o equiliacutebrio de fases jaacute que

elas estatildeo em equiliacutebrio com a fase soacutelida na qual soacute haacute moleacuteculas neutras pelo

princiacutepio da eletroneutralidade Eacute tambeacutem afirmado que dado este equiliacutebrio a

atividade das moleacuteculas neutras natildeo se altera com a variaccedilatildeo do pH e eacute

proporcional agraves atividades de qualquer tipo de configuraccedilatildeo neutra

Neste mesmo trabalho eacute atribuiacuteda a Linderstroslashm-Lang o desenvolvimento de uma

teoria de prediccedilatildeo da solubilidade de proteiacutenas com a variaccedilatildeo do pH na regiatildeo do

ponto isoeleacutetrico Este desenvolvimento apresenta um balanccedilo de cargas de um

modo impliacutecito contudo como atestado por Groumlnwall o escasso conhecimento

sobre as estruturas proteacuteicas impediram agravequele tempo uma formulaccedilatildeo mais

pormenorizada do problema

52 Desenvolvimento teoacuterico

A base desta abordagem descrita por Groumlnwall e atribuiacuteda a Linderstroslashm-Lang

reside na hipoacutetese de que a moleacutecula de proteiacutena de configuraccedilatildeo k e carga nula

participa do seguinte equiliacutebrio com os iacuteons H+ e com sua forma de carga i

22 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

푃 + 푖퐻 푃 lowast

(52 ndash 1)

Note-se que o valor de i pode ser negativo A constante do equiliacutebrio quiacutemico

descrita pela equaccedilatildeo (52 ndash 1) pode ser expressa como

퐾 =푎

lowast

푎 푎

(52 ndash 2)

Sabendo que a atividade da moleacutecula de proteiacutena de configuraccedilatildeo k e carga i eacute dada

pelo produto entre sua concentraccedilatildeo e seu coeficiente de atividade tem-se que

푥lowast

= 푎 푎퐾훾

lowast

(52 ndash 3)

Entretanto a solubilidade da proteiacutena eacute soma das concentraccedilotildees de todas as

moleacuteculas de carga i Poreacutem a concentraccedilatildeo das moleacuteculas de carga i eacute a soma das

concentraccedilotildees das moleacuteculas de configuraccedilatildeo k Assim a solubilidade pode ser

escrita como

푠 (푝퐻) = 푎 푎퐾훾

lowast

(52 ndash 4)

Derivando a equaccedilatildeo (52 ndash 4) com respeito agrave atividade do iacuteon H+ considerando

que atividade da moleacutecula neutra eacute constante para qualquer configuraccedilatildeo k e ainda

que o coeficiente de atividade da proteiacutena de carga i independe da atividade do iacuteon

H+ tem-se que

푑푠푑푎 = 푖 ∙ 푎 푎

퐾훾

lowast

(52 ndash 5)

23 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

Sendo

푑 log 푠 (푝퐻)푑(푝퐻) = minus

푎푠 (푝퐻)

푑푠푑푎

(52 ndash 6)

Substituindo as equaccedilotildees (52 ndash 4) e (52 ndash 5) na equaccedilatildeo (52 ndash 6) e

reescrevendo em termos de pH e das concentraccedilotildees das proteiacutenas de carga i tem-

se que

푑 log 푠푑(푝퐻) = minus

sum (푖 ∙ 푥 )sum 푥

(52 ndash 7)

Contudo o termo do lado direito da equaccedilatildeo (52 ndash 7) estaacute associado ao conceito

de valecircncia meacutedia estabelecido por Linderstroslashm-Lang (1924)

횤 =sum (푖 ∙ 푥 )sum 푥

(52 ndash 8)

Os autores natildeo possuiacuteam um modo mais adequado de construir a curva de

solubilidade dada pela equaccedilatildeo (52 ndash 7) do que aproximar por uma funccedilatildeo linear o

perfil de carga liacutequida da proteiacutena obtido experimentalmente e integraacute-lo valendo-se

da analogia entre o conceito de carga liacutequida (Z) e de valecircncia meacutedia ( i ) Entretanto

hoje jaacute se tem uma descriccedilatildeo analiacutetica do perfil de carga liacutequida de proteiacutenas que

pode ser escrita como

푍(푝퐻) = 휈 훼

(52 ndash 9)

Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (52 ndash 9) e a resultante na equaccedilatildeo

(52 ndash 7) tem-se que

24 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

푑 log 푠푑(푝퐻) = minus

12

11 + 10

1 + 휈 + 휈 1 minus 휈 10

(52 ndash 10)

Integrando a equaccedilatildeo (52 ndash 10) de um ponto de referecircncia por exemplo do ponto

isoeleacutetrico (pI) ateacute um pH qualquer tem-se a seguinte relaccedilatildeo

푑 log 푠

( )

( )

= minus12

1

1 + 101 + 휈 + 휈 1 minus 휈 10 푑(푝퐻)

(52 ndash 11)

log푠 (푝퐻)푠 (푝퐼) = minus

12 1 + 휈

11 + 10

푑(푝퐻)

+ 휈 1 minus 휈10

1 + 10푑(푝퐻)

(52 ndash 12)

Fazendo a seguinte substituiccedilatildeo

푢 = 10 푡푎푙 푞푢푒 푑푢푢 = ln 10푑(푝퐻)

(52 ndash 13)

Tem-se que

log푠 (푝퐻)푠 (푝퐼) = minus

12

1 + 휈ln 10

1푢(1 + 푢) 푑푢 +

휈 1 minus 휈ln 10

1(1 + 푢) 푑푢

(52 ndash 14)

log푠 (푝퐻)푠 (푝퐼) = minus

12

1 + 휈ln 10

1푢 푑푢 minus

11 + 푢 푑푢 +

휈 1 minus 휈ln 10

1(1 + 푢) 푑푢

(52 ndash 15)

25 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐼) = minus

12 1 + 휈 log

1010

minus 휈 1 minus 휈 minus 1 + 휈 log1 + 101 + 10

(52 ndash 16)

Sendo

휈 1 minus 휈 minus 1 + 휈 = 휈 minus 휈 minus 1 minus 휈 = minus 1 + 휈 = minus2

(52 ndash 17)

Resultando em

log푠 (푝퐻)푠 (푝퐼) = log

1 + 101 + 10

minus1 + 휈

2 (푝퐻 minus 푝퐼)

(52 ndash 18)

Ainda eacute possiacutevel reescrever a equaccedilatildeo (52 ndash 18) como

log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log

1 + 101 + 10

(52 ndash 19)

Na qual n+ representa o nuacutemero de resiacuteduos ionizaacuteveis que na sua forma carregada

apresentam carga positiva A equaccedilatildeo (52 ndash 19) eacute uma expressatildeo analiacutetica que a

partir de dados da estrutura proteacuteica e de um dado de solubilidade permite predizer

a curva de solubilidade de uma dada proteiacutena em funccedilatildeo do pH na regiatildeo do ponto

isoeleacutetrico mantendo fixas a temperatura e a forccedila iocircnica do sistema

Eacute possiacutevel provar que as equaccedilotildees (42 ndash 8) e (52 ndash 19) satildeo idecircnticas - a prova

disso eacute descrita na seccedilatildeo 6 ndash e assim tem-se que apesar das distintas abordagens

a descriccedilatildeo do fenocircmeno eacute a mesma Note-se que um passo fundamental no

desenvolvimento da Equaccedilatildeo (52 ndash 5) eacute admitir que por hipoacutetese a atividade da

26 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

forma neutra natildeo depende do pH essa hipoacutetese tambeacutem eacute a base da equaccedilatildeo (41

ndash 7) Deve-se registrar o fato de que pelo melhor do nosso conhecimento esta eacute a

primeira vez que uma expressatildeo analiacutetica para o caacutelculo da solubilidade de

proteiacutenas em funccedilatildeo do pH eacute descrita mesmo no limite em que se considera vaacutelida

a lei de Henry

53 Soluccedilatildeo Paraboacutelica da Curva de Solubilidade

Tanto Groumlnwall (1941) quanto Fredericq e Neurath (1950) adotaram a hipoacutetese de

que os perfis de carga liacutequida da -lactoglobulina para um e da insulina para os

outros dois eram lineares na regiatildeo do ponto isoeleacutetrico Esta hipoacutetese eacute bastante

plausiacutevel e simplificadora principalmente a eacutepoca na qual estes trabalhos foram

desenvolvidos em que a estrutura proteacuteica bem como as constantes de ionizaccedilatildeo

dos resiacuteduos com grupos ionizaacuteveis era pouco conhecida De fato ainda hoje a falta

de dados das constantes de ionizaccedilatildeo na cadeia proteacuteica eacute o maior desafio no uso

do modelo rigoroso ndash equaccedilatildeo (52 ndash 18) Por isso o valor desta hipoacutetese de perfil

de carga liacutequida linear eacute notaacutevel

Supondo entatildeo que o perfil de carga seja linear eacute possiacutevel escrevecirc-lo como

푍(푝퐻) = minus퐴(푝퐻 minus 푝퐼) 푐표푚 퐴 gt 0

(53 ndash 1)

Substituindo (53 ndash 1) em (52 ndash 6)

푑 log 푠 (푝퐻)푑(푝퐻) = 퐴(푝퐻 minus 푝퐼)

(53 ndash 2)

Integrando (53 ndash 2) de um pH0 de referecircncia ateacute pH tem-se que

27 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐻 ) = 퐾[푝퐻 minus 2푝퐼(푝퐻 minus 푝퐻 ) minus 푝퐻 ] 푐표푚 퐾 =

퐴2

(53 ndash 3)

Ao se adotar como ponto de referecircncia o ponto isoeleacutetrico a equaccedilatildeo (53 ndash 3)

reduz-se agrave

log푠 (푝퐻)푠 (푝퐼) = 퐾(푝퐻 minus 푝퐼)

(53 ndash 4)

Contudo apesar da soluccedilatildeo quadraacutetica ou paraboacutelica para a equaccedilatildeo estendida de

Linderstroslashm-lang e Groumlnwall expressa na equaccedilatildeo (53 ndash 3) natildeo requerer os dados

das constantes de ionizaccedilatildeo dos resiacuteduos com grupos ionizaacuteveis ela exige a

definiccedilatildeo do paracircmetro A que fisicamente representa a inclinaccedilatildeo da reta de

aproximaccedilatildeo da curva de carga liacutequida e que pode ser calculado por correlaccedilatildeo a

partir de um conjunto de dados experimentais de solubilidade ou de carga liacutequida

6 Identidade entre o Modelo Proposto e a Equaccedilatildeo

Estendida de Linderstroslashm-Lang e Groumlnwall

A equaccedilatildeo final da modelagem termodinacircmica proposta apresentada na seccedilatildeo 4 eacute a

equaccedilatildeo (42 ndash 8) dada por

푠 (푝퐻)푠 (푝퐼) =

1 + 101 + 10

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 1)

Aplicando-se o logaritmo decimal nos dois termos da equaccedilatildeo (6 ndash 1) tem-se que

log푠 (푝퐻)푠 (푝퐼) = log

1 + 101 + 10

+ log

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 2)

Pelo bem da simplificaccedilatildeo desta deduccedilatildeo adotar-se-atildeo as seguintes funccedilotildees

휂 (푝퐻) = log

(6 ndash 3)

휃 (푝퐻) = log

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 4)

Assim pode-se reescrever a equaccedilatildeo (6 ndash 2) por

29 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐼) = 휂 (푝퐻) + 휃 (푝퐻)

(6 ndash 5)

Observando-se a equaccedilatildeo (6 ndash 5) tem-se que a funccedilatildeo j independe do estado de

ionizaccedilatildeo do resiacuteduo j poreacutem a funccedilatildeo jk depende Por isso deve-se analisar esta

funccedilatildeo para cada estado de ionizaccedilatildeo possiacutevel como mostrado na Tabela 61

Tabela 6 1 ndash Anaacutelise da funccedilatildeo jk para cada estado de ionizaccedilatildeo possiacutevel

j jk jk Quantidade de resiacuteduos neste estado

-1 -1 푝퐼 minus 푝퐻 na

0 0 nb

+1 +1 0 nc

0 푝퐼 minus 푝퐻 nd

Pela anaacutelise da Tabela 61 e considerando uma proteiacutena com n resiacuteduos com

grupos ionizaacuteveis infere-se que a equaccedilatildeo (6 ndash 5) pode ser reescrita como

log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)

(6 ndash 6)

Contudo as equaccedilotildees acima descritas satildeo vaacutelidas apenas para configuraccedilotildees

neutras pois apenas as configuraccedilotildees neutras da fase liacutequida estatildeo em equiliacutebrio

com as moleacuteculas de proteiacutena da fase soacutelida Para que uma configuraccedilatildeo seja

neutra vale a seguinte restriccedilatildeo

휀 = 0 hArr 푛 = 푛

(6 ndash 7)

30 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall

Substituindo a restriccedilatildeo dada pela equaccedilatildeo (6 ndash 7) na equaccedilatildeo (6 ndash 6) tem-se que

log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)

(6 ndash 8)

Ora mas a soma de nc e de nd natildeo resulta em outra coisa senatildeo no nuacutemero de

resiacuteduos com grupos ionizaacuteveis da estrutura proteacuteica cujo j seja +1 Assim

substituindo nc mais nd por n+ e substituindo a equaccedilatildeo (6 ndash 3) na equaccedilatildeo (6 ndash 8)

tem-se que

log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log

1 + 101 + 10

(6 ndash 9)

Ao se analisar a equaccedilatildeo (6 ndash 9) observa-se que ela eacute idecircntica a equaccedilatildeo estendida

de Linderstroslashm-Lang e Groumlnwall apresentada pela equaccedilatildeo (52 ndash 19) Com isso

tem-se que apesar das distintas formulaccedilotildees tanto a modelagem termodinacircmica aqui

proposta quanto a extensatildeo a teoria de Linderstroslashm-Lang e Groumlnwall resultam na

mesma descriccedilatildeo do fenocircmeno Aleacutem disso a equaccedilatildeo final dos modelos eacute

extremamente simples e depende apenas de um ponto de referecircncia e dos dados da

estrutura da moleacutecula de proteiacutena cuja solubilidade se deseja estudar

7 Aplicaccedilatildeo dos Modelos Expostos

Para validar o modelo comparando-o com o caacutelculo feito a partir da teoria de Debye-

Huumlckel o criteacuterio que relaciona os pontos calculados pelo modelo com os pontos

experimentais foi estabelecido a partir da seguinte funccedilatildeo objetivo (FO)

퐹푂 =1푁

푠 minus 푠푠

(7 ndash 1)

Contudo a equaccedilatildeo (7 ndash 1) natildeo eacute a melhor definiccedilatildeo de funccedilatildeo objetivo neste caso

pois a derivada da curva de solubilidade eacute razoavelmente grande nos dois lados do

ponto isoeleacutetrico e isso permite que pequenos desvios na direccedilatildeo horizontal

resultem em um grande aumento no valor da funccedilatildeo objetivo Uma soluccedilatildeo possiacutevel

seria substituir essa funccedilatildeo objetivo por uma funccedilatildeo definida pela soma do quadrado

da distacircncia do ponto experimental agrave curva do modelo principalmente se fosse

necessaacuterio calcular algum paracircmetro do modelo via otimizaccedilatildeo da funccedilatildeo objetivo

estipulada Natildeo sendo este o escopo deste trabalho optou-se pelo uso da FO

definida na equaccedilatildeo (7 ndash 1)

71 Solubilidade da Insulina Suiacutena

As Figuras 711 712 e 713 apresentam os graacuteficos da curva de solubilidade

dada pelos pontos experimentais pelo modelo proposto pela abordagem claacutessica e

tambeacutem a curva obtida pela soluccedilatildeo paraboacutelica da Equaccedilatildeo de Linderstroslashm-Lang e

Groumlnwall em trecircs temperaturas distintas

32 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 711 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 25 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

Figura 712 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 15 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

00

40

80

120

160

200

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

00

50

100

150

200

250

300

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

33 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 713 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 5 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

Os desvios da curva obtida pelo modelo proposto para valores de pH distantes do pI

podem ser explicados por ao menos trecircs importantes motivos dois devidos a

hipoacuteteses do modelo e um devido a fenocircmenos intriacutensecos a proteiacutena Sabendo que

no pI a solubilidade eacute miacutenima para valores de pH distantes do pI pode-se ter

solubilidades suficientemente grandes para que a validade da lei de Henry ndash adotada

na formulaccedilatildeo do modelo - seja questionada pois quanto mais distante do pI maior

a solubilidade e menor a validade da lei de Henry jaacute que haacute um aumento da

concentraccedilatildeo do soluto (proteiacutena) na soluccedilatildeo e tambeacutem ao fato do modelo prever

solubilidade infinita quando a fraccedilatildeo de moleacuteculas eletricamente neutras tende a

zero

limrarr푠 = lim

rarr

Φ(푝퐼)푠 (푝퐼)Φ(푝퐻) = +infin

(711 ndash 1)

00

50

100

150

200

250

300

350

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

34 7 Aplicaccedilatildeo dos Modelos Expostos

Todavia ainda haacute um fator de ordem natural que justifica o desvio apresentado para

valores de pH distantes do pI o desnovelamento da cadeia proteacuteica Este fenocircmeno

pode ocorrer de maneira a expor grupos hidroacutefobos resiacuteduos antes natildeo expostos

acrescentando relaccedilotildees de equiliacutebrio quiacutemico natildeo existentes na regiatildeo do pI

alterando o equiliacutebrio de fases e portanto alterando o valor da solubilidade

A Tabela 711 apresenta os valores obtidos para a funccedilatildeo objetivo definida em (7 ndash

1) tanto para o modelo proposto quanto para a abordagem claacutessica para trecircs

diferentes temperaturas

Tabela 711 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada

abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para insulina

suiacutena

T ordmC Abordagem FO

25 P 01857 C 02535

15 P 01981 C 05056

5 P 03595 C 03064

Observando-se a Tabela 711 vecirc-se que o modelo apresentou melhores resultados

do que o caacutelculo efetuado atraveacutes da abordagem claacutessica no que tange a

minimizaccedilatildeo da funccedilatildeo objetivo exceto para os dados a 5 ordmC

Tambeacutem eacute possiacutevel observar que a funccedilatildeo objetivo sofreu aumento com a

diminuiccedilatildeo da temperatura Isto ocorreu principalmente devido agrave dificuldade de

obter dados experimentais de solubilidade a temperaturas baixas o que aumenta o

desvio experimental fazendo com que se tenha um aumento do valor da funccedilatildeo

objetivo como a definida em (5 ndash 1) Um efeito secundaacuterio que tambeacutem pressiona a

35 7 Aplicaccedilatildeo dos Modelos Expostos

funccedilatildeo objetivo eacute o fato dos dados de pKA terem sido obtidos a uma temperatura

especiacutefica o que tende a acrescentar erro no caacutelculo de solubilidades a temperaturas

diferentes ainda que o pKA natildeo varie de forma ab-rupta com a temperatura

Outra observaccedilatildeo que deve ser registrada eacute o fato da funccedilatildeo objetivo para a

abordagem claacutessica na temperatura de 15 ordmC divergir a um valor tatildeo elevado em

relaccedilatildeo aos demais Isto se deve a um ponto experimental especiacutefico a um pH de

45 a solubilidade da insulina suiacutena obtida experimentalmente eacute 230 x 10-5 mol kg-1

enquanto a calculada pelo modelo proposto eacute 230 x 10-5 mol kg-1 e a calculada pela

abordagem claacutessica eacute 520 x 10-5 mol kg-1 Por conta do desvio deste ponto a funccedilatildeo

objetivo para a abordagem claacutessica nesta temperatura tem um aumento significativo

A Tabela 712 apresenta os valores do paracircmetro K da soluccedilatildeo paraboacutelica obtidos

neste trabalho para a insulina suiacutena comparados ao encontrado na literatura

Tabela 712 ndash Valores do paracircmetro K da soluccedilatildeo paraboacutelica para a insulina suiacutena

Referecircncias T ordmC K Fredericq e Neurath (1950) - 081 Neste trabalho 25 104 Neste trabalho 15 101 Neste trabalho 5 145

Pela Tabela 712 pode-se observar que haacute uma diferenccedila pequena entre os

valores do paracircmetro K obtidos neste trabalho e por Fredericq e Neurath (1950) Por

isso natildeo se pode afirmar a que se deve esta diferenccedila se eacute devido a diferenccedilas entre

procedimentos experimentais ou se eacute devido agrave diferenccedila de meacutetodo de caacutelculo do

paracircmetro Apesar de no experimento realizado por Fredericq e Neurath (1950)

haver a presenccedila do acircnion tiocianato e este acircnion interagir com grupos ionizaacuteveis

da cadeia proteacuteica como observado pelos autores do trabalho tambeacutem estes

36 7 Aplicaccedilatildeo dos Modelos Expostos

proacuteprios autores afirmam que a presenccedila deste acircnion natildeo altera a forma da curva

que eacute basicamente determinada pelo paracircmetro K De qualquer modo eacute interessante

observar a proximidade dos valores encontrados neste trabalho com o obtido por

Fredericq e Neurath (1950) pelo menos no que diz respeito agrave ordem de grandeza do

paracircmetro em questatildeo

72 Solubilidade da Lisozima de clara de ovo de galinha

Um modelo para ser validado necessita correlacionar dados experimentais de modo

satisfatoacuterio ou seja um modelo deve buscar fidelidade ao fenocircmeno fiacutesico

observado Assim na procura de dados de solubilidade de proteiacutenas poucos dados

na regiatildeo do pI foram encontrados Este eacute o caso da lisozima de clara de ovo de

galinha que apesar de ter muitos estudos de solubilidade nenhum deles se

encontra na regiatildeo do pI Surgiu assim a necessidade de se obter estes dados

experimentais para poder validar o modelo proposto A escolha da lisozima de clara

de ovo de galinha se deu em parte pela sua importacircncia mas tambeacutem em parte por

ter os valores de pKA conhecidos

A curva de solubilidade da lisozima de clara de ovo de galinha levantada neste

trabalho estaacute apresentada na Figura 721

37 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em

soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e

dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()

Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento

esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH

isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de

soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se

comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto

isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da

soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos

ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente

neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a

solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e

00

10

20

30

40

50

60

70

80

90

100

95 100 105 110 115 120

Solu

bilid

ade

(mg

mL)

pH

38 7 Aplicaccedilatildeo dos Modelos Expostos

alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado

em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo

Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo

a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo

Por conta de falta de dados a este respeito modelou-se apenas a curva de

solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura

722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de

galinha em funccedilatildeo do pH da soluccedilatildeo

Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)

00

10

20

30

40

50

60

70

80

90

96 99 102 105 108 111 114 117 120

Solu

bilid

ade

(mg

mL)

pH

39 7 Aplicaccedilatildeo dos Modelos Expostos

O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721

Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada

abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima

de clara de ovo de galinha

T ordmC Abordagem FO

25 P 4650 C gt7919a

a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado

Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta

aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a

abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca

de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos

anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao

efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de

clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a

variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A

proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de

cargas pontuais de Debye-Huumlckel

8 Conclusotildees

A modelagem termodinacircmica proposta neste trabalho apresentou expressivos

resultados quando comparada a abordagem claacutessica de Debye-Huumlckel

Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o

modelo aproximou melhor os pontos experimentais do que a referida abordagem

comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima

ao ponto isoeleacutetrico

Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica

para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua

construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo

lugar por sua aplicabilidade

Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis

da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva

em regiotildees distantes do ponto isoeleacutetrico

9 Referecircncias Bibliograacuteficas

BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene

Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects

Biophys J 95 1285-1294 2008

FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and

other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72

2684 - 26911950

GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v

93 p 517-542 1931

GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab

Carlsberg v 24 p 185-200 1941

KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native

and mutant insulins pK perturbation of B13-Glu in aggregated species Arch

Biochem Biophys v 283 p 496-502 1990

KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for

the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng

Chem Res v 35 p 4319-4327 1996

42 9 Referecircncias Bibliograacuteficas

KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen

lysozyme J Biochem v 87 p 1215-1219 1980

LADISCH M R Bioseparations Engineering principles practice and

economics John Wiley amp Sons 2001 pp1 116 ndash 117 133

LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab

Carlsberg v 15 p 1-29 1924

PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da

particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas

2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP

PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the

excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte

solutions Fluid Phase Equilib v 269 p 25ndash35 2008

PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-

contribution model involving phase and chemical equilibrium Ind Eng Chem Res

v 33 p 1341-1347 1994

PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277

1973

PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino

acids Fluid Phase Equilib v 152 p 121-132 1998

43 9 Referecircncias Bibliograacuteficas

PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular

Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999

SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of

equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte

solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009

TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J

R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with

carbon dioxide Biotech Bioeng v103 p 909-919 2009

TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer

free energy Biophys J v 95 p 2601-2609 2008

TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in

water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95

2009

Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na

cadeia proteacuteica

Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo

de ionizaccedilatildeo

퐻퐴 퐴 + 퐻

(A ndash 1)

Assim considerando que a constante de equiliacutebrio

퐾 = 푎

(A ndash 2)

Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que

퐾 =[퐴 ][퐻 ]

[퐻퐴]

(A ndash 3)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que

log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]

(A ndash 4)

Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado

por

minus log[휑] = 푝휑

(A ndash 5)

Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que

45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

푝퐾 = log[퐻퐴][퐴 ] + 푝퐻

(A ndash 6)

Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por

훼 =[퐴 ]

[퐻퐴] + [퐴 ]

(A ndash 7)

Reescrevendo (A ndash 7) tem-se que

훼 =[퐴 ] [퐻퐴frasl ]

1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =

훼1 minus 훼

(A ndash 8)

Substituindo (A ndash 8) em (A ndash 6) tem-se que

푝퐾 = log훼

1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10

(A ndash 9)

Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos

훼 =1

1 + 10

(A ndash 10)

Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio

퐴 + 퐻 퐻퐴

(A ndash 11)

Pode se escrever a constante de equiliacutebrio como

퐾 =[퐻퐴 ]

[퐴][퐻 ]

(A ndash 12)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que

46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

log퐾 = minus log[퐴]

[퐻퐴 ] minus log[퐻 ]

(A -13)

Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por

훼 =[퐻퐴 ]

[퐴] + [퐻퐴 ]

(A ndash 14)

Assim a equaccedilatildeo (A ndash 13) fica

훼1 minus 훼 = 10

(A ndash 15)

Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo

훼 =10

1 + 10

(A ndash 16)

Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos

modelos expostos

Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]

48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]

49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)

50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])

51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]

52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])

53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)

54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2

55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO

ii

RESUMO

Neste trabalho eacute apresentado um modelo para a curva de solubilidade de proteiacutenas

em soluccedilatildeo aquosa em funccedilatildeo do pH da soluccedilatildeo baseado em ferramentas da

termodinacircmica claacutessica e considerando os diferentes estados de ionizaccedilatildeo que

moleacuteculas proteacuteicas podem assumir Tambeacutem foi estudada a modelagem descrita

por Groumlnwall em seu artigo publicado no iniacutecio da deacutecada de 1940 e deste estudo

resultou uma extensatildeo agrave sua teoria que se provou ser idecircntica agrave modelagem

proposta inicialmente Para efeito de comparaccedilatildeo foram modeladas curvas de

solubilidade utilizando o modelo de atividade estendido de Debye-Huumlckel para

soluccedilotildees eletroliacuteticas

Foram obtidos dados experimentais da solubilidade da lisozima de clara de ovo de

galinha para alguns valores de pH na regiatildeo do ponto isoeleacutetrico Tanto para a

insulina suiacutena como para lisozima de clara de ovo de galinha o modelo

desenvolvido descreveu com grande precisatildeo o fenocircmeno observado

experimentalmente A aplicaccedilatildeo do modelo permite concluir que a utilizaccedilatildeo de

caacutelculos de estados de ionizaccedilatildeo eacute uma ferramenta eficaz na modelagem

termodinacircmica de soluccedilotildees proteacuteicas

iii

ABSTRACT

In this work it is presented a model for the protein solubility curve in aqueous

solutions as a function of the solution pH based on classical thermodynamic tools

and considering the different ionization states that protein molecules may assume It

was also studied the model described by Groumlnwall in his article published in the early

1940rsquos and from this study it was developed an extension of his theory which as

proved in this work is identical to the initially proposed modeling For comparison

solubility curves were modeled using the Debye-Huumlckel extended activity model for

electrolytic solutions

It was obtained experimental hen egg white lysozyme solubility data for some pH

values in the region of the isoelectric point So much for porcine insulin as for the hen

egg white lysozyme the developed model describes with high accuracy the

phenomenon experimentally observed The model application allows us to conclude

that the utilization of the ionization states calculus is an effective tool in the

thermodynamic modeling of protein solutions

Sumaacuterio

1 Introduccedilatildeo 1

2 Materiais e Meacutetodos 7

21 Meacutetodos computacionais 7

22 Curva de solubilidade da lisozima da clara de ovo de galinha 9

221 Reagentes 9

222 Equipamentos 9

223 Preparaccedilatildeo das soluccedilotildees-tampatildeo 9

224 Procedimento experimental 10

3 Modelo Estendido de Debye-Huumlckel 11

31 Introduccedilatildeo 11

32 Desenvolvimento teoacuterico 12

4 Modelagem Termodinacircmica Proposta 16

41 Introduccedilatildeo 16

42 Caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras 18

5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall 21

51 Introduccedilatildeo 21

52 Desenvolvimento teoacuterico 21

53 Soluccedilatildeo Paraboacutelica da Curva de Solubilidade 26

6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall 28

7 Aplicaccedilatildeo dos Modelos Expostos 31

71 Solubilidade da Insulina Suiacutena 31

72 Solubilidade da Lisozima de clara de ovo de galinha 36

8 Conclusotildees 40

9 Referecircncias Bibliograacuteficas 41

Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach 44

Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos 47

1 Introduccedilatildeo

Dentre as etapas de um processo biotecnoloacutegico aquela dedicada a purificaccedilatildeo de

bioprodutos tende a ser determinante em geral para o custo do processo seguindo

a tendecircncia dos processos de separaccedilatildeo da induacutestria quiacutemica tradicional A

produccedilatildeo de proteiacutenas tem lugar de destaque no rol de bioprodutos de interesse

pois muitos antibioacuteticos hormocircnios e enzimas pertencem a esta classe de

biomoleacuteculas e possuem notoacuterio interesse industrial por suas propriedades

terapecircuticas e aplicaccedilotildees na induacutestria alimentiacutecia No entanto proteiacutenas a serem

comercializadas para estes fins exigem altos graus de pureza que somente satildeo

obtidos pelas etapas de purificaccedilatildeo Como afirmado por Bončina et al (2008)

estudos de separaccedilatildeo de proteiacutenas especificamente tecircm sido motivados por um

aumento da demanda por proteiacutenas puras nas induacutestrias farmacecircutica e correlatas

Muitas moleacuteculas bioloacutegicas ndash ou comumente chamadas biomoleacuteculas - e

particularmente proteiacutenas satildeo destruiacutedas pelo calor natildeo podem ser destiladas satildeo

geradas a baixas concentraccedilotildees e tecircm uma estrutura tridimensional que pode ser

alterada durante a purificaccedilatildeo resultando na perda da atividade bioloacutegica Por isso

bioprodutos tais como proteiacutenas devem ser recuperados purificados e

concentrados em operaccedilotildees com membranas etapas de adsorccedilatildeo cromatografia

cristalizaccedilatildeo e outras teacutecnicas que natildeo requerem calor ou pH extremo para alcanccedilar

o fracionamento (Ladisch 2001)

Em geral nos processos biotecnoloacutegicos as correntes de saiacuteda dos biorreatores

seguem para as operaccedilotildees de downstream (etapas de separaccedilatildeo que visam

concentrar e dispor o produto final) As primeiras operaccedilotildees de downstream por

exemplo a clarificaccedilatildeo e a centrifugaccedilatildeo tecircm por objetivo isolar a proteiacutena de

2 1 Introduccedilatildeo

interesse das ceacutelulas que a produziram Apoacutes estas primeiras etapas de purificaccedilatildeo

seguem-se as operaccedilotildees de baixa resoluccedilatildeo A precipitaccedilatildeo e a extraccedilatildeo em

sistemas de duas fases aquosas satildeo exemplos destas operaccedilotildees que tendem a

concentrar a proteiacutena-alvo preparando-a para os proacuteximos estaacutegios de separaccedilatildeo

Por fim a proteiacutena ora na concentraccedilatildeo obtida pelas operaccedilotildees anteriores eacute tratada

por operaccedilotildees de alta resoluccedilatildeo caracterizadas principalmente pela teacutecnica de

cromatografia a fim de concentrar a proteiacutena agrave pureza especificada para seu uso

Vale ressaltar que esta uacuteltima etapa eacute extremamente dispendiosa e quanto mais

eficientes forem as etapas precedentes no que tange a pureza da proteiacutena-alvo

menos custosa seraacute a etapa posterior

O escopo deste trabalho estaacute centrado na operaccedilatildeo de precipitaccedilatildeo de proteiacutenas

cujos fundamentos satildeo as relaccedilotildees do equiliacutebrio soacutelido-liacutequido (ESL) destes

sistemas A solubilidade de uma proteiacutena em soluccedilatildeo eacute governada pelos mesmos

princiacutepios fundamentais ou seja condiccedilotildees de equiliacutebrio termodinacircmico que regem

o comportamento de qualquer substacircncia no ESL Contudo algumas diferenccedilas

devem ser levadas em conta na descriccedilatildeo deste fenocircmeno e no projeto destas

operaccedilotildees

Proteiacutenas satildeo formadas por cadeias de aminoaacutecidos atraveacutes de ligaccedilotildees peptiacutedicas

cada aminoaacutecido pode ser considerado um monocircmero que ao possuir um grupo

ionizaacutevel natildeo ligado tal como ocorre em alguns aminoaacutecidos naturais tirosina (Tyr)

lisina (Lys) cisteiacutena (Cys) histidina (His) arginina (Arg) aacutecido aspaacutertico (Asp) e

aacutecido glutacircmico (Glu) e tambeacutem em resiacuteduos terminais confere a proteiacutena uma

caracteriacutestica de polieletroacutelito Eacute importante entatildeo considerar a definiccedilatildeo de

polieletroacutelitos tal qual definida por Pessocirca Filho e Maurer (2008) polieletroacutelitos satildeo

3 1 Introduccedilatildeo

poliacutemeros com muitas unidades monomeacutericas eletroliacuteticas ndash neste caso

aminoaacutecidos que possuem grupos ionizaacuteveis natildeo ligados

Para muitos processos industriais e mesmo naturais informaccedilotildees a respeito de

equiliacutebrios de fases de soluccedilotildees eletroliacuteticas satildeo necessaacuterias e necessaacuterias tambeacutem

satildeo modificaccedilotildees nos modelos tradicionais de coeficiente de atividade quando se

trata de descrever equiliacutebrios de fases em sistemas que conteacutem eletroacutelitos (Prausnitz

et al 1999)

Sendo assim tendo que a pressatildeo do sistema natildeo influencia de modo significativo o

ESL tem-se que trecircs variaacuteveis o influenciam diretamente a temperatura o pH e a

forccedila iocircnica estas duas uacuteltimas tornam-se importantes devido agrave caracteriacutestica

eletroliacutetica das proteiacutenas

Na verdade a forccedila iocircnica natildeo eacute uma variaacutevel que represente de modo abrangente

os possiacuteveis efeitos de iacuteons em soluccedilotildees proteacuteicas Isto se deve ao fato de que a

forccedila iocircnica do modo como eacute definida natildeo contempla uma diferenciaccedilatildeo entre os

equiliacutebrios que se estabelecem entre os iacuteons e alguns resiacuteduos ionizaacuteveis da cadeia

proteacuteica De fato a variaccedilatildeo da forccedila iocircnica de uma soluccedilatildeo proteacuteica altera o valor

da solubilidade da proteiacutena em soluccedilatildeo mas natildeo da mesma forma para qualquer

espeacutecie de iacuteon Portanto seria mais prudente acrescer ao conjunto de variaacuteveis que

influenciam o ESL a espeacutecie quiacutemica dos iacuteons presentes em soluccedilatildeo

O objetivo deste trabalho eacute estabelecer um modelo capaz de prever a influecircncia do

pH no ESL de proteiacutenas mantendo-se temperatura e forccedila iocircnica constantes

Sabe-se por observaccedilotildees experimentais que a variaccedilatildeo do pH de um sistema altera

o valor da solubilidade de proteiacutenas em soluccedilatildeo e a solubilidade de proteiacutenas por

sua vez atinge seu valor miacutenimo em um pH denominado ponto isoeleacutetrico (pI) no

qual a carga liacutequida da proteiacutena eacute nula

4 1 Introduccedilatildeo

Os primeiros trabalhos relacionados agrave modelagem da curva de solubilidade de

proteiacutenas em funccedilatildeo do pH datam do iniacutecio do seacuteculo XX Green (1931) propocircs um

modelo para a curva de solubilidade da carboxihemoglobina equumlina considerando

que esta proteiacutena se comportaria tanto como um aacutecido bivalente quanto uma base

bivalente Jaacute Groumlnwall (1941) atribuiu a Linderstroslashm-Lang o desenvolvimento de um

modelo capaz de predizer a curva de solubilidade a partir da integraccedilatildeo do perfil de

carga da proteiacutena Este trabalho de Groumlnwall apesar de esquecido pelo tempo eacute de

extrema importacircncia e relevacircncia tanto para o trabalho aqui apresentado quanto e

aqui um motivo muito mais nobre para o desenvolvimento de modelos a partir das

ferramentas da termodinacircmica claacutessica Quando da exposiccedilatildeo da modelagem aqui

tratada retornar-se-aacute a este trabalho que muito contribuiu ao entendimento do

fenocircmeno estudado

Eacute digno de nota o trabalho de Fredericq e Neurath (1950) no qual uma proposta de

equacionamento para uma correlaccedilatildeo semi-empiacuterica da curva de solubilidade de

insulina eacute apresentada Natildeo haacute de fato algo novo em relaccedilatildeo agrave modelagem do

efeito do pH na curva de solubilidade neste trabalho no entanto apesar de natildeo

haver qualquer menccedilatildeo ou referecircncia quanto agrave origem da equaccedilatildeo proposta nota-se

que eacute uma aplicaccedilatildeo direta da equaccedilatildeo descrita por Groumlnwall (1941) Haacute uma

hipoacutetese impliacutecita no trabalho de que o perfil de carga liacutequida da insulina seja linear

na regiatildeo do ponto isoeleacutetrico o que eacute bastante plausiacutevel para muitas proteiacutenas

Assim pela integraccedilatildeo da equaccedilatildeo diferencial proposta por Groumlwall (1941) uma

correlaccedilatildeo semi-empiacuterica quadraacutetica eacute obtida Reforccedila-se o uso da expressatildeo semi-

empiacuterica devido agrave natureza dual da equaccedilatildeo em parte advinda de um

desenvolvimento teoacuterico descrito por Groumlnwall (1941) e atribuiacutedo a Linderstroslashm-

Lang e em parte pela necessidade de se obter paracircmetros a partir de um ajuste de

5 1 Introduccedilatildeo

um conjunto de dados experimentais Vale observar que resultados expressivos

foram alcanccedilados neste trabalho de modo particular o fato de que a presenccedila do

acircnion tiocianato natildeo altera a forma da curva de solubilidade da insulina mas a

desloca em direccedilatildeo a menores valores de pH e de solubilidade

Contudo os trabalhos mais recentes se concentraram na modelagem da curva de

solubilidade de aminoaacutecidos em funccedilatildeo do pH dando maior enfoque aos modelos

termodinacircmicos para soluccedilotildees natildeo-ideais tanto atraveacutes de equaccedilotildees de estado

como de modelos de energia livre de Gibbs excedente

Destaca-se neste grupo o trabalho de Pinho et al (1994) que aplicaram o modelo

UNIFAC associado ao termo de Debye-Huumlckel para aminoaacutecidos como glicina D-

alanina L-serina e DL-valina Tambeacutem o trabalho de Khoshkbarchi e Vera (1996)

no qual foi desenvolvido um modelo simplificado de esfera riacutegida perturbada para

calcular o coeficiente de atividade de aminoaacutecidos e de peptiacutedeos permite prever a

curva de solubilidade destes em funccedilatildeo do pH Jaacute o modelo NRTL foi aplicado tanto

por Pradhan e Vera (1998) quanto Tseng et al (2009) para aminoaacutecidos Jaacute Seyfi et

al (2009) aplicaram a equaccedilatildeo de estado SAFT para a prediccedilatildeo da curva de

solubilidade da DL-metionina

Entretanto o primeiro trabalho dedicado exclusivamente agrave modelagem e prediccedilatildeo da

curva de solubilidade de proteiacutena propriamente dita em funccedilatildeo do pH foi publicado

por Tjong e Zhou (2008) Neste trabalho a solubilidade foi calculada a partir da

energia livre de transferecircncia da fase soacutelida para a fase liacutequida Para a execuccedilatildeo

deste caacutelculo a energia livre de transferecircncia foi dividida em duas contribuiccedilotildees

uma de natureza eletrostaacutetica calculada pela meacutedia de 100 conformaccedilotildees proteacuteicas

advindas da aplicaccedilatildeo de dinacircmica molecular a pH constante e outra de natureza

natildeo-eletrostaacutetica baseada na aacuterea superficial acessiacutevel ao solvente Poreacutem o

6 1 Introduccedilatildeo

esforccedilo computacional requerido pelo modelo por eles proposto para calcular

apenas alguns pontos da curva natildeo apresenta uma aplicabilidade razoaacutevel Aleacutem

deste trabalho Tashima et al (2009) propuseram uma modelagem termodinacircmica

para prever a curva de solubilidade especificamente da insulina suiacutena aplicando o

modelo de Pitzer truncado apoacutes o segundo coeficiente do virial

No presente trabalho propomos um novo modelo baseado no caacutelculo de estados de

ionizaccedilatildeo e em ferramentas de termodinacircmica claacutessica bem como uma extensatildeo agrave

teoria de Linderstroslashm-Lang e Groumlnwall Vale ressaltar de antematildeo que tanto este

novo modelo proposto quanto a extensatildeo desenvolvida resultam na mesma equaccedilatildeo

para o fenocircmeno apesar das distintas abordagens

2 Materiais e Meacutetodos

21 Meacutetodos computacionais

O coacutedigo-fonte do programa em linguagem C estaacute apresentado no Apecircndice B Os

meacutetodos numeacutericos utilizados se resumem a interpolaccedilatildeo linear o meacutetodo de

Newton-Raphson cujo uso seraacute apresentado na proacutexima seccedilatildeo quando se deduziraacute

o algoritmo do modelo de Debye-Huumlckel e o meacutetodo de busca unidirecional de

miacutenimos de funccedilatildeo pela Seccedilatildeo Aacuteurea

As Tabelas 211 e 212 apresentam os resiacuteduos considerados para cada proteiacutena

considerada bem como os seus valores de pKA que foram obtidos a partir da

literatura e satildeo indispensaacuteveis para execuccedilatildeo dos caacutelculos mais rigorosos

Tabela 211 ndash Resiacuteduos ionizaacuteveis considerados e valores de pKA da insulina suiacutena

Valores extraiacutedos de Kaarsholm et al (1990)

Aminoaacutecido Grupo Ionizaacutevel pKA

A1 ndash Gly -NH2 738 A4 ndash Glu -COOH 437 A14 ndash Tyr Fenol-OH 1020 A17 ndash Glu -COOH 437 A19 ndash Tyr Fenol-OH 1020 A21 ndash Asn -COOH 345

B1 ndash Phe -NH2 738 B5 ndash His Imidazol-NH 598 B10 ndash His Imidazol-NH 598 B 13 ndash Glu -COOH 437 B16 ndash Tyr Fenol-OH 1020 B21 ndash Glu -COOH 437

B22 ndash Arg Guaniacutedio-NH2 1110 B26 ndash Tyr Fenol-OH 1020

B29 ndash Lys -NH2 852 B30 ndashAla -COOH 345

8 2 Materiais e Meacutetodos

Tabela 212 ndash Resiacuteduos ionizaacuteveis considerados e valores de pKA a 25 ordmC da lisozima

de clara de ovo de galinha Valores extraiacutedos de Kuramitsu e Hamaguchi (1980)

Aminoaacutecido Grupo Ionizaacutevel pKA α-NH2 α-NH2 79

Lys1 ε-NH2 108

Arg5 Guaniacutedio-NH2 120 Glu7 -COOH 26

Lys13 ε-NH2 105

Arg14 Guaniacutedio-NH2 120 His15 Imidazol-NH 58 Asp18 -COOH 20 Tyr20 Fenol-OH 103

Arg21 Guaniacutedio-NH2 120 Tyr23 Fenol-OH 98

Lys33 ε-NH2 106 Glu35 -COOH 61

Arg45 Guaniacutedio-NH2 120 Asp48 -COOH 43 Asp52 -COOH 34 Tyr53 Fenol-OH 121

Arg61 Guaniacutedio-NH2 120 Asp66 -COOH 16

Arg68 Guaniacutedio-NH2 120

Arg73 Guaniacutedio-NH2 120 Asp87 -COOH 21

Lys96 ε-NH2 108

Lys97 ε-NH2 103 Asp101 -COOH 45

Arg112 Guaniacutedio-NH2 120

Arg114 Guaniacutedio-NH2 120

Lys116 ε-NH2 104 Asp119 -COOH 25

Arg125 Guaniacutedio-NH2 120

Arg128 Guaniacutedio-NH2 120 α-COOH α-COOH 31

9 2 Materiais e Meacutetodos

22 Curva de solubilidade da lisozima da clara de ovo de galinha

221 Reagentes

Neste experimento de determinaccedilatildeo da curva de solubilidade da lisozima da clara de

ovo de galinha os reagentes utilizados foram cloreto de soacutedio (Reatec P A)

bicarbonato de soacutedio (Research Becto Chemical P A) Na2HPO4 7H2O (Reagen

P A) aacutegua destilada deionizada Milli-Q (Millipore) e lisozima de clara de ovo de

galinha (Sigma min 99)

222 Equipamentos

Neste experimento os equipamentos utilizados foram espectrofotocircmetro UV-Visiacutevel

(Beckman DU-530) centriacutefuga (Eppendorf) banho-teacutermico (Laacutectea) com controlador

de temperatura (Julabo) pHmetro (Micronal) e balanccedila (Mettler Toledo AB204S)

223 Preparaccedilatildeo das soluccedilotildees-tampatildeo

Foram preparadas soluccedilotildees-tampatildeo com valores de pH=96 pH = 98 pH = 100

pH = 102 pH = 104 pH = 106 pH = 108 pH = 110 pH = 112 pH = 114 pH =

116 e pH = 118 a partir de quatro soluccedilotildees uma de hidroacutexido de soacutedio 01 M uma

de cloreto de soacutedio 1 M (para equalizar a forccedila iocircnica) uma de bicarbonato de soacutedio

005 M e outra de Na2HPO4 005 M

A Tabela 2231 apresenta os valores de volume usados no preparo de cada uma

das soluccedilotildees-tampatildeo

10 2 Materiais e Meacutetodos

Tabela 2231 ndash Volumes de hidroacutexido de soacutedio a 01 M adicionados no preparo das

soluccedilotildees-tampatildeo

Tampatildeo pH V NaOH mL

NaHCO3 96 100 005 M 98 152

(para cada soluccedilatildeo-tampatildeo 100 mL 100 214

desta soluccedilatildeo foram adicionados) 102 276

104 330 106 382

108 424

110 454

112 530 114 583

Na2HPO4 110 82

005 M 112 126

(para cada soluccedilatildeo-tampatildeo 100 mL 114 182 desta soluccedilatildeo foram adicionados) 116 270

118 388

224 Procedimento experimental

Foram adicionadas quantidades natildeo definidas de lisozima de clara de ovo de galinha

a 13 mL de cada soluccedilatildeo-tampatildeo em tubos Eppendorf de 2 mL Colocaram-se

entatildeo as amostras apoacutes agitaccedilatildeo vigorosa em banho teacutermico a 250 plusmn 01 ordmC por 24

horas para que os sistemas atingissem o equiliacutebrio termodinacircmico Caso natildeo

houvesse a formaccedilatildeo de precipitado lisozima era adicionada e o procedimento

repetido Ao se observar a formaccedilatildeo de precipitado o sistema era centrifugado a

13000 rpm por 15 minutos Uma aliacutequota do sobrenadante era retirada e sua

concentraccedilatildeo proteacuteica determinada por medida de absorbacircncia a 280 nm Cada

sistema foi feito ao menos em duplicata

3 Modelo Estendido de Debye-Huumlckel

31 Introduccedilatildeo

De fato como descrito por Pessocirca Filho (2002) a equaccedilatildeo de Debye-Huumlckel natildeo

deve ser aplicada agrave modelagem de polieletroacutelitos tais como proteiacutenas porque nestas

moleacuteculas as cargas satildeo distribuiacutedas ao longo da cadeia e portanto natildeo satildeo cargas

pontuais como suposto por Debye-Huumlckel

Contudo nesta modelagem considera-se uma regiatildeo de pH em torno do ponto

isoeleacutetrico (pI) na qual satildeo inerentes duas condiccedilotildees favoraacuteveis a aplicaccedilatildeo da

equaccedilatildeo de Debye-Huumlckel carga liacutequida proacutexima a zero pois Z(pI) = 0 e regiatildeo de

miacutenima solubilidade que significa baixas concentraccedilotildees de proteiacutenas em soluccedilatildeo

Isto significa em primeiro lugar que os efeitos da carga tais como ldquodesnovelamentordquo

da cadeia proteacuteica com exposiccedilatildeo de resiacuteduos outrora blindados podem ser

desprezados em uma regiatildeo proacutexima ao ponto isoeleacutetrico e em segundo lugar

baixas concentraccedilotildees de proteiacutena em soluccedilatildeo significam que os termos de curto

alcance podem ser desprezados e portanto haacute prevalecircncia do termo de longo

alcance que no caso de soluccedilotildees eletroliacuteticas pode ser descrito por uma equaccedilatildeo

estendida de Debye-Huumlckel

Assim o modelo de Debye-Huumlckel foi utilizado natildeo para verificar sua aplicabilidade agrave

modelagem de soluccedilotildees proteacuteicas mas sim para confrontar o modelo proposto com

um modelo usual em modelagem de soluccedilotildees eletroliacuteticas e seraacute referido no texto

sempre como abordagem claacutessica

12 3 Modelo Estendido de Debye-Huumlckel

32 Desenvolvimento teoacuterico

Pode-se escrever a atividade da proteiacutena como o produto entre a solubilidade e o

coeficiente de atividade da mesma como mostrado na equaccedilatildeo (32 - 1)

푎 = 훾푠

(32 - 1)

Na qual pode-se calcular o coeficiente de atividade atraveacutes da equaccedilatildeo estendida

de Debye-Huumlckel (Pitzer 1973)

ln 훾 = minus퐴 푍radic퐼

1 + 푏radic퐼+

2푏

ln 1 + 푏radic퐼

(32 - 2)

Sendo que a constante universal empiacuterica b = 12 kg12 mol-12 eacute usada para todos os

eletroacutelitos Jaacute AΦ eacute o paracircmetro de Debye-Huumlckel para o coeficiente osmoacutetico e eacute

dado por

퐴 =13

(2휋푁 휌 ) frasl 푒4휋휀 휀 푘푇

frasl

(32 - 3)

Em que NA eacute a constante de Avogadro ρs eacute a densidade do solvente em g cm-3 e eacute

a carga eletrocircnica (e = 160218 x 10-19 C) ε0 eacute a permissividade do espaccedilo livre (ε0 =

885419 x 10-12 C2 N-1 m-2) εr eacute a constante dieleacutetrica do solvente k aacute constante de

Boltzmann e T eacute a temperatura absoluta Jaacute a carga liacutequida em funccedilatildeo do pH pode

ser calculada como

푍 = 훼 minus 훼

(32 - 4)

Sendo que α+ e α- satildeo dados pelas equaccedilotildees (A - 10) e (A - 16) do Apecircndice A

13 3 Modelo Estendido de Debye-Huumlckel

E a forccedila iocircnica eacute dada pela equaccedilatildeo (32 - 5) descrita abaixo

퐼 = 12

푚 푍

(32 - 5)

Contudo no ponto isoeleacutetrico a carga meacutedia da proteiacutena eacute nula portanto o termo de

Debye-Huumlckel se anula e o coeficiente de atividade se torna unitaacuterio

ln푎 (푝퐼) = ln 푠 (푝퐼)

(32 - 6)

Considerando que a atividade da proteiacutena seja constante com a variaccedilatildeo de pH isto

implica que esta eacute sempre igual agrave solubilidade da proteiacutena no ponto isoeleacutetrico e

portanto vale que

ln푎 (푝퐻) = ln 푠 (푝퐻) + ln 훾(푝퐻) = ln 푠 (푝퐼)

(32 - 7)

Assim

ln 푠 (푝퐻) = ln 푠 (푝퐼) + 퐴휙푍푝퐻2 radic퐼1 + 푏radic퐼

+2푏

ln 1 + 푏radic퐼

(32 - 8)

Esta equaccedilatildeo prevecirc a curva de solubilidade em funccedilatildeo do pH atraveacutes do caacutelculo da

atividade da proteiacutena na fase liacutequida pela equaccedilatildeo estendida de Debye-Huumlckel Para

resolvecirc-la eacute necessaacuterio se utilizar de um meacutetodo numeacuterico pois a forccedila iocircnica

depende da solubilidade naquele pH Optou-se neste trabalho pelo Meacutetodo de

Newton-Raphson para executar o meacutetodo iterativo que eacute exigido pela equaccedilatildeo (32

ndash 8) Para aplicar este meacutetodo arbitrou-se uma funccedilatildeo f(sp) definida aqui como

푓 푠 = minus ln 푠 (푝퐻) + ln 푠 (푝퐼) + 퐴휙푍푝퐻2 radic퐼

1 + 푏radic퐼+

2푏

ln 1 + 푏radic퐼

(32 - 9)

14 3 Modelo Estendido de Debye-Huumlckel

Assim ao calcular o sp que zera esta funccedilatildeo f(sp) saber-se-aacute que eacute a proacutepria

solubilidade que se deseja calcular Para aplicar o Meacutetodo de Newton-Raphson

basta derivar a funccedilatildeo f(sp) e aplicar o seguinte algoritmo de resoluccedilatildeo

푠 = 푠 minus푓(푠 )푓 (푠 )

(32 - 10)

Para calcular frsquo(s) deve-se considerar que a forccedila iocircnica depende da solubilidade

Para isto observando a equaccedilatildeo (32 - 5) vecirc-se que a forccedila iocircnica eacute dada pelo

somatoacuterio das contribuiccedilotildees de todos os iacuteons presentes na soluccedilatildeo por isso aqui

cabe um artifiacutecio de dividir estas contribuiccedilotildees em duas macro-contribuiccedilotildees aquela

devida a todos os iacuteons presentes na soluccedilatildeo exclusive os grupos ionizaacuteveis

presentes nas moleacuteculas da proteiacutena em questatildeo (I0) e que se considera constante

com o pH e aquela que engloba apenas os grupos ionizaacuteveis presentes nas

moleacuteculas da proteiacutena (IP)

퐼 = 퐼 + 퐼 = 퐼 +12푍 푠

(32 - 11)

Considerando a funccedilatildeo w tal que

푤 = radic퐼 = 퐼 +12푍 푠

(32 - 12)

Sendo

푤 =14푍 퐼

(32 - 13)

Entatildeo aplicando-se as devidas regras de derivaccedilatildeo tem-se

15 3 Modelo Estendido de Debye-Huumlckel

푓 (푠 ) = minus1푠 + 퐴 푍

3푤 + 2푤 푏푤(1 + 푏푤)

(32 - 14)

Substituindo as equaccedilotildees (32 - 12) e (32 - 13) na equaccedilatildeo (32 - 14) tem-se que

푓 (푠 ) = minus1푠 + 퐴 푍

15 + 푏radic퐼2radic퐼(1 + 푏radic퐼)

(32 - 15)

Entatildeo o algoritmo deve ser

푠 = 푠 minus

⎜⎛ln 푠 (푝퐼)

푠 + 퐴휙푍푝퐻2 radic퐼

1 + 푏radic퐼+ 2푏 ln 1 + 푏radic퐼

minus 1푠 + 퐴휙푍

15 + 푏radic퐼2radic퐼(1 + 푏radic퐼) ⎠

⎟⎞

(32 - 16)

4 Modelagem Termodinacircmica Proposta

41 Introduccedilatildeo

A condiccedilatildeo de equiliacutebrio entre duas fases (α e β) com m componentes eacute dada por

(Prausnitz et al 1999)

푝 = 푝

(41 ndash 1)

푇 = 푇

(41 ndash 2)

휇 = 휇⋮

휇 = 휇

(41 ndash 3)

Considerando o equiliacutebrio soacutelido-liacutequido (ESL) de sistemas contendo proteiacutenas

sendo que os efeitos da pressatildeo podem ser desprezados que as temperaturas nas

duas fases satildeo iguais e que na fase soacutelida soacute haacute proteiacutena tem-se que para a

proteiacutena a relaccedilatildeo de equiliacutebrio pode ser descrita por

휇 (푇푥) = 휇 (푇)

(41 ndash 4)

Contudo adotando-se a lei de Henry que eacute vaacutelida para baixas concentraccedilotildees de

soluto hipoacutetese que natildeo eacute distante dos valores observados da solubilidade de

proteiacutenas pode se escrever o potencial quiacutemico na fase liacutequida por

휇 (푇푥) = 휇 (푇 푥 ) + 푅푇푙푛푥

(41 ndash 5)

17 4 Modelagem Termodinacircmica Proposta

Entretanto variaccedilotildees de pH natildeo alteram o potencial quiacutemico da fase soacutelida o que

resulta pela relaccedilatildeo (41 ndash 4) que o mesmo natildeo altera tambeacutem o potencial quiacutemico

da fase liacutequida Com isso pela relaccedilatildeo (41 ndash 5) sendo o potencial quiacutemico de

referecircncia constante com o pH uma contradiccedilatildeo emerge a variaccedilatildeo do pH natildeo

poderia alterar o valor da solubilidade poreacutem a observaccedilatildeo experimental mostra o

contraacuterio Assim deve-se lembrar que pelo princiacutepio da eletroneutralidade a fase

soacutelida soacute possui moleacuteculas proteacuteicas eletricamente neutras e portanto o equiliacutebrio

de fases deve se estabelecer apenas entre as moleacuteculas presentes na fase soacutelida e

as moleacuteculas eletricamente neutras em soluccedilatildeo Ou seja como soacute moleacuteculas

eletricamente neutras podem estar na fase soacutelida o equiliacutebrio de fases depende

exclusivamente da fraccedilatildeo de moleacuteculas eletricamente neutras em soluccedilatildeo pois soacute

estas podem precipitar Assim tanto a equaccedilatildeo (41 ndash 4) quanto a equaccedilatildeo (41 ndash

5) devem ser aplicadas natildeo ao conjunto de todas as moleacuteculas de proteiacutena em

soluccedilatildeo mas somente as moleacuteculas proteacuteicas eletricamente neutras Portanto a

concentraccedilatildeo das moleacuteculas de proteiacutena eletricamente neutras em soluccedilatildeo eacute

constante com o pH e pode ser interpretada como a multiplicaccedilatildeo da fraccedilatildeo de

moleacuteculas eletricamente neutras pela concentraccedilatildeo total de proteiacutenas que eacute a

proacutepria solubilidade Assim uma relaccedilatildeo de inversa proporcionalidade eacute definida

quanto maior a fraccedilatildeo de moleacuteculas neutras menor seraacute a solubilidade de uma

proteiacutena em soluccedilatildeo Portanto no ponto isoeleacutetrico no qual haacute o miacutenimo de

solubilidade tem-se o ponto maacuteximo de fraccedilatildeo de moleacuteculas eletricamente neutras

A partir disto eacute possiacutevel escrever a equaccedilatildeo que rege o comportamento da

solubilidade de uma proteiacutena em funccedilatildeo do pH da soluccedilatildeo

휙(푝퐻)푆 (푝퐻) = 휆 = 푐표푛푠푡푎푛푡푒

(41 ndash 6)

18 4 Modelagem Termodinacircmica Proposta

Na equaccedilatildeo (41 ndash 6) o paracircmetro λ pode ser um paracircmetro de ajuste do modelo a

um conjunto de valores experimentais tendo se estabelecido uma funccedilatildeo objetivo ou

ainda dado pelo produto entre a solubilidade no ponto isoeleacutetrico e a fraccedilatildeo de

moleacuteculas eletricamente neutras em soluccedilatildeo tambeacutem no pI neste caso vale a

seguinte equaccedilatildeo

푠 (푝퐻) =휙(푝퐼)푠 (푝퐼)휙(푝퐻)

(41 ndash 7)

Sendo a equaccedilatildeo do modelo ndash equaccedilatildeo (41 ndash 7) ndash extremamente simples a uacutenica

dificuldade reside no caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras

(휙(푝퐻))

42 Caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras

Dentre os aminoaacutecidos que formam atraveacutes de ligaccedilotildees peptiacutedicas as proteiacutenas haacute

aqueles que possuem resiacuteduos com grupos ionizaacuteveis aleacutem dos grupos amina e

aacutecido carboxiacutelico terminais na cadeia Todos estes participam de equiliacutebrios

quiacutemicos com iacuteons H+ presentes na soluccedilatildeo entatildeo ao se alterar o pH da soluccedilatildeo

estes equiliacutebrios satildeo alterados

Assim haacute vaacuterias possibilidades de combinaccedilotildees de estados ionizados destes grupos

ionizaacuteveis que resultam em uma moleacutecula de proteiacutena eletricamente neutra Eacute

importante notar que dada a fraccedilatildeo de uma configuraccedilatildeo de uma moleacutecula neutra

todas as outras fraccedilotildees de configuraccedilotildees possiacuteveis que tambeacutem resultem em

moleacuteculas neutras satildeo proporcionais agrave fraccedilatildeo da configuraccedilatildeo dada pois todas as

configuraccedilotildees participam de equiliacutebrios entre si

19 4 Modelagem Termodinacircmica Proposta

Desta observaccedilatildeo implica-se que basta identificar uma configuraccedilatildeo proteacuteica cuja

soma dos estados ionizados resulte em carga nula para se descrever o equiliacutebrio de

fases em relaccedilatildeo ao pH na regiatildeo do ponto isoeleacutetrico onde esta consideraccedilatildeo eacute

predominante em relaccedilatildeo a outros possiacuteveis fenocircmenos

Contudo eacute necessaacuterio contabilizar a contribuiccedilatildeo de cada grupo ionizaacutevel via

equaccedilatildeo de Henderson-Hasselbach equaccedilatildeo (42 ndash 1)

훼 (푝퐻) =

⎩⎪⎨

⎪⎧ 10

1 + 10 푠푒 휈 = minus1

11 + 10

푠푒 휈 = +1

(42 ndash 1)

Na qual pKAj eacute o co-logaritmo da constante de equiliacutebrio do grupo ionizaacutevel do

resiacuteduo j j eacute estado carregado potencial do resiacuteduo j (-1 para grupos aacutecidos e +1

para grupos baacutesicos) e j eacute a fraccedilatildeo ionizada para o pH dado Para grupos cujo

estado de ionizaccedilatildeo na dada configuraccedilatildeo seja neutro a sua fraccedilatildeo eacute calculada tal

que a soma de sua fraccedilatildeo e da fraccedilatildeo ionizada tenha como resultado o valor

unitaacuterio

Assim a funccedilatildeo Pn pode ser escrita como o produto de cada fraccedilatildeo de cada grupo

ionizaacutevel j naquele estado (-1 0 ou +1) na configuraccedilatildeo neutra k em uma proteiacutena

com n grupos ionizaacuteveis Uma representaccedilatildeo matemaacutetica possiacutevel para esta funccedilatildeo

pode ser escrita como

휙 (푝퐻) = 훼 (푝퐻)

(42 ndash 2)

Na qual a fraccedilatildeo jrsquo(pH) eacute dada por

20 4 Modelagem Termodinacircmica Proposta

훼 (푝퐻) =훼 (푝퐻) 푠푒 휀 = 11 minus 훼 (푝퐻) 푠푒 휀 = 0

(42 ndash 3)

Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (42 ndash 3) e a resultante na equaccedilatildeo

(42 ndash 2) pode-se escrever que

휙 (푝퐻) =1

1 + 10

1 + 휈2 minus 휈 휀 10

minus휈 minus 1

2 minus 휈 휀 푐표푚 휀 = 0

(42 ndash 4)

A equaccedilatildeo (42 ndash 4) junto agrave equaccedilatildeo (41 ndash 7) constituem o modelo termodinacircmico

capaz de predizer a razatildeo entre as fraccedilotildees de moleacuteculas neutras de uma proteiacutena

em funccedilatildeo do pH na regiatildeo do ponto isoeleacutetrico mantendo fixas temperatura e forccedila

iocircnica Substituindo a equaccedilatildeo (42 ndash 4) na equaccedilatildeo (41 ndash 7) obteacutem-se para a

curva de solubilidade

푠 (푝퐻)푠 (푝퐼) =

1 + 101 + 10

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

푐표푚 휀 = 0

(42 ndash 8)

5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

51 Introduccedilatildeo

Segundo Groumlnwall (1941) na fase liacutequida haacute moleacuteculas de proteiacutenas com muitas

configuraccedilotildees k distintas que possuem carga liacutequida i e tambeacutem haacute certas

configuraccedilotildees que tem carga liacutequida nula e satildeo chamadas configuraccedilotildees neutras

Aleacutem disso estas uacuteltimas satildeo aquelas que determinam o equiliacutebrio de fases jaacute que

elas estatildeo em equiliacutebrio com a fase soacutelida na qual soacute haacute moleacuteculas neutras pelo

princiacutepio da eletroneutralidade Eacute tambeacutem afirmado que dado este equiliacutebrio a

atividade das moleacuteculas neutras natildeo se altera com a variaccedilatildeo do pH e eacute

proporcional agraves atividades de qualquer tipo de configuraccedilatildeo neutra

Neste mesmo trabalho eacute atribuiacuteda a Linderstroslashm-Lang o desenvolvimento de uma

teoria de prediccedilatildeo da solubilidade de proteiacutenas com a variaccedilatildeo do pH na regiatildeo do

ponto isoeleacutetrico Este desenvolvimento apresenta um balanccedilo de cargas de um

modo impliacutecito contudo como atestado por Groumlnwall o escasso conhecimento

sobre as estruturas proteacuteicas impediram agravequele tempo uma formulaccedilatildeo mais

pormenorizada do problema

52 Desenvolvimento teoacuterico

A base desta abordagem descrita por Groumlnwall e atribuiacuteda a Linderstroslashm-Lang

reside na hipoacutetese de que a moleacutecula de proteiacutena de configuraccedilatildeo k e carga nula

participa do seguinte equiliacutebrio com os iacuteons H+ e com sua forma de carga i

22 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

푃 + 푖퐻 푃 lowast

(52 ndash 1)

Note-se que o valor de i pode ser negativo A constante do equiliacutebrio quiacutemico

descrita pela equaccedilatildeo (52 ndash 1) pode ser expressa como

퐾 =푎

lowast

푎 푎

(52 ndash 2)

Sabendo que a atividade da moleacutecula de proteiacutena de configuraccedilatildeo k e carga i eacute dada

pelo produto entre sua concentraccedilatildeo e seu coeficiente de atividade tem-se que

푥lowast

= 푎 푎퐾훾

lowast

(52 ndash 3)

Entretanto a solubilidade da proteiacutena eacute soma das concentraccedilotildees de todas as

moleacuteculas de carga i Poreacutem a concentraccedilatildeo das moleacuteculas de carga i eacute a soma das

concentraccedilotildees das moleacuteculas de configuraccedilatildeo k Assim a solubilidade pode ser

escrita como

푠 (푝퐻) = 푎 푎퐾훾

lowast

(52 ndash 4)

Derivando a equaccedilatildeo (52 ndash 4) com respeito agrave atividade do iacuteon H+ considerando

que atividade da moleacutecula neutra eacute constante para qualquer configuraccedilatildeo k e ainda

que o coeficiente de atividade da proteiacutena de carga i independe da atividade do iacuteon

H+ tem-se que

푑푠푑푎 = 푖 ∙ 푎 푎

퐾훾

lowast

(52 ndash 5)

23 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

Sendo

푑 log 푠 (푝퐻)푑(푝퐻) = minus

푎푠 (푝퐻)

푑푠푑푎

(52 ndash 6)

Substituindo as equaccedilotildees (52 ndash 4) e (52 ndash 5) na equaccedilatildeo (52 ndash 6) e

reescrevendo em termos de pH e das concentraccedilotildees das proteiacutenas de carga i tem-

se que

푑 log 푠푑(푝퐻) = minus

sum (푖 ∙ 푥 )sum 푥

(52 ndash 7)

Contudo o termo do lado direito da equaccedilatildeo (52 ndash 7) estaacute associado ao conceito

de valecircncia meacutedia estabelecido por Linderstroslashm-Lang (1924)

횤 =sum (푖 ∙ 푥 )sum 푥

(52 ndash 8)

Os autores natildeo possuiacuteam um modo mais adequado de construir a curva de

solubilidade dada pela equaccedilatildeo (52 ndash 7) do que aproximar por uma funccedilatildeo linear o

perfil de carga liacutequida da proteiacutena obtido experimentalmente e integraacute-lo valendo-se

da analogia entre o conceito de carga liacutequida (Z) e de valecircncia meacutedia ( i ) Entretanto

hoje jaacute se tem uma descriccedilatildeo analiacutetica do perfil de carga liacutequida de proteiacutenas que

pode ser escrita como

푍(푝퐻) = 휈 훼

(52 ndash 9)

Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (52 ndash 9) e a resultante na equaccedilatildeo

(52 ndash 7) tem-se que

24 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

푑 log 푠푑(푝퐻) = minus

12

11 + 10

1 + 휈 + 휈 1 minus 휈 10

(52 ndash 10)

Integrando a equaccedilatildeo (52 ndash 10) de um ponto de referecircncia por exemplo do ponto

isoeleacutetrico (pI) ateacute um pH qualquer tem-se a seguinte relaccedilatildeo

푑 log 푠

( )

( )

= minus12

1

1 + 101 + 휈 + 휈 1 minus 휈 10 푑(푝퐻)

(52 ndash 11)

log푠 (푝퐻)푠 (푝퐼) = minus

12 1 + 휈

11 + 10

푑(푝퐻)

+ 휈 1 minus 휈10

1 + 10푑(푝퐻)

(52 ndash 12)

Fazendo a seguinte substituiccedilatildeo

푢 = 10 푡푎푙 푞푢푒 푑푢푢 = ln 10푑(푝퐻)

(52 ndash 13)

Tem-se que

log푠 (푝퐻)푠 (푝퐼) = minus

12

1 + 휈ln 10

1푢(1 + 푢) 푑푢 +

휈 1 minus 휈ln 10

1(1 + 푢) 푑푢

(52 ndash 14)

log푠 (푝퐻)푠 (푝퐼) = minus

12

1 + 휈ln 10

1푢 푑푢 minus

11 + 푢 푑푢 +

휈 1 minus 휈ln 10

1(1 + 푢) 푑푢

(52 ndash 15)

25 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐼) = minus

12 1 + 휈 log

1010

minus 휈 1 minus 휈 minus 1 + 휈 log1 + 101 + 10

(52 ndash 16)

Sendo

휈 1 minus 휈 minus 1 + 휈 = 휈 minus 휈 minus 1 minus 휈 = minus 1 + 휈 = minus2

(52 ndash 17)

Resultando em

log푠 (푝퐻)푠 (푝퐼) = log

1 + 101 + 10

minus1 + 휈

2 (푝퐻 minus 푝퐼)

(52 ndash 18)

Ainda eacute possiacutevel reescrever a equaccedilatildeo (52 ndash 18) como

log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log

1 + 101 + 10

(52 ndash 19)

Na qual n+ representa o nuacutemero de resiacuteduos ionizaacuteveis que na sua forma carregada

apresentam carga positiva A equaccedilatildeo (52 ndash 19) eacute uma expressatildeo analiacutetica que a

partir de dados da estrutura proteacuteica e de um dado de solubilidade permite predizer

a curva de solubilidade de uma dada proteiacutena em funccedilatildeo do pH na regiatildeo do ponto

isoeleacutetrico mantendo fixas a temperatura e a forccedila iocircnica do sistema

Eacute possiacutevel provar que as equaccedilotildees (42 ndash 8) e (52 ndash 19) satildeo idecircnticas - a prova

disso eacute descrita na seccedilatildeo 6 ndash e assim tem-se que apesar das distintas abordagens

a descriccedilatildeo do fenocircmeno eacute a mesma Note-se que um passo fundamental no

desenvolvimento da Equaccedilatildeo (52 ndash 5) eacute admitir que por hipoacutetese a atividade da

26 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

forma neutra natildeo depende do pH essa hipoacutetese tambeacutem eacute a base da equaccedilatildeo (41

ndash 7) Deve-se registrar o fato de que pelo melhor do nosso conhecimento esta eacute a

primeira vez que uma expressatildeo analiacutetica para o caacutelculo da solubilidade de

proteiacutenas em funccedilatildeo do pH eacute descrita mesmo no limite em que se considera vaacutelida

a lei de Henry

53 Soluccedilatildeo Paraboacutelica da Curva de Solubilidade

Tanto Groumlnwall (1941) quanto Fredericq e Neurath (1950) adotaram a hipoacutetese de

que os perfis de carga liacutequida da -lactoglobulina para um e da insulina para os

outros dois eram lineares na regiatildeo do ponto isoeleacutetrico Esta hipoacutetese eacute bastante

plausiacutevel e simplificadora principalmente a eacutepoca na qual estes trabalhos foram

desenvolvidos em que a estrutura proteacuteica bem como as constantes de ionizaccedilatildeo

dos resiacuteduos com grupos ionizaacuteveis era pouco conhecida De fato ainda hoje a falta

de dados das constantes de ionizaccedilatildeo na cadeia proteacuteica eacute o maior desafio no uso

do modelo rigoroso ndash equaccedilatildeo (52 ndash 18) Por isso o valor desta hipoacutetese de perfil

de carga liacutequida linear eacute notaacutevel

Supondo entatildeo que o perfil de carga seja linear eacute possiacutevel escrevecirc-lo como

푍(푝퐻) = minus퐴(푝퐻 minus 푝퐼) 푐표푚 퐴 gt 0

(53 ndash 1)

Substituindo (53 ndash 1) em (52 ndash 6)

푑 log 푠 (푝퐻)푑(푝퐻) = 퐴(푝퐻 minus 푝퐼)

(53 ndash 2)

Integrando (53 ndash 2) de um pH0 de referecircncia ateacute pH tem-se que

27 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐻 ) = 퐾[푝퐻 minus 2푝퐼(푝퐻 minus 푝퐻 ) minus 푝퐻 ] 푐표푚 퐾 =

퐴2

(53 ndash 3)

Ao se adotar como ponto de referecircncia o ponto isoeleacutetrico a equaccedilatildeo (53 ndash 3)

reduz-se agrave

log푠 (푝퐻)푠 (푝퐼) = 퐾(푝퐻 minus 푝퐼)

(53 ndash 4)

Contudo apesar da soluccedilatildeo quadraacutetica ou paraboacutelica para a equaccedilatildeo estendida de

Linderstroslashm-lang e Groumlnwall expressa na equaccedilatildeo (53 ndash 3) natildeo requerer os dados

das constantes de ionizaccedilatildeo dos resiacuteduos com grupos ionizaacuteveis ela exige a

definiccedilatildeo do paracircmetro A que fisicamente representa a inclinaccedilatildeo da reta de

aproximaccedilatildeo da curva de carga liacutequida e que pode ser calculado por correlaccedilatildeo a

partir de um conjunto de dados experimentais de solubilidade ou de carga liacutequida

6 Identidade entre o Modelo Proposto e a Equaccedilatildeo

Estendida de Linderstroslashm-Lang e Groumlnwall

A equaccedilatildeo final da modelagem termodinacircmica proposta apresentada na seccedilatildeo 4 eacute a

equaccedilatildeo (42 ndash 8) dada por

푠 (푝퐻)푠 (푝퐼) =

1 + 101 + 10

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 1)

Aplicando-se o logaritmo decimal nos dois termos da equaccedilatildeo (6 ndash 1) tem-se que

log푠 (푝퐻)푠 (푝퐼) = log

1 + 101 + 10

+ log

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 2)

Pelo bem da simplificaccedilatildeo desta deduccedilatildeo adotar-se-atildeo as seguintes funccedilotildees

휂 (푝퐻) = log

(6 ndash 3)

휃 (푝퐻) = log

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 4)

Assim pode-se reescrever a equaccedilatildeo (6 ndash 2) por

29 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐼) = 휂 (푝퐻) + 휃 (푝퐻)

(6 ndash 5)

Observando-se a equaccedilatildeo (6 ndash 5) tem-se que a funccedilatildeo j independe do estado de

ionizaccedilatildeo do resiacuteduo j poreacutem a funccedilatildeo jk depende Por isso deve-se analisar esta

funccedilatildeo para cada estado de ionizaccedilatildeo possiacutevel como mostrado na Tabela 61

Tabela 6 1 ndash Anaacutelise da funccedilatildeo jk para cada estado de ionizaccedilatildeo possiacutevel

j jk jk Quantidade de resiacuteduos neste estado

-1 -1 푝퐼 minus 푝퐻 na

0 0 nb

+1 +1 0 nc

0 푝퐼 minus 푝퐻 nd

Pela anaacutelise da Tabela 61 e considerando uma proteiacutena com n resiacuteduos com

grupos ionizaacuteveis infere-se que a equaccedilatildeo (6 ndash 5) pode ser reescrita como

log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)

(6 ndash 6)

Contudo as equaccedilotildees acima descritas satildeo vaacutelidas apenas para configuraccedilotildees

neutras pois apenas as configuraccedilotildees neutras da fase liacutequida estatildeo em equiliacutebrio

com as moleacuteculas de proteiacutena da fase soacutelida Para que uma configuraccedilatildeo seja

neutra vale a seguinte restriccedilatildeo

휀 = 0 hArr 푛 = 푛

(6 ndash 7)

30 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall

Substituindo a restriccedilatildeo dada pela equaccedilatildeo (6 ndash 7) na equaccedilatildeo (6 ndash 6) tem-se que

log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)

(6 ndash 8)

Ora mas a soma de nc e de nd natildeo resulta em outra coisa senatildeo no nuacutemero de

resiacuteduos com grupos ionizaacuteveis da estrutura proteacuteica cujo j seja +1 Assim

substituindo nc mais nd por n+ e substituindo a equaccedilatildeo (6 ndash 3) na equaccedilatildeo (6 ndash 8)

tem-se que

log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log

1 + 101 + 10

(6 ndash 9)

Ao se analisar a equaccedilatildeo (6 ndash 9) observa-se que ela eacute idecircntica a equaccedilatildeo estendida

de Linderstroslashm-Lang e Groumlnwall apresentada pela equaccedilatildeo (52 ndash 19) Com isso

tem-se que apesar das distintas formulaccedilotildees tanto a modelagem termodinacircmica aqui

proposta quanto a extensatildeo a teoria de Linderstroslashm-Lang e Groumlnwall resultam na

mesma descriccedilatildeo do fenocircmeno Aleacutem disso a equaccedilatildeo final dos modelos eacute

extremamente simples e depende apenas de um ponto de referecircncia e dos dados da

estrutura da moleacutecula de proteiacutena cuja solubilidade se deseja estudar

7 Aplicaccedilatildeo dos Modelos Expostos

Para validar o modelo comparando-o com o caacutelculo feito a partir da teoria de Debye-

Huumlckel o criteacuterio que relaciona os pontos calculados pelo modelo com os pontos

experimentais foi estabelecido a partir da seguinte funccedilatildeo objetivo (FO)

퐹푂 =1푁

푠 minus 푠푠

(7 ndash 1)

Contudo a equaccedilatildeo (7 ndash 1) natildeo eacute a melhor definiccedilatildeo de funccedilatildeo objetivo neste caso

pois a derivada da curva de solubilidade eacute razoavelmente grande nos dois lados do

ponto isoeleacutetrico e isso permite que pequenos desvios na direccedilatildeo horizontal

resultem em um grande aumento no valor da funccedilatildeo objetivo Uma soluccedilatildeo possiacutevel

seria substituir essa funccedilatildeo objetivo por uma funccedilatildeo definida pela soma do quadrado

da distacircncia do ponto experimental agrave curva do modelo principalmente se fosse

necessaacuterio calcular algum paracircmetro do modelo via otimizaccedilatildeo da funccedilatildeo objetivo

estipulada Natildeo sendo este o escopo deste trabalho optou-se pelo uso da FO

definida na equaccedilatildeo (7 ndash 1)

71 Solubilidade da Insulina Suiacutena

As Figuras 711 712 e 713 apresentam os graacuteficos da curva de solubilidade

dada pelos pontos experimentais pelo modelo proposto pela abordagem claacutessica e

tambeacutem a curva obtida pela soluccedilatildeo paraboacutelica da Equaccedilatildeo de Linderstroslashm-Lang e

Groumlnwall em trecircs temperaturas distintas

32 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 711 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 25 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

Figura 712 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 15 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

00

40

80

120

160

200

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

00

50

100

150

200

250

300

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

33 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 713 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 5 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

Os desvios da curva obtida pelo modelo proposto para valores de pH distantes do pI

podem ser explicados por ao menos trecircs importantes motivos dois devidos a

hipoacuteteses do modelo e um devido a fenocircmenos intriacutensecos a proteiacutena Sabendo que

no pI a solubilidade eacute miacutenima para valores de pH distantes do pI pode-se ter

solubilidades suficientemente grandes para que a validade da lei de Henry ndash adotada

na formulaccedilatildeo do modelo - seja questionada pois quanto mais distante do pI maior

a solubilidade e menor a validade da lei de Henry jaacute que haacute um aumento da

concentraccedilatildeo do soluto (proteiacutena) na soluccedilatildeo e tambeacutem ao fato do modelo prever

solubilidade infinita quando a fraccedilatildeo de moleacuteculas eletricamente neutras tende a

zero

limrarr푠 = lim

rarr

Φ(푝퐼)푠 (푝퐼)Φ(푝퐻) = +infin

(711 ndash 1)

00

50

100

150

200

250

300

350

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

34 7 Aplicaccedilatildeo dos Modelos Expostos

Todavia ainda haacute um fator de ordem natural que justifica o desvio apresentado para

valores de pH distantes do pI o desnovelamento da cadeia proteacuteica Este fenocircmeno

pode ocorrer de maneira a expor grupos hidroacutefobos resiacuteduos antes natildeo expostos

acrescentando relaccedilotildees de equiliacutebrio quiacutemico natildeo existentes na regiatildeo do pI

alterando o equiliacutebrio de fases e portanto alterando o valor da solubilidade

A Tabela 711 apresenta os valores obtidos para a funccedilatildeo objetivo definida em (7 ndash

1) tanto para o modelo proposto quanto para a abordagem claacutessica para trecircs

diferentes temperaturas

Tabela 711 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada

abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para insulina

suiacutena

T ordmC Abordagem FO

25 P 01857 C 02535

15 P 01981 C 05056

5 P 03595 C 03064

Observando-se a Tabela 711 vecirc-se que o modelo apresentou melhores resultados

do que o caacutelculo efetuado atraveacutes da abordagem claacutessica no que tange a

minimizaccedilatildeo da funccedilatildeo objetivo exceto para os dados a 5 ordmC

Tambeacutem eacute possiacutevel observar que a funccedilatildeo objetivo sofreu aumento com a

diminuiccedilatildeo da temperatura Isto ocorreu principalmente devido agrave dificuldade de

obter dados experimentais de solubilidade a temperaturas baixas o que aumenta o

desvio experimental fazendo com que se tenha um aumento do valor da funccedilatildeo

objetivo como a definida em (5 ndash 1) Um efeito secundaacuterio que tambeacutem pressiona a

35 7 Aplicaccedilatildeo dos Modelos Expostos

funccedilatildeo objetivo eacute o fato dos dados de pKA terem sido obtidos a uma temperatura

especiacutefica o que tende a acrescentar erro no caacutelculo de solubilidades a temperaturas

diferentes ainda que o pKA natildeo varie de forma ab-rupta com a temperatura

Outra observaccedilatildeo que deve ser registrada eacute o fato da funccedilatildeo objetivo para a

abordagem claacutessica na temperatura de 15 ordmC divergir a um valor tatildeo elevado em

relaccedilatildeo aos demais Isto se deve a um ponto experimental especiacutefico a um pH de

45 a solubilidade da insulina suiacutena obtida experimentalmente eacute 230 x 10-5 mol kg-1

enquanto a calculada pelo modelo proposto eacute 230 x 10-5 mol kg-1 e a calculada pela

abordagem claacutessica eacute 520 x 10-5 mol kg-1 Por conta do desvio deste ponto a funccedilatildeo

objetivo para a abordagem claacutessica nesta temperatura tem um aumento significativo

A Tabela 712 apresenta os valores do paracircmetro K da soluccedilatildeo paraboacutelica obtidos

neste trabalho para a insulina suiacutena comparados ao encontrado na literatura

Tabela 712 ndash Valores do paracircmetro K da soluccedilatildeo paraboacutelica para a insulina suiacutena

Referecircncias T ordmC K Fredericq e Neurath (1950) - 081 Neste trabalho 25 104 Neste trabalho 15 101 Neste trabalho 5 145

Pela Tabela 712 pode-se observar que haacute uma diferenccedila pequena entre os

valores do paracircmetro K obtidos neste trabalho e por Fredericq e Neurath (1950) Por

isso natildeo se pode afirmar a que se deve esta diferenccedila se eacute devido a diferenccedilas entre

procedimentos experimentais ou se eacute devido agrave diferenccedila de meacutetodo de caacutelculo do

paracircmetro Apesar de no experimento realizado por Fredericq e Neurath (1950)

haver a presenccedila do acircnion tiocianato e este acircnion interagir com grupos ionizaacuteveis

da cadeia proteacuteica como observado pelos autores do trabalho tambeacutem estes

36 7 Aplicaccedilatildeo dos Modelos Expostos

proacuteprios autores afirmam que a presenccedila deste acircnion natildeo altera a forma da curva

que eacute basicamente determinada pelo paracircmetro K De qualquer modo eacute interessante

observar a proximidade dos valores encontrados neste trabalho com o obtido por

Fredericq e Neurath (1950) pelo menos no que diz respeito agrave ordem de grandeza do

paracircmetro em questatildeo

72 Solubilidade da Lisozima de clara de ovo de galinha

Um modelo para ser validado necessita correlacionar dados experimentais de modo

satisfatoacuterio ou seja um modelo deve buscar fidelidade ao fenocircmeno fiacutesico

observado Assim na procura de dados de solubilidade de proteiacutenas poucos dados

na regiatildeo do pI foram encontrados Este eacute o caso da lisozima de clara de ovo de

galinha que apesar de ter muitos estudos de solubilidade nenhum deles se

encontra na regiatildeo do pI Surgiu assim a necessidade de se obter estes dados

experimentais para poder validar o modelo proposto A escolha da lisozima de clara

de ovo de galinha se deu em parte pela sua importacircncia mas tambeacutem em parte por

ter os valores de pKA conhecidos

A curva de solubilidade da lisozima de clara de ovo de galinha levantada neste

trabalho estaacute apresentada na Figura 721

37 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em

soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e

dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()

Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento

esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH

isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de

soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se

comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto

isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da

soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos

ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente

neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a

solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e

00

10

20

30

40

50

60

70

80

90

100

95 100 105 110 115 120

Solu

bilid

ade

(mg

mL)

pH

38 7 Aplicaccedilatildeo dos Modelos Expostos

alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado

em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo

Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo

a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo

Por conta de falta de dados a este respeito modelou-se apenas a curva de

solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura

722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de

galinha em funccedilatildeo do pH da soluccedilatildeo

Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)

00

10

20

30

40

50

60

70

80

90

96 99 102 105 108 111 114 117 120

Solu

bilid

ade

(mg

mL)

pH

39 7 Aplicaccedilatildeo dos Modelos Expostos

O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721

Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada

abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima

de clara de ovo de galinha

T ordmC Abordagem FO

25 P 4650 C gt7919a

a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado

Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta

aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a

abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca

de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos

anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao

efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de

clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a

variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A

proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de

cargas pontuais de Debye-Huumlckel

8 Conclusotildees

A modelagem termodinacircmica proposta neste trabalho apresentou expressivos

resultados quando comparada a abordagem claacutessica de Debye-Huumlckel

Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o

modelo aproximou melhor os pontos experimentais do que a referida abordagem

comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima

ao ponto isoeleacutetrico

Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica

para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua

construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo

lugar por sua aplicabilidade

Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis

da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva

em regiotildees distantes do ponto isoeleacutetrico

9 Referecircncias Bibliograacuteficas

BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene

Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects

Biophys J 95 1285-1294 2008

FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and

other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72

2684 - 26911950

GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v

93 p 517-542 1931

GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab

Carlsberg v 24 p 185-200 1941

KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native

and mutant insulins pK perturbation of B13-Glu in aggregated species Arch

Biochem Biophys v 283 p 496-502 1990

KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for

the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng

Chem Res v 35 p 4319-4327 1996

42 9 Referecircncias Bibliograacuteficas

KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen

lysozyme J Biochem v 87 p 1215-1219 1980

LADISCH M R Bioseparations Engineering principles practice and

economics John Wiley amp Sons 2001 pp1 116 ndash 117 133

LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab

Carlsberg v 15 p 1-29 1924

PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da

particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas

2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP

PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the

excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte

solutions Fluid Phase Equilib v 269 p 25ndash35 2008

PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-

contribution model involving phase and chemical equilibrium Ind Eng Chem Res

v 33 p 1341-1347 1994

PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277

1973

PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino

acids Fluid Phase Equilib v 152 p 121-132 1998

43 9 Referecircncias Bibliograacuteficas

PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular

Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999

SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of

equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte

solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009

TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J

R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with

carbon dioxide Biotech Bioeng v103 p 909-919 2009

TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer

free energy Biophys J v 95 p 2601-2609 2008

TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in

water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95

2009

Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na

cadeia proteacuteica

Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo

de ionizaccedilatildeo

퐻퐴 퐴 + 퐻

(A ndash 1)

Assim considerando que a constante de equiliacutebrio

퐾 = 푎

(A ndash 2)

Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que

퐾 =[퐴 ][퐻 ]

[퐻퐴]

(A ndash 3)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que

log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]

(A ndash 4)

Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado

por

minus log[휑] = 푝휑

(A ndash 5)

Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que

45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

푝퐾 = log[퐻퐴][퐴 ] + 푝퐻

(A ndash 6)

Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por

훼 =[퐴 ]

[퐻퐴] + [퐴 ]

(A ndash 7)

Reescrevendo (A ndash 7) tem-se que

훼 =[퐴 ] [퐻퐴frasl ]

1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =

훼1 minus 훼

(A ndash 8)

Substituindo (A ndash 8) em (A ndash 6) tem-se que

푝퐾 = log훼

1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10

(A ndash 9)

Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos

훼 =1

1 + 10

(A ndash 10)

Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio

퐴 + 퐻 퐻퐴

(A ndash 11)

Pode se escrever a constante de equiliacutebrio como

퐾 =[퐻퐴 ]

[퐴][퐻 ]

(A ndash 12)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que

46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

log퐾 = minus log[퐴]

[퐻퐴 ] minus log[퐻 ]

(A -13)

Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por

훼 =[퐻퐴 ]

[퐴] + [퐻퐴 ]

(A ndash 14)

Assim a equaccedilatildeo (A ndash 13) fica

훼1 minus 훼 = 10

(A ndash 15)

Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo

훼 =10

1 + 10

(A ndash 16)

Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos

modelos expostos

Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]

48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]

49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)

50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])

51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]

52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])

53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)

54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2

55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO

iii

ABSTRACT

In this work it is presented a model for the protein solubility curve in aqueous

solutions as a function of the solution pH based on classical thermodynamic tools

and considering the different ionization states that protein molecules may assume It

was also studied the model described by Groumlnwall in his article published in the early

1940rsquos and from this study it was developed an extension of his theory which as

proved in this work is identical to the initially proposed modeling For comparison

solubility curves were modeled using the Debye-Huumlckel extended activity model for

electrolytic solutions

It was obtained experimental hen egg white lysozyme solubility data for some pH

values in the region of the isoelectric point So much for porcine insulin as for the hen

egg white lysozyme the developed model describes with high accuracy the

phenomenon experimentally observed The model application allows us to conclude

that the utilization of the ionization states calculus is an effective tool in the

thermodynamic modeling of protein solutions

Sumaacuterio

1 Introduccedilatildeo 1

2 Materiais e Meacutetodos 7

21 Meacutetodos computacionais 7

22 Curva de solubilidade da lisozima da clara de ovo de galinha 9

221 Reagentes 9

222 Equipamentos 9

223 Preparaccedilatildeo das soluccedilotildees-tampatildeo 9

224 Procedimento experimental 10

3 Modelo Estendido de Debye-Huumlckel 11

31 Introduccedilatildeo 11

32 Desenvolvimento teoacuterico 12

4 Modelagem Termodinacircmica Proposta 16

41 Introduccedilatildeo 16

42 Caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras 18

5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall 21

51 Introduccedilatildeo 21

52 Desenvolvimento teoacuterico 21

53 Soluccedilatildeo Paraboacutelica da Curva de Solubilidade 26

6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall 28

7 Aplicaccedilatildeo dos Modelos Expostos 31

71 Solubilidade da Insulina Suiacutena 31

72 Solubilidade da Lisozima de clara de ovo de galinha 36

8 Conclusotildees 40

9 Referecircncias Bibliograacuteficas 41

Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach 44

Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos 47

1 Introduccedilatildeo

Dentre as etapas de um processo biotecnoloacutegico aquela dedicada a purificaccedilatildeo de

bioprodutos tende a ser determinante em geral para o custo do processo seguindo

a tendecircncia dos processos de separaccedilatildeo da induacutestria quiacutemica tradicional A

produccedilatildeo de proteiacutenas tem lugar de destaque no rol de bioprodutos de interesse

pois muitos antibioacuteticos hormocircnios e enzimas pertencem a esta classe de

biomoleacuteculas e possuem notoacuterio interesse industrial por suas propriedades

terapecircuticas e aplicaccedilotildees na induacutestria alimentiacutecia No entanto proteiacutenas a serem

comercializadas para estes fins exigem altos graus de pureza que somente satildeo

obtidos pelas etapas de purificaccedilatildeo Como afirmado por Bončina et al (2008)

estudos de separaccedilatildeo de proteiacutenas especificamente tecircm sido motivados por um

aumento da demanda por proteiacutenas puras nas induacutestrias farmacecircutica e correlatas

Muitas moleacuteculas bioloacutegicas ndash ou comumente chamadas biomoleacuteculas - e

particularmente proteiacutenas satildeo destruiacutedas pelo calor natildeo podem ser destiladas satildeo

geradas a baixas concentraccedilotildees e tecircm uma estrutura tridimensional que pode ser

alterada durante a purificaccedilatildeo resultando na perda da atividade bioloacutegica Por isso

bioprodutos tais como proteiacutenas devem ser recuperados purificados e

concentrados em operaccedilotildees com membranas etapas de adsorccedilatildeo cromatografia

cristalizaccedilatildeo e outras teacutecnicas que natildeo requerem calor ou pH extremo para alcanccedilar

o fracionamento (Ladisch 2001)

Em geral nos processos biotecnoloacutegicos as correntes de saiacuteda dos biorreatores

seguem para as operaccedilotildees de downstream (etapas de separaccedilatildeo que visam

concentrar e dispor o produto final) As primeiras operaccedilotildees de downstream por

exemplo a clarificaccedilatildeo e a centrifugaccedilatildeo tecircm por objetivo isolar a proteiacutena de

2 1 Introduccedilatildeo

interesse das ceacutelulas que a produziram Apoacutes estas primeiras etapas de purificaccedilatildeo

seguem-se as operaccedilotildees de baixa resoluccedilatildeo A precipitaccedilatildeo e a extraccedilatildeo em

sistemas de duas fases aquosas satildeo exemplos destas operaccedilotildees que tendem a

concentrar a proteiacutena-alvo preparando-a para os proacuteximos estaacutegios de separaccedilatildeo

Por fim a proteiacutena ora na concentraccedilatildeo obtida pelas operaccedilotildees anteriores eacute tratada

por operaccedilotildees de alta resoluccedilatildeo caracterizadas principalmente pela teacutecnica de

cromatografia a fim de concentrar a proteiacutena agrave pureza especificada para seu uso

Vale ressaltar que esta uacuteltima etapa eacute extremamente dispendiosa e quanto mais

eficientes forem as etapas precedentes no que tange a pureza da proteiacutena-alvo

menos custosa seraacute a etapa posterior

O escopo deste trabalho estaacute centrado na operaccedilatildeo de precipitaccedilatildeo de proteiacutenas

cujos fundamentos satildeo as relaccedilotildees do equiliacutebrio soacutelido-liacutequido (ESL) destes

sistemas A solubilidade de uma proteiacutena em soluccedilatildeo eacute governada pelos mesmos

princiacutepios fundamentais ou seja condiccedilotildees de equiliacutebrio termodinacircmico que regem

o comportamento de qualquer substacircncia no ESL Contudo algumas diferenccedilas

devem ser levadas em conta na descriccedilatildeo deste fenocircmeno e no projeto destas

operaccedilotildees

Proteiacutenas satildeo formadas por cadeias de aminoaacutecidos atraveacutes de ligaccedilotildees peptiacutedicas

cada aminoaacutecido pode ser considerado um monocircmero que ao possuir um grupo

ionizaacutevel natildeo ligado tal como ocorre em alguns aminoaacutecidos naturais tirosina (Tyr)

lisina (Lys) cisteiacutena (Cys) histidina (His) arginina (Arg) aacutecido aspaacutertico (Asp) e

aacutecido glutacircmico (Glu) e tambeacutem em resiacuteduos terminais confere a proteiacutena uma

caracteriacutestica de polieletroacutelito Eacute importante entatildeo considerar a definiccedilatildeo de

polieletroacutelitos tal qual definida por Pessocirca Filho e Maurer (2008) polieletroacutelitos satildeo

3 1 Introduccedilatildeo

poliacutemeros com muitas unidades monomeacutericas eletroliacuteticas ndash neste caso

aminoaacutecidos que possuem grupos ionizaacuteveis natildeo ligados

Para muitos processos industriais e mesmo naturais informaccedilotildees a respeito de

equiliacutebrios de fases de soluccedilotildees eletroliacuteticas satildeo necessaacuterias e necessaacuterias tambeacutem

satildeo modificaccedilotildees nos modelos tradicionais de coeficiente de atividade quando se

trata de descrever equiliacutebrios de fases em sistemas que conteacutem eletroacutelitos (Prausnitz

et al 1999)

Sendo assim tendo que a pressatildeo do sistema natildeo influencia de modo significativo o

ESL tem-se que trecircs variaacuteveis o influenciam diretamente a temperatura o pH e a

forccedila iocircnica estas duas uacuteltimas tornam-se importantes devido agrave caracteriacutestica

eletroliacutetica das proteiacutenas

Na verdade a forccedila iocircnica natildeo eacute uma variaacutevel que represente de modo abrangente

os possiacuteveis efeitos de iacuteons em soluccedilotildees proteacuteicas Isto se deve ao fato de que a

forccedila iocircnica do modo como eacute definida natildeo contempla uma diferenciaccedilatildeo entre os

equiliacutebrios que se estabelecem entre os iacuteons e alguns resiacuteduos ionizaacuteveis da cadeia

proteacuteica De fato a variaccedilatildeo da forccedila iocircnica de uma soluccedilatildeo proteacuteica altera o valor

da solubilidade da proteiacutena em soluccedilatildeo mas natildeo da mesma forma para qualquer

espeacutecie de iacuteon Portanto seria mais prudente acrescer ao conjunto de variaacuteveis que

influenciam o ESL a espeacutecie quiacutemica dos iacuteons presentes em soluccedilatildeo

O objetivo deste trabalho eacute estabelecer um modelo capaz de prever a influecircncia do

pH no ESL de proteiacutenas mantendo-se temperatura e forccedila iocircnica constantes

Sabe-se por observaccedilotildees experimentais que a variaccedilatildeo do pH de um sistema altera

o valor da solubilidade de proteiacutenas em soluccedilatildeo e a solubilidade de proteiacutenas por

sua vez atinge seu valor miacutenimo em um pH denominado ponto isoeleacutetrico (pI) no

qual a carga liacutequida da proteiacutena eacute nula

4 1 Introduccedilatildeo

Os primeiros trabalhos relacionados agrave modelagem da curva de solubilidade de

proteiacutenas em funccedilatildeo do pH datam do iniacutecio do seacuteculo XX Green (1931) propocircs um

modelo para a curva de solubilidade da carboxihemoglobina equumlina considerando

que esta proteiacutena se comportaria tanto como um aacutecido bivalente quanto uma base

bivalente Jaacute Groumlnwall (1941) atribuiu a Linderstroslashm-Lang o desenvolvimento de um

modelo capaz de predizer a curva de solubilidade a partir da integraccedilatildeo do perfil de

carga da proteiacutena Este trabalho de Groumlnwall apesar de esquecido pelo tempo eacute de

extrema importacircncia e relevacircncia tanto para o trabalho aqui apresentado quanto e

aqui um motivo muito mais nobre para o desenvolvimento de modelos a partir das

ferramentas da termodinacircmica claacutessica Quando da exposiccedilatildeo da modelagem aqui

tratada retornar-se-aacute a este trabalho que muito contribuiu ao entendimento do

fenocircmeno estudado

Eacute digno de nota o trabalho de Fredericq e Neurath (1950) no qual uma proposta de

equacionamento para uma correlaccedilatildeo semi-empiacuterica da curva de solubilidade de

insulina eacute apresentada Natildeo haacute de fato algo novo em relaccedilatildeo agrave modelagem do

efeito do pH na curva de solubilidade neste trabalho no entanto apesar de natildeo

haver qualquer menccedilatildeo ou referecircncia quanto agrave origem da equaccedilatildeo proposta nota-se

que eacute uma aplicaccedilatildeo direta da equaccedilatildeo descrita por Groumlnwall (1941) Haacute uma

hipoacutetese impliacutecita no trabalho de que o perfil de carga liacutequida da insulina seja linear

na regiatildeo do ponto isoeleacutetrico o que eacute bastante plausiacutevel para muitas proteiacutenas

Assim pela integraccedilatildeo da equaccedilatildeo diferencial proposta por Groumlwall (1941) uma

correlaccedilatildeo semi-empiacuterica quadraacutetica eacute obtida Reforccedila-se o uso da expressatildeo semi-

empiacuterica devido agrave natureza dual da equaccedilatildeo em parte advinda de um

desenvolvimento teoacuterico descrito por Groumlnwall (1941) e atribuiacutedo a Linderstroslashm-

Lang e em parte pela necessidade de se obter paracircmetros a partir de um ajuste de

5 1 Introduccedilatildeo

um conjunto de dados experimentais Vale observar que resultados expressivos

foram alcanccedilados neste trabalho de modo particular o fato de que a presenccedila do

acircnion tiocianato natildeo altera a forma da curva de solubilidade da insulina mas a

desloca em direccedilatildeo a menores valores de pH e de solubilidade

Contudo os trabalhos mais recentes se concentraram na modelagem da curva de

solubilidade de aminoaacutecidos em funccedilatildeo do pH dando maior enfoque aos modelos

termodinacircmicos para soluccedilotildees natildeo-ideais tanto atraveacutes de equaccedilotildees de estado

como de modelos de energia livre de Gibbs excedente

Destaca-se neste grupo o trabalho de Pinho et al (1994) que aplicaram o modelo

UNIFAC associado ao termo de Debye-Huumlckel para aminoaacutecidos como glicina D-

alanina L-serina e DL-valina Tambeacutem o trabalho de Khoshkbarchi e Vera (1996)

no qual foi desenvolvido um modelo simplificado de esfera riacutegida perturbada para

calcular o coeficiente de atividade de aminoaacutecidos e de peptiacutedeos permite prever a

curva de solubilidade destes em funccedilatildeo do pH Jaacute o modelo NRTL foi aplicado tanto

por Pradhan e Vera (1998) quanto Tseng et al (2009) para aminoaacutecidos Jaacute Seyfi et

al (2009) aplicaram a equaccedilatildeo de estado SAFT para a prediccedilatildeo da curva de

solubilidade da DL-metionina

Entretanto o primeiro trabalho dedicado exclusivamente agrave modelagem e prediccedilatildeo da

curva de solubilidade de proteiacutena propriamente dita em funccedilatildeo do pH foi publicado

por Tjong e Zhou (2008) Neste trabalho a solubilidade foi calculada a partir da

energia livre de transferecircncia da fase soacutelida para a fase liacutequida Para a execuccedilatildeo

deste caacutelculo a energia livre de transferecircncia foi dividida em duas contribuiccedilotildees

uma de natureza eletrostaacutetica calculada pela meacutedia de 100 conformaccedilotildees proteacuteicas

advindas da aplicaccedilatildeo de dinacircmica molecular a pH constante e outra de natureza

natildeo-eletrostaacutetica baseada na aacuterea superficial acessiacutevel ao solvente Poreacutem o

6 1 Introduccedilatildeo

esforccedilo computacional requerido pelo modelo por eles proposto para calcular

apenas alguns pontos da curva natildeo apresenta uma aplicabilidade razoaacutevel Aleacutem

deste trabalho Tashima et al (2009) propuseram uma modelagem termodinacircmica

para prever a curva de solubilidade especificamente da insulina suiacutena aplicando o

modelo de Pitzer truncado apoacutes o segundo coeficiente do virial

No presente trabalho propomos um novo modelo baseado no caacutelculo de estados de

ionizaccedilatildeo e em ferramentas de termodinacircmica claacutessica bem como uma extensatildeo agrave

teoria de Linderstroslashm-Lang e Groumlnwall Vale ressaltar de antematildeo que tanto este

novo modelo proposto quanto a extensatildeo desenvolvida resultam na mesma equaccedilatildeo

para o fenocircmeno apesar das distintas abordagens

2 Materiais e Meacutetodos

21 Meacutetodos computacionais

O coacutedigo-fonte do programa em linguagem C estaacute apresentado no Apecircndice B Os

meacutetodos numeacutericos utilizados se resumem a interpolaccedilatildeo linear o meacutetodo de

Newton-Raphson cujo uso seraacute apresentado na proacutexima seccedilatildeo quando se deduziraacute

o algoritmo do modelo de Debye-Huumlckel e o meacutetodo de busca unidirecional de

miacutenimos de funccedilatildeo pela Seccedilatildeo Aacuteurea

As Tabelas 211 e 212 apresentam os resiacuteduos considerados para cada proteiacutena

considerada bem como os seus valores de pKA que foram obtidos a partir da

literatura e satildeo indispensaacuteveis para execuccedilatildeo dos caacutelculos mais rigorosos

Tabela 211 ndash Resiacuteduos ionizaacuteveis considerados e valores de pKA da insulina suiacutena

Valores extraiacutedos de Kaarsholm et al (1990)

Aminoaacutecido Grupo Ionizaacutevel pKA

A1 ndash Gly -NH2 738 A4 ndash Glu -COOH 437 A14 ndash Tyr Fenol-OH 1020 A17 ndash Glu -COOH 437 A19 ndash Tyr Fenol-OH 1020 A21 ndash Asn -COOH 345

B1 ndash Phe -NH2 738 B5 ndash His Imidazol-NH 598 B10 ndash His Imidazol-NH 598 B 13 ndash Glu -COOH 437 B16 ndash Tyr Fenol-OH 1020 B21 ndash Glu -COOH 437

B22 ndash Arg Guaniacutedio-NH2 1110 B26 ndash Tyr Fenol-OH 1020

B29 ndash Lys -NH2 852 B30 ndashAla -COOH 345

8 2 Materiais e Meacutetodos

Tabela 212 ndash Resiacuteduos ionizaacuteveis considerados e valores de pKA a 25 ordmC da lisozima

de clara de ovo de galinha Valores extraiacutedos de Kuramitsu e Hamaguchi (1980)

Aminoaacutecido Grupo Ionizaacutevel pKA α-NH2 α-NH2 79

Lys1 ε-NH2 108

Arg5 Guaniacutedio-NH2 120 Glu7 -COOH 26

Lys13 ε-NH2 105

Arg14 Guaniacutedio-NH2 120 His15 Imidazol-NH 58 Asp18 -COOH 20 Tyr20 Fenol-OH 103

Arg21 Guaniacutedio-NH2 120 Tyr23 Fenol-OH 98

Lys33 ε-NH2 106 Glu35 -COOH 61

Arg45 Guaniacutedio-NH2 120 Asp48 -COOH 43 Asp52 -COOH 34 Tyr53 Fenol-OH 121

Arg61 Guaniacutedio-NH2 120 Asp66 -COOH 16

Arg68 Guaniacutedio-NH2 120

Arg73 Guaniacutedio-NH2 120 Asp87 -COOH 21

Lys96 ε-NH2 108

Lys97 ε-NH2 103 Asp101 -COOH 45

Arg112 Guaniacutedio-NH2 120

Arg114 Guaniacutedio-NH2 120

Lys116 ε-NH2 104 Asp119 -COOH 25

Arg125 Guaniacutedio-NH2 120

Arg128 Guaniacutedio-NH2 120 α-COOH α-COOH 31

9 2 Materiais e Meacutetodos

22 Curva de solubilidade da lisozima da clara de ovo de galinha

221 Reagentes

Neste experimento de determinaccedilatildeo da curva de solubilidade da lisozima da clara de

ovo de galinha os reagentes utilizados foram cloreto de soacutedio (Reatec P A)

bicarbonato de soacutedio (Research Becto Chemical P A) Na2HPO4 7H2O (Reagen

P A) aacutegua destilada deionizada Milli-Q (Millipore) e lisozima de clara de ovo de

galinha (Sigma min 99)

222 Equipamentos

Neste experimento os equipamentos utilizados foram espectrofotocircmetro UV-Visiacutevel

(Beckman DU-530) centriacutefuga (Eppendorf) banho-teacutermico (Laacutectea) com controlador

de temperatura (Julabo) pHmetro (Micronal) e balanccedila (Mettler Toledo AB204S)

223 Preparaccedilatildeo das soluccedilotildees-tampatildeo

Foram preparadas soluccedilotildees-tampatildeo com valores de pH=96 pH = 98 pH = 100

pH = 102 pH = 104 pH = 106 pH = 108 pH = 110 pH = 112 pH = 114 pH =

116 e pH = 118 a partir de quatro soluccedilotildees uma de hidroacutexido de soacutedio 01 M uma

de cloreto de soacutedio 1 M (para equalizar a forccedila iocircnica) uma de bicarbonato de soacutedio

005 M e outra de Na2HPO4 005 M

A Tabela 2231 apresenta os valores de volume usados no preparo de cada uma

das soluccedilotildees-tampatildeo

10 2 Materiais e Meacutetodos

Tabela 2231 ndash Volumes de hidroacutexido de soacutedio a 01 M adicionados no preparo das

soluccedilotildees-tampatildeo

Tampatildeo pH V NaOH mL

NaHCO3 96 100 005 M 98 152

(para cada soluccedilatildeo-tampatildeo 100 mL 100 214

desta soluccedilatildeo foram adicionados) 102 276

104 330 106 382

108 424

110 454

112 530 114 583

Na2HPO4 110 82

005 M 112 126

(para cada soluccedilatildeo-tampatildeo 100 mL 114 182 desta soluccedilatildeo foram adicionados) 116 270

118 388

224 Procedimento experimental

Foram adicionadas quantidades natildeo definidas de lisozima de clara de ovo de galinha

a 13 mL de cada soluccedilatildeo-tampatildeo em tubos Eppendorf de 2 mL Colocaram-se

entatildeo as amostras apoacutes agitaccedilatildeo vigorosa em banho teacutermico a 250 plusmn 01 ordmC por 24

horas para que os sistemas atingissem o equiliacutebrio termodinacircmico Caso natildeo

houvesse a formaccedilatildeo de precipitado lisozima era adicionada e o procedimento

repetido Ao se observar a formaccedilatildeo de precipitado o sistema era centrifugado a

13000 rpm por 15 minutos Uma aliacutequota do sobrenadante era retirada e sua

concentraccedilatildeo proteacuteica determinada por medida de absorbacircncia a 280 nm Cada

sistema foi feito ao menos em duplicata

3 Modelo Estendido de Debye-Huumlckel

31 Introduccedilatildeo

De fato como descrito por Pessocirca Filho (2002) a equaccedilatildeo de Debye-Huumlckel natildeo

deve ser aplicada agrave modelagem de polieletroacutelitos tais como proteiacutenas porque nestas

moleacuteculas as cargas satildeo distribuiacutedas ao longo da cadeia e portanto natildeo satildeo cargas

pontuais como suposto por Debye-Huumlckel

Contudo nesta modelagem considera-se uma regiatildeo de pH em torno do ponto

isoeleacutetrico (pI) na qual satildeo inerentes duas condiccedilotildees favoraacuteveis a aplicaccedilatildeo da

equaccedilatildeo de Debye-Huumlckel carga liacutequida proacutexima a zero pois Z(pI) = 0 e regiatildeo de

miacutenima solubilidade que significa baixas concentraccedilotildees de proteiacutenas em soluccedilatildeo

Isto significa em primeiro lugar que os efeitos da carga tais como ldquodesnovelamentordquo

da cadeia proteacuteica com exposiccedilatildeo de resiacuteduos outrora blindados podem ser

desprezados em uma regiatildeo proacutexima ao ponto isoeleacutetrico e em segundo lugar

baixas concentraccedilotildees de proteiacutena em soluccedilatildeo significam que os termos de curto

alcance podem ser desprezados e portanto haacute prevalecircncia do termo de longo

alcance que no caso de soluccedilotildees eletroliacuteticas pode ser descrito por uma equaccedilatildeo

estendida de Debye-Huumlckel

Assim o modelo de Debye-Huumlckel foi utilizado natildeo para verificar sua aplicabilidade agrave

modelagem de soluccedilotildees proteacuteicas mas sim para confrontar o modelo proposto com

um modelo usual em modelagem de soluccedilotildees eletroliacuteticas e seraacute referido no texto

sempre como abordagem claacutessica

12 3 Modelo Estendido de Debye-Huumlckel

32 Desenvolvimento teoacuterico

Pode-se escrever a atividade da proteiacutena como o produto entre a solubilidade e o

coeficiente de atividade da mesma como mostrado na equaccedilatildeo (32 - 1)

푎 = 훾푠

(32 - 1)

Na qual pode-se calcular o coeficiente de atividade atraveacutes da equaccedilatildeo estendida

de Debye-Huumlckel (Pitzer 1973)

ln 훾 = minus퐴 푍radic퐼

1 + 푏radic퐼+

2푏

ln 1 + 푏radic퐼

(32 - 2)

Sendo que a constante universal empiacuterica b = 12 kg12 mol-12 eacute usada para todos os

eletroacutelitos Jaacute AΦ eacute o paracircmetro de Debye-Huumlckel para o coeficiente osmoacutetico e eacute

dado por

퐴 =13

(2휋푁 휌 ) frasl 푒4휋휀 휀 푘푇

frasl

(32 - 3)

Em que NA eacute a constante de Avogadro ρs eacute a densidade do solvente em g cm-3 e eacute

a carga eletrocircnica (e = 160218 x 10-19 C) ε0 eacute a permissividade do espaccedilo livre (ε0 =

885419 x 10-12 C2 N-1 m-2) εr eacute a constante dieleacutetrica do solvente k aacute constante de

Boltzmann e T eacute a temperatura absoluta Jaacute a carga liacutequida em funccedilatildeo do pH pode

ser calculada como

푍 = 훼 minus 훼

(32 - 4)

Sendo que α+ e α- satildeo dados pelas equaccedilotildees (A - 10) e (A - 16) do Apecircndice A

13 3 Modelo Estendido de Debye-Huumlckel

E a forccedila iocircnica eacute dada pela equaccedilatildeo (32 - 5) descrita abaixo

퐼 = 12

푚 푍

(32 - 5)

Contudo no ponto isoeleacutetrico a carga meacutedia da proteiacutena eacute nula portanto o termo de

Debye-Huumlckel se anula e o coeficiente de atividade se torna unitaacuterio

ln푎 (푝퐼) = ln 푠 (푝퐼)

(32 - 6)

Considerando que a atividade da proteiacutena seja constante com a variaccedilatildeo de pH isto

implica que esta eacute sempre igual agrave solubilidade da proteiacutena no ponto isoeleacutetrico e

portanto vale que

ln푎 (푝퐻) = ln 푠 (푝퐻) + ln 훾(푝퐻) = ln 푠 (푝퐼)

(32 - 7)

Assim

ln 푠 (푝퐻) = ln 푠 (푝퐼) + 퐴휙푍푝퐻2 radic퐼1 + 푏radic퐼

+2푏

ln 1 + 푏radic퐼

(32 - 8)

Esta equaccedilatildeo prevecirc a curva de solubilidade em funccedilatildeo do pH atraveacutes do caacutelculo da

atividade da proteiacutena na fase liacutequida pela equaccedilatildeo estendida de Debye-Huumlckel Para

resolvecirc-la eacute necessaacuterio se utilizar de um meacutetodo numeacuterico pois a forccedila iocircnica

depende da solubilidade naquele pH Optou-se neste trabalho pelo Meacutetodo de

Newton-Raphson para executar o meacutetodo iterativo que eacute exigido pela equaccedilatildeo (32

ndash 8) Para aplicar este meacutetodo arbitrou-se uma funccedilatildeo f(sp) definida aqui como

푓 푠 = minus ln 푠 (푝퐻) + ln 푠 (푝퐼) + 퐴휙푍푝퐻2 radic퐼

1 + 푏radic퐼+

2푏

ln 1 + 푏radic퐼

(32 - 9)

14 3 Modelo Estendido de Debye-Huumlckel

Assim ao calcular o sp que zera esta funccedilatildeo f(sp) saber-se-aacute que eacute a proacutepria

solubilidade que se deseja calcular Para aplicar o Meacutetodo de Newton-Raphson

basta derivar a funccedilatildeo f(sp) e aplicar o seguinte algoritmo de resoluccedilatildeo

푠 = 푠 minus푓(푠 )푓 (푠 )

(32 - 10)

Para calcular frsquo(s) deve-se considerar que a forccedila iocircnica depende da solubilidade

Para isto observando a equaccedilatildeo (32 - 5) vecirc-se que a forccedila iocircnica eacute dada pelo

somatoacuterio das contribuiccedilotildees de todos os iacuteons presentes na soluccedilatildeo por isso aqui

cabe um artifiacutecio de dividir estas contribuiccedilotildees em duas macro-contribuiccedilotildees aquela

devida a todos os iacuteons presentes na soluccedilatildeo exclusive os grupos ionizaacuteveis

presentes nas moleacuteculas da proteiacutena em questatildeo (I0) e que se considera constante

com o pH e aquela que engloba apenas os grupos ionizaacuteveis presentes nas

moleacuteculas da proteiacutena (IP)

퐼 = 퐼 + 퐼 = 퐼 +12푍 푠

(32 - 11)

Considerando a funccedilatildeo w tal que

푤 = radic퐼 = 퐼 +12푍 푠

(32 - 12)

Sendo

푤 =14푍 퐼

(32 - 13)

Entatildeo aplicando-se as devidas regras de derivaccedilatildeo tem-se

15 3 Modelo Estendido de Debye-Huumlckel

푓 (푠 ) = minus1푠 + 퐴 푍

3푤 + 2푤 푏푤(1 + 푏푤)

(32 - 14)

Substituindo as equaccedilotildees (32 - 12) e (32 - 13) na equaccedilatildeo (32 - 14) tem-se que

푓 (푠 ) = minus1푠 + 퐴 푍

15 + 푏radic퐼2radic퐼(1 + 푏radic퐼)

(32 - 15)

Entatildeo o algoritmo deve ser

푠 = 푠 minus

⎜⎛ln 푠 (푝퐼)

푠 + 퐴휙푍푝퐻2 radic퐼

1 + 푏radic퐼+ 2푏 ln 1 + 푏radic퐼

minus 1푠 + 퐴휙푍

15 + 푏radic퐼2radic퐼(1 + 푏radic퐼) ⎠

⎟⎞

(32 - 16)

4 Modelagem Termodinacircmica Proposta

41 Introduccedilatildeo

A condiccedilatildeo de equiliacutebrio entre duas fases (α e β) com m componentes eacute dada por

(Prausnitz et al 1999)

푝 = 푝

(41 ndash 1)

푇 = 푇

(41 ndash 2)

휇 = 휇⋮

휇 = 휇

(41 ndash 3)

Considerando o equiliacutebrio soacutelido-liacutequido (ESL) de sistemas contendo proteiacutenas

sendo que os efeitos da pressatildeo podem ser desprezados que as temperaturas nas

duas fases satildeo iguais e que na fase soacutelida soacute haacute proteiacutena tem-se que para a

proteiacutena a relaccedilatildeo de equiliacutebrio pode ser descrita por

휇 (푇푥) = 휇 (푇)

(41 ndash 4)

Contudo adotando-se a lei de Henry que eacute vaacutelida para baixas concentraccedilotildees de

soluto hipoacutetese que natildeo eacute distante dos valores observados da solubilidade de

proteiacutenas pode se escrever o potencial quiacutemico na fase liacutequida por

휇 (푇푥) = 휇 (푇 푥 ) + 푅푇푙푛푥

(41 ndash 5)

17 4 Modelagem Termodinacircmica Proposta

Entretanto variaccedilotildees de pH natildeo alteram o potencial quiacutemico da fase soacutelida o que

resulta pela relaccedilatildeo (41 ndash 4) que o mesmo natildeo altera tambeacutem o potencial quiacutemico

da fase liacutequida Com isso pela relaccedilatildeo (41 ndash 5) sendo o potencial quiacutemico de

referecircncia constante com o pH uma contradiccedilatildeo emerge a variaccedilatildeo do pH natildeo

poderia alterar o valor da solubilidade poreacutem a observaccedilatildeo experimental mostra o

contraacuterio Assim deve-se lembrar que pelo princiacutepio da eletroneutralidade a fase

soacutelida soacute possui moleacuteculas proteacuteicas eletricamente neutras e portanto o equiliacutebrio

de fases deve se estabelecer apenas entre as moleacuteculas presentes na fase soacutelida e

as moleacuteculas eletricamente neutras em soluccedilatildeo Ou seja como soacute moleacuteculas

eletricamente neutras podem estar na fase soacutelida o equiliacutebrio de fases depende

exclusivamente da fraccedilatildeo de moleacuteculas eletricamente neutras em soluccedilatildeo pois soacute

estas podem precipitar Assim tanto a equaccedilatildeo (41 ndash 4) quanto a equaccedilatildeo (41 ndash

5) devem ser aplicadas natildeo ao conjunto de todas as moleacuteculas de proteiacutena em

soluccedilatildeo mas somente as moleacuteculas proteacuteicas eletricamente neutras Portanto a

concentraccedilatildeo das moleacuteculas de proteiacutena eletricamente neutras em soluccedilatildeo eacute

constante com o pH e pode ser interpretada como a multiplicaccedilatildeo da fraccedilatildeo de

moleacuteculas eletricamente neutras pela concentraccedilatildeo total de proteiacutenas que eacute a

proacutepria solubilidade Assim uma relaccedilatildeo de inversa proporcionalidade eacute definida

quanto maior a fraccedilatildeo de moleacuteculas neutras menor seraacute a solubilidade de uma

proteiacutena em soluccedilatildeo Portanto no ponto isoeleacutetrico no qual haacute o miacutenimo de

solubilidade tem-se o ponto maacuteximo de fraccedilatildeo de moleacuteculas eletricamente neutras

A partir disto eacute possiacutevel escrever a equaccedilatildeo que rege o comportamento da

solubilidade de uma proteiacutena em funccedilatildeo do pH da soluccedilatildeo

휙(푝퐻)푆 (푝퐻) = 휆 = 푐표푛푠푡푎푛푡푒

(41 ndash 6)

18 4 Modelagem Termodinacircmica Proposta

Na equaccedilatildeo (41 ndash 6) o paracircmetro λ pode ser um paracircmetro de ajuste do modelo a

um conjunto de valores experimentais tendo se estabelecido uma funccedilatildeo objetivo ou

ainda dado pelo produto entre a solubilidade no ponto isoeleacutetrico e a fraccedilatildeo de

moleacuteculas eletricamente neutras em soluccedilatildeo tambeacutem no pI neste caso vale a

seguinte equaccedilatildeo

푠 (푝퐻) =휙(푝퐼)푠 (푝퐼)휙(푝퐻)

(41 ndash 7)

Sendo a equaccedilatildeo do modelo ndash equaccedilatildeo (41 ndash 7) ndash extremamente simples a uacutenica

dificuldade reside no caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras

(휙(푝퐻))

42 Caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras

Dentre os aminoaacutecidos que formam atraveacutes de ligaccedilotildees peptiacutedicas as proteiacutenas haacute

aqueles que possuem resiacuteduos com grupos ionizaacuteveis aleacutem dos grupos amina e

aacutecido carboxiacutelico terminais na cadeia Todos estes participam de equiliacutebrios

quiacutemicos com iacuteons H+ presentes na soluccedilatildeo entatildeo ao se alterar o pH da soluccedilatildeo

estes equiliacutebrios satildeo alterados

Assim haacute vaacuterias possibilidades de combinaccedilotildees de estados ionizados destes grupos

ionizaacuteveis que resultam em uma moleacutecula de proteiacutena eletricamente neutra Eacute

importante notar que dada a fraccedilatildeo de uma configuraccedilatildeo de uma moleacutecula neutra

todas as outras fraccedilotildees de configuraccedilotildees possiacuteveis que tambeacutem resultem em

moleacuteculas neutras satildeo proporcionais agrave fraccedilatildeo da configuraccedilatildeo dada pois todas as

configuraccedilotildees participam de equiliacutebrios entre si

19 4 Modelagem Termodinacircmica Proposta

Desta observaccedilatildeo implica-se que basta identificar uma configuraccedilatildeo proteacuteica cuja

soma dos estados ionizados resulte em carga nula para se descrever o equiliacutebrio de

fases em relaccedilatildeo ao pH na regiatildeo do ponto isoeleacutetrico onde esta consideraccedilatildeo eacute

predominante em relaccedilatildeo a outros possiacuteveis fenocircmenos

Contudo eacute necessaacuterio contabilizar a contribuiccedilatildeo de cada grupo ionizaacutevel via

equaccedilatildeo de Henderson-Hasselbach equaccedilatildeo (42 ndash 1)

훼 (푝퐻) =

⎩⎪⎨

⎪⎧ 10

1 + 10 푠푒 휈 = minus1

11 + 10

푠푒 휈 = +1

(42 ndash 1)

Na qual pKAj eacute o co-logaritmo da constante de equiliacutebrio do grupo ionizaacutevel do

resiacuteduo j j eacute estado carregado potencial do resiacuteduo j (-1 para grupos aacutecidos e +1

para grupos baacutesicos) e j eacute a fraccedilatildeo ionizada para o pH dado Para grupos cujo

estado de ionizaccedilatildeo na dada configuraccedilatildeo seja neutro a sua fraccedilatildeo eacute calculada tal

que a soma de sua fraccedilatildeo e da fraccedilatildeo ionizada tenha como resultado o valor

unitaacuterio

Assim a funccedilatildeo Pn pode ser escrita como o produto de cada fraccedilatildeo de cada grupo

ionizaacutevel j naquele estado (-1 0 ou +1) na configuraccedilatildeo neutra k em uma proteiacutena

com n grupos ionizaacuteveis Uma representaccedilatildeo matemaacutetica possiacutevel para esta funccedilatildeo

pode ser escrita como

휙 (푝퐻) = 훼 (푝퐻)

(42 ndash 2)

Na qual a fraccedilatildeo jrsquo(pH) eacute dada por

20 4 Modelagem Termodinacircmica Proposta

훼 (푝퐻) =훼 (푝퐻) 푠푒 휀 = 11 minus 훼 (푝퐻) 푠푒 휀 = 0

(42 ndash 3)

Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (42 ndash 3) e a resultante na equaccedilatildeo

(42 ndash 2) pode-se escrever que

휙 (푝퐻) =1

1 + 10

1 + 휈2 minus 휈 휀 10

minus휈 minus 1

2 minus 휈 휀 푐표푚 휀 = 0

(42 ndash 4)

A equaccedilatildeo (42 ndash 4) junto agrave equaccedilatildeo (41 ndash 7) constituem o modelo termodinacircmico

capaz de predizer a razatildeo entre as fraccedilotildees de moleacuteculas neutras de uma proteiacutena

em funccedilatildeo do pH na regiatildeo do ponto isoeleacutetrico mantendo fixas temperatura e forccedila

iocircnica Substituindo a equaccedilatildeo (42 ndash 4) na equaccedilatildeo (41 ndash 7) obteacutem-se para a

curva de solubilidade

푠 (푝퐻)푠 (푝퐼) =

1 + 101 + 10

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

푐표푚 휀 = 0

(42 ndash 8)

5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

51 Introduccedilatildeo

Segundo Groumlnwall (1941) na fase liacutequida haacute moleacuteculas de proteiacutenas com muitas

configuraccedilotildees k distintas que possuem carga liacutequida i e tambeacutem haacute certas

configuraccedilotildees que tem carga liacutequida nula e satildeo chamadas configuraccedilotildees neutras

Aleacutem disso estas uacuteltimas satildeo aquelas que determinam o equiliacutebrio de fases jaacute que

elas estatildeo em equiliacutebrio com a fase soacutelida na qual soacute haacute moleacuteculas neutras pelo

princiacutepio da eletroneutralidade Eacute tambeacutem afirmado que dado este equiliacutebrio a

atividade das moleacuteculas neutras natildeo se altera com a variaccedilatildeo do pH e eacute

proporcional agraves atividades de qualquer tipo de configuraccedilatildeo neutra

Neste mesmo trabalho eacute atribuiacuteda a Linderstroslashm-Lang o desenvolvimento de uma

teoria de prediccedilatildeo da solubilidade de proteiacutenas com a variaccedilatildeo do pH na regiatildeo do

ponto isoeleacutetrico Este desenvolvimento apresenta um balanccedilo de cargas de um

modo impliacutecito contudo como atestado por Groumlnwall o escasso conhecimento

sobre as estruturas proteacuteicas impediram agravequele tempo uma formulaccedilatildeo mais

pormenorizada do problema

52 Desenvolvimento teoacuterico

A base desta abordagem descrita por Groumlnwall e atribuiacuteda a Linderstroslashm-Lang

reside na hipoacutetese de que a moleacutecula de proteiacutena de configuraccedilatildeo k e carga nula

participa do seguinte equiliacutebrio com os iacuteons H+ e com sua forma de carga i

22 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

푃 + 푖퐻 푃 lowast

(52 ndash 1)

Note-se que o valor de i pode ser negativo A constante do equiliacutebrio quiacutemico

descrita pela equaccedilatildeo (52 ndash 1) pode ser expressa como

퐾 =푎

lowast

푎 푎

(52 ndash 2)

Sabendo que a atividade da moleacutecula de proteiacutena de configuraccedilatildeo k e carga i eacute dada

pelo produto entre sua concentraccedilatildeo e seu coeficiente de atividade tem-se que

푥lowast

= 푎 푎퐾훾

lowast

(52 ndash 3)

Entretanto a solubilidade da proteiacutena eacute soma das concentraccedilotildees de todas as

moleacuteculas de carga i Poreacutem a concentraccedilatildeo das moleacuteculas de carga i eacute a soma das

concentraccedilotildees das moleacuteculas de configuraccedilatildeo k Assim a solubilidade pode ser

escrita como

푠 (푝퐻) = 푎 푎퐾훾

lowast

(52 ndash 4)

Derivando a equaccedilatildeo (52 ndash 4) com respeito agrave atividade do iacuteon H+ considerando

que atividade da moleacutecula neutra eacute constante para qualquer configuraccedilatildeo k e ainda

que o coeficiente de atividade da proteiacutena de carga i independe da atividade do iacuteon

H+ tem-se que

푑푠푑푎 = 푖 ∙ 푎 푎

퐾훾

lowast

(52 ndash 5)

23 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

Sendo

푑 log 푠 (푝퐻)푑(푝퐻) = minus

푎푠 (푝퐻)

푑푠푑푎

(52 ndash 6)

Substituindo as equaccedilotildees (52 ndash 4) e (52 ndash 5) na equaccedilatildeo (52 ndash 6) e

reescrevendo em termos de pH e das concentraccedilotildees das proteiacutenas de carga i tem-

se que

푑 log 푠푑(푝퐻) = minus

sum (푖 ∙ 푥 )sum 푥

(52 ndash 7)

Contudo o termo do lado direito da equaccedilatildeo (52 ndash 7) estaacute associado ao conceito

de valecircncia meacutedia estabelecido por Linderstroslashm-Lang (1924)

횤 =sum (푖 ∙ 푥 )sum 푥

(52 ndash 8)

Os autores natildeo possuiacuteam um modo mais adequado de construir a curva de

solubilidade dada pela equaccedilatildeo (52 ndash 7) do que aproximar por uma funccedilatildeo linear o

perfil de carga liacutequida da proteiacutena obtido experimentalmente e integraacute-lo valendo-se

da analogia entre o conceito de carga liacutequida (Z) e de valecircncia meacutedia ( i ) Entretanto

hoje jaacute se tem uma descriccedilatildeo analiacutetica do perfil de carga liacutequida de proteiacutenas que

pode ser escrita como

푍(푝퐻) = 휈 훼

(52 ndash 9)

Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (52 ndash 9) e a resultante na equaccedilatildeo

(52 ndash 7) tem-se que

24 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

푑 log 푠푑(푝퐻) = minus

12

11 + 10

1 + 휈 + 휈 1 minus 휈 10

(52 ndash 10)

Integrando a equaccedilatildeo (52 ndash 10) de um ponto de referecircncia por exemplo do ponto

isoeleacutetrico (pI) ateacute um pH qualquer tem-se a seguinte relaccedilatildeo

푑 log 푠

( )

( )

= minus12

1

1 + 101 + 휈 + 휈 1 minus 휈 10 푑(푝퐻)

(52 ndash 11)

log푠 (푝퐻)푠 (푝퐼) = minus

12 1 + 휈

11 + 10

푑(푝퐻)

+ 휈 1 minus 휈10

1 + 10푑(푝퐻)

(52 ndash 12)

Fazendo a seguinte substituiccedilatildeo

푢 = 10 푡푎푙 푞푢푒 푑푢푢 = ln 10푑(푝퐻)

(52 ndash 13)

Tem-se que

log푠 (푝퐻)푠 (푝퐼) = minus

12

1 + 휈ln 10

1푢(1 + 푢) 푑푢 +

휈 1 minus 휈ln 10

1(1 + 푢) 푑푢

(52 ndash 14)

log푠 (푝퐻)푠 (푝퐼) = minus

12

1 + 휈ln 10

1푢 푑푢 minus

11 + 푢 푑푢 +

휈 1 minus 휈ln 10

1(1 + 푢) 푑푢

(52 ndash 15)

25 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐼) = minus

12 1 + 휈 log

1010

minus 휈 1 minus 휈 minus 1 + 휈 log1 + 101 + 10

(52 ndash 16)

Sendo

휈 1 minus 휈 minus 1 + 휈 = 휈 minus 휈 minus 1 minus 휈 = minus 1 + 휈 = minus2

(52 ndash 17)

Resultando em

log푠 (푝퐻)푠 (푝퐼) = log

1 + 101 + 10

minus1 + 휈

2 (푝퐻 minus 푝퐼)

(52 ndash 18)

Ainda eacute possiacutevel reescrever a equaccedilatildeo (52 ndash 18) como

log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log

1 + 101 + 10

(52 ndash 19)

Na qual n+ representa o nuacutemero de resiacuteduos ionizaacuteveis que na sua forma carregada

apresentam carga positiva A equaccedilatildeo (52 ndash 19) eacute uma expressatildeo analiacutetica que a

partir de dados da estrutura proteacuteica e de um dado de solubilidade permite predizer

a curva de solubilidade de uma dada proteiacutena em funccedilatildeo do pH na regiatildeo do ponto

isoeleacutetrico mantendo fixas a temperatura e a forccedila iocircnica do sistema

Eacute possiacutevel provar que as equaccedilotildees (42 ndash 8) e (52 ndash 19) satildeo idecircnticas - a prova

disso eacute descrita na seccedilatildeo 6 ndash e assim tem-se que apesar das distintas abordagens

a descriccedilatildeo do fenocircmeno eacute a mesma Note-se que um passo fundamental no

desenvolvimento da Equaccedilatildeo (52 ndash 5) eacute admitir que por hipoacutetese a atividade da

26 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

forma neutra natildeo depende do pH essa hipoacutetese tambeacutem eacute a base da equaccedilatildeo (41

ndash 7) Deve-se registrar o fato de que pelo melhor do nosso conhecimento esta eacute a

primeira vez que uma expressatildeo analiacutetica para o caacutelculo da solubilidade de

proteiacutenas em funccedilatildeo do pH eacute descrita mesmo no limite em que se considera vaacutelida

a lei de Henry

53 Soluccedilatildeo Paraboacutelica da Curva de Solubilidade

Tanto Groumlnwall (1941) quanto Fredericq e Neurath (1950) adotaram a hipoacutetese de

que os perfis de carga liacutequida da -lactoglobulina para um e da insulina para os

outros dois eram lineares na regiatildeo do ponto isoeleacutetrico Esta hipoacutetese eacute bastante

plausiacutevel e simplificadora principalmente a eacutepoca na qual estes trabalhos foram

desenvolvidos em que a estrutura proteacuteica bem como as constantes de ionizaccedilatildeo

dos resiacuteduos com grupos ionizaacuteveis era pouco conhecida De fato ainda hoje a falta

de dados das constantes de ionizaccedilatildeo na cadeia proteacuteica eacute o maior desafio no uso

do modelo rigoroso ndash equaccedilatildeo (52 ndash 18) Por isso o valor desta hipoacutetese de perfil

de carga liacutequida linear eacute notaacutevel

Supondo entatildeo que o perfil de carga seja linear eacute possiacutevel escrevecirc-lo como

푍(푝퐻) = minus퐴(푝퐻 minus 푝퐼) 푐표푚 퐴 gt 0

(53 ndash 1)

Substituindo (53 ndash 1) em (52 ndash 6)

푑 log 푠 (푝퐻)푑(푝퐻) = 퐴(푝퐻 minus 푝퐼)

(53 ndash 2)

Integrando (53 ndash 2) de um pH0 de referecircncia ateacute pH tem-se que

27 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐻 ) = 퐾[푝퐻 minus 2푝퐼(푝퐻 minus 푝퐻 ) minus 푝퐻 ] 푐표푚 퐾 =

퐴2

(53 ndash 3)

Ao se adotar como ponto de referecircncia o ponto isoeleacutetrico a equaccedilatildeo (53 ndash 3)

reduz-se agrave

log푠 (푝퐻)푠 (푝퐼) = 퐾(푝퐻 minus 푝퐼)

(53 ndash 4)

Contudo apesar da soluccedilatildeo quadraacutetica ou paraboacutelica para a equaccedilatildeo estendida de

Linderstroslashm-lang e Groumlnwall expressa na equaccedilatildeo (53 ndash 3) natildeo requerer os dados

das constantes de ionizaccedilatildeo dos resiacuteduos com grupos ionizaacuteveis ela exige a

definiccedilatildeo do paracircmetro A que fisicamente representa a inclinaccedilatildeo da reta de

aproximaccedilatildeo da curva de carga liacutequida e que pode ser calculado por correlaccedilatildeo a

partir de um conjunto de dados experimentais de solubilidade ou de carga liacutequida

6 Identidade entre o Modelo Proposto e a Equaccedilatildeo

Estendida de Linderstroslashm-Lang e Groumlnwall

A equaccedilatildeo final da modelagem termodinacircmica proposta apresentada na seccedilatildeo 4 eacute a

equaccedilatildeo (42 ndash 8) dada por

푠 (푝퐻)푠 (푝퐼) =

1 + 101 + 10

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 1)

Aplicando-se o logaritmo decimal nos dois termos da equaccedilatildeo (6 ndash 1) tem-se que

log푠 (푝퐻)푠 (푝퐼) = log

1 + 101 + 10

+ log

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 2)

Pelo bem da simplificaccedilatildeo desta deduccedilatildeo adotar-se-atildeo as seguintes funccedilotildees

휂 (푝퐻) = log

(6 ndash 3)

휃 (푝퐻) = log

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 4)

Assim pode-se reescrever a equaccedilatildeo (6 ndash 2) por

29 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐼) = 휂 (푝퐻) + 휃 (푝퐻)

(6 ndash 5)

Observando-se a equaccedilatildeo (6 ndash 5) tem-se que a funccedilatildeo j independe do estado de

ionizaccedilatildeo do resiacuteduo j poreacutem a funccedilatildeo jk depende Por isso deve-se analisar esta

funccedilatildeo para cada estado de ionizaccedilatildeo possiacutevel como mostrado na Tabela 61

Tabela 6 1 ndash Anaacutelise da funccedilatildeo jk para cada estado de ionizaccedilatildeo possiacutevel

j jk jk Quantidade de resiacuteduos neste estado

-1 -1 푝퐼 minus 푝퐻 na

0 0 nb

+1 +1 0 nc

0 푝퐼 minus 푝퐻 nd

Pela anaacutelise da Tabela 61 e considerando uma proteiacutena com n resiacuteduos com

grupos ionizaacuteveis infere-se que a equaccedilatildeo (6 ndash 5) pode ser reescrita como

log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)

(6 ndash 6)

Contudo as equaccedilotildees acima descritas satildeo vaacutelidas apenas para configuraccedilotildees

neutras pois apenas as configuraccedilotildees neutras da fase liacutequida estatildeo em equiliacutebrio

com as moleacuteculas de proteiacutena da fase soacutelida Para que uma configuraccedilatildeo seja

neutra vale a seguinte restriccedilatildeo

휀 = 0 hArr 푛 = 푛

(6 ndash 7)

30 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall

Substituindo a restriccedilatildeo dada pela equaccedilatildeo (6 ndash 7) na equaccedilatildeo (6 ndash 6) tem-se que

log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)

(6 ndash 8)

Ora mas a soma de nc e de nd natildeo resulta em outra coisa senatildeo no nuacutemero de

resiacuteduos com grupos ionizaacuteveis da estrutura proteacuteica cujo j seja +1 Assim

substituindo nc mais nd por n+ e substituindo a equaccedilatildeo (6 ndash 3) na equaccedilatildeo (6 ndash 8)

tem-se que

log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log

1 + 101 + 10

(6 ndash 9)

Ao se analisar a equaccedilatildeo (6 ndash 9) observa-se que ela eacute idecircntica a equaccedilatildeo estendida

de Linderstroslashm-Lang e Groumlnwall apresentada pela equaccedilatildeo (52 ndash 19) Com isso

tem-se que apesar das distintas formulaccedilotildees tanto a modelagem termodinacircmica aqui

proposta quanto a extensatildeo a teoria de Linderstroslashm-Lang e Groumlnwall resultam na

mesma descriccedilatildeo do fenocircmeno Aleacutem disso a equaccedilatildeo final dos modelos eacute

extremamente simples e depende apenas de um ponto de referecircncia e dos dados da

estrutura da moleacutecula de proteiacutena cuja solubilidade se deseja estudar

7 Aplicaccedilatildeo dos Modelos Expostos

Para validar o modelo comparando-o com o caacutelculo feito a partir da teoria de Debye-

Huumlckel o criteacuterio que relaciona os pontos calculados pelo modelo com os pontos

experimentais foi estabelecido a partir da seguinte funccedilatildeo objetivo (FO)

퐹푂 =1푁

푠 minus 푠푠

(7 ndash 1)

Contudo a equaccedilatildeo (7 ndash 1) natildeo eacute a melhor definiccedilatildeo de funccedilatildeo objetivo neste caso

pois a derivada da curva de solubilidade eacute razoavelmente grande nos dois lados do

ponto isoeleacutetrico e isso permite que pequenos desvios na direccedilatildeo horizontal

resultem em um grande aumento no valor da funccedilatildeo objetivo Uma soluccedilatildeo possiacutevel

seria substituir essa funccedilatildeo objetivo por uma funccedilatildeo definida pela soma do quadrado

da distacircncia do ponto experimental agrave curva do modelo principalmente se fosse

necessaacuterio calcular algum paracircmetro do modelo via otimizaccedilatildeo da funccedilatildeo objetivo

estipulada Natildeo sendo este o escopo deste trabalho optou-se pelo uso da FO

definida na equaccedilatildeo (7 ndash 1)

71 Solubilidade da Insulina Suiacutena

As Figuras 711 712 e 713 apresentam os graacuteficos da curva de solubilidade

dada pelos pontos experimentais pelo modelo proposto pela abordagem claacutessica e

tambeacutem a curva obtida pela soluccedilatildeo paraboacutelica da Equaccedilatildeo de Linderstroslashm-Lang e

Groumlnwall em trecircs temperaturas distintas

32 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 711 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 25 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

Figura 712 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 15 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

00

40

80

120

160

200

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

00

50

100

150

200

250

300

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

33 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 713 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 5 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

Os desvios da curva obtida pelo modelo proposto para valores de pH distantes do pI

podem ser explicados por ao menos trecircs importantes motivos dois devidos a

hipoacuteteses do modelo e um devido a fenocircmenos intriacutensecos a proteiacutena Sabendo que

no pI a solubilidade eacute miacutenima para valores de pH distantes do pI pode-se ter

solubilidades suficientemente grandes para que a validade da lei de Henry ndash adotada

na formulaccedilatildeo do modelo - seja questionada pois quanto mais distante do pI maior

a solubilidade e menor a validade da lei de Henry jaacute que haacute um aumento da

concentraccedilatildeo do soluto (proteiacutena) na soluccedilatildeo e tambeacutem ao fato do modelo prever

solubilidade infinita quando a fraccedilatildeo de moleacuteculas eletricamente neutras tende a

zero

limrarr푠 = lim

rarr

Φ(푝퐼)푠 (푝퐼)Φ(푝퐻) = +infin

(711 ndash 1)

00

50

100

150

200

250

300

350

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

34 7 Aplicaccedilatildeo dos Modelos Expostos

Todavia ainda haacute um fator de ordem natural que justifica o desvio apresentado para

valores de pH distantes do pI o desnovelamento da cadeia proteacuteica Este fenocircmeno

pode ocorrer de maneira a expor grupos hidroacutefobos resiacuteduos antes natildeo expostos

acrescentando relaccedilotildees de equiliacutebrio quiacutemico natildeo existentes na regiatildeo do pI

alterando o equiliacutebrio de fases e portanto alterando o valor da solubilidade

A Tabela 711 apresenta os valores obtidos para a funccedilatildeo objetivo definida em (7 ndash

1) tanto para o modelo proposto quanto para a abordagem claacutessica para trecircs

diferentes temperaturas

Tabela 711 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada

abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para insulina

suiacutena

T ordmC Abordagem FO

25 P 01857 C 02535

15 P 01981 C 05056

5 P 03595 C 03064

Observando-se a Tabela 711 vecirc-se que o modelo apresentou melhores resultados

do que o caacutelculo efetuado atraveacutes da abordagem claacutessica no que tange a

minimizaccedilatildeo da funccedilatildeo objetivo exceto para os dados a 5 ordmC

Tambeacutem eacute possiacutevel observar que a funccedilatildeo objetivo sofreu aumento com a

diminuiccedilatildeo da temperatura Isto ocorreu principalmente devido agrave dificuldade de

obter dados experimentais de solubilidade a temperaturas baixas o que aumenta o

desvio experimental fazendo com que se tenha um aumento do valor da funccedilatildeo

objetivo como a definida em (5 ndash 1) Um efeito secundaacuterio que tambeacutem pressiona a

35 7 Aplicaccedilatildeo dos Modelos Expostos

funccedilatildeo objetivo eacute o fato dos dados de pKA terem sido obtidos a uma temperatura

especiacutefica o que tende a acrescentar erro no caacutelculo de solubilidades a temperaturas

diferentes ainda que o pKA natildeo varie de forma ab-rupta com a temperatura

Outra observaccedilatildeo que deve ser registrada eacute o fato da funccedilatildeo objetivo para a

abordagem claacutessica na temperatura de 15 ordmC divergir a um valor tatildeo elevado em

relaccedilatildeo aos demais Isto se deve a um ponto experimental especiacutefico a um pH de

45 a solubilidade da insulina suiacutena obtida experimentalmente eacute 230 x 10-5 mol kg-1

enquanto a calculada pelo modelo proposto eacute 230 x 10-5 mol kg-1 e a calculada pela

abordagem claacutessica eacute 520 x 10-5 mol kg-1 Por conta do desvio deste ponto a funccedilatildeo

objetivo para a abordagem claacutessica nesta temperatura tem um aumento significativo

A Tabela 712 apresenta os valores do paracircmetro K da soluccedilatildeo paraboacutelica obtidos

neste trabalho para a insulina suiacutena comparados ao encontrado na literatura

Tabela 712 ndash Valores do paracircmetro K da soluccedilatildeo paraboacutelica para a insulina suiacutena

Referecircncias T ordmC K Fredericq e Neurath (1950) - 081 Neste trabalho 25 104 Neste trabalho 15 101 Neste trabalho 5 145

Pela Tabela 712 pode-se observar que haacute uma diferenccedila pequena entre os

valores do paracircmetro K obtidos neste trabalho e por Fredericq e Neurath (1950) Por

isso natildeo se pode afirmar a que se deve esta diferenccedila se eacute devido a diferenccedilas entre

procedimentos experimentais ou se eacute devido agrave diferenccedila de meacutetodo de caacutelculo do

paracircmetro Apesar de no experimento realizado por Fredericq e Neurath (1950)

haver a presenccedila do acircnion tiocianato e este acircnion interagir com grupos ionizaacuteveis

da cadeia proteacuteica como observado pelos autores do trabalho tambeacutem estes

36 7 Aplicaccedilatildeo dos Modelos Expostos

proacuteprios autores afirmam que a presenccedila deste acircnion natildeo altera a forma da curva

que eacute basicamente determinada pelo paracircmetro K De qualquer modo eacute interessante

observar a proximidade dos valores encontrados neste trabalho com o obtido por

Fredericq e Neurath (1950) pelo menos no que diz respeito agrave ordem de grandeza do

paracircmetro em questatildeo

72 Solubilidade da Lisozima de clara de ovo de galinha

Um modelo para ser validado necessita correlacionar dados experimentais de modo

satisfatoacuterio ou seja um modelo deve buscar fidelidade ao fenocircmeno fiacutesico

observado Assim na procura de dados de solubilidade de proteiacutenas poucos dados

na regiatildeo do pI foram encontrados Este eacute o caso da lisozima de clara de ovo de

galinha que apesar de ter muitos estudos de solubilidade nenhum deles se

encontra na regiatildeo do pI Surgiu assim a necessidade de se obter estes dados

experimentais para poder validar o modelo proposto A escolha da lisozima de clara

de ovo de galinha se deu em parte pela sua importacircncia mas tambeacutem em parte por

ter os valores de pKA conhecidos

A curva de solubilidade da lisozima de clara de ovo de galinha levantada neste

trabalho estaacute apresentada na Figura 721

37 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em

soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e

dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()

Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento

esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH

isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de

soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se

comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto

isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da

soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos

ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente

neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a

solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e

00

10

20

30

40

50

60

70

80

90

100

95 100 105 110 115 120

Solu

bilid

ade

(mg

mL)

pH

38 7 Aplicaccedilatildeo dos Modelos Expostos

alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado

em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo

Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo

a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo

Por conta de falta de dados a este respeito modelou-se apenas a curva de

solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura

722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de

galinha em funccedilatildeo do pH da soluccedilatildeo

Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)

00

10

20

30

40

50

60

70

80

90

96 99 102 105 108 111 114 117 120

Solu

bilid

ade

(mg

mL)

pH

39 7 Aplicaccedilatildeo dos Modelos Expostos

O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721

Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada

abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima

de clara de ovo de galinha

T ordmC Abordagem FO

25 P 4650 C gt7919a

a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado

Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta

aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a

abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca

de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos

anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao

efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de

clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a

variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A

proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de

cargas pontuais de Debye-Huumlckel

8 Conclusotildees

A modelagem termodinacircmica proposta neste trabalho apresentou expressivos

resultados quando comparada a abordagem claacutessica de Debye-Huumlckel

Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o

modelo aproximou melhor os pontos experimentais do que a referida abordagem

comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima

ao ponto isoeleacutetrico

Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica

para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua

construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo

lugar por sua aplicabilidade

Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis

da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva

em regiotildees distantes do ponto isoeleacutetrico

9 Referecircncias Bibliograacuteficas

BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene

Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects

Biophys J 95 1285-1294 2008

FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and

other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72

2684 - 26911950

GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v

93 p 517-542 1931

GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab

Carlsberg v 24 p 185-200 1941

KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native

and mutant insulins pK perturbation of B13-Glu in aggregated species Arch

Biochem Biophys v 283 p 496-502 1990

KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for

the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng

Chem Res v 35 p 4319-4327 1996

42 9 Referecircncias Bibliograacuteficas

KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen

lysozyme J Biochem v 87 p 1215-1219 1980

LADISCH M R Bioseparations Engineering principles practice and

economics John Wiley amp Sons 2001 pp1 116 ndash 117 133

LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab

Carlsberg v 15 p 1-29 1924

PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da

particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas

2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP

PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the

excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte

solutions Fluid Phase Equilib v 269 p 25ndash35 2008

PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-

contribution model involving phase and chemical equilibrium Ind Eng Chem Res

v 33 p 1341-1347 1994

PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277

1973

PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino

acids Fluid Phase Equilib v 152 p 121-132 1998

43 9 Referecircncias Bibliograacuteficas

PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular

Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999

SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of

equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte

solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009

TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J

R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with

carbon dioxide Biotech Bioeng v103 p 909-919 2009

TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer

free energy Biophys J v 95 p 2601-2609 2008

TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in

water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95

2009

Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na

cadeia proteacuteica

Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo

de ionizaccedilatildeo

퐻퐴 퐴 + 퐻

(A ndash 1)

Assim considerando que a constante de equiliacutebrio

퐾 = 푎

(A ndash 2)

Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que

퐾 =[퐴 ][퐻 ]

[퐻퐴]

(A ndash 3)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que

log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]

(A ndash 4)

Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado

por

minus log[휑] = 푝휑

(A ndash 5)

Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que

45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

푝퐾 = log[퐻퐴][퐴 ] + 푝퐻

(A ndash 6)

Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por

훼 =[퐴 ]

[퐻퐴] + [퐴 ]

(A ndash 7)

Reescrevendo (A ndash 7) tem-se que

훼 =[퐴 ] [퐻퐴frasl ]

1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =

훼1 minus 훼

(A ndash 8)

Substituindo (A ndash 8) em (A ndash 6) tem-se que

푝퐾 = log훼

1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10

(A ndash 9)

Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos

훼 =1

1 + 10

(A ndash 10)

Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio

퐴 + 퐻 퐻퐴

(A ndash 11)

Pode se escrever a constante de equiliacutebrio como

퐾 =[퐻퐴 ]

[퐴][퐻 ]

(A ndash 12)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que

46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

log퐾 = minus log[퐴]

[퐻퐴 ] minus log[퐻 ]

(A -13)

Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por

훼 =[퐻퐴 ]

[퐴] + [퐻퐴 ]

(A ndash 14)

Assim a equaccedilatildeo (A ndash 13) fica

훼1 minus 훼 = 10

(A ndash 15)

Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo

훼 =10

1 + 10

(A ndash 16)

Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos

modelos expostos

Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]

48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]

49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)

50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])

51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]

52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])

53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)

54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2

55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO

Sumaacuterio

1 Introduccedilatildeo 1

2 Materiais e Meacutetodos 7

21 Meacutetodos computacionais 7

22 Curva de solubilidade da lisozima da clara de ovo de galinha 9

221 Reagentes 9

222 Equipamentos 9

223 Preparaccedilatildeo das soluccedilotildees-tampatildeo 9

224 Procedimento experimental 10

3 Modelo Estendido de Debye-Huumlckel 11

31 Introduccedilatildeo 11

32 Desenvolvimento teoacuterico 12

4 Modelagem Termodinacircmica Proposta 16

41 Introduccedilatildeo 16

42 Caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras 18

5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall 21

51 Introduccedilatildeo 21

52 Desenvolvimento teoacuterico 21

53 Soluccedilatildeo Paraboacutelica da Curva de Solubilidade 26

6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall 28

7 Aplicaccedilatildeo dos Modelos Expostos 31

71 Solubilidade da Insulina Suiacutena 31

72 Solubilidade da Lisozima de clara de ovo de galinha 36

8 Conclusotildees 40

9 Referecircncias Bibliograacuteficas 41

Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach 44

Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos 47

1 Introduccedilatildeo

Dentre as etapas de um processo biotecnoloacutegico aquela dedicada a purificaccedilatildeo de

bioprodutos tende a ser determinante em geral para o custo do processo seguindo

a tendecircncia dos processos de separaccedilatildeo da induacutestria quiacutemica tradicional A

produccedilatildeo de proteiacutenas tem lugar de destaque no rol de bioprodutos de interesse

pois muitos antibioacuteticos hormocircnios e enzimas pertencem a esta classe de

biomoleacuteculas e possuem notoacuterio interesse industrial por suas propriedades

terapecircuticas e aplicaccedilotildees na induacutestria alimentiacutecia No entanto proteiacutenas a serem

comercializadas para estes fins exigem altos graus de pureza que somente satildeo

obtidos pelas etapas de purificaccedilatildeo Como afirmado por Bončina et al (2008)

estudos de separaccedilatildeo de proteiacutenas especificamente tecircm sido motivados por um

aumento da demanda por proteiacutenas puras nas induacutestrias farmacecircutica e correlatas

Muitas moleacuteculas bioloacutegicas ndash ou comumente chamadas biomoleacuteculas - e

particularmente proteiacutenas satildeo destruiacutedas pelo calor natildeo podem ser destiladas satildeo

geradas a baixas concentraccedilotildees e tecircm uma estrutura tridimensional que pode ser

alterada durante a purificaccedilatildeo resultando na perda da atividade bioloacutegica Por isso

bioprodutos tais como proteiacutenas devem ser recuperados purificados e

concentrados em operaccedilotildees com membranas etapas de adsorccedilatildeo cromatografia

cristalizaccedilatildeo e outras teacutecnicas que natildeo requerem calor ou pH extremo para alcanccedilar

o fracionamento (Ladisch 2001)

Em geral nos processos biotecnoloacutegicos as correntes de saiacuteda dos biorreatores

seguem para as operaccedilotildees de downstream (etapas de separaccedilatildeo que visam

concentrar e dispor o produto final) As primeiras operaccedilotildees de downstream por

exemplo a clarificaccedilatildeo e a centrifugaccedilatildeo tecircm por objetivo isolar a proteiacutena de

2 1 Introduccedilatildeo

interesse das ceacutelulas que a produziram Apoacutes estas primeiras etapas de purificaccedilatildeo

seguem-se as operaccedilotildees de baixa resoluccedilatildeo A precipitaccedilatildeo e a extraccedilatildeo em

sistemas de duas fases aquosas satildeo exemplos destas operaccedilotildees que tendem a

concentrar a proteiacutena-alvo preparando-a para os proacuteximos estaacutegios de separaccedilatildeo

Por fim a proteiacutena ora na concentraccedilatildeo obtida pelas operaccedilotildees anteriores eacute tratada

por operaccedilotildees de alta resoluccedilatildeo caracterizadas principalmente pela teacutecnica de

cromatografia a fim de concentrar a proteiacutena agrave pureza especificada para seu uso

Vale ressaltar que esta uacuteltima etapa eacute extremamente dispendiosa e quanto mais

eficientes forem as etapas precedentes no que tange a pureza da proteiacutena-alvo

menos custosa seraacute a etapa posterior

O escopo deste trabalho estaacute centrado na operaccedilatildeo de precipitaccedilatildeo de proteiacutenas

cujos fundamentos satildeo as relaccedilotildees do equiliacutebrio soacutelido-liacutequido (ESL) destes

sistemas A solubilidade de uma proteiacutena em soluccedilatildeo eacute governada pelos mesmos

princiacutepios fundamentais ou seja condiccedilotildees de equiliacutebrio termodinacircmico que regem

o comportamento de qualquer substacircncia no ESL Contudo algumas diferenccedilas

devem ser levadas em conta na descriccedilatildeo deste fenocircmeno e no projeto destas

operaccedilotildees

Proteiacutenas satildeo formadas por cadeias de aminoaacutecidos atraveacutes de ligaccedilotildees peptiacutedicas

cada aminoaacutecido pode ser considerado um monocircmero que ao possuir um grupo

ionizaacutevel natildeo ligado tal como ocorre em alguns aminoaacutecidos naturais tirosina (Tyr)

lisina (Lys) cisteiacutena (Cys) histidina (His) arginina (Arg) aacutecido aspaacutertico (Asp) e

aacutecido glutacircmico (Glu) e tambeacutem em resiacuteduos terminais confere a proteiacutena uma

caracteriacutestica de polieletroacutelito Eacute importante entatildeo considerar a definiccedilatildeo de

polieletroacutelitos tal qual definida por Pessocirca Filho e Maurer (2008) polieletroacutelitos satildeo

3 1 Introduccedilatildeo

poliacutemeros com muitas unidades monomeacutericas eletroliacuteticas ndash neste caso

aminoaacutecidos que possuem grupos ionizaacuteveis natildeo ligados

Para muitos processos industriais e mesmo naturais informaccedilotildees a respeito de

equiliacutebrios de fases de soluccedilotildees eletroliacuteticas satildeo necessaacuterias e necessaacuterias tambeacutem

satildeo modificaccedilotildees nos modelos tradicionais de coeficiente de atividade quando se

trata de descrever equiliacutebrios de fases em sistemas que conteacutem eletroacutelitos (Prausnitz

et al 1999)

Sendo assim tendo que a pressatildeo do sistema natildeo influencia de modo significativo o

ESL tem-se que trecircs variaacuteveis o influenciam diretamente a temperatura o pH e a

forccedila iocircnica estas duas uacuteltimas tornam-se importantes devido agrave caracteriacutestica

eletroliacutetica das proteiacutenas

Na verdade a forccedila iocircnica natildeo eacute uma variaacutevel que represente de modo abrangente

os possiacuteveis efeitos de iacuteons em soluccedilotildees proteacuteicas Isto se deve ao fato de que a

forccedila iocircnica do modo como eacute definida natildeo contempla uma diferenciaccedilatildeo entre os

equiliacutebrios que se estabelecem entre os iacuteons e alguns resiacuteduos ionizaacuteveis da cadeia

proteacuteica De fato a variaccedilatildeo da forccedila iocircnica de uma soluccedilatildeo proteacuteica altera o valor

da solubilidade da proteiacutena em soluccedilatildeo mas natildeo da mesma forma para qualquer

espeacutecie de iacuteon Portanto seria mais prudente acrescer ao conjunto de variaacuteveis que

influenciam o ESL a espeacutecie quiacutemica dos iacuteons presentes em soluccedilatildeo

O objetivo deste trabalho eacute estabelecer um modelo capaz de prever a influecircncia do

pH no ESL de proteiacutenas mantendo-se temperatura e forccedila iocircnica constantes

Sabe-se por observaccedilotildees experimentais que a variaccedilatildeo do pH de um sistema altera

o valor da solubilidade de proteiacutenas em soluccedilatildeo e a solubilidade de proteiacutenas por

sua vez atinge seu valor miacutenimo em um pH denominado ponto isoeleacutetrico (pI) no

qual a carga liacutequida da proteiacutena eacute nula

4 1 Introduccedilatildeo

Os primeiros trabalhos relacionados agrave modelagem da curva de solubilidade de

proteiacutenas em funccedilatildeo do pH datam do iniacutecio do seacuteculo XX Green (1931) propocircs um

modelo para a curva de solubilidade da carboxihemoglobina equumlina considerando

que esta proteiacutena se comportaria tanto como um aacutecido bivalente quanto uma base

bivalente Jaacute Groumlnwall (1941) atribuiu a Linderstroslashm-Lang o desenvolvimento de um

modelo capaz de predizer a curva de solubilidade a partir da integraccedilatildeo do perfil de

carga da proteiacutena Este trabalho de Groumlnwall apesar de esquecido pelo tempo eacute de

extrema importacircncia e relevacircncia tanto para o trabalho aqui apresentado quanto e

aqui um motivo muito mais nobre para o desenvolvimento de modelos a partir das

ferramentas da termodinacircmica claacutessica Quando da exposiccedilatildeo da modelagem aqui

tratada retornar-se-aacute a este trabalho que muito contribuiu ao entendimento do

fenocircmeno estudado

Eacute digno de nota o trabalho de Fredericq e Neurath (1950) no qual uma proposta de

equacionamento para uma correlaccedilatildeo semi-empiacuterica da curva de solubilidade de

insulina eacute apresentada Natildeo haacute de fato algo novo em relaccedilatildeo agrave modelagem do

efeito do pH na curva de solubilidade neste trabalho no entanto apesar de natildeo

haver qualquer menccedilatildeo ou referecircncia quanto agrave origem da equaccedilatildeo proposta nota-se

que eacute uma aplicaccedilatildeo direta da equaccedilatildeo descrita por Groumlnwall (1941) Haacute uma

hipoacutetese impliacutecita no trabalho de que o perfil de carga liacutequida da insulina seja linear

na regiatildeo do ponto isoeleacutetrico o que eacute bastante plausiacutevel para muitas proteiacutenas

Assim pela integraccedilatildeo da equaccedilatildeo diferencial proposta por Groumlwall (1941) uma

correlaccedilatildeo semi-empiacuterica quadraacutetica eacute obtida Reforccedila-se o uso da expressatildeo semi-

empiacuterica devido agrave natureza dual da equaccedilatildeo em parte advinda de um

desenvolvimento teoacuterico descrito por Groumlnwall (1941) e atribuiacutedo a Linderstroslashm-

Lang e em parte pela necessidade de se obter paracircmetros a partir de um ajuste de

5 1 Introduccedilatildeo

um conjunto de dados experimentais Vale observar que resultados expressivos

foram alcanccedilados neste trabalho de modo particular o fato de que a presenccedila do

acircnion tiocianato natildeo altera a forma da curva de solubilidade da insulina mas a

desloca em direccedilatildeo a menores valores de pH e de solubilidade

Contudo os trabalhos mais recentes se concentraram na modelagem da curva de

solubilidade de aminoaacutecidos em funccedilatildeo do pH dando maior enfoque aos modelos

termodinacircmicos para soluccedilotildees natildeo-ideais tanto atraveacutes de equaccedilotildees de estado

como de modelos de energia livre de Gibbs excedente

Destaca-se neste grupo o trabalho de Pinho et al (1994) que aplicaram o modelo

UNIFAC associado ao termo de Debye-Huumlckel para aminoaacutecidos como glicina D-

alanina L-serina e DL-valina Tambeacutem o trabalho de Khoshkbarchi e Vera (1996)

no qual foi desenvolvido um modelo simplificado de esfera riacutegida perturbada para

calcular o coeficiente de atividade de aminoaacutecidos e de peptiacutedeos permite prever a

curva de solubilidade destes em funccedilatildeo do pH Jaacute o modelo NRTL foi aplicado tanto

por Pradhan e Vera (1998) quanto Tseng et al (2009) para aminoaacutecidos Jaacute Seyfi et

al (2009) aplicaram a equaccedilatildeo de estado SAFT para a prediccedilatildeo da curva de

solubilidade da DL-metionina

Entretanto o primeiro trabalho dedicado exclusivamente agrave modelagem e prediccedilatildeo da

curva de solubilidade de proteiacutena propriamente dita em funccedilatildeo do pH foi publicado

por Tjong e Zhou (2008) Neste trabalho a solubilidade foi calculada a partir da

energia livre de transferecircncia da fase soacutelida para a fase liacutequida Para a execuccedilatildeo

deste caacutelculo a energia livre de transferecircncia foi dividida em duas contribuiccedilotildees

uma de natureza eletrostaacutetica calculada pela meacutedia de 100 conformaccedilotildees proteacuteicas

advindas da aplicaccedilatildeo de dinacircmica molecular a pH constante e outra de natureza

natildeo-eletrostaacutetica baseada na aacuterea superficial acessiacutevel ao solvente Poreacutem o

6 1 Introduccedilatildeo

esforccedilo computacional requerido pelo modelo por eles proposto para calcular

apenas alguns pontos da curva natildeo apresenta uma aplicabilidade razoaacutevel Aleacutem

deste trabalho Tashima et al (2009) propuseram uma modelagem termodinacircmica

para prever a curva de solubilidade especificamente da insulina suiacutena aplicando o

modelo de Pitzer truncado apoacutes o segundo coeficiente do virial

No presente trabalho propomos um novo modelo baseado no caacutelculo de estados de

ionizaccedilatildeo e em ferramentas de termodinacircmica claacutessica bem como uma extensatildeo agrave

teoria de Linderstroslashm-Lang e Groumlnwall Vale ressaltar de antematildeo que tanto este

novo modelo proposto quanto a extensatildeo desenvolvida resultam na mesma equaccedilatildeo

para o fenocircmeno apesar das distintas abordagens

2 Materiais e Meacutetodos

21 Meacutetodos computacionais

O coacutedigo-fonte do programa em linguagem C estaacute apresentado no Apecircndice B Os

meacutetodos numeacutericos utilizados se resumem a interpolaccedilatildeo linear o meacutetodo de

Newton-Raphson cujo uso seraacute apresentado na proacutexima seccedilatildeo quando se deduziraacute

o algoritmo do modelo de Debye-Huumlckel e o meacutetodo de busca unidirecional de

miacutenimos de funccedilatildeo pela Seccedilatildeo Aacuteurea

As Tabelas 211 e 212 apresentam os resiacuteduos considerados para cada proteiacutena

considerada bem como os seus valores de pKA que foram obtidos a partir da

literatura e satildeo indispensaacuteveis para execuccedilatildeo dos caacutelculos mais rigorosos

Tabela 211 ndash Resiacuteduos ionizaacuteveis considerados e valores de pKA da insulina suiacutena

Valores extraiacutedos de Kaarsholm et al (1990)

Aminoaacutecido Grupo Ionizaacutevel pKA

A1 ndash Gly -NH2 738 A4 ndash Glu -COOH 437 A14 ndash Tyr Fenol-OH 1020 A17 ndash Glu -COOH 437 A19 ndash Tyr Fenol-OH 1020 A21 ndash Asn -COOH 345

B1 ndash Phe -NH2 738 B5 ndash His Imidazol-NH 598 B10 ndash His Imidazol-NH 598 B 13 ndash Glu -COOH 437 B16 ndash Tyr Fenol-OH 1020 B21 ndash Glu -COOH 437

B22 ndash Arg Guaniacutedio-NH2 1110 B26 ndash Tyr Fenol-OH 1020

B29 ndash Lys -NH2 852 B30 ndashAla -COOH 345

8 2 Materiais e Meacutetodos

Tabela 212 ndash Resiacuteduos ionizaacuteveis considerados e valores de pKA a 25 ordmC da lisozima

de clara de ovo de galinha Valores extraiacutedos de Kuramitsu e Hamaguchi (1980)

Aminoaacutecido Grupo Ionizaacutevel pKA α-NH2 α-NH2 79

Lys1 ε-NH2 108

Arg5 Guaniacutedio-NH2 120 Glu7 -COOH 26

Lys13 ε-NH2 105

Arg14 Guaniacutedio-NH2 120 His15 Imidazol-NH 58 Asp18 -COOH 20 Tyr20 Fenol-OH 103

Arg21 Guaniacutedio-NH2 120 Tyr23 Fenol-OH 98

Lys33 ε-NH2 106 Glu35 -COOH 61

Arg45 Guaniacutedio-NH2 120 Asp48 -COOH 43 Asp52 -COOH 34 Tyr53 Fenol-OH 121

Arg61 Guaniacutedio-NH2 120 Asp66 -COOH 16

Arg68 Guaniacutedio-NH2 120

Arg73 Guaniacutedio-NH2 120 Asp87 -COOH 21

Lys96 ε-NH2 108

Lys97 ε-NH2 103 Asp101 -COOH 45

Arg112 Guaniacutedio-NH2 120

Arg114 Guaniacutedio-NH2 120

Lys116 ε-NH2 104 Asp119 -COOH 25

Arg125 Guaniacutedio-NH2 120

Arg128 Guaniacutedio-NH2 120 α-COOH α-COOH 31

9 2 Materiais e Meacutetodos

22 Curva de solubilidade da lisozima da clara de ovo de galinha

221 Reagentes

Neste experimento de determinaccedilatildeo da curva de solubilidade da lisozima da clara de

ovo de galinha os reagentes utilizados foram cloreto de soacutedio (Reatec P A)

bicarbonato de soacutedio (Research Becto Chemical P A) Na2HPO4 7H2O (Reagen

P A) aacutegua destilada deionizada Milli-Q (Millipore) e lisozima de clara de ovo de

galinha (Sigma min 99)

222 Equipamentos

Neste experimento os equipamentos utilizados foram espectrofotocircmetro UV-Visiacutevel

(Beckman DU-530) centriacutefuga (Eppendorf) banho-teacutermico (Laacutectea) com controlador

de temperatura (Julabo) pHmetro (Micronal) e balanccedila (Mettler Toledo AB204S)

223 Preparaccedilatildeo das soluccedilotildees-tampatildeo

Foram preparadas soluccedilotildees-tampatildeo com valores de pH=96 pH = 98 pH = 100

pH = 102 pH = 104 pH = 106 pH = 108 pH = 110 pH = 112 pH = 114 pH =

116 e pH = 118 a partir de quatro soluccedilotildees uma de hidroacutexido de soacutedio 01 M uma

de cloreto de soacutedio 1 M (para equalizar a forccedila iocircnica) uma de bicarbonato de soacutedio

005 M e outra de Na2HPO4 005 M

A Tabela 2231 apresenta os valores de volume usados no preparo de cada uma

das soluccedilotildees-tampatildeo

10 2 Materiais e Meacutetodos

Tabela 2231 ndash Volumes de hidroacutexido de soacutedio a 01 M adicionados no preparo das

soluccedilotildees-tampatildeo

Tampatildeo pH V NaOH mL

NaHCO3 96 100 005 M 98 152

(para cada soluccedilatildeo-tampatildeo 100 mL 100 214

desta soluccedilatildeo foram adicionados) 102 276

104 330 106 382

108 424

110 454

112 530 114 583

Na2HPO4 110 82

005 M 112 126

(para cada soluccedilatildeo-tampatildeo 100 mL 114 182 desta soluccedilatildeo foram adicionados) 116 270

118 388

224 Procedimento experimental

Foram adicionadas quantidades natildeo definidas de lisozima de clara de ovo de galinha

a 13 mL de cada soluccedilatildeo-tampatildeo em tubos Eppendorf de 2 mL Colocaram-se

entatildeo as amostras apoacutes agitaccedilatildeo vigorosa em banho teacutermico a 250 plusmn 01 ordmC por 24

horas para que os sistemas atingissem o equiliacutebrio termodinacircmico Caso natildeo

houvesse a formaccedilatildeo de precipitado lisozima era adicionada e o procedimento

repetido Ao se observar a formaccedilatildeo de precipitado o sistema era centrifugado a

13000 rpm por 15 minutos Uma aliacutequota do sobrenadante era retirada e sua

concentraccedilatildeo proteacuteica determinada por medida de absorbacircncia a 280 nm Cada

sistema foi feito ao menos em duplicata

3 Modelo Estendido de Debye-Huumlckel

31 Introduccedilatildeo

De fato como descrito por Pessocirca Filho (2002) a equaccedilatildeo de Debye-Huumlckel natildeo

deve ser aplicada agrave modelagem de polieletroacutelitos tais como proteiacutenas porque nestas

moleacuteculas as cargas satildeo distribuiacutedas ao longo da cadeia e portanto natildeo satildeo cargas

pontuais como suposto por Debye-Huumlckel

Contudo nesta modelagem considera-se uma regiatildeo de pH em torno do ponto

isoeleacutetrico (pI) na qual satildeo inerentes duas condiccedilotildees favoraacuteveis a aplicaccedilatildeo da

equaccedilatildeo de Debye-Huumlckel carga liacutequida proacutexima a zero pois Z(pI) = 0 e regiatildeo de

miacutenima solubilidade que significa baixas concentraccedilotildees de proteiacutenas em soluccedilatildeo

Isto significa em primeiro lugar que os efeitos da carga tais como ldquodesnovelamentordquo

da cadeia proteacuteica com exposiccedilatildeo de resiacuteduos outrora blindados podem ser

desprezados em uma regiatildeo proacutexima ao ponto isoeleacutetrico e em segundo lugar

baixas concentraccedilotildees de proteiacutena em soluccedilatildeo significam que os termos de curto

alcance podem ser desprezados e portanto haacute prevalecircncia do termo de longo

alcance que no caso de soluccedilotildees eletroliacuteticas pode ser descrito por uma equaccedilatildeo

estendida de Debye-Huumlckel

Assim o modelo de Debye-Huumlckel foi utilizado natildeo para verificar sua aplicabilidade agrave

modelagem de soluccedilotildees proteacuteicas mas sim para confrontar o modelo proposto com

um modelo usual em modelagem de soluccedilotildees eletroliacuteticas e seraacute referido no texto

sempre como abordagem claacutessica

12 3 Modelo Estendido de Debye-Huumlckel

32 Desenvolvimento teoacuterico

Pode-se escrever a atividade da proteiacutena como o produto entre a solubilidade e o

coeficiente de atividade da mesma como mostrado na equaccedilatildeo (32 - 1)

푎 = 훾푠

(32 - 1)

Na qual pode-se calcular o coeficiente de atividade atraveacutes da equaccedilatildeo estendida

de Debye-Huumlckel (Pitzer 1973)

ln 훾 = minus퐴 푍radic퐼

1 + 푏radic퐼+

2푏

ln 1 + 푏radic퐼

(32 - 2)

Sendo que a constante universal empiacuterica b = 12 kg12 mol-12 eacute usada para todos os

eletroacutelitos Jaacute AΦ eacute o paracircmetro de Debye-Huumlckel para o coeficiente osmoacutetico e eacute

dado por

퐴 =13

(2휋푁 휌 ) frasl 푒4휋휀 휀 푘푇

frasl

(32 - 3)

Em que NA eacute a constante de Avogadro ρs eacute a densidade do solvente em g cm-3 e eacute

a carga eletrocircnica (e = 160218 x 10-19 C) ε0 eacute a permissividade do espaccedilo livre (ε0 =

885419 x 10-12 C2 N-1 m-2) εr eacute a constante dieleacutetrica do solvente k aacute constante de

Boltzmann e T eacute a temperatura absoluta Jaacute a carga liacutequida em funccedilatildeo do pH pode

ser calculada como

푍 = 훼 minus 훼

(32 - 4)

Sendo que α+ e α- satildeo dados pelas equaccedilotildees (A - 10) e (A - 16) do Apecircndice A

13 3 Modelo Estendido de Debye-Huumlckel

E a forccedila iocircnica eacute dada pela equaccedilatildeo (32 - 5) descrita abaixo

퐼 = 12

푚 푍

(32 - 5)

Contudo no ponto isoeleacutetrico a carga meacutedia da proteiacutena eacute nula portanto o termo de

Debye-Huumlckel se anula e o coeficiente de atividade se torna unitaacuterio

ln푎 (푝퐼) = ln 푠 (푝퐼)

(32 - 6)

Considerando que a atividade da proteiacutena seja constante com a variaccedilatildeo de pH isto

implica que esta eacute sempre igual agrave solubilidade da proteiacutena no ponto isoeleacutetrico e

portanto vale que

ln푎 (푝퐻) = ln 푠 (푝퐻) + ln 훾(푝퐻) = ln 푠 (푝퐼)

(32 - 7)

Assim

ln 푠 (푝퐻) = ln 푠 (푝퐼) + 퐴휙푍푝퐻2 radic퐼1 + 푏radic퐼

+2푏

ln 1 + 푏radic퐼

(32 - 8)

Esta equaccedilatildeo prevecirc a curva de solubilidade em funccedilatildeo do pH atraveacutes do caacutelculo da

atividade da proteiacutena na fase liacutequida pela equaccedilatildeo estendida de Debye-Huumlckel Para

resolvecirc-la eacute necessaacuterio se utilizar de um meacutetodo numeacuterico pois a forccedila iocircnica

depende da solubilidade naquele pH Optou-se neste trabalho pelo Meacutetodo de

Newton-Raphson para executar o meacutetodo iterativo que eacute exigido pela equaccedilatildeo (32

ndash 8) Para aplicar este meacutetodo arbitrou-se uma funccedilatildeo f(sp) definida aqui como

푓 푠 = minus ln 푠 (푝퐻) + ln 푠 (푝퐼) + 퐴휙푍푝퐻2 radic퐼

1 + 푏radic퐼+

2푏

ln 1 + 푏radic퐼

(32 - 9)

14 3 Modelo Estendido de Debye-Huumlckel

Assim ao calcular o sp que zera esta funccedilatildeo f(sp) saber-se-aacute que eacute a proacutepria

solubilidade que se deseja calcular Para aplicar o Meacutetodo de Newton-Raphson

basta derivar a funccedilatildeo f(sp) e aplicar o seguinte algoritmo de resoluccedilatildeo

푠 = 푠 minus푓(푠 )푓 (푠 )

(32 - 10)

Para calcular frsquo(s) deve-se considerar que a forccedila iocircnica depende da solubilidade

Para isto observando a equaccedilatildeo (32 - 5) vecirc-se que a forccedila iocircnica eacute dada pelo

somatoacuterio das contribuiccedilotildees de todos os iacuteons presentes na soluccedilatildeo por isso aqui

cabe um artifiacutecio de dividir estas contribuiccedilotildees em duas macro-contribuiccedilotildees aquela

devida a todos os iacuteons presentes na soluccedilatildeo exclusive os grupos ionizaacuteveis

presentes nas moleacuteculas da proteiacutena em questatildeo (I0) e que se considera constante

com o pH e aquela que engloba apenas os grupos ionizaacuteveis presentes nas

moleacuteculas da proteiacutena (IP)

퐼 = 퐼 + 퐼 = 퐼 +12푍 푠

(32 - 11)

Considerando a funccedilatildeo w tal que

푤 = radic퐼 = 퐼 +12푍 푠

(32 - 12)

Sendo

푤 =14푍 퐼

(32 - 13)

Entatildeo aplicando-se as devidas regras de derivaccedilatildeo tem-se

15 3 Modelo Estendido de Debye-Huumlckel

푓 (푠 ) = minus1푠 + 퐴 푍

3푤 + 2푤 푏푤(1 + 푏푤)

(32 - 14)

Substituindo as equaccedilotildees (32 - 12) e (32 - 13) na equaccedilatildeo (32 - 14) tem-se que

푓 (푠 ) = minus1푠 + 퐴 푍

15 + 푏radic퐼2radic퐼(1 + 푏radic퐼)

(32 - 15)

Entatildeo o algoritmo deve ser

푠 = 푠 minus

⎜⎛ln 푠 (푝퐼)

푠 + 퐴휙푍푝퐻2 radic퐼

1 + 푏radic퐼+ 2푏 ln 1 + 푏radic퐼

minus 1푠 + 퐴휙푍

15 + 푏radic퐼2radic퐼(1 + 푏radic퐼) ⎠

⎟⎞

(32 - 16)

4 Modelagem Termodinacircmica Proposta

41 Introduccedilatildeo

A condiccedilatildeo de equiliacutebrio entre duas fases (α e β) com m componentes eacute dada por

(Prausnitz et al 1999)

푝 = 푝

(41 ndash 1)

푇 = 푇

(41 ndash 2)

휇 = 휇⋮

휇 = 휇

(41 ndash 3)

Considerando o equiliacutebrio soacutelido-liacutequido (ESL) de sistemas contendo proteiacutenas

sendo que os efeitos da pressatildeo podem ser desprezados que as temperaturas nas

duas fases satildeo iguais e que na fase soacutelida soacute haacute proteiacutena tem-se que para a

proteiacutena a relaccedilatildeo de equiliacutebrio pode ser descrita por

휇 (푇푥) = 휇 (푇)

(41 ndash 4)

Contudo adotando-se a lei de Henry que eacute vaacutelida para baixas concentraccedilotildees de

soluto hipoacutetese que natildeo eacute distante dos valores observados da solubilidade de

proteiacutenas pode se escrever o potencial quiacutemico na fase liacutequida por

휇 (푇푥) = 휇 (푇 푥 ) + 푅푇푙푛푥

(41 ndash 5)

17 4 Modelagem Termodinacircmica Proposta

Entretanto variaccedilotildees de pH natildeo alteram o potencial quiacutemico da fase soacutelida o que

resulta pela relaccedilatildeo (41 ndash 4) que o mesmo natildeo altera tambeacutem o potencial quiacutemico

da fase liacutequida Com isso pela relaccedilatildeo (41 ndash 5) sendo o potencial quiacutemico de

referecircncia constante com o pH uma contradiccedilatildeo emerge a variaccedilatildeo do pH natildeo

poderia alterar o valor da solubilidade poreacutem a observaccedilatildeo experimental mostra o

contraacuterio Assim deve-se lembrar que pelo princiacutepio da eletroneutralidade a fase

soacutelida soacute possui moleacuteculas proteacuteicas eletricamente neutras e portanto o equiliacutebrio

de fases deve se estabelecer apenas entre as moleacuteculas presentes na fase soacutelida e

as moleacuteculas eletricamente neutras em soluccedilatildeo Ou seja como soacute moleacuteculas

eletricamente neutras podem estar na fase soacutelida o equiliacutebrio de fases depende

exclusivamente da fraccedilatildeo de moleacuteculas eletricamente neutras em soluccedilatildeo pois soacute

estas podem precipitar Assim tanto a equaccedilatildeo (41 ndash 4) quanto a equaccedilatildeo (41 ndash

5) devem ser aplicadas natildeo ao conjunto de todas as moleacuteculas de proteiacutena em

soluccedilatildeo mas somente as moleacuteculas proteacuteicas eletricamente neutras Portanto a

concentraccedilatildeo das moleacuteculas de proteiacutena eletricamente neutras em soluccedilatildeo eacute

constante com o pH e pode ser interpretada como a multiplicaccedilatildeo da fraccedilatildeo de

moleacuteculas eletricamente neutras pela concentraccedilatildeo total de proteiacutenas que eacute a

proacutepria solubilidade Assim uma relaccedilatildeo de inversa proporcionalidade eacute definida

quanto maior a fraccedilatildeo de moleacuteculas neutras menor seraacute a solubilidade de uma

proteiacutena em soluccedilatildeo Portanto no ponto isoeleacutetrico no qual haacute o miacutenimo de

solubilidade tem-se o ponto maacuteximo de fraccedilatildeo de moleacuteculas eletricamente neutras

A partir disto eacute possiacutevel escrever a equaccedilatildeo que rege o comportamento da

solubilidade de uma proteiacutena em funccedilatildeo do pH da soluccedilatildeo

휙(푝퐻)푆 (푝퐻) = 휆 = 푐표푛푠푡푎푛푡푒

(41 ndash 6)

18 4 Modelagem Termodinacircmica Proposta

Na equaccedilatildeo (41 ndash 6) o paracircmetro λ pode ser um paracircmetro de ajuste do modelo a

um conjunto de valores experimentais tendo se estabelecido uma funccedilatildeo objetivo ou

ainda dado pelo produto entre a solubilidade no ponto isoeleacutetrico e a fraccedilatildeo de

moleacuteculas eletricamente neutras em soluccedilatildeo tambeacutem no pI neste caso vale a

seguinte equaccedilatildeo

푠 (푝퐻) =휙(푝퐼)푠 (푝퐼)휙(푝퐻)

(41 ndash 7)

Sendo a equaccedilatildeo do modelo ndash equaccedilatildeo (41 ndash 7) ndash extremamente simples a uacutenica

dificuldade reside no caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras

(휙(푝퐻))

42 Caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras

Dentre os aminoaacutecidos que formam atraveacutes de ligaccedilotildees peptiacutedicas as proteiacutenas haacute

aqueles que possuem resiacuteduos com grupos ionizaacuteveis aleacutem dos grupos amina e

aacutecido carboxiacutelico terminais na cadeia Todos estes participam de equiliacutebrios

quiacutemicos com iacuteons H+ presentes na soluccedilatildeo entatildeo ao se alterar o pH da soluccedilatildeo

estes equiliacutebrios satildeo alterados

Assim haacute vaacuterias possibilidades de combinaccedilotildees de estados ionizados destes grupos

ionizaacuteveis que resultam em uma moleacutecula de proteiacutena eletricamente neutra Eacute

importante notar que dada a fraccedilatildeo de uma configuraccedilatildeo de uma moleacutecula neutra

todas as outras fraccedilotildees de configuraccedilotildees possiacuteveis que tambeacutem resultem em

moleacuteculas neutras satildeo proporcionais agrave fraccedilatildeo da configuraccedilatildeo dada pois todas as

configuraccedilotildees participam de equiliacutebrios entre si

19 4 Modelagem Termodinacircmica Proposta

Desta observaccedilatildeo implica-se que basta identificar uma configuraccedilatildeo proteacuteica cuja

soma dos estados ionizados resulte em carga nula para se descrever o equiliacutebrio de

fases em relaccedilatildeo ao pH na regiatildeo do ponto isoeleacutetrico onde esta consideraccedilatildeo eacute

predominante em relaccedilatildeo a outros possiacuteveis fenocircmenos

Contudo eacute necessaacuterio contabilizar a contribuiccedilatildeo de cada grupo ionizaacutevel via

equaccedilatildeo de Henderson-Hasselbach equaccedilatildeo (42 ndash 1)

훼 (푝퐻) =

⎩⎪⎨

⎪⎧ 10

1 + 10 푠푒 휈 = minus1

11 + 10

푠푒 휈 = +1

(42 ndash 1)

Na qual pKAj eacute o co-logaritmo da constante de equiliacutebrio do grupo ionizaacutevel do

resiacuteduo j j eacute estado carregado potencial do resiacuteduo j (-1 para grupos aacutecidos e +1

para grupos baacutesicos) e j eacute a fraccedilatildeo ionizada para o pH dado Para grupos cujo

estado de ionizaccedilatildeo na dada configuraccedilatildeo seja neutro a sua fraccedilatildeo eacute calculada tal

que a soma de sua fraccedilatildeo e da fraccedilatildeo ionizada tenha como resultado o valor

unitaacuterio

Assim a funccedilatildeo Pn pode ser escrita como o produto de cada fraccedilatildeo de cada grupo

ionizaacutevel j naquele estado (-1 0 ou +1) na configuraccedilatildeo neutra k em uma proteiacutena

com n grupos ionizaacuteveis Uma representaccedilatildeo matemaacutetica possiacutevel para esta funccedilatildeo

pode ser escrita como

휙 (푝퐻) = 훼 (푝퐻)

(42 ndash 2)

Na qual a fraccedilatildeo jrsquo(pH) eacute dada por

20 4 Modelagem Termodinacircmica Proposta

훼 (푝퐻) =훼 (푝퐻) 푠푒 휀 = 11 minus 훼 (푝퐻) 푠푒 휀 = 0

(42 ndash 3)

Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (42 ndash 3) e a resultante na equaccedilatildeo

(42 ndash 2) pode-se escrever que

휙 (푝퐻) =1

1 + 10

1 + 휈2 minus 휈 휀 10

minus휈 minus 1

2 minus 휈 휀 푐표푚 휀 = 0

(42 ndash 4)

A equaccedilatildeo (42 ndash 4) junto agrave equaccedilatildeo (41 ndash 7) constituem o modelo termodinacircmico

capaz de predizer a razatildeo entre as fraccedilotildees de moleacuteculas neutras de uma proteiacutena

em funccedilatildeo do pH na regiatildeo do ponto isoeleacutetrico mantendo fixas temperatura e forccedila

iocircnica Substituindo a equaccedilatildeo (42 ndash 4) na equaccedilatildeo (41 ndash 7) obteacutem-se para a

curva de solubilidade

푠 (푝퐻)푠 (푝퐼) =

1 + 101 + 10

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

푐표푚 휀 = 0

(42 ndash 8)

5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

51 Introduccedilatildeo

Segundo Groumlnwall (1941) na fase liacutequida haacute moleacuteculas de proteiacutenas com muitas

configuraccedilotildees k distintas que possuem carga liacutequida i e tambeacutem haacute certas

configuraccedilotildees que tem carga liacutequida nula e satildeo chamadas configuraccedilotildees neutras

Aleacutem disso estas uacuteltimas satildeo aquelas que determinam o equiliacutebrio de fases jaacute que

elas estatildeo em equiliacutebrio com a fase soacutelida na qual soacute haacute moleacuteculas neutras pelo

princiacutepio da eletroneutralidade Eacute tambeacutem afirmado que dado este equiliacutebrio a

atividade das moleacuteculas neutras natildeo se altera com a variaccedilatildeo do pH e eacute

proporcional agraves atividades de qualquer tipo de configuraccedilatildeo neutra

Neste mesmo trabalho eacute atribuiacuteda a Linderstroslashm-Lang o desenvolvimento de uma

teoria de prediccedilatildeo da solubilidade de proteiacutenas com a variaccedilatildeo do pH na regiatildeo do

ponto isoeleacutetrico Este desenvolvimento apresenta um balanccedilo de cargas de um

modo impliacutecito contudo como atestado por Groumlnwall o escasso conhecimento

sobre as estruturas proteacuteicas impediram agravequele tempo uma formulaccedilatildeo mais

pormenorizada do problema

52 Desenvolvimento teoacuterico

A base desta abordagem descrita por Groumlnwall e atribuiacuteda a Linderstroslashm-Lang

reside na hipoacutetese de que a moleacutecula de proteiacutena de configuraccedilatildeo k e carga nula

participa do seguinte equiliacutebrio com os iacuteons H+ e com sua forma de carga i

22 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

푃 + 푖퐻 푃 lowast

(52 ndash 1)

Note-se que o valor de i pode ser negativo A constante do equiliacutebrio quiacutemico

descrita pela equaccedilatildeo (52 ndash 1) pode ser expressa como

퐾 =푎

lowast

푎 푎

(52 ndash 2)

Sabendo que a atividade da moleacutecula de proteiacutena de configuraccedilatildeo k e carga i eacute dada

pelo produto entre sua concentraccedilatildeo e seu coeficiente de atividade tem-se que

푥lowast

= 푎 푎퐾훾

lowast

(52 ndash 3)

Entretanto a solubilidade da proteiacutena eacute soma das concentraccedilotildees de todas as

moleacuteculas de carga i Poreacutem a concentraccedilatildeo das moleacuteculas de carga i eacute a soma das

concentraccedilotildees das moleacuteculas de configuraccedilatildeo k Assim a solubilidade pode ser

escrita como

푠 (푝퐻) = 푎 푎퐾훾

lowast

(52 ndash 4)

Derivando a equaccedilatildeo (52 ndash 4) com respeito agrave atividade do iacuteon H+ considerando

que atividade da moleacutecula neutra eacute constante para qualquer configuraccedilatildeo k e ainda

que o coeficiente de atividade da proteiacutena de carga i independe da atividade do iacuteon

H+ tem-se que

푑푠푑푎 = 푖 ∙ 푎 푎

퐾훾

lowast

(52 ndash 5)

23 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

Sendo

푑 log 푠 (푝퐻)푑(푝퐻) = minus

푎푠 (푝퐻)

푑푠푑푎

(52 ndash 6)

Substituindo as equaccedilotildees (52 ndash 4) e (52 ndash 5) na equaccedilatildeo (52 ndash 6) e

reescrevendo em termos de pH e das concentraccedilotildees das proteiacutenas de carga i tem-

se que

푑 log 푠푑(푝퐻) = minus

sum (푖 ∙ 푥 )sum 푥

(52 ndash 7)

Contudo o termo do lado direito da equaccedilatildeo (52 ndash 7) estaacute associado ao conceito

de valecircncia meacutedia estabelecido por Linderstroslashm-Lang (1924)

횤 =sum (푖 ∙ 푥 )sum 푥

(52 ndash 8)

Os autores natildeo possuiacuteam um modo mais adequado de construir a curva de

solubilidade dada pela equaccedilatildeo (52 ndash 7) do que aproximar por uma funccedilatildeo linear o

perfil de carga liacutequida da proteiacutena obtido experimentalmente e integraacute-lo valendo-se

da analogia entre o conceito de carga liacutequida (Z) e de valecircncia meacutedia ( i ) Entretanto

hoje jaacute se tem uma descriccedilatildeo analiacutetica do perfil de carga liacutequida de proteiacutenas que

pode ser escrita como

푍(푝퐻) = 휈 훼

(52 ndash 9)

Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (52 ndash 9) e a resultante na equaccedilatildeo

(52 ndash 7) tem-se que

24 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

푑 log 푠푑(푝퐻) = minus

12

11 + 10

1 + 휈 + 휈 1 minus 휈 10

(52 ndash 10)

Integrando a equaccedilatildeo (52 ndash 10) de um ponto de referecircncia por exemplo do ponto

isoeleacutetrico (pI) ateacute um pH qualquer tem-se a seguinte relaccedilatildeo

푑 log 푠

( )

( )

= minus12

1

1 + 101 + 휈 + 휈 1 minus 휈 10 푑(푝퐻)

(52 ndash 11)

log푠 (푝퐻)푠 (푝퐼) = minus

12 1 + 휈

11 + 10

푑(푝퐻)

+ 휈 1 minus 휈10

1 + 10푑(푝퐻)

(52 ndash 12)

Fazendo a seguinte substituiccedilatildeo

푢 = 10 푡푎푙 푞푢푒 푑푢푢 = ln 10푑(푝퐻)

(52 ndash 13)

Tem-se que

log푠 (푝퐻)푠 (푝퐼) = minus

12

1 + 휈ln 10

1푢(1 + 푢) 푑푢 +

휈 1 minus 휈ln 10

1(1 + 푢) 푑푢

(52 ndash 14)

log푠 (푝퐻)푠 (푝퐼) = minus

12

1 + 휈ln 10

1푢 푑푢 minus

11 + 푢 푑푢 +

휈 1 minus 휈ln 10

1(1 + 푢) 푑푢

(52 ndash 15)

25 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐼) = minus

12 1 + 휈 log

1010

minus 휈 1 minus 휈 minus 1 + 휈 log1 + 101 + 10

(52 ndash 16)

Sendo

휈 1 minus 휈 minus 1 + 휈 = 휈 minus 휈 minus 1 minus 휈 = minus 1 + 휈 = minus2

(52 ndash 17)

Resultando em

log푠 (푝퐻)푠 (푝퐼) = log

1 + 101 + 10

minus1 + 휈

2 (푝퐻 minus 푝퐼)

(52 ndash 18)

Ainda eacute possiacutevel reescrever a equaccedilatildeo (52 ndash 18) como

log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log

1 + 101 + 10

(52 ndash 19)

Na qual n+ representa o nuacutemero de resiacuteduos ionizaacuteveis que na sua forma carregada

apresentam carga positiva A equaccedilatildeo (52 ndash 19) eacute uma expressatildeo analiacutetica que a

partir de dados da estrutura proteacuteica e de um dado de solubilidade permite predizer

a curva de solubilidade de uma dada proteiacutena em funccedilatildeo do pH na regiatildeo do ponto

isoeleacutetrico mantendo fixas a temperatura e a forccedila iocircnica do sistema

Eacute possiacutevel provar que as equaccedilotildees (42 ndash 8) e (52 ndash 19) satildeo idecircnticas - a prova

disso eacute descrita na seccedilatildeo 6 ndash e assim tem-se que apesar das distintas abordagens

a descriccedilatildeo do fenocircmeno eacute a mesma Note-se que um passo fundamental no

desenvolvimento da Equaccedilatildeo (52 ndash 5) eacute admitir que por hipoacutetese a atividade da

26 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

forma neutra natildeo depende do pH essa hipoacutetese tambeacutem eacute a base da equaccedilatildeo (41

ndash 7) Deve-se registrar o fato de que pelo melhor do nosso conhecimento esta eacute a

primeira vez que uma expressatildeo analiacutetica para o caacutelculo da solubilidade de

proteiacutenas em funccedilatildeo do pH eacute descrita mesmo no limite em que se considera vaacutelida

a lei de Henry

53 Soluccedilatildeo Paraboacutelica da Curva de Solubilidade

Tanto Groumlnwall (1941) quanto Fredericq e Neurath (1950) adotaram a hipoacutetese de

que os perfis de carga liacutequida da -lactoglobulina para um e da insulina para os

outros dois eram lineares na regiatildeo do ponto isoeleacutetrico Esta hipoacutetese eacute bastante

plausiacutevel e simplificadora principalmente a eacutepoca na qual estes trabalhos foram

desenvolvidos em que a estrutura proteacuteica bem como as constantes de ionizaccedilatildeo

dos resiacuteduos com grupos ionizaacuteveis era pouco conhecida De fato ainda hoje a falta

de dados das constantes de ionizaccedilatildeo na cadeia proteacuteica eacute o maior desafio no uso

do modelo rigoroso ndash equaccedilatildeo (52 ndash 18) Por isso o valor desta hipoacutetese de perfil

de carga liacutequida linear eacute notaacutevel

Supondo entatildeo que o perfil de carga seja linear eacute possiacutevel escrevecirc-lo como

푍(푝퐻) = minus퐴(푝퐻 minus 푝퐼) 푐표푚 퐴 gt 0

(53 ndash 1)

Substituindo (53 ndash 1) em (52 ndash 6)

푑 log 푠 (푝퐻)푑(푝퐻) = 퐴(푝퐻 minus 푝퐼)

(53 ndash 2)

Integrando (53 ndash 2) de um pH0 de referecircncia ateacute pH tem-se que

27 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐻 ) = 퐾[푝퐻 minus 2푝퐼(푝퐻 minus 푝퐻 ) minus 푝퐻 ] 푐표푚 퐾 =

퐴2

(53 ndash 3)

Ao se adotar como ponto de referecircncia o ponto isoeleacutetrico a equaccedilatildeo (53 ndash 3)

reduz-se agrave

log푠 (푝퐻)푠 (푝퐼) = 퐾(푝퐻 minus 푝퐼)

(53 ndash 4)

Contudo apesar da soluccedilatildeo quadraacutetica ou paraboacutelica para a equaccedilatildeo estendida de

Linderstroslashm-lang e Groumlnwall expressa na equaccedilatildeo (53 ndash 3) natildeo requerer os dados

das constantes de ionizaccedilatildeo dos resiacuteduos com grupos ionizaacuteveis ela exige a

definiccedilatildeo do paracircmetro A que fisicamente representa a inclinaccedilatildeo da reta de

aproximaccedilatildeo da curva de carga liacutequida e que pode ser calculado por correlaccedilatildeo a

partir de um conjunto de dados experimentais de solubilidade ou de carga liacutequida

6 Identidade entre o Modelo Proposto e a Equaccedilatildeo

Estendida de Linderstroslashm-Lang e Groumlnwall

A equaccedilatildeo final da modelagem termodinacircmica proposta apresentada na seccedilatildeo 4 eacute a

equaccedilatildeo (42 ndash 8) dada por

푠 (푝퐻)푠 (푝퐼) =

1 + 101 + 10

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 1)

Aplicando-se o logaritmo decimal nos dois termos da equaccedilatildeo (6 ndash 1) tem-se que

log푠 (푝퐻)푠 (푝퐼) = log

1 + 101 + 10

+ log

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 2)

Pelo bem da simplificaccedilatildeo desta deduccedilatildeo adotar-se-atildeo as seguintes funccedilotildees

휂 (푝퐻) = log

(6 ndash 3)

휃 (푝퐻) = log

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 4)

Assim pode-se reescrever a equaccedilatildeo (6 ndash 2) por

29 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐼) = 휂 (푝퐻) + 휃 (푝퐻)

(6 ndash 5)

Observando-se a equaccedilatildeo (6 ndash 5) tem-se que a funccedilatildeo j independe do estado de

ionizaccedilatildeo do resiacuteduo j poreacutem a funccedilatildeo jk depende Por isso deve-se analisar esta

funccedilatildeo para cada estado de ionizaccedilatildeo possiacutevel como mostrado na Tabela 61

Tabela 6 1 ndash Anaacutelise da funccedilatildeo jk para cada estado de ionizaccedilatildeo possiacutevel

j jk jk Quantidade de resiacuteduos neste estado

-1 -1 푝퐼 minus 푝퐻 na

0 0 nb

+1 +1 0 nc

0 푝퐼 minus 푝퐻 nd

Pela anaacutelise da Tabela 61 e considerando uma proteiacutena com n resiacuteduos com

grupos ionizaacuteveis infere-se que a equaccedilatildeo (6 ndash 5) pode ser reescrita como

log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)

(6 ndash 6)

Contudo as equaccedilotildees acima descritas satildeo vaacutelidas apenas para configuraccedilotildees

neutras pois apenas as configuraccedilotildees neutras da fase liacutequida estatildeo em equiliacutebrio

com as moleacuteculas de proteiacutena da fase soacutelida Para que uma configuraccedilatildeo seja

neutra vale a seguinte restriccedilatildeo

휀 = 0 hArr 푛 = 푛

(6 ndash 7)

30 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall

Substituindo a restriccedilatildeo dada pela equaccedilatildeo (6 ndash 7) na equaccedilatildeo (6 ndash 6) tem-se que

log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)

(6 ndash 8)

Ora mas a soma de nc e de nd natildeo resulta em outra coisa senatildeo no nuacutemero de

resiacuteduos com grupos ionizaacuteveis da estrutura proteacuteica cujo j seja +1 Assim

substituindo nc mais nd por n+ e substituindo a equaccedilatildeo (6 ndash 3) na equaccedilatildeo (6 ndash 8)

tem-se que

log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log

1 + 101 + 10

(6 ndash 9)

Ao se analisar a equaccedilatildeo (6 ndash 9) observa-se que ela eacute idecircntica a equaccedilatildeo estendida

de Linderstroslashm-Lang e Groumlnwall apresentada pela equaccedilatildeo (52 ndash 19) Com isso

tem-se que apesar das distintas formulaccedilotildees tanto a modelagem termodinacircmica aqui

proposta quanto a extensatildeo a teoria de Linderstroslashm-Lang e Groumlnwall resultam na

mesma descriccedilatildeo do fenocircmeno Aleacutem disso a equaccedilatildeo final dos modelos eacute

extremamente simples e depende apenas de um ponto de referecircncia e dos dados da

estrutura da moleacutecula de proteiacutena cuja solubilidade se deseja estudar

7 Aplicaccedilatildeo dos Modelos Expostos

Para validar o modelo comparando-o com o caacutelculo feito a partir da teoria de Debye-

Huumlckel o criteacuterio que relaciona os pontos calculados pelo modelo com os pontos

experimentais foi estabelecido a partir da seguinte funccedilatildeo objetivo (FO)

퐹푂 =1푁

푠 minus 푠푠

(7 ndash 1)

Contudo a equaccedilatildeo (7 ndash 1) natildeo eacute a melhor definiccedilatildeo de funccedilatildeo objetivo neste caso

pois a derivada da curva de solubilidade eacute razoavelmente grande nos dois lados do

ponto isoeleacutetrico e isso permite que pequenos desvios na direccedilatildeo horizontal

resultem em um grande aumento no valor da funccedilatildeo objetivo Uma soluccedilatildeo possiacutevel

seria substituir essa funccedilatildeo objetivo por uma funccedilatildeo definida pela soma do quadrado

da distacircncia do ponto experimental agrave curva do modelo principalmente se fosse

necessaacuterio calcular algum paracircmetro do modelo via otimizaccedilatildeo da funccedilatildeo objetivo

estipulada Natildeo sendo este o escopo deste trabalho optou-se pelo uso da FO

definida na equaccedilatildeo (7 ndash 1)

71 Solubilidade da Insulina Suiacutena

As Figuras 711 712 e 713 apresentam os graacuteficos da curva de solubilidade

dada pelos pontos experimentais pelo modelo proposto pela abordagem claacutessica e

tambeacutem a curva obtida pela soluccedilatildeo paraboacutelica da Equaccedilatildeo de Linderstroslashm-Lang e

Groumlnwall em trecircs temperaturas distintas

32 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 711 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 25 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

Figura 712 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 15 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

00

40

80

120

160

200

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

00

50

100

150

200

250

300

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

33 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 713 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 5 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

Os desvios da curva obtida pelo modelo proposto para valores de pH distantes do pI

podem ser explicados por ao menos trecircs importantes motivos dois devidos a

hipoacuteteses do modelo e um devido a fenocircmenos intriacutensecos a proteiacutena Sabendo que

no pI a solubilidade eacute miacutenima para valores de pH distantes do pI pode-se ter

solubilidades suficientemente grandes para que a validade da lei de Henry ndash adotada

na formulaccedilatildeo do modelo - seja questionada pois quanto mais distante do pI maior

a solubilidade e menor a validade da lei de Henry jaacute que haacute um aumento da

concentraccedilatildeo do soluto (proteiacutena) na soluccedilatildeo e tambeacutem ao fato do modelo prever

solubilidade infinita quando a fraccedilatildeo de moleacuteculas eletricamente neutras tende a

zero

limrarr푠 = lim

rarr

Φ(푝퐼)푠 (푝퐼)Φ(푝퐻) = +infin

(711 ndash 1)

00

50

100

150

200

250

300

350

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

34 7 Aplicaccedilatildeo dos Modelos Expostos

Todavia ainda haacute um fator de ordem natural que justifica o desvio apresentado para

valores de pH distantes do pI o desnovelamento da cadeia proteacuteica Este fenocircmeno

pode ocorrer de maneira a expor grupos hidroacutefobos resiacuteduos antes natildeo expostos

acrescentando relaccedilotildees de equiliacutebrio quiacutemico natildeo existentes na regiatildeo do pI

alterando o equiliacutebrio de fases e portanto alterando o valor da solubilidade

A Tabela 711 apresenta os valores obtidos para a funccedilatildeo objetivo definida em (7 ndash

1) tanto para o modelo proposto quanto para a abordagem claacutessica para trecircs

diferentes temperaturas

Tabela 711 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada

abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para insulina

suiacutena

T ordmC Abordagem FO

25 P 01857 C 02535

15 P 01981 C 05056

5 P 03595 C 03064

Observando-se a Tabela 711 vecirc-se que o modelo apresentou melhores resultados

do que o caacutelculo efetuado atraveacutes da abordagem claacutessica no que tange a

minimizaccedilatildeo da funccedilatildeo objetivo exceto para os dados a 5 ordmC

Tambeacutem eacute possiacutevel observar que a funccedilatildeo objetivo sofreu aumento com a

diminuiccedilatildeo da temperatura Isto ocorreu principalmente devido agrave dificuldade de

obter dados experimentais de solubilidade a temperaturas baixas o que aumenta o

desvio experimental fazendo com que se tenha um aumento do valor da funccedilatildeo

objetivo como a definida em (5 ndash 1) Um efeito secundaacuterio que tambeacutem pressiona a

35 7 Aplicaccedilatildeo dos Modelos Expostos

funccedilatildeo objetivo eacute o fato dos dados de pKA terem sido obtidos a uma temperatura

especiacutefica o que tende a acrescentar erro no caacutelculo de solubilidades a temperaturas

diferentes ainda que o pKA natildeo varie de forma ab-rupta com a temperatura

Outra observaccedilatildeo que deve ser registrada eacute o fato da funccedilatildeo objetivo para a

abordagem claacutessica na temperatura de 15 ordmC divergir a um valor tatildeo elevado em

relaccedilatildeo aos demais Isto se deve a um ponto experimental especiacutefico a um pH de

45 a solubilidade da insulina suiacutena obtida experimentalmente eacute 230 x 10-5 mol kg-1

enquanto a calculada pelo modelo proposto eacute 230 x 10-5 mol kg-1 e a calculada pela

abordagem claacutessica eacute 520 x 10-5 mol kg-1 Por conta do desvio deste ponto a funccedilatildeo

objetivo para a abordagem claacutessica nesta temperatura tem um aumento significativo

A Tabela 712 apresenta os valores do paracircmetro K da soluccedilatildeo paraboacutelica obtidos

neste trabalho para a insulina suiacutena comparados ao encontrado na literatura

Tabela 712 ndash Valores do paracircmetro K da soluccedilatildeo paraboacutelica para a insulina suiacutena

Referecircncias T ordmC K Fredericq e Neurath (1950) - 081 Neste trabalho 25 104 Neste trabalho 15 101 Neste trabalho 5 145

Pela Tabela 712 pode-se observar que haacute uma diferenccedila pequena entre os

valores do paracircmetro K obtidos neste trabalho e por Fredericq e Neurath (1950) Por

isso natildeo se pode afirmar a que se deve esta diferenccedila se eacute devido a diferenccedilas entre

procedimentos experimentais ou se eacute devido agrave diferenccedila de meacutetodo de caacutelculo do

paracircmetro Apesar de no experimento realizado por Fredericq e Neurath (1950)

haver a presenccedila do acircnion tiocianato e este acircnion interagir com grupos ionizaacuteveis

da cadeia proteacuteica como observado pelos autores do trabalho tambeacutem estes

36 7 Aplicaccedilatildeo dos Modelos Expostos

proacuteprios autores afirmam que a presenccedila deste acircnion natildeo altera a forma da curva

que eacute basicamente determinada pelo paracircmetro K De qualquer modo eacute interessante

observar a proximidade dos valores encontrados neste trabalho com o obtido por

Fredericq e Neurath (1950) pelo menos no que diz respeito agrave ordem de grandeza do

paracircmetro em questatildeo

72 Solubilidade da Lisozima de clara de ovo de galinha

Um modelo para ser validado necessita correlacionar dados experimentais de modo

satisfatoacuterio ou seja um modelo deve buscar fidelidade ao fenocircmeno fiacutesico

observado Assim na procura de dados de solubilidade de proteiacutenas poucos dados

na regiatildeo do pI foram encontrados Este eacute o caso da lisozima de clara de ovo de

galinha que apesar de ter muitos estudos de solubilidade nenhum deles se

encontra na regiatildeo do pI Surgiu assim a necessidade de se obter estes dados

experimentais para poder validar o modelo proposto A escolha da lisozima de clara

de ovo de galinha se deu em parte pela sua importacircncia mas tambeacutem em parte por

ter os valores de pKA conhecidos

A curva de solubilidade da lisozima de clara de ovo de galinha levantada neste

trabalho estaacute apresentada na Figura 721

37 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em

soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e

dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()

Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento

esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH

isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de

soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se

comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto

isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da

soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos

ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente

neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a

solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e

00

10

20

30

40

50

60

70

80

90

100

95 100 105 110 115 120

Solu

bilid

ade

(mg

mL)

pH

38 7 Aplicaccedilatildeo dos Modelos Expostos

alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado

em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo

Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo

a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo

Por conta de falta de dados a este respeito modelou-se apenas a curva de

solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura

722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de

galinha em funccedilatildeo do pH da soluccedilatildeo

Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)

00

10

20

30

40

50

60

70

80

90

96 99 102 105 108 111 114 117 120

Solu

bilid

ade

(mg

mL)

pH

39 7 Aplicaccedilatildeo dos Modelos Expostos

O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721

Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada

abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima

de clara de ovo de galinha

T ordmC Abordagem FO

25 P 4650 C gt7919a

a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado

Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta

aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a

abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca

de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos

anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao

efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de

clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a

variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A

proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de

cargas pontuais de Debye-Huumlckel

8 Conclusotildees

A modelagem termodinacircmica proposta neste trabalho apresentou expressivos

resultados quando comparada a abordagem claacutessica de Debye-Huumlckel

Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o

modelo aproximou melhor os pontos experimentais do que a referida abordagem

comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima

ao ponto isoeleacutetrico

Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica

para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua

construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo

lugar por sua aplicabilidade

Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis

da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva

em regiotildees distantes do ponto isoeleacutetrico

9 Referecircncias Bibliograacuteficas

BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene

Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects

Biophys J 95 1285-1294 2008

FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and

other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72

2684 - 26911950

GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v

93 p 517-542 1931

GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab

Carlsberg v 24 p 185-200 1941

KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native

and mutant insulins pK perturbation of B13-Glu in aggregated species Arch

Biochem Biophys v 283 p 496-502 1990

KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for

the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng

Chem Res v 35 p 4319-4327 1996

42 9 Referecircncias Bibliograacuteficas

KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen

lysozyme J Biochem v 87 p 1215-1219 1980

LADISCH M R Bioseparations Engineering principles practice and

economics John Wiley amp Sons 2001 pp1 116 ndash 117 133

LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab

Carlsberg v 15 p 1-29 1924

PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da

particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas

2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP

PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the

excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte

solutions Fluid Phase Equilib v 269 p 25ndash35 2008

PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-

contribution model involving phase and chemical equilibrium Ind Eng Chem Res

v 33 p 1341-1347 1994

PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277

1973

PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino

acids Fluid Phase Equilib v 152 p 121-132 1998

43 9 Referecircncias Bibliograacuteficas

PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular

Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999

SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of

equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte

solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009

TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J

R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with

carbon dioxide Biotech Bioeng v103 p 909-919 2009

TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer

free energy Biophys J v 95 p 2601-2609 2008

TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in

water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95

2009

Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na

cadeia proteacuteica

Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo

de ionizaccedilatildeo

퐻퐴 퐴 + 퐻

(A ndash 1)

Assim considerando que a constante de equiliacutebrio

퐾 = 푎

(A ndash 2)

Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que

퐾 =[퐴 ][퐻 ]

[퐻퐴]

(A ndash 3)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que

log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]

(A ndash 4)

Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado

por

minus log[휑] = 푝휑

(A ndash 5)

Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que

45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

푝퐾 = log[퐻퐴][퐴 ] + 푝퐻

(A ndash 6)

Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por

훼 =[퐴 ]

[퐻퐴] + [퐴 ]

(A ndash 7)

Reescrevendo (A ndash 7) tem-se que

훼 =[퐴 ] [퐻퐴frasl ]

1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =

훼1 minus 훼

(A ndash 8)

Substituindo (A ndash 8) em (A ndash 6) tem-se que

푝퐾 = log훼

1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10

(A ndash 9)

Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos

훼 =1

1 + 10

(A ndash 10)

Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio

퐴 + 퐻 퐻퐴

(A ndash 11)

Pode se escrever a constante de equiliacutebrio como

퐾 =[퐻퐴 ]

[퐴][퐻 ]

(A ndash 12)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que

46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

log퐾 = minus log[퐴]

[퐻퐴 ] minus log[퐻 ]

(A -13)

Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por

훼 =[퐻퐴 ]

[퐴] + [퐻퐴 ]

(A ndash 14)

Assim a equaccedilatildeo (A ndash 13) fica

훼1 minus 훼 = 10

(A ndash 15)

Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo

훼 =10

1 + 10

(A ndash 16)

Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos

modelos expostos

Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]

48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]

49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)

50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])

51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]

52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])

53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)

54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2

55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO

1 Introduccedilatildeo

Dentre as etapas de um processo biotecnoloacutegico aquela dedicada a purificaccedilatildeo de

bioprodutos tende a ser determinante em geral para o custo do processo seguindo

a tendecircncia dos processos de separaccedilatildeo da induacutestria quiacutemica tradicional A

produccedilatildeo de proteiacutenas tem lugar de destaque no rol de bioprodutos de interesse

pois muitos antibioacuteticos hormocircnios e enzimas pertencem a esta classe de

biomoleacuteculas e possuem notoacuterio interesse industrial por suas propriedades

terapecircuticas e aplicaccedilotildees na induacutestria alimentiacutecia No entanto proteiacutenas a serem

comercializadas para estes fins exigem altos graus de pureza que somente satildeo

obtidos pelas etapas de purificaccedilatildeo Como afirmado por Bončina et al (2008)

estudos de separaccedilatildeo de proteiacutenas especificamente tecircm sido motivados por um

aumento da demanda por proteiacutenas puras nas induacutestrias farmacecircutica e correlatas

Muitas moleacuteculas bioloacutegicas ndash ou comumente chamadas biomoleacuteculas - e

particularmente proteiacutenas satildeo destruiacutedas pelo calor natildeo podem ser destiladas satildeo

geradas a baixas concentraccedilotildees e tecircm uma estrutura tridimensional que pode ser

alterada durante a purificaccedilatildeo resultando na perda da atividade bioloacutegica Por isso

bioprodutos tais como proteiacutenas devem ser recuperados purificados e

concentrados em operaccedilotildees com membranas etapas de adsorccedilatildeo cromatografia

cristalizaccedilatildeo e outras teacutecnicas que natildeo requerem calor ou pH extremo para alcanccedilar

o fracionamento (Ladisch 2001)

Em geral nos processos biotecnoloacutegicos as correntes de saiacuteda dos biorreatores

seguem para as operaccedilotildees de downstream (etapas de separaccedilatildeo que visam

concentrar e dispor o produto final) As primeiras operaccedilotildees de downstream por

exemplo a clarificaccedilatildeo e a centrifugaccedilatildeo tecircm por objetivo isolar a proteiacutena de

2 1 Introduccedilatildeo

interesse das ceacutelulas que a produziram Apoacutes estas primeiras etapas de purificaccedilatildeo

seguem-se as operaccedilotildees de baixa resoluccedilatildeo A precipitaccedilatildeo e a extraccedilatildeo em

sistemas de duas fases aquosas satildeo exemplos destas operaccedilotildees que tendem a

concentrar a proteiacutena-alvo preparando-a para os proacuteximos estaacutegios de separaccedilatildeo

Por fim a proteiacutena ora na concentraccedilatildeo obtida pelas operaccedilotildees anteriores eacute tratada

por operaccedilotildees de alta resoluccedilatildeo caracterizadas principalmente pela teacutecnica de

cromatografia a fim de concentrar a proteiacutena agrave pureza especificada para seu uso

Vale ressaltar que esta uacuteltima etapa eacute extremamente dispendiosa e quanto mais

eficientes forem as etapas precedentes no que tange a pureza da proteiacutena-alvo

menos custosa seraacute a etapa posterior

O escopo deste trabalho estaacute centrado na operaccedilatildeo de precipitaccedilatildeo de proteiacutenas

cujos fundamentos satildeo as relaccedilotildees do equiliacutebrio soacutelido-liacutequido (ESL) destes

sistemas A solubilidade de uma proteiacutena em soluccedilatildeo eacute governada pelos mesmos

princiacutepios fundamentais ou seja condiccedilotildees de equiliacutebrio termodinacircmico que regem

o comportamento de qualquer substacircncia no ESL Contudo algumas diferenccedilas

devem ser levadas em conta na descriccedilatildeo deste fenocircmeno e no projeto destas

operaccedilotildees

Proteiacutenas satildeo formadas por cadeias de aminoaacutecidos atraveacutes de ligaccedilotildees peptiacutedicas

cada aminoaacutecido pode ser considerado um monocircmero que ao possuir um grupo

ionizaacutevel natildeo ligado tal como ocorre em alguns aminoaacutecidos naturais tirosina (Tyr)

lisina (Lys) cisteiacutena (Cys) histidina (His) arginina (Arg) aacutecido aspaacutertico (Asp) e

aacutecido glutacircmico (Glu) e tambeacutem em resiacuteduos terminais confere a proteiacutena uma

caracteriacutestica de polieletroacutelito Eacute importante entatildeo considerar a definiccedilatildeo de

polieletroacutelitos tal qual definida por Pessocirca Filho e Maurer (2008) polieletroacutelitos satildeo

3 1 Introduccedilatildeo

poliacutemeros com muitas unidades monomeacutericas eletroliacuteticas ndash neste caso

aminoaacutecidos que possuem grupos ionizaacuteveis natildeo ligados

Para muitos processos industriais e mesmo naturais informaccedilotildees a respeito de

equiliacutebrios de fases de soluccedilotildees eletroliacuteticas satildeo necessaacuterias e necessaacuterias tambeacutem

satildeo modificaccedilotildees nos modelos tradicionais de coeficiente de atividade quando se

trata de descrever equiliacutebrios de fases em sistemas que conteacutem eletroacutelitos (Prausnitz

et al 1999)

Sendo assim tendo que a pressatildeo do sistema natildeo influencia de modo significativo o

ESL tem-se que trecircs variaacuteveis o influenciam diretamente a temperatura o pH e a

forccedila iocircnica estas duas uacuteltimas tornam-se importantes devido agrave caracteriacutestica

eletroliacutetica das proteiacutenas

Na verdade a forccedila iocircnica natildeo eacute uma variaacutevel que represente de modo abrangente

os possiacuteveis efeitos de iacuteons em soluccedilotildees proteacuteicas Isto se deve ao fato de que a

forccedila iocircnica do modo como eacute definida natildeo contempla uma diferenciaccedilatildeo entre os

equiliacutebrios que se estabelecem entre os iacuteons e alguns resiacuteduos ionizaacuteveis da cadeia

proteacuteica De fato a variaccedilatildeo da forccedila iocircnica de uma soluccedilatildeo proteacuteica altera o valor

da solubilidade da proteiacutena em soluccedilatildeo mas natildeo da mesma forma para qualquer

espeacutecie de iacuteon Portanto seria mais prudente acrescer ao conjunto de variaacuteveis que

influenciam o ESL a espeacutecie quiacutemica dos iacuteons presentes em soluccedilatildeo

O objetivo deste trabalho eacute estabelecer um modelo capaz de prever a influecircncia do

pH no ESL de proteiacutenas mantendo-se temperatura e forccedila iocircnica constantes

Sabe-se por observaccedilotildees experimentais que a variaccedilatildeo do pH de um sistema altera

o valor da solubilidade de proteiacutenas em soluccedilatildeo e a solubilidade de proteiacutenas por

sua vez atinge seu valor miacutenimo em um pH denominado ponto isoeleacutetrico (pI) no

qual a carga liacutequida da proteiacutena eacute nula

4 1 Introduccedilatildeo

Os primeiros trabalhos relacionados agrave modelagem da curva de solubilidade de

proteiacutenas em funccedilatildeo do pH datam do iniacutecio do seacuteculo XX Green (1931) propocircs um

modelo para a curva de solubilidade da carboxihemoglobina equumlina considerando

que esta proteiacutena se comportaria tanto como um aacutecido bivalente quanto uma base

bivalente Jaacute Groumlnwall (1941) atribuiu a Linderstroslashm-Lang o desenvolvimento de um

modelo capaz de predizer a curva de solubilidade a partir da integraccedilatildeo do perfil de

carga da proteiacutena Este trabalho de Groumlnwall apesar de esquecido pelo tempo eacute de

extrema importacircncia e relevacircncia tanto para o trabalho aqui apresentado quanto e

aqui um motivo muito mais nobre para o desenvolvimento de modelos a partir das

ferramentas da termodinacircmica claacutessica Quando da exposiccedilatildeo da modelagem aqui

tratada retornar-se-aacute a este trabalho que muito contribuiu ao entendimento do

fenocircmeno estudado

Eacute digno de nota o trabalho de Fredericq e Neurath (1950) no qual uma proposta de

equacionamento para uma correlaccedilatildeo semi-empiacuterica da curva de solubilidade de

insulina eacute apresentada Natildeo haacute de fato algo novo em relaccedilatildeo agrave modelagem do

efeito do pH na curva de solubilidade neste trabalho no entanto apesar de natildeo

haver qualquer menccedilatildeo ou referecircncia quanto agrave origem da equaccedilatildeo proposta nota-se

que eacute uma aplicaccedilatildeo direta da equaccedilatildeo descrita por Groumlnwall (1941) Haacute uma

hipoacutetese impliacutecita no trabalho de que o perfil de carga liacutequida da insulina seja linear

na regiatildeo do ponto isoeleacutetrico o que eacute bastante plausiacutevel para muitas proteiacutenas

Assim pela integraccedilatildeo da equaccedilatildeo diferencial proposta por Groumlwall (1941) uma

correlaccedilatildeo semi-empiacuterica quadraacutetica eacute obtida Reforccedila-se o uso da expressatildeo semi-

empiacuterica devido agrave natureza dual da equaccedilatildeo em parte advinda de um

desenvolvimento teoacuterico descrito por Groumlnwall (1941) e atribuiacutedo a Linderstroslashm-

Lang e em parte pela necessidade de se obter paracircmetros a partir de um ajuste de

5 1 Introduccedilatildeo

um conjunto de dados experimentais Vale observar que resultados expressivos

foram alcanccedilados neste trabalho de modo particular o fato de que a presenccedila do

acircnion tiocianato natildeo altera a forma da curva de solubilidade da insulina mas a

desloca em direccedilatildeo a menores valores de pH e de solubilidade

Contudo os trabalhos mais recentes se concentraram na modelagem da curva de

solubilidade de aminoaacutecidos em funccedilatildeo do pH dando maior enfoque aos modelos

termodinacircmicos para soluccedilotildees natildeo-ideais tanto atraveacutes de equaccedilotildees de estado

como de modelos de energia livre de Gibbs excedente

Destaca-se neste grupo o trabalho de Pinho et al (1994) que aplicaram o modelo

UNIFAC associado ao termo de Debye-Huumlckel para aminoaacutecidos como glicina D-

alanina L-serina e DL-valina Tambeacutem o trabalho de Khoshkbarchi e Vera (1996)

no qual foi desenvolvido um modelo simplificado de esfera riacutegida perturbada para

calcular o coeficiente de atividade de aminoaacutecidos e de peptiacutedeos permite prever a

curva de solubilidade destes em funccedilatildeo do pH Jaacute o modelo NRTL foi aplicado tanto

por Pradhan e Vera (1998) quanto Tseng et al (2009) para aminoaacutecidos Jaacute Seyfi et

al (2009) aplicaram a equaccedilatildeo de estado SAFT para a prediccedilatildeo da curva de

solubilidade da DL-metionina

Entretanto o primeiro trabalho dedicado exclusivamente agrave modelagem e prediccedilatildeo da

curva de solubilidade de proteiacutena propriamente dita em funccedilatildeo do pH foi publicado

por Tjong e Zhou (2008) Neste trabalho a solubilidade foi calculada a partir da

energia livre de transferecircncia da fase soacutelida para a fase liacutequida Para a execuccedilatildeo

deste caacutelculo a energia livre de transferecircncia foi dividida em duas contribuiccedilotildees

uma de natureza eletrostaacutetica calculada pela meacutedia de 100 conformaccedilotildees proteacuteicas

advindas da aplicaccedilatildeo de dinacircmica molecular a pH constante e outra de natureza

natildeo-eletrostaacutetica baseada na aacuterea superficial acessiacutevel ao solvente Poreacutem o

6 1 Introduccedilatildeo

esforccedilo computacional requerido pelo modelo por eles proposto para calcular

apenas alguns pontos da curva natildeo apresenta uma aplicabilidade razoaacutevel Aleacutem

deste trabalho Tashima et al (2009) propuseram uma modelagem termodinacircmica

para prever a curva de solubilidade especificamente da insulina suiacutena aplicando o

modelo de Pitzer truncado apoacutes o segundo coeficiente do virial

No presente trabalho propomos um novo modelo baseado no caacutelculo de estados de

ionizaccedilatildeo e em ferramentas de termodinacircmica claacutessica bem como uma extensatildeo agrave

teoria de Linderstroslashm-Lang e Groumlnwall Vale ressaltar de antematildeo que tanto este

novo modelo proposto quanto a extensatildeo desenvolvida resultam na mesma equaccedilatildeo

para o fenocircmeno apesar das distintas abordagens

2 Materiais e Meacutetodos

21 Meacutetodos computacionais

O coacutedigo-fonte do programa em linguagem C estaacute apresentado no Apecircndice B Os

meacutetodos numeacutericos utilizados se resumem a interpolaccedilatildeo linear o meacutetodo de

Newton-Raphson cujo uso seraacute apresentado na proacutexima seccedilatildeo quando se deduziraacute

o algoritmo do modelo de Debye-Huumlckel e o meacutetodo de busca unidirecional de

miacutenimos de funccedilatildeo pela Seccedilatildeo Aacuteurea

As Tabelas 211 e 212 apresentam os resiacuteduos considerados para cada proteiacutena

considerada bem como os seus valores de pKA que foram obtidos a partir da

literatura e satildeo indispensaacuteveis para execuccedilatildeo dos caacutelculos mais rigorosos

Tabela 211 ndash Resiacuteduos ionizaacuteveis considerados e valores de pKA da insulina suiacutena

Valores extraiacutedos de Kaarsholm et al (1990)

Aminoaacutecido Grupo Ionizaacutevel pKA

A1 ndash Gly -NH2 738 A4 ndash Glu -COOH 437 A14 ndash Tyr Fenol-OH 1020 A17 ndash Glu -COOH 437 A19 ndash Tyr Fenol-OH 1020 A21 ndash Asn -COOH 345

B1 ndash Phe -NH2 738 B5 ndash His Imidazol-NH 598 B10 ndash His Imidazol-NH 598 B 13 ndash Glu -COOH 437 B16 ndash Tyr Fenol-OH 1020 B21 ndash Glu -COOH 437

B22 ndash Arg Guaniacutedio-NH2 1110 B26 ndash Tyr Fenol-OH 1020

B29 ndash Lys -NH2 852 B30 ndashAla -COOH 345

8 2 Materiais e Meacutetodos

Tabela 212 ndash Resiacuteduos ionizaacuteveis considerados e valores de pKA a 25 ordmC da lisozima

de clara de ovo de galinha Valores extraiacutedos de Kuramitsu e Hamaguchi (1980)

Aminoaacutecido Grupo Ionizaacutevel pKA α-NH2 α-NH2 79

Lys1 ε-NH2 108

Arg5 Guaniacutedio-NH2 120 Glu7 -COOH 26

Lys13 ε-NH2 105

Arg14 Guaniacutedio-NH2 120 His15 Imidazol-NH 58 Asp18 -COOH 20 Tyr20 Fenol-OH 103

Arg21 Guaniacutedio-NH2 120 Tyr23 Fenol-OH 98

Lys33 ε-NH2 106 Glu35 -COOH 61

Arg45 Guaniacutedio-NH2 120 Asp48 -COOH 43 Asp52 -COOH 34 Tyr53 Fenol-OH 121

Arg61 Guaniacutedio-NH2 120 Asp66 -COOH 16

Arg68 Guaniacutedio-NH2 120

Arg73 Guaniacutedio-NH2 120 Asp87 -COOH 21

Lys96 ε-NH2 108

Lys97 ε-NH2 103 Asp101 -COOH 45

Arg112 Guaniacutedio-NH2 120

Arg114 Guaniacutedio-NH2 120

Lys116 ε-NH2 104 Asp119 -COOH 25

Arg125 Guaniacutedio-NH2 120

Arg128 Guaniacutedio-NH2 120 α-COOH α-COOH 31

9 2 Materiais e Meacutetodos

22 Curva de solubilidade da lisozima da clara de ovo de galinha

221 Reagentes

Neste experimento de determinaccedilatildeo da curva de solubilidade da lisozima da clara de

ovo de galinha os reagentes utilizados foram cloreto de soacutedio (Reatec P A)

bicarbonato de soacutedio (Research Becto Chemical P A) Na2HPO4 7H2O (Reagen

P A) aacutegua destilada deionizada Milli-Q (Millipore) e lisozima de clara de ovo de

galinha (Sigma min 99)

222 Equipamentos

Neste experimento os equipamentos utilizados foram espectrofotocircmetro UV-Visiacutevel

(Beckman DU-530) centriacutefuga (Eppendorf) banho-teacutermico (Laacutectea) com controlador

de temperatura (Julabo) pHmetro (Micronal) e balanccedila (Mettler Toledo AB204S)

223 Preparaccedilatildeo das soluccedilotildees-tampatildeo

Foram preparadas soluccedilotildees-tampatildeo com valores de pH=96 pH = 98 pH = 100

pH = 102 pH = 104 pH = 106 pH = 108 pH = 110 pH = 112 pH = 114 pH =

116 e pH = 118 a partir de quatro soluccedilotildees uma de hidroacutexido de soacutedio 01 M uma

de cloreto de soacutedio 1 M (para equalizar a forccedila iocircnica) uma de bicarbonato de soacutedio

005 M e outra de Na2HPO4 005 M

A Tabela 2231 apresenta os valores de volume usados no preparo de cada uma

das soluccedilotildees-tampatildeo

10 2 Materiais e Meacutetodos

Tabela 2231 ndash Volumes de hidroacutexido de soacutedio a 01 M adicionados no preparo das

soluccedilotildees-tampatildeo

Tampatildeo pH V NaOH mL

NaHCO3 96 100 005 M 98 152

(para cada soluccedilatildeo-tampatildeo 100 mL 100 214

desta soluccedilatildeo foram adicionados) 102 276

104 330 106 382

108 424

110 454

112 530 114 583

Na2HPO4 110 82

005 M 112 126

(para cada soluccedilatildeo-tampatildeo 100 mL 114 182 desta soluccedilatildeo foram adicionados) 116 270

118 388

224 Procedimento experimental

Foram adicionadas quantidades natildeo definidas de lisozima de clara de ovo de galinha

a 13 mL de cada soluccedilatildeo-tampatildeo em tubos Eppendorf de 2 mL Colocaram-se

entatildeo as amostras apoacutes agitaccedilatildeo vigorosa em banho teacutermico a 250 plusmn 01 ordmC por 24

horas para que os sistemas atingissem o equiliacutebrio termodinacircmico Caso natildeo

houvesse a formaccedilatildeo de precipitado lisozima era adicionada e o procedimento

repetido Ao se observar a formaccedilatildeo de precipitado o sistema era centrifugado a

13000 rpm por 15 minutos Uma aliacutequota do sobrenadante era retirada e sua

concentraccedilatildeo proteacuteica determinada por medida de absorbacircncia a 280 nm Cada

sistema foi feito ao menos em duplicata

3 Modelo Estendido de Debye-Huumlckel

31 Introduccedilatildeo

De fato como descrito por Pessocirca Filho (2002) a equaccedilatildeo de Debye-Huumlckel natildeo

deve ser aplicada agrave modelagem de polieletroacutelitos tais como proteiacutenas porque nestas

moleacuteculas as cargas satildeo distribuiacutedas ao longo da cadeia e portanto natildeo satildeo cargas

pontuais como suposto por Debye-Huumlckel

Contudo nesta modelagem considera-se uma regiatildeo de pH em torno do ponto

isoeleacutetrico (pI) na qual satildeo inerentes duas condiccedilotildees favoraacuteveis a aplicaccedilatildeo da

equaccedilatildeo de Debye-Huumlckel carga liacutequida proacutexima a zero pois Z(pI) = 0 e regiatildeo de

miacutenima solubilidade que significa baixas concentraccedilotildees de proteiacutenas em soluccedilatildeo

Isto significa em primeiro lugar que os efeitos da carga tais como ldquodesnovelamentordquo

da cadeia proteacuteica com exposiccedilatildeo de resiacuteduos outrora blindados podem ser

desprezados em uma regiatildeo proacutexima ao ponto isoeleacutetrico e em segundo lugar

baixas concentraccedilotildees de proteiacutena em soluccedilatildeo significam que os termos de curto

alcance podem ser desprezados e portanto haacute prevalecircncia do termo de longo

alcance que no caso de soluccedilotildees eletroliacuteticas pode ser descrito por uma equaccedilatildeo

estendida de Debye-Huumlckel

Assim o modelo de Debye-Huumlckel foi utilizado natildeo para verificar sua aplicabilidade agrave

modelagem de soluccedilotildees proteacuteicas mas sim para confrontar o modelo proposto com

um modelo usual em modelagem de soluccedilotildees eletroliacuteticas e seraacute referido no texto

sempre como abordagem claacutessica

12 3 Modelo Estendido de Debye-Huumlckel

32 Desenvolvimento teoacuterico

Pode-se escrever a atividade da proteiacutena como o produto entre a solubilidade e o

coeficiente de atividade da mesma como mostrado na equaccedilatildeo (32 - 1)

푎 = 훾푠

(32 - 1)

Na qual pode-se calcular o coeficiente de atividade atraveacutes da equaccedilatildeo estendida

de Debye-Huumlckel (Pitzer 1973)

ln 훾 = minus퐴 푍radic퐼

1 + 푏radic퐼+

2푏

ln 1 + 푏radic퐼

(32 - 2)

Sendo que a constante universal empiacuterica b = 12 kg12 mol-12 eacute usada para todos os

eletroacutelitos Jaacute AΦ eacute o paracircmetro de Debye-Huumlckel para o coeficiente osmoacutetico e eacute

dado por

퐴 =13

(2휋푁 휌 ) frasl 푒4휋휀 휀 푘푇

frasl

(32 - 3)

Em que NA eacute a constante de Avogadro ρs eacute a densidade do solvente em g cm-3 e eacute

a carga eletrocircnica (e = 160218 x 10-19 C) ε0 eacute a permissividade do espaccedilo livre (ε0 =

885419 x 10-12 C2 N-1 m-2) εr eacute a constante dieleacutetrica do solvente k aacute constante de

Boltzmann e T eacute a temperatura absoluta Jaacute a carga liacutequida em funccedilatildeo do pH pode

ser calculada como

푍 = 훼 minus 훼

(32 - 4)

Sendo que α+ e α- satildeo dados pelas equaccedilotildees (A - 10) e (A - 16) do Apecircndice A

13 3 Modelo Estendido de Debye-Huumlckel

E a forccedila iocircnica eacute dada pela equaccedilatildeo (32 - 5) descrita abaixo

퐼 = 12

푚 푍

(32 - 5)

Contudo no ponto isoeleacutetrico a carga meacutedia da proteiacutena eacute nula portanto o termo de

Debye-Huumlckel se anula e o coeficiente de atividade se torna unitaacuterio

ln푎 (푝퐼) = ln 푠 (푝퐼)

(32 - 6)

Considerando que a atividade da proteiacutena seja constante com a variaccedilatildeo de pH isto

implica que esta eacute sempre igual agrave solubilidade da proteiacutena no ponto isoeleacutetrico e

portanto vale que

ln푎 (푝퐻) = ln 푠 (푝퐻) + ln 훾(푝퐻) = ln 푠 (푝퐼)

(32 - 7)

Assim

ln 푠 (푝퐻) = ln 푠 (푝퐼) + 퐴휙푍푝퐻2 radic퐼1 + 푏radic퐼

+2푏

ln 1 + 푏radic퐼

(32 - 8)

Esta equaccedilatildeo prevecirc a curva de solubilidade em funccedilatildeo do pH atraveacutes do caacutelculo da

atividade da proteiacutena na fase liacutequida pela equaccedilatildeo estendida de Debye-Huumlckel Para

resolvecirc-la eacute necessaacuterio se utilizar de um meacutetodo numeacuterico pois a forccedila iocircnica

depende da solubilidade naquele pH Optou-se neste trabalho pelo Meacutetodo de

Newton-Raphson para executar o meacutetodo iterativo que eacute exigido pela equaccedilatildeo (32

ndash 8) Para aplicar este meacutetodo arbitrou-se uma funccedilatildeo f(sp) definida aqui como

푓 푠 = minus ln 푠 (푝퐻) + ln 푠 (푝퐼) + 퐴휙푍푝퐻2 radic퐼

1 + 푏radic퐼+

2푏

ln 1 + 푏radic퐼

(32 - 9)

14 3 Modelo Estendido de Debye-Huumlckel

Assim ao calcular o sp que zera esta funccedilatildeo f(sp) saber-se-aacute que eacute a proacutepria

solubilidade que se deseja calcular Para aplicar o Meacutetodo de Newton-Raphson

basta derivar a funccedilatildeo f(sp) e aplicar o seguinte algoritmo de resoluccedilatildeo

푠 = 푠 minus푓(푠 )푓 (푠 )

(32 - 10)

Para calcular frsquo(s) deve-se considerar que a forccedila iocircnica depende da solubilidade

Para isto observando a equaccedilatildeo (32 - 5) vecirc-se que a forccedila iocircnica eacute dada pelo

somatoacuterio das contribuiccedilotildees de todos os iacuteons presentes na soluccedilatildeo por isso aqui

cabe um artifiacutecio de dividir estas contribuiccedilotildees em duas macro-contribuiccedilotildees aquela

devida a todos os iacuteons presentes na soluccedilatildeo exclusive os grupos ionizaacuteveis

presentes nas moleacuteculas da proteiacutena em questatildeo (I0) e que se considera constante

com o pH e aquela que engloba apenas os grupos ionizaacuteveis presentes nas

moleacuteculas da proteiacutena (IP)

퐼 = 퐼 + 퐼 = 퐼 +12푍 푠

(32 - 11)

Considerando a funccedilatildeo w tal que

푤 = radic퐼 = 퐼 +12푍 푠

(32 - 12)

Sendo

푤 =14푍 퐼

(32 - 13)

Entatildeo aplicando-se as devidas regras de derivaccedilatildeo tem-se

15 3 Modelo Estendido de Debye-Huumlckel

푓 (푠 ) = minus1푠 + 퐴 푍

3푤 + 2푤 푏푤(1 + 푏푤)

(32 - 14)

Substituindo as equaccedilotildees (32 - 12) e (32 - 13) na equaccedilatildeo (32 - 14) tem-se que

푓 (푠 ) = minus1푠 + 퐴 푍

15 + 푏radic퐼2radic퐼(1 + 푏radic퐼)

(32 - 15)

Entatildeo o algoritmo deve ser

푠 = 푠 minus

⎜⎛ln 푠 (푝퐼)

푠 + 퐴휙푍푝퐻2 radic퐼

1 + 푏radic퐼+ 2푏 ln 1 + 푏radic퐼

minus 1푠 + 퐴휙푍

15 + 푏radic퐼2radic퐼(1 + 푏radic퐼) ⎠

⎟⎞

(32 - 16)

4 Modelagem Termodinacircmica Proposta

41 Introduccedilatildeo

A condiccedilatildeo de equiliacutebrio entre duas fases (α e β) com m componentes eacute dada por

(Prausnitz et al 1999)

푝 = 푝

(41 ndash 1)

푇 = 푇

(41 ndash 2)

휇 = 휇⋮

휇 = 휇

(41 ndash 3)

Considerando o equiliacutebrio soacutelido-liacutequido (ESL) de sistemas contendo proteiacutenas

sendo que os efeitos da pressatildeo podem ser desprezados que as temperaturas nas

duas fases satildeo iguais e que na fase soacutelida soacute haacute proteiacutena tem-se que para a

proteiacutena a relaccedilatildeo de equiliacutebrio pode ser descrita por

휇 (푇푥) = 휇 (푇)

(41 ndash 4)

Contudo adotando-se a lei de Henry que eacute vaacutelida para baixas concentraccedilotildees de

soluto hipoacutetese que natildeo eacute distante dos valores observados da solubilidade de

proteiacutenas pode se escrever o potencial quiacutemico na fase liacutequida por

휇 (푇푥) = 휇 (푇 푥 ) + 푅푇푙푛푥

(41 ndash 5)

17 4 Modelagem Termodinacircmica Proposta

Entretanto variaccedilotildees de pH natildeo alteram o potencial quiacutemico da fase soacutelida o que

resulta pela relaccedilatildeo (41 ndash 4) que o mesmo natildeo altera tambeacutem o potencial quiacutemico

da fase liacutequida Com isso pela relaccedilatildeo (41 ndash 5) sendo o potencial quiacutemico de

referecircncia constante com o pH uma contradiccedilatildeo emerge a variaccedilatildeo do pH natildeo

poderia alterar o valor da solubilidade poreacutem a observaccedilatildeo experimental mostra o

contraacuterio Assim deve-se lembrar que pelo princiacutepio da eletroneutralidade a fase

soacutelida soacute possui moleacuteculas proteacuteicas eletricamente neutras e portanto o equiliacutebrio

de fases deve se estabelecer apenas entre as moleacuteculas presentes na fase soacutelida e

as moleacuteculas eletricamente neutras em soluccedilatildeo Ou seja como soacute moleacuteculas

eletricamente neutras podem estar na fase soacutelida o equiliacutebrio de fases depende

exclusivamente da fraccedilatildeo de moleacuteculas eletricamente neutras em soluccedilatildeo pois soacute

estas podem precipitar Assim tanto a equaccedilatildeo (41 ndash 4) quanto a equaccedilatildeo (41 ndash

5) devem ser aplicadas natildeo ao conjunto de todas as moleacuteculas de proteiacutena em

soluccedilatildeo mas somente as moleacuteculas proteacuteicas eletricamente neutras Portanto a

concentraccedilatildeo das moleacuteculas de proteiacutena eletricamente neutras em soluccedilatildeo eacute

constante com o pH e pode ser interpretada como a multiplicaccedilatildeo da fraccedilatildeo de

moleacuteculas eletricamente neutras pela concentraccedilatildeo total de proteiacutenas que eacute a

proacutepria solubilidade Assim uma relaccedilatildeo de inversa proporcionalidade eacute definida

quanto maior a fraccedilatildeo de moleacuteculas neutras menor seraacute a solubilidade de uma

proteiacutena em soluccedilatildeo Portanto no ponto isoeleacutetrico no qual haacute o miacutenimo de

solubilidade tem-se o ponto maacuteximo de fraccedilatildeo de moleacuteculas eletricamente neutras

A partir disto eacute possiacutevel escrever a equaccedilatildeo que rege o comportamento da

solubilidade de uma proteiacutena em funccedilatildeo do pH da soluccedilatildeo

휙(푝퐻)푆 (푝퐻) = 휆 = 푐표푛푠푡푎푛푡푒

(41 ndash 6)

18 4 Modelagem Termodinacircmica Proposta

Na equaccedilatildeo (41 ndash 6) o paracircmetro λ pode ser um paracircmetro de ajuste do modelo a

um conjunto de valores experimentais tendo se estabelecido uma funccedilatildeo objetivo ou

ainda dado pelo produto entre a solubilidade no ponto isoeleacutetrico e a fraccedilatildeo de

moleacuteculas eletricamente neutras em soluccedilatildeo tambeacutem no pI neste caso vale a

seguinte equaccedilatildeo

푠 (푝퐻) =휙(푝퐼)푠 (푝퐼)휙(푝퐻)

(41 ndash 7)

Sendo a equaccedilatildeo do modelo ndash equaccedilatildeo (41 ndash 7) ndash extremamente simples a uacutenica

dificuldade reside no caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras

(휙(푝퐻))

42 Caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras

Dentre os aminoaacutecidos que formam atraveacutes de ligaccedilotildees peptiacutedicas as proteiacutenas haacute

aqueles que possuem resiacuteduos com grupos ionizaacuteveis aleacutem dos grupos amina e

aacutecido carboxiacutelico terminais na cadeia Todos estes participam de equiliacutebrios

quiacutemicos com iacuteons H+ presentes na soluccedilatildeo entatildeo ao se alterar o pH da soluccedilatildeo

estes equiliacutebrios satildeo alterados

Assim haacute vaacuterias possibilidades de combinaccedilotildees de estados ionizados destes grupos

ionizaacuteveis que resultam em uma moleacutecula de proteiacutena eletricamente neutra Eacute

importante notar que dada a fraccedilatildeo de uma configuraccedilatildeo de uma moleacutecula neutra

todas as outras fraccedilotildees de configuraccedilotildees possiacuteveis que tambeacutem resultem em

moleacuteculas neutras satildeo proporcionais agrave fraccedilatildeo da configuraccedilatildeo dada pois todas as

configuraccedilotildees participam de equiliacutebrios entre si

19 4 Modelagem Termodinacircmica Proposta

Desta observaccedilatildeo implica-se que basta identificar uma configuraccedilatildeo proteacuteica cuja

soma dos estados ionizados resulte em carga nula para se descrever o equiliacutebrio de

fases em relaccedilatildeo ao pH na regiatildeo do ponto isoeleacutetrico onde esta consideraccedilatildeo eacute

predominante em relaccedilatildeo a outros possiacuteveis fenocircmenos

Contudo eacute necessaacuterio contabilizar a contribuiccedilatildeo de cada grupo ionizaacutevel via

equaccedilatildeo de Henderson-Hasselbach equaccedilatildeo (42 ndash 1)

훼 (푝퐻) =

⎩⎪⎨

⎪⎧ 10

1 + 10 푠푒 휈 = minus1

11 + 10

푠푒 휈 = +1

(42 ndash 1)

Na qual pKAj eacute o co-logaritmo da constante de equiliacutebrio do grupo ionizaacutevel do

resiacuteduo j j eacute estado carregado potencial do resiacuteduo j (-1 para grupos aacutecidos e +1

para grupos baacutesicos) e j eacute a fraccedilatildeo ionizada para o pH dado Para grupos cujo

estado de ionizaccedilatildeo na dada configuraccedilatildeo seja neutro a sua fraccedilatildeo eacute calculada tal

que a soma de sua fraccedilatildeo e da fraccedilatildeo ionizada tenha como resultado o valor

unitaacuterio

Assim a funccedilatildeo Pn pode ser escrita como o produto de cada fraccedilatildeo de cada grupo

ionizaacutevel j naquele estado (-1 0 ou +1) na configuraccedilatildeo neutra k em uma proteiacutena

com n grupos ionizaacuteveis Uma representaccedilatildeo matemaacutetica possiacutevel para esta funccedilatildeo

pode ser escrita como

휙 (푝퐻) = 훼 (푝퐻)

(42 ndash 2)

Na qual a fraccedilatildeo jrsquo(pH) eacute dada por

20 4 Modelagem Termodinacircmica Proposta

훼 (푝퐻) =훼 (푝퐻) 푠푒 휀 = 11 minus 훼 (푝퐻) 푠푒 휀 = 0

(42 ndash 3)

Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (42 ndash 3) e a resultante na equaccedilatildeo

(42 ndash 2) pode-se escrever que

휙 (푝퐻) =1

1 + 10

1 + 휈2 minus 휈 휀 10

minus휈 minus 1

2 minus 휈 휀 푐표푚 휀 = 0

(42 ndash 4)

A equaccedilatildeo (42 ndash 4) junto agrave equaccedilatildeo (41 ndash 7) constituem o modelo termodinacircmico

capaz de predizer a razatildeo entre as fraccedilotildees de moleacuteculas neutras de uma proteiacutena

em funccedilatildeo do pH na regiatildeo do ponto isoeleacutetrico mantendo fixas temperatura e forccedila

iocircnica Substituindo a equaccedilatildeo (42 ndash 4) na equaccedilatildeo (41 ndash 7) obteacutem-se para a

curva de solubilidade

푠 (푝퐻)푠 (푝퐼) =

1 + 101 + 10

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

푐표푚 휀 = 0

(42 ndash 8)

5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

51 Introduccedilatildeo

Segundo Groumlnwall (1941) na fase liacutequida haacute moleacuteculas de proteiacutenas com muitas

configuraccedilotildees k distintas que possuem carga liacutequida i e tambeacutem haacute certas

configuraccedilotildees que tem carga liacutequida nula e satildeo chamadas configuraccedilotildees neutras

Aleacutem disso estas uacuteltimas satildeo aquelas que determinam o equiliacutebrio de fases jaacute que

elas estatildeo em equiliacutebrio com a fase soacutelida na qual soacute haacute moleacuteculas neutras pelo

princiacutepio da eletroneutralidade Eacute tambeacutem afirmado que dado este equiliacutebrio a

atividade das moleacuteculas neutras natildeo se altera com a variaccedilatildeo do pH e eacute

proporcional agraves atividades de qualquer tipo de configuraccedilatildeo neutra

Neste mesmo trabalho eacute atribuiacuteda a Linderstroslashm-Lang o desenvolvimento de uma

teoria de prediccedilatildeo da solubilidade de proteiacutenas com a variaccedilatildeo do pH na regiatildeo do

ponto isoeleacutetrico Este desenvolvimento apresenta um balanccedilo de cargas de um

modo impliacutecito contudo como atestado por Groumlnwall o escasso conhecimento

sobre as estruturas proteacuteicas impediram agravequele tempo uma formulaccedilatildeo mais

pormenorizada do problema

52 Desenvolvimento teoacuterico

A base desta abordagem descrita por Groumlnwall e atribuiacuteda a Linderstroslashm-Lang

reside na hipoacutetese de que a moleacutecula de proteiacutena de configuraccedilatildeo k e carga nula

participa do seguinte equiliacutebrio com os iacuteons H+ e com sua forma de carga i

22 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

푃 + 푖퐻 푃 lowast

(52 ndash 1)

Note-se que o valor de i pode ser negativo A constante do equiliacutebrio quiacutemico

descrita pela equaccedilatildeo (52 ndash 1) pode ser expressa como

퐾 =푎

lowast

푎 푎

(52 ndash 2)

Sabendo que a atividade da moleacutecula de proteiacutena de configuraccedilatildeo k e carga i eacute dada

pelo produto entre sua concentraccedilatildeo e seu coeficiente de atividade tem-se que

푥lowast

= 푎 푎퐾훾

lowast

(52 ndash 3)

Entretanto a solubilidade da proteiacutena eacute soma das concentraccedilotildees de todas as

moleacuteculas de carga i Poreacutem a concentraccedilatildeo das moleacuteculas de carga i eacute a soma das

concentraccedilotildees das moleacuteculas de configuraccedilatildeo k Assim a solubilidade pode ser

escrita como

푠 (푝퐻) = 푎 푎퐾훾

lowast

(52 ndash 4)

Derivando a equaccedilatildeo (52 ndash 4) com respeito agrave atividade do iacuteon H+ considerando

que atividade da moleacutecula neutra eacute constante para qualquer configuraccedilatildeo k e ainda

que o coeficiente de atividade da proteiacutena de carga i independe da atividade do iacuteon

H+ tem-se que

푑푠푑푎 = 푖 ∙ 푎 푎

퐾훾

lowast

(52 ndash 5)

23 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

Sendo

푑 log 푠 (푝퐻)푑(푝퐻) = minus

푎푠 (푝퐻)

푑푠푑푎

(52 ndash 6)

Substituindo as equaccedilotildees (52 ndash 4) e (52 ndash 5) na equaccedilatildeo (52 ndash 6) e

reescrevendo em termos de pH e das concentraccedilotildees das proteiacutenas de carga i tem-

se que

푑 log 푠푑(푝퐻) = minus

sum (푖 ∙ 푥 )sum 푥

(52 ndash 7)

Contudo o termo do lado direito da equaccedilatildeo (52 ndash 7) estaacute associado ao conceito

de valecircncia meacutedia estabelecido por Linderstroslashm-Lang (1924)

횤 =sum (푖 ∙ 푥 )sum 푥

(52 ndash 8)

Os autores natildeo possuiacuteam um modo mais adequado de construir a curva de

solubilidade dada pela equaccedilatildeo (52 ndash 7) do que aproximar por uma funccedilatildeo linear o

perfil de carga liacutequida da proteiacutena obtido experimentalmente e integraacute-lo valendo-se

da analogia entre o conceito de carga liacutequida (Z) e de valecircncia meacutedia ( i ) Entretanto

hoje jaacute se tem uma descriccedilatildeo analiacutetica do perfil de carga liacutequida de proteiacutenas que

pode ser escrita como

푍(푝퐻) = 휈 훼

(52 ndash 9)

Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (52 ndash 9) e a resultante na equaccedilatildeo

(52 ndash 7) tem-se que

24 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

푑 log 푠푑(푝퐻) = minus

12

11 + 10

1 + 휈 + 휈 1 minus 휈 10

(52 ndash 10)

Integrando a equaccedilatildeo (52 ndash 10) de um ponto de referecircncia por exemplo do ponto

isoeleacutetrico (pI) ateacute um pH qualquer tem-se a seguinte relaccedilatildeo

푑 log 푠

( )

( )

= minus12

1

1 + 101 + 휈 + 휈 1 minus 휈 10 푑(푝퐻)

(52 ndash 11)

log푠 (푝퐻)푠 (푝퐼) = minus

12 1 + 휈

11 + 10

푑(푝퐻)

+ 휈 1 minus 휈10

1 + 10푑(푝퐻)

(52 ndash 12)

Fazendo a seguinte substituiccedilatildeo

푢 = 10 푡푎푙 푞푢푒 푑푢푢 = ln 10푑(푝퐻)

(52 ndash 13)

Tem-se que

log푠 (푝퐻)푠 (푝퐼) = minus

12

1 + 휈ln 10

1푢(1 + 푢) 푑푢 +

휈 1 minus 휈ln 10

1(1 + 푢) 푑푢

(52 ndash 14)

log푠 (푝퐻)푠 (푝퐼) = minus

12

1 + 휈ln 10

1푢 푑푢 minus

11 + 푢 푑푢 +

휈 1 minus 휈ln 10

1(1 + 푢) 푑푢

(52 ndash 15)

25 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐼) = minus

12 1 + 휈 log

1010

minus 휈 1 minus 휈 minus 1 + 휈 log1 + 101 + 10

(52 ndash 16)

Sendo

휈 1 minus 휈 minus 1 + 휈 = 휈 minus 휈 minus 1 minus 휈 = minus 1 + 휈 = minus2

(52 ndash 17)

Resultando em

log푠 (푝퐻)푠 (푝퐼) = log

1 + 101 + 10

minus1 + 휈

2 (푝퐻 minus 푝퐼)

(52 ndash 18)

Ainda eacute possiacutevel reescrever a equaccedilatildeo (52 ndash 18) como

log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log

1 + 101 + 10

(52 ndash 19)

Na qual n+ representa o nuacutemero de resiacuteduos ionizaacuteveis que na sua forma carregada

apresentam carga positiva A equaccedilatildeo (52 ndash 19) eacute uma expressatildeo analiacutetica que a

partir de dados da estrutura proteacuteica e de um dado de solubilidade permite predizer

a curva de solubilidade de uma dada proteiacutena em funccedilatildeo do pH na regiatildeo do ponto

isoeleacutetrico mantendo fixas a temperatura e a forccedila iocircnica do sistema

Eacute possiacutevel provar que as equaccedilotildees (42 ndash 8) e (52 ndash 19) satildeo idecircnticas - a prova

disso eacute descrita na seccedilatildeo 6 ndash e assim tem-se que apesar das distintas abordagens

a descriccedilatildeo do fenocircmeno eacute a mesma Note-se que um passo fundamental no

desenvolvimento da Equaccedilatildeo (52 ndash 5) eacute admitir que por hipoacutetese a atividade da

26 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

forma neutra natildeo depende do pH essa hipoacutetese tambeacutem eacute a base da equaccedilatildeo (41

ndash 7) Deve-se registrar o fato de que pelo melhor do nosso conhecimento esta eacute a

primeira vez que uma expressatildeo analiacutetica para o caacutelculo da solubilidade de

proteiacutenas em funccedilatildeo do pH eacute descrita mesmo no limite em que se considera vaacutelida

a lei de Henry

53 Soluccedilatildeo Paraboacutelica da Curva de Solubilidade

Tanto Groumlnwall (1941) quanto Fredericq e Neurath (1950) adotaram a hipoacutetese de

que os perfis de carga liacutequida da -lactoglobulina para um e da insulina para os

outros dois eram lineares na regiatildeo do ponto isoeleacutetrico Esta hipoacutetese eacute bastante

plausiacutevel e simplificadora principalmente a eacutepoca na qual estes trabalhos foram

desenvolvidos em que a estrutura proteacuteica bem como as constantes de ionizaccedilatildeo

dos resiacuteduos com grupos ionizaacuteveis era pouco conhecida De fato ainda hoje a falta

de dados das constantes de ionizaccedilatildeo na cadeia proteacuteica eacute o maior desafio no uso

do modelo rigoroso ndash equaccedilatildeo (52 ndash 18) Por isso o valor desta hipoacutetese de perfil

de carga liacutequida linear eacute notaacutevel

Supondo entatildeo que o perfil de carga seja linear eacute possiacutevel escrevecirc-lo como

푍(푝퐻) = minus퐴(푝퐻 minus 푝퐼) 푐표푚 퐴 gt 0

(53 ndash 1)

Substituindo (53 ndash 1) em (52 ndash 6)

푑 log 푠 (푝퐻)푑(푝퐻) = 퐴(푝퐻 minus 푝퐼)

(53 ndash 2)

Integrando (53 ndash 2) de um pH0 de referecircncia ateacute pH tem-se que

27 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐻 ) = 퐾[푝퐻 minus 2푝퐼(푝퐻 minus 푝퐻 ) minus 푝퐻 ] 푐표푚 퐾 =

퐴2

(53 ndash 3)

Ao se adotar como ponto de referecircncia o ponto isoeleacutetrico a equaccedilatildeo (53 ndash 3)

reduz-se agrave

log푠 (푝퐻)푠 (푝퐼) = 퐾(푝퐻 minus 푝퐼)

(53 ndash 4)

Contudo apesar da soluccedilatildeo quadraacutetica ou paraboacutelica para a equaccedilatildeo estendida de

Linderstroslashm-lang e Groumlnwall expressa na equaccedilatildeo (53 ndash 3) natildeo requerer os dados

das constantes de ionizaccedilatildeo dos resiacuteduos com grupos ionizaacuteveis ela exige a

definiccedilatildeo do paracircmetro A que fisicamente representa a inclinaccedilatildeo da reta de

aproximaccedilatildeo da curva de carga liacutequida e que pode ser calculado por correlaccedilatildeo a

partir de um conjunto de dados experimentais de solubilidade ou de carga liacutequida

6 Identidade entre o Modelo Proposto e a Equaccedilatildeo

Estendida de Linderstroslashm-Lang e Groumlnwall

A equaccedilatildeo final da modelagem termodinacircmica proposta apresentada na seccedilatildeo 4 eacute a

equaccedilatildeo (42 ndash 8) dada por

푠 (푝퐻)푠 (푝퐼) =

1 + 101 + 10

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 1)

Aplicando-se o logaritmo decimal nos dois termos da equaccedilatildeo (6 ndash 1) tem-se que

log푠 (푝퐻)푠 (푝퐼) = log

1 + 101 + 10

+ log

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 2)

Pelo bem da simplificaccedilatildeo desta deduccedilatildeo adotar-se-atildeo as seguintes funccedilotildees

휂 (푝퐻) = log

(6 ndash 3)

휃 (푝퐻) = log

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 4)

Assim pode-se reescrever a equaccedilatildeo (6 ndash 2) por

29 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐼) = 휂 (푝퐻) + 휃 (푝퐻)

(6 ndash 5)

Observando-se a equaccedilatildeo (6 ndash 5) tem-se que a funccedilatildeo j independe do estado de

ionizaccedilatildeo do resiacuteduo j poreacutem a funccedilatildeo jk depende Por isso deve-se analisar esta

funccedilatildeo para cada estado de ionizaccedilatildeo possiacutevel como mostrado na Tabela 61

Tabela 6 1 ndash Anaacutelise da funccedilatildeo jk para cada estado de ionizaccedilatildeo possiacutevel

j jk jk Quantidade de resiacuteduos neste estado

-1 -1 푝퐼 minus 푝퐻 na

0 0 nb

+1 +1 0 nc

0 푝퐼 minus 푝퐻 nd

Pela anaacutelise da Tabela 61 e considerando uma proteiacutena com n resiacuteduos com

grupos ionizaacuteveis infere-se que a equaccedilatildeo (6 ndash 5) pode ser reescrita como

log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)

(6 ndash 6)

Contudo as equaccedilotildees acima descritas satildeo vaacutelidas apenas para configuraccedilotildees

neutras pois apenas as configuraccedilotildees neutras da fase liacutequida estatildeo em equiliacutebrio

com as moleacuteculas de proteiacutena da fase soacutelida Para que uma configuraccedilatildeo seja

neutra vale a seguinte restriccedilatildeo

휀 = 0 hArr 푛 = 푛

(6 ndash 7)

30 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall

Substituindo a restriccedilatildeo dada pela equaccedilatildeo (6 ndash 7) na equaccedilatildeo (6 ndash 6) tem-se que

log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)

(6 ndash 8)

Ora mas a soma de nc e de nd natildeo resulta em outra coisa senatildeo no nuacutemero de

resiacuteduos com grupos ionizaacuteveis da estrutura proteacuteica cujo j seja +1 Assim

substituindo nc mais nd por n+ e substituindo a equaccedilatildeo (6 ndash 3) na equaccedilatildeo (6 ndash 8)

tem-se que

log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log

1 + 101 + 10

(6 ndash 9)

Ao se analisar a equaccedilatildeo (6 ndash 9) observa-se que ela eacute idecircntica a equaccedilatildeo estendida

de Linderstroslashm-Lang e Groumlnwall apresentada pela equaccedilatildeo (52 ndash 19) Com isso

tem-se que apesar das distintas formulaccedilotildees tanto a modelagem termodinacircmica aqui

proposta quanto a extensatildeo a teoria de Linderstroslashm-Lang e Groumlnwall resultam na

mesma descriccedilatildeo do fenocircmeno Aleacutem disso a equaccedilatildeo final dos modelos eacute

extremamente simples e depende apenas de um ponto de referecircncia e dos dados da

estrutura da moleacutecula de proteiacutena cuja solubilidade se deseja estudar

7 Aplicaccedilatildeo dos Modelos Expostos

Para validar o modelo comparando-o com o caacutelculo feito a partir da teoria de Debye-

Huumlckel o criteacuterio que relaciona os pontos calculados pelo modelo com os pontos

experimentais foi estabelecido a partir da seguinte funccedilatildeo objetivo (FO)

퐹푂 =1푁

푠 minus 푠푠

(7 ndash 1)

Contudo a equaccedilatildeo (7 ndash 1) natildeo eacute a melhor definiccedilatildeo de funccedilatildeo objetivo neste caso

pois a derivada da curva de solubilidade eacute razoavelmente grande nos dois lados do

ponto isoeleacutetrico e isso permite que pequenos desvios na direccedilatildeo horizontal

resultem em um grande aumento no valor da funccedilatildeo objetivo Uma soluccedilatildeo possiacutevel

seria substituir essa funccedilatildeo objetivo por uma funccedilatildeo definida pela soma do quadrado

da distacircncia do ponto experimental agrave curva do modelo principalmente se fosse

necessaacuterio calcular algum paracircmetro do modelo via otimizaccedilatildeo da funccedilatildeo objetivo

estipulada Natildeo sendo este o escopo deste trabalho optou-se pelo uso da FO

definida na equaccedilatildeo (7 ndash 1)

71 Solubilidade da Insulina Suiacutena

As Figuras 711 712 e 713 apresentam os graacuteficos da curva de solubilidade

dada pelos pontos experimentais pelo modelo proposto pela abordagem claacutessica e

tambeacutem a curva obtida pela soluccedilatildeo paraboacutelica da Equaccedilatildeo de Linderstroslashm-Lang e

Groumlnwall em trecircs temperaturas distintas

32 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 711 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 25 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

Figura 712 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 15 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

00

40

80

120

160

200

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

00

50

100

150

200

250

300

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

33 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 713 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 5 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

Os desvios da curva obtida pelo modelo proposto para valores de pH distantes do pI

podem ser explicados por ao menos trecircs importantes motivos dois devidos a

hipoacuteteses do modelo e um devido a fenocircmenos intriacutensecos a proteiacutena Sabendo que

no pI a solubilidade eacute miacutenima para valores de pH distantes do pI pode-se ter

solubilidades suficientemente grandes para que a validade da lei de Henry ndash adotada

na formulaccedilatildeo do modelo - seja questionada pois quanto mais distante do pI maior

a solubilidade e menor a validade da lei de Henry jaacute que haacute um aumento da

concentraccedilatildeo do soluto (proteiacutena) na soluccedilatildeo e tambeacutem ao fato do modelo prever

solubilidade infinita quando a fraccedilatildeo de moleacuteculas eletricamente neutras tende a

zero

limrarr푠 = lim

rarr

Φ(푝퐼)푠 (푝퐼)Φ(푝퐻) = +infin

(711 ndash 1)

00

50

100

150

200

250

300

350

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

34 7 Aplicaccedilatildeo dos Modelos Expostos

Todavia ainda haacute um fator de ordem natural que justifica o desvio apresentado para

valores de pH distantes do pI o desnovelamento da cadeia proteacuteica Este fenocircmeno

pode ocorrer de maneira a expor grupos hidroacutefobos resiacuteduos antes natildeo expostos

acrescentando relaccedilotildees de equiliacutebrio quiacutemico natildeo existentes na regiatildeo do pI

alterando o equiliacutebrio de fases e portanto alterando o valor da solubilidade

A Tabela 711 apresenta os valores obtidos para a funccedilatildeo objetivo definida em (7 ndash

1) tanto para o modelo proposto quanto para a abordagem claacutessica para trecircs

diferentes temperaturas

Tabela 711 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada

abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para insulina

suiacutena

T ordmC Abordagem FO

25 P 01857 C 02535

15 P 01981 C 05056

5 P 03595 C 03064

Observando-se a Tabela 711 vecirc-se que o modelo apresentou melhores resultados

do que o caacutelculo efetuado atraveacutes da abordagem claacutessica no que tange a

minimizaccedilatildeo da funccedilatildeo objetivo exceto para os dados a 5 ordmC

Tambeacutem eacute possiacutevel observar que a funccedilatildeo objetivo sofreu aumento com a

diminuiccedilatildeo da temperatura Isto ocorreu principalmente devido agrave dificuldade de

obter dados experimentais de solubilidade a temperaturas baixas o que aumenta o

desvio experimental fazendo com que se tenha um aumento do valor da funccedilatildeo

objetivo como a definida em (5 ndash 1) Um efeito secundaacuterio que tambeacutem pressiona a

35 7 Aplicaccedilatildeo dos Modelos Expostos

funccedilatildeo objetivo eacute o fato dos dados de pKA terem sido obtidos a uma temperatura

especiacutefica o que tende a acrescentar erro no caacutelculo de solubilidades a temperaturas

diferentes ainda que o pKA natildeo varie de forma ab-rupta com a temperatura

Outra observaccedilatildeo que deve ser registrada eacute o fato da funccedilatildeo objetivo para a

abordagem claacutessica na temperatura de 15 ordmC divergir a um valor tatildeo elevado em

relaccedilatildeo aos demais Isto se deve a um ponto experimental especiacutefico a um pH de

45 a solubilidade da insulina suiacutena obtida experimentalmente eacute 230 x 10-5 mol kg-1

enquanto a calculada pelo modelo proposto eacute 230 x 10-5 mol kg-1 e a calculada pela

abordagem claacutessica eacute 520 x 10-5 mol kg-1 Por conta do desvio deste ponto a funccedilatildeo

objetivo para a abordagem claacutessica nesta temperatura tem um aumento significativo

A Tabela 712 apresenta os valores do paracircmetro K da soluccedilatildeo paraboacutelica obtidos

neste trabalho para a insulina suiacutena comparados ao encontrado na literatura

Tabela 712 ndash Valores do paracircmetro K da soluccedilatildeo paraboacutelica para a insulina suiacutena

Referecircncias T ordmC K Fredericq e Neurath (1950) - 081 Neste trabalho 25 104 Neste trabalho 15 101 Neste trabalho 5 145

Pela Tabela 712 pode-se observar que haacute uma diferenccedila pequena entre os

valores do paracircmetro K obtidos neste trabalho e por Fredericq e Neurath (1950) Por

isso natildeo se pode afirmar a que se deve esta diferenccedila se eacute devido a diferenccedilas entre

procedimentos experimentais ou se eacute devido agrave diferenccedila de meacutetodo de caacutelculo do

paracircmetro Apesar de no experimento realizado por Fredericq e Neurath (1950)

haver a presenccedila do acircnion tiocianato e este acircnion interagir com grupos ionizaacuteveis

da cadeia proteacuteica como observado pelos autores do trabalho tambeacutem estes

36 7 Aplicaccedilatildeo dos Modelos Expostos

proacuteprios autores afirmam que a presenccedila deste acircnion natildeo altera a forma da curva

que eacute basicamente determinada pelo paracircmetro K De qualquer modo eacute interessante

observar a proximidade dos valores encontrados neste trabalho com o obtido por

Fredericq e Neurath (1950) pelo menos no que diz respeito agrave ordem de grandeza do

paracircmetro em questatildeo

72 Solubilidade da Lisozima de clara de ovo de galinha

Um modelo para ser validado necessita correlacionar dados experimentais de modo

satisfatoacuterio ou seja um modelo deve buscar fidelidade ao fenocircmeno fiacutesico

observado Assim na procura de dados de solubilidade de proteiacutenas poucos dados

na regiatildeo do pI foram encontrados Este eacute o caso da lisozima de clara de ovo de

galinha que apesar de ter muitos estudos de solubilidade nenhum deles se

encontra na regiatildeo do pI Surgiu assim a necessidade de se obter estes dados

experimentais para poder validar o modelo proposto A escolha da lisozima de clara

de ovo de galinha se deu em parte pela sua importacircncia mas tambeacutem em parte por

ter os valores de pKA conhecidos

A curva de solubilidade da lisozima de clara de ovo de galinha levantada neste

trabalho estaacute apresentada na Figura 721

37 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em

soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e

dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()

Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento

esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH

isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de

soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se

comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto

isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da

soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos

ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente

neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a

solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e

00

10

20

30

40

50

60

70

80

90

100

95 100 105 110 115 120

Solu

bilid

ade

(mg

mL)

pH

38 7 Aplicaccedilatildeo dos Modelos Expostos

alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado

em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo

Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo

a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo

Por conta de falta de dados a este respeito modelou-se apenas a curva de

solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura

722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de

galinha em funccedilatildeo do pH da soluccedilatildeo

Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)

00

10

20

30

40

50

60

70

80

90

96 99 102 105 108 111 114 117 120

Solu

bilid

ade

(mg

mL)

pH

39 7 Aplicaccedilatildeo dos Modelos Expostos

O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721

Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada

abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima

de clara de ovo de galinha

T ordmC Abordagem FO

25 P 4650 C gt7919a

a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado

Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta

aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a

abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca

de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos

anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao

efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de

clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a

variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A

proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de

cargas pontuais de Debye-Huumlckel

8 Conclusotildees

A modelagem termodinacircmica proposta neste trabalho apresentou expressivos

resultados quando comparada a abordagem claacutessica de Debye-Huumlckel

Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o

modelo aproximou melhor os pontos experimentais do que a referida abordagem

comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima

ao ponto isoeleacutetrico

Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica

para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua

construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo

lugar por sua aplicabilidade

Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis

da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva

em regiotildees distantes do ponto isoeleacutetrico

9 Referecircncias Bibliograacuteficas

BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene

Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects

Biophys J 95 1285-1294 2008

FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and

other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72

2684 - 26911950

GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v

93 p 517-542 1931

GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab

Carlsberg v 24 p 185-200 1941

KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native

and mutant insulins pK perturbation of B13-Glu in aggregated species Arch

Biochem Biophys v 283 p 496-502 1990

KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for

the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng

Chem Res v 35 p 4319-4327 1996

42 9 Referecircncias Bibliograacuteficas

KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen

lysozyme J Biochem v 87 p 1215-1219 1980

LADISCH M R Bioseparations Engineering principles practice and

economics John Wiley amp Sons 2001 pp1 116 ndash 117 133

LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab

Carlsberg v 15 p 1-29 1924

PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da

particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas

2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP

PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the

excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte

solutions Fluid Phase Equilib v 269 p 25ndash35 2008

PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-

contribution model involving phase and chemical equilibrium Ind Eng Chem Res

v 33 p 1341-1347 1994

PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277

1973

PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino

acids Fluid Phase Equilib v 152 p 121-132 1998

43 9 Referecircncias Bibliograacuteficas

PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular

Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999

SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of

equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte

solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009

TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J

R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with

carbon dioxide Biotech Bioeng v103 p 909-919 2009

TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer

free energy Biophys J v 95 p 2601-2609 2008

TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in

water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95

2009

Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na

cadeia proteacuteica

Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo

de ionizaccedilatildeo

퐻퐴 퐴 + 퐻

(A ndash 1)

Assim considerando que a constante de equiliacutebrio

퐾 = 푎

(A ndash 2)

Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que

퐾 =[퐴 ][퐻 ]

[퐻퐴]

(A ndash 3)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que

log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]

(A ndash 4)

Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado

por

minus log[휑] = 푝휑

(A ndash 5)

Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que

45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

푝퐾 = log[퐻퐴][퐴 ] + 푝퐻

(A ndash 6)

Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por

훼 =[퐴 ]

[퐻퐴] + [퐴 ]

(A ndash 7)

Reescrevendo (A ndash 7) tem-se que

훼 =[퐴 ] [퐻퐴frasl ]

1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =

훼1 minus 훼

(A ndash 8)

Substituindo (A ndash 8) em (A ndash 6) tem-se que

푝퐾 = log훼

1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10

(A ndash 9)

Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos

훼 =1

1 + 10

(A ndash 10)

Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio

퐴 + 퐻 퐻퐴

(A ndash 11)

Pode se escrever a constante de equiliacutebrio como

퐾 =[퐻퐴 ]

[퐴][퐻 ]

(A ndash 12)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que

46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

log퐾 = minus log[퐴]

[퐻퐴 ] minus log[퐻 ]

(A -13)

Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por

훼 =[퐻퐴 ]

[퐴] + [퐻퐴 ]

(A ndash 14)

Assim a equaccedilatildeo (A ndash 13) fica

훼1 minus 훼 = 10

(A ndash 15)

Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo

훼 =10

1 + 10

(A ndash 16)

Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos

modelos expostos

Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]

48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]

49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)

50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])

51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]

52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])

53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)

54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2

55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO

2 1 Introduccedilatildeo

interesse das ceacutelulas que a produziram Apoacutes estas primeiras etapas de purificaccedilatildeo

seguem-se as operaccedilotildees de baixa resoluccedilatildeo A precipitaccedilatildeo e a extraccedilatildeo em

sistemas de duas fases aquosas satildeo exemplos destas operaccedilotildees que tendem a

concentrar a proteiacutena-alvo preparando-a para os proacuteximos estaacutegios de separaccedilatildeo

Por fim a proteiacutena ora na concentraccedilatildeo obtida pelas operaccedilotildees anteriores eacute tratada

por operaccedilotildees de alta resoluccedilatildeo caracterizadas principalmente pela teacutecnica de

cromatografia a fim de concentrar a proteiacutena agrave pureza especificada para seu uso

Vale ressaltar que esta uacuteltima etapa eacute extremamente dispendiosa e quanto mais

eficientes forem as etapas precedentes no que tange a pureza da proteiacutena-alvo

menos custosa seraacute a etapa posterior

O escopo deste trabalho estaacute centrado na operaccedilatildeo de precipitaccedilatildeo de proteiacutenas

cujos fundamentos satildeo as relaccedilotildees do equiliacutebrio soacutelido-liacutequido (ESL) destes

sistemas A solubilidade de uma proteiacutena em soluccedilatildeo eacute governada pelos mesmos

princiacutepios fundamentais ou seja condiccedilotildees de equiliacutebrio termodinacircmico que regem

o comportamento de qualquer substacircncia no ESL Contudo algumas diferenccedilas

devem ser levadas em conta na descriccedilatildeo deste fenocircmeno e no projeto destas

operaccedilotildees

Proteiacutenas satildeo formadas por cadeias de aminoaacutecidos atraveacutes de ligaccedilotildees peptiacutedicas

cada aminoaacutecido pode ser considerado um monocircmero que ao possuir um grupo

ionizaacutevel natildeo ligado tal como ocorre em alguns aminoaacutecidos naturais tirosina (Tyr)

lisina (Lys) cisteiacutena (Cys) histidina (His) arginina (Arg) aacutecido aspaacutertico (Asp) e

aacutecido glutacircmico (Glu) e tambeacutem em resiacuteduos terminais confere a proteiacutena uma

caracteriacutestica de polieletroacutelito Eacute importante entatildeo considerar a definiccedilatildeo de

polieletroacutelitos tal qual definida por Pessocirca Filho e Maurer (2008) polieletroacutelitos satildeo

3 1 Introduccedilatildeo

poliacutemeros com muitas unidades monomeacutericas eletroliacuteticas ndash neste caso

aminoaacutecidos que possuem grupos ionizaacuteveis natildeo ligados

Para muitos processos industriais e mesmo naturais informaccedilotildees a respeito de

equiliacutebrios de fases de soluccedilotildees eletroliacuteticas satildeo necessaacuterias e necessaacuterias tambeacutem

satildeo modificaccedilotildees nos modelos tradicionais de coeficiente de atividade quando se

trata de descrever equiliacutebrios de fases em sistemas que conteacutem eletroacutelitos (Prausnitz

et al 1999)

Sendo assim tendo que a pressatildeo do sistema natildeo influencia de modo significativo o

ESL tem-se que trecircs variaacuteveis o influenciam diretamente a temperatura o pH e a

forccedila iocircnica estas duas uacuteltimas tornam-se importantes devido agrave caracteriacutestica

eletroliacutetica das proteiacutenas

Na verdade a forccedila iocircnica natildeo eacute uma variaacutevel que represente de modo abrangente

os possiacuteveis efeitos de iacuteons em soluccedilotildees proteacuteicas Isto se deve ao fato de que a

forccedila iocircnica do modo como eacute definida natildeo contempla uma diferenciaccedilatildeo entre os

equiliacutebrios que se estabelecem entre os iacuteons e alguns resiacuteduos ionizaacuteveis da cadeia

proteacuteica De fato a variaccedilatildeo da forccedila iocircnica de uma soluccedilatildeo proteacuteica altera o valor

da solubilidade da proteiacutena em soluccedilatildeo mas natildeo da mesma forma para qualquer

espeacutecie de iacuteon Portanto seria mais prudente acrescer ao conjunto de variaacuteveis que

influenciam o ESL a espeacutecie quiacutemica dos iacuteons presentes em soluccedilatildeo

O objetivo deste trabalho eacute estabelecer um modelo capaz de prever a influecircncia do

pH no ESL de proteiacutenas mantendo-se temperatura e forccedila iocircnica constantes

Sabe-se por observaccedilotildees experimentais que a variaccedilatildeo do pH de um sistema altera

o valor da solubilidade de proteiacutenas em soluccedilatildeo e a solubilidade de proteiacutenas por

sua vez atinge seu valor miacutenimo em um pH denominado ponto isoeleacutetrico (pI) no

qual a carga liacutequida da proteiacutena eacute nula

4 1 Introduccedilatildeo

Os primeiros trabalhos relacionados agrave modelagem da curva de solubilidade de

proteiacutenas em funccedilatildeo do pH datam do iniacutecio do seacuteculo XX Green (1931) propocircs um

modelo para a curva de solubilidade da carboxihemoglobina equumlina considerando

que esta proteiacutena se comportaria tanto como um aacutecido bivalente quanto uma base

bivalente Jaacute Groumlnwall (1941) atribuiu a Linderstroslashm-Lang o desenvolvimento de um

modelo capaz de predizer a curva de solubilidade a partir da integraccedilatildeo do perfil de

carga da proteiacutena Este trabalho de Groumlnwall apesar de esquecido pelo tempo eacute de

extrema importacircncia e relevacircncia tanto para o trabalho aqui apresentado quanto e

aqui um motivo muito mais nobre para o desenvolvimento de modelos a partir das

ferramentas da termodinacircmica claacutessica Quando da exposiccedilatildeo da modelagem aqui

tratada retornar-se-aacute a este trabalho que muito contribuiu ao entendimento do

fenocircmeno estudado

Eacute digno de nota o trabalho de Fredericq e Neurath (1950) no qual uma proposta de

equacionamento para uma correlaccedilatildeo semi-empiacuterica da curva de solubilidade de

insulina eacute apresentada Natildeo haacute de fato algo novo em relaccedilatildeo agrave modelagem do

efeito do pH na curva de solubilidade neste trabalho no entanto apesar de natildeo

haver qualquer menccedilatildeo ou referecircncia quanto agrave origem da equaccedilatildeo proposta nota-se

que eacute uma aplicaccedilatildeo direta da equaccedilatildeo descrita por Groumlnwall (1941) Haacute uma

hipoacutetese impliacutecita no trabalho de que o perfil de carga liacutequida da insulina seja linear

na regiatildeo do ponto isoeleacutetrico o que eacute bastante plausiacutevel para muitas proteiacutenas

Assim pela integraccedilatildeo da equaccedilatildeo diferencial proposta por Groumlwall (1941) uma

correlaccedilatildeo semi-empiacuterica quadraacutetica eacute obtida Reforccedila-se o uso da expressatildeo semi-

empiacuterica devido agrave natureza dual da equaccedilatildeo em parte advinda de um

desenvolvimento teoacuterico descrito por Groumlnwall (1941) e atribuiacutedo a Linderstroslashm-

Lang e em parte pela necessidade de se obter paracircmetros a partir de um ajuste de

5 1 Introduccedilatildeo

um conjunto de dados experimentais Vale observar que resultados expressivos

foram alcanccedilados neste trabalho de modo particular o fato de que a presenccedila do

acircnion tiocianato natildeo altera a forma da curva de solubilidade da insulina mas a

desloca em direccedilatildeo a menores valores de pH e de solubilidade

Contudo os trabalhos mais recentes se concentraram na modelagem da curva de

solubilidade de aminoaacutecidos em funccedilatildeo do pH dando maior enfoque aos modelos

termodinacircmicos para soluccedilotildees natildeo-ideais tanto atraveacutes de equaccedilotildees de estado

como de modelos de energia livre de Gibbs excedente

Destaca-se neste grupo o trabalho de Pinho et al (1994) que aplicaram o modelo

UNIFAC associado ao termo de Debye-Huumlckel para aminoaacutecidos como glicina D-

alanina L-serina e DL-valina Tambeacutem o trabalho de Khoshkbarchi e Vera (1996)

no qual foi desenvolvido um modelo simplificado de esfera riacutegida perturbada para

calcular o coeficiente de atividade de aminoaacutecidos e de peptiacutedeos permite prever a

curva de solubilidade destes em funccedilatildeo do pH Jaacute o modelo NRTL foi aplicado tanto

por Pradhan e Vera (1998) quanto Tseng et al (2009) para aminoaacutecidos Jaacute Seyfi et

al (2009) aplicaram a equaccedilatildeo de estado SAFT para a prediccedilatildeo da curva de

solubilidade da DL-metionina

Entretanto o primeiro trabalho dedicado exclusivamente agrave modelagem e prediccedilatildeo da

curva de solubilidade de proteiacutena propriamente dita em funccedilatildeo do pH foi publicado

por Tjong e Zhou (2008) Neste trabalho a solubilidade foi calculada a partir da

energia livre de transferecircncia da fase soacutelida para a fase liacutequida Para a execuccedilatildeo

deste caacutelculo a energia livre de transferecircncia foi dividida em duas contribuiccedilotildees

uma de natureza eletrostaacutetica calculada pela meacutedia de 100 conformaccedilotildees proteacuteicas

advindas da aplicaccedilatildeo de dinacircmica molecular a pH constante e outra de natureza

natildeo-eletrostaacutetica baseada na aacuterea superficial acessiacutevel ao solvente Poreacutem o

6 1 Introduccedilatildeo

esforccedilo computacional requerido pelo modelo por eles proposto para calcular

apenas alguns pontos da curva natildeo apresenta uma aplicabilidade razoaacutevel Aleacutem

deste trabalho Tashima et al (2009) propuseram uma modelagem termodinacircmica

para prever a curva de solubilidade especificamente da insulina suiacutena aplicando o

modelo de Pitzer truncado apoacutes o segundo coeficiente do virial

No presente trabalho propomos um novo modelo baseado no caacutelculo de estados de

ionizaccedilatildeo e em ferramentas de termodinacircmica claacutessica bem como uma extensatildeo agrave

teoria de Linderstroslashm-Lang e Groumlnwall Vale ressaltar de antematildeo que tanto este

novo modelo proposto quanto a extensatildeo desenvolvida resultam na mesma equaccedilatildeo

para o fenocircmeno apesar das distintas abordagens

2 Materiais e Meacutetodos

21 Meacutetodos computacionais

O coacutedigo-fonte do programa em linguagem C estaacute apresentado no Apecircndice B Os

meacutetodos numeacutericos utilizados se resumem a interpolaccedilatildeo linear o meacutetodo de

Newton-Raphson cujo uso seraacute apresentado na proacutexima seccedilatildeo quando se deduziraacute

o algoritmo do modelo de Debye-Huumlckel e o meacutetodo de busca unidirecional de

miacutenimos de funccedilatildeo pela Seccedilatildeo Aacuteurea

As Tabelas 211 e 212 apresentam os resiacuteduos considerados para cada proteiacutena

considerada bem como os seus valores de pKA que foram obtidos a partir da

literatura e satildeo indispensaacuteveis para execuccedilatildeo dos caacutelculos mais rigorosos

Tabela 211 ndash Resiacuteduos ionizaacuteveis considerados e valores de pKA da insulina suiacutena

Valores extraiacutedos de Kaarsholm et al (1990)

Aminoaacutecido Grupo Ionizaacutevel pKA

A1 ndash Gly -NH2 738 A4 ndash Glu -COOH 437 A14 ndash Tyr Fenol-OH 1020 A17 ndash Glu -COOH 437 A19 ndash Tyr Fenol-OH 1020 A21 ndash Asn -COOH 345

B1 ndash Phe -NH2 738 B5 ndash His Imidazol-NH 598 B10 ndash His Imidazol-NH 598 B 13 ndash Glu -COOH 437 B16 ndash Tyr Fenol-OH 1020 B21 ndash Glu -COOH 437

B22 ndash Arg Guaniacutedio-NH2 1110 B26 ndash Tyr Fenol-OH 1020

B29 ndash Lys -NH2 852 B30 ndashAla -COOH 345

8 2 Materiais e Meacutetodos

Tabela 212 ndash Resiacuteduos ionizaacuteveis considerados e valores de pKA a 25 ordmC da lisozima

de clara de ovo de galinha Valores extraiacutedos de Kuramitsu e Hamaguchi (1980)

Aminoaacutecido Grupo Ionizaacutevel pKA α-NH2 α-NH2 79

Lys1 ε-NH2 108

Arg5 Guaniacutedio-NH2 120 Glu7 -COOH 26

Lys13 ε-NH2 105

Arg14 Guaniacutedio-NH2 120 His15 Imidazol-NH 58 Asp18 -COOH 20 Tyr20 Fenol-OH 103

Arg21 Guaniacutedio-NH2 120 Tyr23 Fenol-OH 98

Lys33 ε-NH2 106 Glu35 -COOH 61

Arg45 Guaniacutedio-NH2 120 Asp48 -COOH 43 Asp52 -COOH 34 Tyr53 Fenol-OH 121

Arg61 Guaniacutedio-NH2 120 Asp66 -COOH 16

Arg68 Guaniacutedio-NH2 120

Arg73 Guaniacutedio-NH2 120 Asp87 -COOH 21

Lys96 ε-NH2 108

Lys97 ε-NH2 103 Asp101 -COOH 45

Arg112 Guaniacutedio-NH2 120

Arg114 Guaniacutedio-NH2 120

Lys116 ε-NH2 104 Asp119 -COOH 25

Arg125 Guaniacutedio-NH2 120

Arg128 Guaniacutedio-NH2 120 α-COOH α-COOH 31

9 2 Materiais e Meacutetodos

22 Curva de solubilidade da lisozima da clara de ovo de galinha

221 Reagentes

Neste experimento de determinaccedilatildeo da curva de solubilidade da lisozima da clara de

ovo de galinha os reagentes utilizados foram cloreto de soacutedio (Reatec P A)

bicarbonato de soacutedio (Research Becto Chemical P A) Na2HPO4 7H2O (Reagen

P A) aacutegua destilada deionizada Milli-Q (Millipore) e lisozima de clara de ovo de

galinha (Sigma min 99)

222 Equipamentos

Neste experimento os equipamentos utilizados foram espectrofotocircmetro UV-Visiacutevel

(Beckman DU-530) centriacutefuga (Eppendorf) banho-teacutermico (Laacutectea) com controlador

de temperatura (Julabo) pHmetro (Micronal) e balanccedila (Mettler Toledo AB204S)

223 Preparaccedilatildeo das soluccedilotildees-tampatildeo

Foram preparadas soluccedilotildees-tampatildeo com valores de pH=96 pH = 98 pH = 100

pH = 102 pH = 104 pH = 106 pH = 108 pH = 110 pH = 112 pH = 114 pH =

116 e pH = 118 a partir de quatro soluccedilotildees uma de hidroacutexido de soacutedio 01 M uma

de cloreto de soacutedio 1 M (para equalizar a forccedila iocircnica) uma de bicarbonato de soacutedio

005 M e outra de Na2HPO4 005 M

A Tabela 2231 apresenta os valores de volume usados no preparo de cada uma

das soluccedilotildees-tampatildeo

10 2 Materiais e Meacutetodos

Tabela 2231 ndash Volumes de hidroacutexido de soacutedio a 01 M adicionados no preparo das

soluccedilotildees-tampatildeo

Tampatildeo pH V NaOH mL

NaHCO3 96 100 005 M 98 152

(para cada soluccedilatildeo-tampatildeo 100 mL 100 214

desta soluccedilatildeo foram adicionados) 102 276

104 330 106 382

108 424

110 454

112 530 114 583

Na2HPO4 110 82

005 M 112 126

(para cada soluccedilatildeo-tampatildeo 100 mL 114 182 desta soluccedilatildeo foram adicionados) 116 270

118 388

224 Procedimento experimental

Foram adicionadas quantidades natildeo definidas de lisozima de clara de ovo de galinha

a 13 mL de cada soluccedilatildeo-tampatildeo em tubos Eppendorf de 2 mL Colocaram-se

entatildeo as amostras apoacutes agitaccedilatildeo vigorosa em banho teacutermico a 250 plusmn 01 ordmC por 24

horas para que os sistemas atingissem o equiliacutebrio termodinacircmico Caso natildeo

houvesse a formaccedilatildeo de precipitado lisozima era adicionada e o procedimento

repetido Ao se observar a formaccedilatildeo de precipitado o sistema era centrifugado a

13000 rpm por 15 minutos Uma aliacutequota do sobrenadante era retirada e sua

concentraccedilatildeo proteacuteica determinada por medida de absorbacircncia a 280 nm Cada

sistema foi feito ao menos em duplicata

3 Modelo Estendido de Debye-Huumlckel

31 Introduccedilatildeo

De fato como descrito por Pessocirca Filho (2002) a equaccedilatildeo de Debye-Huumlckel natildeo

deve ser aplicada agrave modelagem de polieletroacutelitos tais como proteiacutenas porque nestas

moleacuteculas as cargas satildeo distribuiacutedas ao longo da cadeia e portanto natildeo satildeo cargas

pontuais como suposto por Debye-Huumlckel

Contudo nesta modelagem considera-se uma regiatildeo de pH em torno do ponto

isoeleacutetrico (pI) na qual satildeo inerentes duas condiccedilotildees favoraacuteveis a aplicaccedilatildeo da

equaccedilatildeo de Debye-Huumlckel carga liacutequida proacutexima a zero pois Z(pI) = 0 e regiatildeo de

miacutenima solubilidade que significa baixas concentraccedilotildees de proteiacutenas em soluccedilatildeo

Isto significa em primeiro lugar que os efeitos da carga tais como ldquodesnovelamentordquo

da cadeia proteacuteica com exposiccedilatildeo de resiacuteduos outrora blindados podem ser

desprezados em uma regiatildeo proacutexima ao ponto isoeleacutetrico e em segundo lugar

baixas concentraccedilotildees de proteiacutena em soluccedilatildeo significam que os termos de curto

alcance podem ser desprezados e portanto haacute prevalecircncia do termo de longo

alcance que no caso de soluccedilotildees eletroliacuteticas pode ser descrito por uma equaccedilatildeo

estendida de Debye-Huumlckel

Assim o modelo de Debye-Huumlckel foi utilizado natildeo para verificar sua aplicabilidade agrave

modelagem de soluccedilotildees proteacuteicas mas sim para confrontar o modelo proposto com

um modelo usual em modelagem de soluccedilotildees eletroliacuteticas e seraacute referido no texto

sempre como abordagem claacutessica

12 3 Modelo Estendido de Debye-Huumlckel

32 Desenvolvimento teoacuterico

Pode-se escrever a atividade da proteiacutena como o produto entre a solubilidade e o

coeficiente de atividade da mesma como mostrado na equaccedilatildeo (32 - 1)

푎 = 훾푠

(32 - 1)

Na qual pode-se calcular o coeficiente de atividade atraveacutes da equaccedilatildeo estendida

de Debye-Huumlckel (Pitzer 1973)

ln 훾 = minus퐴 푍radic퐼

1 + 푏radic퐼+

2푏

ln 1 + 푏radic퐼

(32 - 2)

Sendo que a constante universal empiacuterica b = 12 kg12 mol-12 eacute usada para todos os

eletroacutelitos Jaacute AΦ eacute o paracircmetro de Debye-Huumlckel para o coeficiente osmoacutetico e eacute

dado por

퐴 =13

(2휋푁 휌 ) frasl 푒4휋휀 휀 푘푇

frasl

(32 - 3)

Em que NA eacute a constante de Avogadro ρs eacute a densidade do solvente em g cm-3 e eacute

a carga eletrocircnica (e = 160218 x 10-19 C) ε0 eacute a permissividade do espaccedilo livre (ε0 =

885419 x 10-12 C2 N-1 m-2) εr eacute a constante dieleacutetrica do solvente k aacute constante de

Boltzmann e T eacute a temperatura absoluta Jaacute a carga liacutequida em funccedilatildeo do pH pode

ser calculada como

푍 = 훼 minus 훼

(32 - 4)

Sendo que α+ e α- satildeo dados pelas equaccedilotildees (A - 10) e (A - 16) do Apecircndice A

13 3 Modelo Estendido de Debye-Huumlckel

E a forccedila iocircnica eacute dada pela equaccedilatildeo (32 - 5) descrita abaixo

퐼 = 12

푚 푍

(32 - 5)

Contudo no ponto isoeleacutetrico a carga meacutedia da proteiacutena eacute nula portanto o termo de

Debye-Huumlckel se anula e o coeficiente de atividade se torna unitaacuterio

ln푎 (푝퐼) = ln 푠 (푝퐼)

(32 - 6)

Considerando que a atividade da proteiacutena seja constante com a variaccedilatildeo de pH isto

implica que esta eacute sempre igual agrave solubilidade da proteiacutena no ponto isoeleacutetrico e

portanto vale que

ln푎 (푝퐻) = ln 푠 (푝퐻) + ln 훾(푝퐻) = ln 푠 (푝퐼)

(32 - 7)

Assim

ln 푠 (푝퐻) = ln 푠 (푝퐼) + 퐴휙푍푝퐻2 radic퐼1 + 푏radic퐼

+2푏

ln 1 + 푏radic퐼

(32 - 8)

Esta equaccedilatildeo prevecirc a curva de solubilidade em funccedilatildeo do pH atraveacutes do caacutelculo da

atividade da proteiacutena na fase liacutequida pela equaccedilatildeo estendida de Debye-Huumlckel Para

resolvecirc-la eacute necessaacuterio se utilizar de um meacutetodo numeacuterico pois a forccedila iocircnica

depende da solubilidade naquele pH Optou-se neste trabalho pelo Meacutetodo de

Newton-Raphson para executar o meacutetodo iterativo que eacute exigido pela equaccedilatildeo (32

ndash 8) Para aplicar este meacutetodo arbitrou-se uma funccedilatildeo f(sp) definida aqui como

푓 푠 = minus ln 푠 (푝퐻) + ln 푠 (푝퐼) + 퐴휙푍푝퐻2 radic퐼

1 + 푏radic퐼+

2푏

ln 1 + 푏radic퐼

(32 - 9)

14 3 Modelo Estendido de Debye-Huumlckel

Assim ao calcular o sp que zera esta funccedilatildeo f(sp) saber-se-aacute que eacute a proacutepria

solubilidade que se deseja calcular Para aplicar o Meacutetodo de Newton-Raphson

basta derivar a funccedilatildeo f(sp) e aplicar o seguinte algoritmo de resoluccedilatildeo

푠 = 푠 minus푓(푠 )푓 (푠 )

(32 - 10)

Para calcular frsquo(s) deve-se considerar que a forccedila iocircnica depende da solubilidade

Para isto observando a equaccedilatildeo (32 - 5) vecirc-se que a forccedila iocircnica eacute dada pelo

somatoacuterio das contribuiccedilotildees de todos os iacuteons presentes na soluccedilatildeo por isso aqui

cabe um artifiacutecio de dividir estas contribuiccedilotildees em duas macro-contribuiccedilotildees aquela

devida a todos os iacuteons presentes na soluccedilatildeo exclusive os grupos ionizaacuteveis

presentes nas moleacuteculas da proteiacutena em questatildeo (I0) e que se considera constante

com o pH e aquela que engloba apenas os grupos ionizaacuteveis presentes nas

moleacuteculas da proteiacutena (IP)

퐼 = 퐼 + 퐼 = 퐼 +12푍 푠

(32 - 11)

Considerando a funccedilatildeo w tal que

푤 = radic퐼 = 퐼 +12푍 푠

(32 - 12)

Sendo

푤 =14푍 퐼

(32 - 13)

Entatildeo aplicando-se as devidas regras de derivaccedilatildeo tem-se

15 3 Modelo Estendido de Debye-Huumlckel

푓 (푠 ) = minus1푠 + 퐴 푍

3푤 + 2푤 푏푤(1 + 푏푤)

(32 - 14)

Substituindo as equaccedilotildees (32 - 12) e (32 - 13) na equaccedilatildeo (32 - 14) tem-se que

푓 (푠 ) = minus1푠 + 퐴 푍

15 + 푏radic퐼2radic퐼(1 + 푏radic퐼)

(32 - 15)

Entatildeo o algoritmo deve ser

푠 = 푠 minus

⎜⎛ln 푠 (푝퐼)

푠 + 퐴휙푍푝퐻2 radic퐼

1 + 푏radic퐼+ 2푏 ln 1 + 푏radic퐼

minus 1푠 + 퐴휙푍

15 + 푏radic퐼2radic퐼(1 + 푏radic퐼) ⎠

⎟⎞

(32 - 16)

4 Modelagem Termodinacircmica Proposta

41 Introduccedilatildeo

A condiccedilatildeo de equiliacutebrio entre duas fases (α e β) com m componentes eacute dada por

(Prausnitz et al 1999)

푝 = 푝

(41 ndash 1)

푇 = 푇

(41 ndash 2)

휇 = 휇⋮

휇 = 휇

(41 ndash 3)

Considerando o equiliacutebrio soacutelido-liacutequido (ESL) de sistemas contendo proteiacutenas

sendo que os efeitos da pressatildeo podem ser desprezados que as temperaturas nas

duas fases satildeo iguais e que na fase soacutelida soacute haacute proteiacutena tem-se que para a

proteiacutena a relaccedilatildeo de equiliacutebrio pode ser descrita por

휇 (푇푥) = 휇 (푇)

(41 ndash 4)

Contudo adotando-se a lei de Henry que eacute vaacutelida para baixas concentraccedilotildees de

soluto hipoacutetese que natildeo eacute distante dos valores observados da solubilidade de

proteiacutenas pode se escrever o potencial quiacutemico na fase liacutequida por

휇 (푇푥) = 휇 (푇 푥 ) + 푅푇푙푛푥

(41 ndash 5)

17 4 Modelagem Termodinacircmica Proposta

Entretanto variaccedilotildees de pH natildeo alteram o potencial quiacutemico da fase soacutelida o que

resulta pela relaccedilatildeo (41 ndash 4) que o mesmo natildeo altera tambeacutem o potencial quiacutemico

da fase liacutequida Com isso pela relaccedilatildeo (41 ndash 5) sendo o potencial quiacutemico de

referecircncia constante com o pH uma contradiccedilatildeo emerge a variaccedilatildeo do pH natildeo

poderia alterar o valor da solubilidade poreacutem a observaccedilatildeo experimental mostra o

contraacuterio Assim deve-se lembrar que pelo princiacutepio da eletroneutralidade a fase

soacutelida soacute possui moleacuteculas proteacuteicas eletricamente neutras e portanto o equiliacutebrio

de fases deve se estabelecer apenas entre as moleacuteculas presentes na fase soacutelida e

as moleacuteculas eletricamente neutras em soluccedilatildeo Ou seja como soacute moleacuteculas

eletricamente neutras podem estar na fase soacutelida o equiliacutebrio de fases depende

exclusivamente da fraccedilatildeo de moleacuteculas eletricamente neutras em soluccedilatildeo pois soacute

estas podem precipitar Assim tanto a equaccedilatildeo (41 ndash 4) quanto a equaccedilatildeo (41 ndash

5) devem ser aplicadas natildeo ao conjunto de todas as moleacuteculas de proteiacutena em

soluccedilatildeo mas somente as moleacuteculas proteacuteicas eletricamente neutras Portanto a

concentraccedilatildeo das moleacuteculas de proteiacutena eletricamente neutras em soluccedilatildeo eacute

constante com o pH e pode ser interpretada como a multiplicaccedilatildeo da fraccedilatildeo de

moleacuteculas eletricamente neutras pela concentraccedilatildeo total de proteiacutenas que eacute a

proacutepria solubilidade Assim uma relaccedilatildeo de inversa proporcionalidade eacute definida

quanto maior a fraccedilatildeo de moleacuteculas neutras menor seraacute a solubilidade de uma

proteiacutena em soluccedilatildeo Portanto no ponto isoeleacutetrico no qual haacute o miacutenimo de

solubilidade tem-se o ponto maacuteximo de fraccedilatildeo de moleacuteculas eletricamente neutras

A partir disto eacute possiacutevel escrever a equaccedilatildeo que rege o comportamento da

solubilidade de uma proteiacutena em funccedilatildeo do pH da soluccedilatildeo

휙(푝퐻)푆 (푝퐻) = 휆 = 푐표푛푠푡푎푛푡푒

(41 ndash 6)

18 4 Modelagem Termodinacircmica Proposta

Na equaccedilatildeo (41 ndash 6) o paracircmetro λ pode ser um paracircmetro de ajuste do modelo a

um conjunto de valores experimentais tendo se estabelecido uma funccedilatildeo objetivo ou

ainda dado pelo produto entre a solubilidade no ponto isoeleacutetrico e a fraccedilatildeo de

moleacuteculas eletricamente neutras em soluccedilatildeo tambeacutem no pI neste caso vale a

seguinte equaccedilatildeo

푠 (푝퐻) =휙(푝퐼)푠 (푝퐼)휙(푝퐻)

(41 ndash 7)

Sendo a equaccedilatildeo do modelo ndash equaccedilatildeo (41 ndash 7) ndash extremamente simples a uacutenica

dificuldade reside no caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras

(휙(푝퐻))

42 Caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras

Dentre os aminoaacutecidos que formam atraveacutes de ligaccedilotildees peptiacutedicas as proteiacutenas haacute

aqueles que possuem resiacuteduos com grupos ionizaacuteveis aleacutem dos grupos amina e

aacutecido carboxiacutelico terminais na cadeia Todos estes participam de equiliacutebrios

quiacutemicos com iacuteons H+ presentes na soluccedilatildeo entatildeo ao se alterar o pH da soluccedilatildeo

estes equiliacutebrios satildeo alterados

Assim haacute vaacuterias possibilidades de combinaccedilotildees de estados ionizados destes grupos

ionizaacuteveis que resultam em uma moleacutecula de proteiacutena eletricamente neutra Eacute

importante notar que dada a fraccedilatildeo de uma configuraccedilatildeo de uma moleacutecula neutra

todas as outras fraccedilotildees de configuraccedilotildees possiacuteveis que tambeacutem resultem em

moleacuteculas neutras satildeo proporcionais agrave fraccedilatildeo da configuraccedilatildeo dada pois todas as

configuraccedilotildees participam de equiliacutebrios entre si

19 4 Modelagem Termodinacircmica Proposta

Desta observaccedilatildeo implica-se que basta identificar uma configuraccedilatildeo proteacuteica cuja

soma dos estados ionizados resulte em carga nula para se descrever o equiliacutebrio de

fases em relaccedilatildeo ao pH na regiatildeo do ponto isoeleacutetrico onde esta consideraccedilatildeo eacute

predominante em relaccedilatildeo a outros possiacuteveis fenocircmenos

Contudo eacute necessaacuterio contabilizar a contribuiccedilatildeo de cada grupo ionizaacutevel via

equaccedilatildeo de Henderson-Hasselbach equaccedilatildeo (42 ndash 1)

훼 (푝퐻) =

⎩⎪⎨

⎪⎧ 10

1 + 10 푠푒 휈 = minus1

11 + 10

푠푒 휈 = +1

(42 ndash 1)

Na qual pKAj eacute o co-logaritmo da constante de equiliacutebrio do grupo ionizaacutevel do

resiacuteduo j j eacute estado carregado potencial do resiacuteduo j (-1 para grupos aacutecidos e +1

para grupos baacutesicos) e j eacute a fraccedilatildeo ionizada para o pH dado Para grupos cujo

estado de ionizaccedilatildeo na dada configuraccedilatildeo seja neutro a sua fraccedilatildeo eacute calculada tal

que a soma de sua fraccedilatildeo e da fraccedilatildeo ionizada tenha como resultado o valor

unitaacuterio

Assim a funccedilatildeo Pn pode ser escrita como o produto de cada fraccedilatildeo de cada grupo

ionizaacutevel j naquele estado (-1 0 ou +1) na configuraccedilatildeo neutra k em uma proteiacutena

com n grupos ionizaacuteveis Uma representaccedilatildeo matemaacutetica possiacutevel para esta funccedilatildeo

pode ser escrita como

휙 (푝퐻) = 훼 (푝퐻)

(42 ndash 2)

Na qual a fraccedilatildeo jrsquo(pH) eacute dada por

20 4 Modelagem Termodinacircmica Proposta

훼 (푝퐻) =훼 (푝퐻) 푠푒 휀 = 11 minus 훼 (푝퐻) 푠푒 휀 = 0

(42 ndash 3)

Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (42 ndash 3) e a resultante na equaccedilatildeo

(42 ndash 2) pode-se escrever que

휙 (푝퐻) =1

1 + 10

1 + 휈2 minus 휈 휀 10

minus휈 minus 1

2 minus 휈 휀 푐표푚 휀 = 0

(42 ndash 4)

A equaccedilatildeo (42 ndash 4) junto agrave equaccedilatildeo (41 ndash 7) constituem o modelo termodinacircmico

capaz de predizer a razatildeo entre as fraccedilotildees de moleacuteculas neutras de uma proteiacutena

em funccedilatildeo do pH na regiatildeo do ponto isoeleacutetrico mantendo fixas temperatura e forccedila

iocircnica Substituindo a equaccedilatildeo (42 ndash 4) na equaccedilatildeo (41 ndash 7) obteacutem-se para a

curva de solubilidade

푠 (푝퐻)푠 (푝퐼) =

1 + 101 + 10

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

푐표푚 휀 = 0

(42 ndash 8)

5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

51 Introduccedilatildeo

Segundo Groumlnwall (1941) na fase liacutequida haacute moleacuteculas de proteiacutenas com muitas

configuraccedilotildees k distintas que possuem carga liacutequida i e tambeacutem haacute certas

configuraccedilotildees que tem carga liacutequida nula e satildeo chamadas configuraccedilotildees neutras

Aleacutem disso estas uacuteltimas satildeo aquelas que determinam o equiliacutebrio de fases jaacute que

elas estatildeo em equiliacutebrio com a fase soacutelida na qual soacute haacute moleacuteculas neutras pelo

princiacutepio da eletroneutralidade Eacute tambeacutem afirmado que dado este equiliacutebrio a

atividade das moleacuteculas neutras natildeo se altera com a variaccedilatildeo do pH e eacute

proporcional agraves atividades de qualquer tipo de configuraccedilatildeo neutra

Neste mesmo trabalho eacute atribuiacuteda a Linderstroslashm-Lang o desenvolvimento de uma

teoria de prediccedilatildeo da solubilidade de proteiacutenas com a variaccedilatildeo do pH na regiatildeo do

ponto isoeleacutetrico Este desenvolvimento apresenta um balanccedilo de cargas de um

modo impliacutecito contudo como atestado por Groumlnwall o escasso conhecimento

sobre as estruturas proteacuteicas impediram agravequele tempo uma formulaccedilatildeo mais

pormenorizada do problema

52 Desenvolvimento teoacuterico

A base desta abordagem descrita por Groumlnwall e atribuiacuteda a Linderstroslashm-Lang

reside na hipoacutetese de que a moleacutecula de proteiacutena de configuraccedilatildeo k e carga nula

participa do seguinte equiliacutebrio com os iacuteons H+ e com sua forma de carga i

22 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

푃 + 푖퐻 푃 lowast

(52 ndash 1)

Note-se que o valor de i pode ser negativo A constante do equiliacutebrio quiacutemico

descrita pela equaccedilatildeo (52 ndash 1) pode ser expressa como

퐾 =푎

lowast

푎 푎

(52 ndash 2)

Sabendo que a atividade da moleacutecula de proteiacutena de configuraccedilatildeo k e carga i eacute dada

pelo produto entre sua concentraccedilatildeo e seu coeficiente de atividade tem-se que

푥lowast

= 푎 푎퐾훾

lowast

(52 ndash 3)

Entretanto a solubilidade da proteiacutena eacute soma das concentraccedilotildees de todas as

moleacuteculas de carga i Poreacutem a concentraccedilatildeo das moleacuteculas de carga i eacute a soma das

concentraccedilotildees das moleacuteculas de configuraccedilatildeo k Assim a solubilidade pode ser

escrita como

푠 (푝퐻) = 푎 푎퐾훾

lowast

(52 ndash 4)

Derivando a equaccedilatildeo (52 ndash 4) com respeito agrave atividade do iacuteon H+ considerando

que atividade da moleacutecula neutra eacute constante para qualquer configuraccedilatildeo k e ainda

que o coeficiente de atividade da proteiacutena de carga i independe da atividade do iacuteon

H+ tem-se que

푑푠푑푎 = 푖 ∙ 푎 푎

퐾훾

lowast

(52 ndash 5)

23 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

Sendo

푑 log 푠 (푝퐻)푑(푝퐻) = minus

푎푠 (푝퐻)

푑푠푑푎

(52 ndash 6)

Substituindo as equaccedilotildees (52 ndash 4) e (52 ndash 5) na equaccedilatildeo (52 ndash 6) e

reescrevendo em termos de pH e das concentraccedilotildees das proteiacutenas de carga i tem-

se que

푑 log 푠푑(푝퐻) = minus

sum (푖 ∙ 푥 )sum 푥

(52 ndash 7)

Contudo o termo do lado direito da equaccedilatildeo (52 ndash 7) estaacute associado ao conceito

de valecircncia meacutedia estabelecido por Linderstroslashm-Lang (1924)

횤 =sum (푖 ∙ 푥 )sum 푥

(52 ndash 8)

Os autores natildeo possuiacuteam um modo mais adequado de construir a curva de

solubilidade dada pela equaccedilatildeo (52 ndash 7) do que aproximar por uma funccedilatildeo linear o

perfil de carga liacutequida da proteiacutena obtido experimentalmente e integraacute-lo valendo-se

da analogia entre o conceito de carga liacutequida (Z) e de valecircncia meacutedia ( i ) Entretanto

hoje jaacute se tem uma descriccedilatildeo analiacutetica do perfil de carga liacutequida de proteiacutenas que

pode ser escrita como

푍(푝퐻) = 휈 훼

(52 ndash 9)

Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (52 ndash 9) e a resultante na equaccedilatildeo

(52 ndash 7) tem-se que

24 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

푑 log 푠푑(푝퐻) = minus

12

11 + 10

1 + 휈 + 휈 1 minus 휈 10

(52 ndash 10)

Integrando a equaccedilatildeo (52 ndash 10) de um ponto de referecircncia por exemplo do ponto

isoeleacutetrico (pI) ateacute um pH qualquer tem-se a seguinte relaccedilatildeo

푑 log 푠

( )

( )

= minus12

1

1 + 101 + 휈 + 휈 1 minus 휈 10 푑(푝퐻)

(52 ndash 11)

log푠 (푝퐻)푠 (푝퐼) = minus

12 1 + 휈

11 + 10

푑(푝퐻)

+ 휈 1 minus 휈10

1 + 10푑(푝퐻)

(52 ndash 12)

Fazendo a seguinte substituiccedilatildeo

푢 = 10 푡푎푙 푞푢푒 푑푢푢 = ln 10푑(푝퐻)

(52 ndash 13)

Tem-se que

log푠 (푝퐻)푠 (푝퐼) = minus

12

1 + 휈ln 10

1푢(1 + 푢) 푑푢 +

휈 1 minus 휈ln 10

1(1 + 푢) 푑푢

(52 ndash 14)

log푠 (푝퐻)푠 (푝퐼) = minus

12

1 + 휈ln 10

1푢 푑푢 minus

11 + 푢 푑푢 +

휈 1 minus 휈ln 10

1(1 + 푢) 푑푢

(52 ndash 15)

25 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐼) = minus

12 1 + 휈 log

1010

minus 휈 1 minus 휈 minus 1 + 휈 log1 + 101 + 10

(52 ndash 16)

Sendo

휈 1 minus 휈 minus 1 + 휈 = 휈 minus 휈 minus 1 minus 휈 = minus 1 + 휈 = minus2

(52 ndash 17)

Resultando em

log푠 (푝퐻)푠 (푝퐼) = log

1 + 101 + 10

minus1 + 휈

2 (푝퐻 minus 푝퐼)

(52 ndash 18)

Ainda eacute possiacutevel reescrever a equaccedilatildeo (52 ndash 18) como

log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log

1 + 101 + 10

(52 ndash 19)

Na qual n+ representa o nuacutemero de resiacuteduos ionizaacuteveis que na sua forma carregada

apresentam carga positiva A equaccedilatildeo (52 ndash 19) eacute uma expressatildeo analiacutetica que a

partir de dados da estrutura proteacuteica e de um dado de solubilidade permite predizer

a curva de solubilidade de uma dada proteiacutena em funccedilatildeo do pH na regiatildeo do ponto

isoeleacutetrico mantendo fixas a temperatura e a forccedila iocircnica do sistema

Eacute possiacutevel provar que as equaccedilotildees (42 ndash 8) e (52 ndash 19) satildeo idecircnticas - a prova

disso eacute descrita na seccedilatildeo 6 ndash e assim tem-se que apesar das distintas abordagens

a descriccedilatildeo do fenocircmeno eacute a mesma Note-se que um passo fundamental no

desenvolvimento da Equaccedilatildeo (52 ndash 5) eacute admitir que por hipoacutetese a atividade da

26 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

forma neutra natildeo depende do pH essa hipoacutetese tambeacutem eacute a base da equaccedilatildeo (41

ndash 7) Deve-se registrar o fato de que pelo melhor do nosso conhecimento esta eacute a

primeira vez que uma expressatildeo analiacutetica para o caacutelculo da solubilidade de

proteiacutenas em funccedilatildeo do pH eacute descrita mesmo no limite em que se considera vaacutelida

a lei de Henry

53 Soluccedilatildeo Paraboacutelica da Curva de Solubilidade

Tanto Groumlnwall (1941) quanto Fredericq e Neurath (1950) adotaram a hipoacutetese de

que os perfis de carga liacutequida da -lactoglobulina para um e da insulina para os

outros dois eram lineares na regiatildeo do ponto isoeleacutetrico Esta hipoacutetese eacute bastante

plausiacutevel e simplificadora principalmente a eacutepoca na qual estes trabalhos foram

desenvolvidos em que a estrutura proteacuteica bem como as constantes de ionizaccedilatildeo

dos resiacuteduos com grupos ionizaacuteveis era pouco conhecida De fato ainda hoje a falta

de dados das constantes de ionizaccedilatildeo na cadeia proteacuteica eacute o maior desafio no uso

do modelo rigoroso ndash equaccedilatildeo (52 ndash 18) Por isso o valor desta hipoacutetese de perfil

de carga liacutequida linear eacute notaacutevel

Supondo entatildeo que o perfil de carga seja linear eacute possiacutevel escrevecirc-lo como

푍(푝퐻) = minus퐴(푝퐻 minus 푝퐼) 푐표푚 퐴 gt 0

(53 ndash 1)

Substituindo (53 ndash 1) em (52 ndash 6)

푑 log 푠 (푝퐻)푑(푝퐻) = 퐴(푝퐻 minus 푝퐼)

(53 ndash 2)

Integrando (53 ndash 2) de um pH0 de referecircncia ateacute pH tem-se que

27 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐻 ) = 퐾[푝퐻 minus 2푝퐼(푝퐻 minus 푝퐻 ) minus 푝퐻 ] 푐표푚 퐾 =

퐴2

(53 ndash 3)

Ao se adotar como ponto de referecircncia o ponto isoeleacutetrico a equaccedilatildeo (53 ndash 3)

reduz-se agrave

log푠 (푝퐻)푠 (푝퐼) = 퐾(푝퐻 minus 푝퐼)

(53 ndash 4)

Contudo apesar da soluccedilatildeo quadraacutetica ou paraboacutelica para a equaccedilatildeo estendida de

Linderstroslashm-lang e Groumlnwall expressa na equaccedilatildeo (53 ndash 3) natildeo requerer os dados

das constantes de ionizaccedilatildeo dos resiacuteduos com grupos ionizaacuteveis ela exige a

definiccedilatildeo do paracircmetro A que fisicamente representa a inclinaccedilatildeo da reta de

aproximaccedilatildeo da curva de carga liacutequida e que pode ser calculado por correlaccedilatildeo a

partir de um conjunto de dados experimentais de solubilidade ou de carga liacutequida

6 Identidade entre o Modelo Proposto e a Equaccedilatildeo

Estendida de Linderstroslashm-Lang e Groumlnwall

A equaccedilatildeo final da modelagem termodinacircmica proposta apresentada na seccedilatildeo 4 eacute a

equaccedilatildeo (42 ndash 8) dada por

푠 (푝퐻)푠 (푝퐼) =

1 + 101 + 10

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 1)

Aplicando-se o logaritmo decimal nos dois termos da equaccedilatildeo (6 ndash 1) tem-se que

log푠 (푝퐻)푠 (푝퐼) = log

1 + 101 + 10

+ log

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 2)

Pelo bem da simplificaccedilatildeo desta deduccedilatildeo adotar-se-atildeo as seguintes funccedilotildees

휂 (푝퐻) = log

(6 ndash 3)

휃 (푝퐻) = log

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 4)

Assim pode-se reescrever a equaccedilatildeo (6 ndash 2) por

29 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐼) = 휂 (푝퐻) + 휃 (푝퐻)

(6 ndash 5)

Observando-se a equaccedilatildeo (6 ndash 5) tem-se que a funccedilatildeo j independe do estado de

ionizaccedilatildeo do resiacuteduo j poreacutem a funccedilatildeo jk depende Por isso deve-se analisar esta

funccedilatildeo para cada estado de ionizaccedilatildeo possiacutevel como mostrado na Tabela 61

Tabela 6 1 ndash Anaacutelise da funccedilatildeo jk para cada estado de ionizaccedilatildeo possiacutevel

j jk jk Quantidade de resiacuteduos neste estado

-1 -1 푝퐼 minus 푝퐻 na

0 0 nb

+1 +1 0 nc

0 푝퐼 minus 푝퐻 nd

Pela anaacutelise da Tabela 61 e considerando uma proteiacutena com n resiacuteduos com

grupos ionizaacuteveis infere-se que a equaccedilatildeo (6 ndash 5) pode ser reescrita como

log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)

(6 ndash 6)

Contudo as equaccedilotildees acima descritas satildeo vaacutelidas apenas para configuraccedilotildees

neutras pois apenas as configuraccedilotildees neutras da fase liacutequida estatildeo em equiliacutebrio

com as moleacuteculas de proteiacutena da fase soacutelida Para que uma configuraccedilatildeo seja

neutra vale a seguinte restriccedilatildeo

휀 = 0 hArr 푛 = 푛

(6 ndash 7)

30 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall

Substituindo a restriccedilatildeo dada pela equaccedilatildeo (6 ndash 7) na equaccedilatildeo (6 ndash 6) tem-se que

log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)

(6 ndash 8)

Ora mas a soma de nc e de nd natildeo resulta em outra coisa senatildeo no nuacutemero de

resiacuteduos com grupos ionizaacuteveis da estrutura proteacuteica cujo j seja +1 Assim

substituindo nc mais nd por n+ e substituindo a equaccedilatildeo (6 ndash 3) na equaccedilatildeo (6 ndash 8)

tem-se que

log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log

1 + 101 + 10

(6 ndash 9)

Ao se analisar a equaccedilatildeo (6 ndash 9) observa-se que ela eacute idecircntica a equaccedilatildeo estendida

de Linderstroslashm-Lang e Groumlnwall apresentada pela equaccedilatildeo (52 ndash 19) Com isso

tem-se que apesar das distintas formulaccedilotildees tanto a modelagem termodinacircmica aqui

proposta quanto a extensatildeo a teoria de Linderstroslashm-Lang e Groumlnwall resultam na

mesma descriccedilatildeo do fenocircmeno Aleacutem disso a equaccedilatildeo final dos modelos eacute

extremamente simples e depende apenas de um ponto de referecircncia e dos dados da

estrutura da moleacutecula de proteiacutena cuja solubilidade se deseja estudar

7 Aplicaccedilatildeo dos Modelos Expostos

Para validar o modelo comparando-o com o caacutelculo feito a partir da teoria de Debye-

Huumlckel o criteacuterio que relaciona os pontos calculados pelo modelo com os pontos

experimentais foi estabelecido a partir da seguinte funccedilatildeo objetivo (FO)

퐹푂 =1푁

푠 minus 푠푠

(7 ndash 1)

Contudo a equaccedilatildeo (7 ndash 1) natildeo eacute a melhor definiccedilatildeo de funccedilatildeo objetivo neste caso

pois a derivada da curva de solubilidade eacute razoavelmente grande nos dois lados do

ponto isoeleacutetrico e isso permite que pequenos desvios na direccedilatildeo horizontal

resultem em um grande aumento no valor da funccedilatildeo objetivo Uma soluccedilatildeo possiacutevel

seria substituir essa funccedilatildeo objetivo por uma funccedilatildeo definida pela soma do quadrado

da distacircncia do ponto experimental agrave curva do modelo principalmente se fosse

necessaacuterio calcular algum paracircmetro do modelo via otimizaccedilatildeo da funccedilatildeo objetivo

estipulada Natildeo sendo este o escopo deste trabalho optou-se pelo uso da FO

definida na equaccedilatildeo (7 ndash 1)

71 Solubilidade da Insulina Suiacutena

As Figuras 711 712 e 713 apresentam os graacuteficos da curva de solubilidade

dada pelos pontos experimentais pelo modelo proposto pela abordagem claacutessica e

tambeacutem a curva obtida pela soluccedilatildeo paraboacutelica da Equaccedilatildeo de Linderstroslashm-Lang e

Groumlnwall em trecircs temperaturas distintas

32 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 711 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 25 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

Figura 712 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 15 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

00

40

80

120

160

200

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

00

50

100

150

200

250

300

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

33 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 713 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 5 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

Os desvios da curva obtida pelo modelo proposto para valores de pH distantes do pI

podem ser explicados por ao menos trecircs importantes motivos dois devidos a

hipoacuteteses do modelo e um devido a fenocircmenos intriacutensecos a proteiacutena Sabendo que

no pI a solubilidade eacute miacutenima para valores de pH distantes do pI pode-se ter

solubilidades suficientemente grandes para que a validade da lei de Henry ndash adotada

na formulaccedilatildeo do modelo - seja questionada pois quanto mais distante do pI maior

a solubilidade e menor a validade da lei de Henry jaacute que haacute um aumento da

concentraccedilatildeo do soluto (proteiacutena) na soluccedilatildeo e tambeacutem ao fato do modelo prever

solubilidade infinita quando a fraccedilatildeo de moleacuteculas eletricamente neutras tende a

zero

limrarr푠 = lim

rarr

Φ(푝퐼)푠 (푝퐼)Φ(푝퐻) = +infin

(711 ndash 1)

00

50

100

150

200

250

300

350

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

34 7 Aplicaccedilatildeo dos Modelos Expostos

Todavia ainda haacute um fator de ordem natural que justifica o desvio apresentado para

valores de pH distantes do pI o desnovelamento da cadeia proteacuteica Este fenocircmeno

pode ocorrer de maneira a expor grupos hidroacutefobos resiacuteduos antes natildeo expostos

acrescentando relaccedilotildees de equiliacutebrio quiacutemico natildeo existentes na regiatildeo do pI

alterando o equiliacutebrio de fases e portanto alterando o valor da solubilidade

A Tabela 711 apresenta os valores obtidos para a funccedilatildeo objetivo definida em (7 ndash

1) tanto para o modelo proposto quanto para a abordagem claacutessica para trecircs

diferentes temperaturas

Tabela 711 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada

abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para insulina

suiacutena

T ordmC Abordagem FO

25 P 01857 C 02535

15 P 01981 C 05056

5 P 03595 C 03064

Observando-se a Tabela 711 vecirc-se que o modelo apresentou melhores resultados

do que o caacutelculo efetuado atraveacutes da abordagem claacutessica no que tange a

minimizaccedilatildeo da funccedilatildeo objetivo exceto para os dados a 5 ordmC

Tambeacutem eacute possiacutevel observar que a funccedilatildeo objetivo sofreu aumento com a

diminuiccedilatildeo da temperatura Isto ocorreu principalmente devido agrave dificuldade de

obter dados experimentais de solubilidade a temperaturas baixas o que aumenta o

desvio experimental fazendo com que se tenha um aumento do valor da funccedilatildeo

objetivo como a definida em (5 ndash 1) Um efeito secundaacuterio que tambeacutem pressiona a

35 7 Aplicaccedilatildeo dos Modelos Expostos

funccedilatildeo objetivo eacute o fato dos dados de pKA terem sido obtidos a uma temperatura

especiacutefica o que tende a acrescentar erro no caacutelculo de solubilidades a temperaturas

diferentes ainda que o pKA natildeo varie de forma ab-rupta com a temperatura

Outra observaccedilatildeo que deve ser registrada eacute o fato da funccedilatildeo objetivo para a

abordagem claacutessica na temperatura de 15 ordmC divergir a um valor tatildeo elevado em

relaccedilatildeo aos demais Isto se deve a um ponto experimental especiacutefico a um pH de

45 a solubilidade da insulina suiacutena obtida experimentalmente eacute 230 x 10-5 mol kg-1

enquanto a calculada pelo modelo proposto eacute 230 x 10-5 mol kg-1 e a calculada pela

abordagem claacutessica eacute 520 x 10-5 mol kg-1 Por conta do desvio deste ponto a funccedilatildeo

objetivo para a abordagem claacutessica nesta temperatura tem um aumento significativo

A Tabela 712 apresenta os valores do paracircmetro K da soluccedilatildeo paraboacutelica obtidos

neste trabalho para a insulina suiacutena comparados ao encontrado na literatura

Tabela 712 ndash Valores do paracircmetro K da soluccedilatildeo paraboacutelica para a insulina suiacutena

Referecircncias T ordmC K Fredericq e Neurath (1950) - 081 Neste trabalho 25 104 Neste trabalho 15 101 Neste trabalho 5 145

Pela Tabela 712 pode-se observar que haacute uma diferenccedila pequena entre os

valores do paracircmetro K obtidos neste trabalho e por Fredericq e Neurath (1950) Por

isso natildeo se pode afirmar a que se deve esta diferenccedila se eacute devido a diferenccedilas entre

procedimentos experimentais ou se eacute devido agrave diferenccedila de meacutetodo de caacutelculo do

paracircmetro Apesar de no experimento realizado por Fredericq e Neurath (1950)

haver a presenccedila do acircnion tiocianato e este acircnion interagir com grupos ionizaacuteveis

da cadeia proteacuteica como observado pelos autores do trabalho tambeacutem estes

36 7 Aplicaccedilatildeo dos Modelos Expostos

proacuteprios autores afirmam que a presenccedila deste acircnion natildeo altera a forma da curva

que eacute basicamente determinada pelo paracircmetro K De qualquer modo eacute interessante

observar a proximidade dos valores encontrados neste trabalho com o obtido por

Fredericq e Neurath (1950) pelo menos no que diz respeito agrave ordem de grandeza do

paracircmetro em questatildeo

72 Solubilidade da Lisozima de clara de ovo de galinha

Um modelo para ser validado necessita correlacionar dados experimentais de modo

satisfatoacuterio ou seja um modelo deve buscar fidelidade ao fenocircmeno fiacutesico

observado Assim na procura de dados de solubilidade de proteiacutenas poucos dados

na regiatildeo do pI foram encontrados Este eacute o caso da lisozima de clara de ovo de

galinha que apesar de ter muitos estudos de solubilidade nenhum deles se

encontra na regiatildeo do pI Surgiu assim a necessidade de se obter estes dados

experimentais para poder validar o modelo proposto A escolha da lisozima de clara

de ovo de galinha se deu em parte pela sua importacircncia mas tambeacutem em parte por

ter os valores de pKA conhecidos

A curva de solubilidade da lisozima de clara de ovo de galinha levantada neste

trabalho estaacute apresentada na Figura 721

37 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em

soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e

dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()

Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento

esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH

isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de

soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se

comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto

isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da

soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos

ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente

neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a

solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e

00

10

20

30

40

50

60

70

80

90

100

95 100 105 110 115 120

Solu

bilid

ade

(mg

mL)

pH

38 7 Aplicaccedilatildeo dos Modelos Expostos

alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado

em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo

Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo

a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo

Por conta de falta de dados a este respeito modelou-se apenas a curva de

solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura

722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de

galinha em funccedilatildeo do pH da soluccedilatildeo

Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)

00

10

20

30

40

50

60

70

80

90

96 99 102 105 108 111 114 117 120

Solu

bilid

ade

(mg

mL)

pH

39 7 Aplicaccedilatildeo dos Modelos Expostos

O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721

Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada

abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima

de clara de ovo de galinha

T ordmC Abordagem FO

25 P 4650 C gt7919a

a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado

Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta

aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a

abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca

de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos

anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao

efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de

clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a

variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A

proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de

cargas pontuais de Debye-Huumlckel

8 Conclusotildees

A modelagem termodinacircmica proposta neste trabalho apresentou expressivos

resultados quando comparada a abordagem claacutessica de Debye-Huumlckel

Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o

modelo aproximou melhor os pontos experimentais do que a referida abordagem

comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima

ao ponto isoeleacutetrico

Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica

para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua

construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo

lugar por sua aplicabilidade

Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis

da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva

em regiotildees distantes do ponto isoeleacutetrico

9 Referecircncias Bibliograacuteficas

BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene

Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects

Biophys J 95 1285-1294 2008

FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and

other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72

2684 - 26911950

GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v

93 p 517-542 1931

GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab

Carlsberg v 24 p 185-200 1941

KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native

and mutant insulins pK perturbation of B13-Glu in aggregated species Arch

Biochem Biophys v 283 p 496-502 1990

KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for

the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng

Chem Res v 35 p 4319-4327 1996

42 9 Referecircncias Bibliograacuteficas

KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen

lysozyme J Biochem v 87 p 1215-1219 1980

LADISCH M R Bioseparations Engineering principles practice and

economics John Wiley amp Sons 2001 pp1 116 ndash 117 133

LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab

Carlsberg v 15 p 1-29 1924

PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da

particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas

2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP

PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the

excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte

solutions Fluid Phase Equilib v 269 p 25ndash35 2008

PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-

contribution model involving phase and chemical equilibrium Ind Eng Chem Res

v 33 p 1341-1347 1994

PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277

1973

PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino

acids Fluid Phase Equilib v 152 p 121-132 1998

43 9 Referecircncias Bibliograacuteficas

PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular

Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999

SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of

equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte

solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009

TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J

R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with

carbon dioxide Biotech Bioeng v103 p 909-919 2009

TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer

free energy Biophys J v 95 p 2601-2609 2008

TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in

water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95

2009

Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na

cadeia proteacuteica

Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo

de ionizaccedilatildeo

퐻퐴 퐴 + 퐻

(A ndash 1)

Assim considerando que a constante de equiliacutebrio

퐾 = 푎

(A ndash 2)

Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que

퐾 =[퐴 ][퐻 ]

[퐻퐴]

(A ndash 3)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que

log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]

(A ndash 4)

Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado

por

minus log[휑] = 푝휑

(A ndash 5)

Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que

45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

푝퐾 = log[퐻퐴][퐴 ] + 푝퐻

(A ndash 6)

Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por

훼 =[퐴 ]

[퐻퐴] + [퐴 ]

(A ndash 7)

Reescrevendo (A ndash 7) tem-se que

훼 =[퐴 ] [퐻퐴frasl ]

1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =

훼1 minus 훼

(A ndash 8)

Substituindo (A ndash 8) em (A ndash 6) tem-se que

푝퐾 = log훼

1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10

(A ndash 9)

Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos

훼 =1

1 + 10

(A ndash 10)

Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio

퐴 + 퐻 퐻퐴

(A ndash 11)

Pode se escrever a constante de equiliacutebrio como

퐾 =[퐻퐴 ]

[퐴][퐻 ]

(A ndash 12)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que

46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

log퐾 = minus log[퐴]

[퐻퐴 ] minus log[퐻 ]

(A -13)

Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por

훼 =[퐻퐴 ]

[퐴] + [퐻퐴 ]

(A ndash 14)

Assim a equaccedilatildeo (A ndash 13) fica

훼1 minus 훼 = 10

(A ndash 15)

Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo

훼 =10

1 + 10

(A ndash 16)

Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos

modelos expostos

Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]

48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]

49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)

50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])

51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]

52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])

53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)

54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2

55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO

3 1 Introduccedilatildeo

poliacutemeros com muitas unidades monomeacutericas eletroliacuteticas ndash neste caso

aminoaacutecidos que possuem grupos ionizaacuteveis natildeo ligados

Para muitos processos industriais e mesmo naturais informaccedilotildees a respeito de

equiliacutebrios de fases de soluccedilotildees eletroliacuteticas satildeo necessaacuterias e necessaacuterias tambeacutem

satildeo modificaccedilotildees nos modelos tradicionais de coeficiente de atividade quando se

trata de descrever equiliacutebrios de fases em sistemas que conteacutem eletroacutelitos (Prausnitz

et al 1999)

Sendo assim tendo que a pressatildeo do sistema natildeo influencia de modo significativo o

ESL tem-se que trecircs variaacuteveis o influenciam diretamente a temperatura o pH e a

forccedila iocircnica estas duas uacuteltimas tornam-se importantes devido agrave caracteriacutestica

eletroliacutetica das proteiacutenas

Na verdade a forccedila iocircnica natildeo eacute uma variaacutevel que represente de modo abrangente

os possiacuteveis efeitos de iacuteons em soluccedilotildees proteacuteicas Isto se deve ao fato de que a

forccedila iocircnica do modo como eacute definida natildeo contempla uma diferenciaccedilatildeo entre os

equiliacutebrios que se estabelecem entre os iacuteons e alguns resiacuteduos ionizaacuteveis da cadeia

proteacuteica De fato a variaccedilatildeo da forccedila iocircnica de uma soluccedilatildeo proteacuteica altera o valor

da solubilidade da proteiacutena em soluccedilatildeo mas natildeo da mesma forma para qualquer

espeacutecie de iacuteon Portanto seria mais prudente acrescer ao conjunto de variaacuteveis que

influenciam o ESL a espeacutecie quiacutemica dos iacuteons presentes em soluccedilatildeo

O objetivo deste trabalho eacute estabelecer um modelo capaz de prever a influecircncia do

pH no ESL de proteiacutenas mantendo-se temperatura e forccedila iocircnica constantes

Sabe-se por observaccedilotildees experimentais que a variaccedilatildeo do pH de um sistema altera

o valor da solubilidade de proteiacutenas em soluccedilatildeo e a solubilidade de proteiacutenas por

sua vez atinge seu valor miacutenimo em um pH denominado ponto isoeleacutetrico (pI) no

qual a carga liacutequida da proteiacutena eacute nula

4 1 Introduccedilatildeo

Os primeiros trabalhos relacionados agrave modelagem da curva de solubilidade de

proteiacutenas em funccedilatildeo do pH datam do iniacutecio do seacuteculo XX Green (1931) propocircs um

modelo para a curva de solubilidade da carboxihemoglobina equumlina considerando

que esta proteiacutena se comportaria tanto como um aacutecido bivalente quanto uma base

bivalente Jaacute Groumlnwall (1941) atribuiu a Linderstroslashm-Lang o desenvolvimento de um

modelo capaz de predizer a curva de solubilidade a partir da integraccedilatildeo do perfil de

carga da proteiacutena Este trabalho de Groumlnwall apesar de esquecido pelo tempo eacute de

extrema importacircncia e relevacircncia tanto para o trabalho aqui apresentado quanto e

aqui um motivo muito mais nobre para o desenvolvimento de modelos a partir das

ferramentas da termodinacircmica claacutessica Quando da exposiccedilatildeo da modelagem aqui

tratada retornar-se-aacute a este trabalho que muito contribuiu ao entendimento do

fenocircmeno estudado

Eacute digno de nota o trabalho de Fredericq e Neurath (1950) no qual uma proposta de

equacionamento para uma correlaccedilatildeo semi-empiacuterica da curva de solubilidade de

insulina eacute apresentada Natildeo haacute de fato algo novo em relaccedilatildeo agrave modelagem do

efeito do pH na curva de solubilidade neste trabalho no entanto apesar de natildeo

haver qualquer menccedilatildeo ou referecircncia quanto agrave origem da equaccedilatildeo proposta nota-se

que eacute uma aplicaccedilatildeo direta da equaccedilatildeo descrita por Groumlnwall (1941) Haacute uma

hipoacutetese impliacutecita no trabalho de que o perfil de carga liacutequida da insulina seja linear

na regiatildeo do ponto isoeleacutetrico o que eacute bastante plausiacutevel para muitas proteiacutenas

Assim pela integraccedilatildeo da equaccedilatildeo diferencial proposta por Groumlwall (1941) uma

correlaccedilatildeo semi-empiacuterica quadraacutetica eacute obtida Reforccedila-se o uso da expressatildeo semi-

empiacuterica devido agrave natureza dual da equaccedilatildeo em parte advinda de um

desenvolvimento teoacuterico descrito por Groumlnwall (1941) e atribuiacutedo a Linderstroslashm-

Lang e em parte pela necessidade de se obter paracircmetros a partir de um ajuste de

5 1 Introduccedilatildeo

um conjunto de dados experimentais Vale observar que resultados expressivos

foram alcanccedilados neste trabalho de modo particular o fato de que a presenccedila do

acircnion tiocianato natildeo altera a forma da curva de solubilidade da insulina mas a

desloca em direccedilatildeo a menores valores de pH e de solubilidade

Contudo os trabalhos mais recentes se concentraram na modelagem da curva de

solubilidade de aminoaacutecidos em funccedilatildeo do pH dando maior enfoque aos modelos

termodinacircmicos para soluccedilotildees natildeo-ideais tanto atraveacutes de equaccedilotildees de estado

como de modelos de energia livre de Gibbs excedente

Destaca-se neste grupo o trabalho de Pinho et al (1994) que aplicaram o modelo

UNIFAC associado ao termo de Debye-Huumlckel para aminoaacutecidos como glicina D-

alanina L-serina e DL-valina Tambeacutem o trabalho de Khoshkbarchi e Vera (1996)

no qual foi desenvolvido um modelo simplificado de esfera riacutegida perturbada para

calcular o coeficiente de atividade de aminoaacutecidos e de peptiacutedeos permite prever a

curva de solubilidade destes em funccedilatildeo do pH Jaacute o modelo NRTL foi aplicado tanto

por Pradhan e Vera (1998) quanto Tseng et al (2009) para aminoaacutecidos Jaacute Seyfi et

al (2009) aplicaram a equaccedilatildeo de estado SAFT para a prediccedilatildeo da curva de

solubilidade da DL-metionina

Entretanto o primeiro trabalho dedicado exclusivamente agrave modelagem e prediccedilatildeo da

curva de solubilidade de proteiacutena propriamente dita em funccedilatildeo do pH foi publicado

por Tjong e Zhou (2008) Neste trabalho a solubilidade foi calculada a partir da

energia livre de transferecircncia da fase soacutelida para a fase liacutequida Para a execuccedilatildeo

deste caacutelculo a energia livre de transferecircncia foi dividida em duas contribuiccedilotildees

uma de natureza eletrostaacutetica calculada pela meacutedia de 100 conformaccedilotildees proteacuteicas

advindas da aplicaccedilatildeo de dinacircmica molecular a pH constante e outra de natureza

natildeo-eletrostaacutetica baseada na aacuterea superficial acessiacutevel ao solvente Poreacutem o

6 1 Introduccedilatildeo

esforccedilo computacional requerido pelo modelo por eles proposto para calcular

apenas alguns pontos da curva natildeo apresenta uma aplicabilidade razoaacutevel Aleacutem

deste trabalho Tashima et al (2009) propuseram uma modelagem termodinacircmica

para prever a curva de solubilidade especificamente da insulina suiacutena aplicando o

modelo de Pitzer truncado apoacutes o segundo coeficiente do virial

No presente trabalho propomos um novo modelo baseado no caacutelculo de estados de

ionizaccedilatildeo e em ferramentas de termodinacircmica claacutessica bem como uma extensatildeo agrave

teoria de Linderstroslashm-Lang e Groumlnwall Vale ressaltar de antematildeo que tanto este

novo modelo proposto quanto a extensatildeo desenvolvida resultam na mesma equaccedilatildeo

para o fenocircmeno apesar das distintas abordagens

2 Materiais e Meacutetodos

21 Meacutetodos computacionais

O coacutedigo-fonte do programa em linguagem C estaacute apresentado no Apecircndice B Os

meacutetodos numeacutericos utilizados se resumem a interpolaccedilatildeo linear o meacutetodo de

Newton-Raphson cujo uso seraacute apresentado na proacutexima seccedilatildeo quando se deduziraacute

o algoritmo do modelo de Debye-Huumlckel e o meacutetodo de busca unidirecional de

miacutenimos de funccedilatildeo pela Seccedilatildeo Aacuteurea

As Tabelas 211 e 212 apresentam os resiacuteduos considerados para cada proteiacutena

considerada bem como os seus valores de pKA que foram obtidos a partir da

literatura e satildeo indispensaacuteveis para execuccedilatildeo dos caacutelculos mais rigorosos

Tabela 211 ndash Resiacuteduos ionizaacuteveis considerados e valores de pKA da insulina suiacutena

Valores extraiacutedos de Kaarsholm et al (1990)

Aminoaacutecido Grupo Ionizaacutevel pKA

A1 ndash Gly -NH2 738 A4 ndash Glu -COOH 437 A14 ndash Tyr Fenol-OH 1020 A17 ndash Glu -COOH 437 A19 ndash Tyr Fenol-OH 1020 A21 ndash Asn -COOH 345

B1 ndash Phe -NH2 738 B5 ndash His Imidazol-NH 598 B10 ndash His Imidazol-NH 598 B 13 ndash Glu -COOH 437 B16 ndash Tyr Fenol-OH 1020 B21 ndash Glu -COOH 437

B22 ndash Arg Guaniacutedio-NH2 1110 B26 ndash Tyr Fenol-OH 1020

B29 ndash Lys -NH2 852 B30 ndashAla -COOH 345

8 2 Materiais e Meacutetodos

Tabela 212 ndash Resiacuteduos ionizaacuteveis considerados e valores de pKA a 25 ordmC da lisozima

de clara de ovo de galinha Valores extraiacutedos de Kuramitsu e Hamaguchi (1980)

Aminoaacutecido Grupo Ionizaacutevel pKA α-NH2 α-NH2 79

Lys1 ε-NH2 108

Arg5 Guaniacutedio-NH2 120 Glu7 -COOH 26

Lys13 ε-NH2 105

Arg14 Guaniacutedio-NH2 120 His15 Imidazol-NH 58 Asp18 -COOH 20 Tyr20 Fenol-OH 103

Arg21 Guaniacutedio-NH2 120 Tyr23 Fenol-OH 98

Lys33 ε-NH2 106 Glu35 -COOH 61

Arg45 Guaniacutedio-NH2 120 Asp48 -COOH 43 Asp52 -COOH 34 Tyr53 Fenol-OH 121

Arg61 Guaniacutedio-NH2 120 Asp66 -COOH 16

Arg68 Guaniacutedio-NH2 120

Arg73 Guaniacutedio-NH2 120 Asp87 -COOH 21

Lys96 ε-NH2 108

Lys97 ε-NH2 103 Asp101 -COOH 45

Arg112 Guaniacutedio-NH2 120

Arg114 Guaniacutedio-NH2 120

Lys116 ε-NH2 104 Asp119 -COOH 25

Arg125 Guaniacutedio-NH2 120

Arg128 Guaniacutedio-NH2 120 α-COOH α-COOH 31

9 2 Materiais e Meacutetodos

22 Curva de solubilidade da lisozima da clara de ovo de galinha

221 Reagentes

Neste experimento de determinaccedilatildeo da curva de solubilidade da lisozima da clara de

ovo de galinha os reagentes utilizados foram cloreto de soacutedio (Reatec P A)

bicarbonato de soacutedio (Research Becto Chemical P A) Na2HPO4 7H2O (Reagen

P A) aacutegua destilada deionizada Milli-Q (Millipore) e lisozima de clara de ovo de

galinha (Sigma min 99)

222 Equipamentos

Neste experimento os equipamentos utilizados foram espectrofotocircmetro UV-Visiacutevel

(Beckman DU-530) centriacutefuga (Eppendorf) banho-teacutermico (Laacutectea) com controlador

de temperatura (Julabo) pHmetro (Micronal) e balanccedila (Mettler Toledo AB204S)

223 Preparaccedilatildeo das soluccedilotildees-tampatildeo

Foram preparadas soluccedilotildees-tampatildeo com valores de pH=96 pH = 98 pH = 100

pH = 102 pH = 104 pH = 106 pH = 108 pH = 110 pH = 112 pH = 114 pH =

116 e pH = 118 a partir de quatro soluccedilotildees uma de hidroacutexido de soacutedio 01 M uma

de cloreto de soacutedio 1 M (para equalizar a forccedila iocircnica) uma de bicarbonato de soacutedio

005 M e outra de Na2HPO4 005 M

A Tabela 2231 apresenta os valores de volume usados no preparo de cada uma

das soluccedilotildees-tampatildeo

10 2 Materiais e Meacutetodos

Tabela 2231 ndash Volumes de hidroacutexido de soacutedio a 01 M adicionados no preparo das

soluccedilotildees-tampatildeo

Tampatildeo pH V NaOH mL

NaHCO3 96 100 005 M 98 152

(para cada soluccedilatildeo-tampatildeo 100 mL 100 214

desta soluccedilatildeo foram adicionados) 102 276

104 330 106 382

108 424

110 454

112 530 114 583

Na2HPO4 110 82

005 M 112 126

(para cada soluccedilatildeo-tampatildeo 100 mL 114 182 desta soluccedilatildeo foram adicionados) 116 270

118 388

224 Procedimento experimental

Foram adicionadas quantidades natildeo definidas de lisozima de clara de ovo de galinha

a 13 mL de cada soluccedilatildeo-tampatildeo em tubos Eppendorf de 2 mL Colocaram-se

entatildeo as amostras apoacutes agitaccedilatildeo vigorosa em banho teacutermico a 250 plusmn 01 ordmC por 24

horas para que os sistemas atingissem o equiliacutebrio termodinacircmico Caso natildeo

houvesse a formaccedilatildeo de precipitado lisozima era adicionada e o procedimento

repetido Ao se observar a formaccedilatildeo de precipitado o sistema era centrifugado a

13000 rpm por 15 minutos Uma aliacutequota do sobrenadante era retirada e sua

concentraccedilatildeo proteacuteica determinada por medida de absorbacircncia a 280 nm Cada

sistema foi feito ao menos em duplicata

3 Modelo Estendido de Debye-Huumlckel

31 Introduccedilatildeo

De fato como descrito por Pessocirca Filho (2002) a equaccedilatildeo de Debye-Huumlckel natildeo

deve ser aplicada agrave modelagem de polieletroacutelitos tais como proteiacutenas porque nestas

moleacuteculas as cargas satildeo distribuiacutedas ao longo da cadeia e portanto natildeo satildeo cargas

pontuais como suposto por Debye-Huumlckel

Contudo nesta modelagem considera-se uma regiatildeo de pH em torno do ponto

isoeleacutetrico (pI) na qual satildeo inerentes duas condiccedilotildees favoraacuteveis a aplicaccedilatildeo da

equaccedilatildeo de Debye-Huumlckel carga liacutequida proacutexima a zero pois Z(pI) = 0 e regiatildeo de

miacutenima solubilidade que significa baixas concentraccedilotildees de proteiacutenas em soluccedilatildeo

Isto significa em primeiro lugar que os efeitos da carga tais como ldquodesnovelamentordquo

da cadeia proteacuteica com exposiccedilatildeo de resiacuteduos outrora blindados podem ser

desprezados em uma regiatildeo proacutexima ao ponto isoeleacutetrico e em segundo lugar

baixas concentraccedilotildees de proteiacutena em soluccedilatildeo significam que os termos de curto

alcance podem ser desprezados e portanto haacute prevalecircncia do termo de longo

alcance que no caso de soluccedilotildees eletroliacuteticas pode ser descrito por uma equaccedilatildeo

estendida de Debye-Huumlckel

Assim o modelo de Debye-Huumlckel foi utilizado natildeo para verificar sua aplicabilidade agrave

modelagem de soluccedilotildees proteacuteicas mas sim para confrontar o modelo proposto com

um modelo usual em modelagem de soluccedilotildees eletroliacuteticas e seraacute referido no texto

sempre como abordagem claacutessica

12 3 Modelo Estendido de Debye-Huumlckel

32 Desenvolvimento teoacuterico

Pode-se escrever a atividade da proteiacutena como o produto entre a solubilidade e o

coeficiente de atividade da mesma como mostrado na equaccedilatildeo (32 - 1)

푎 = 훾푠

(32 - 1)

Na qual pode-se calcular o coeficiente de atividade atraveacutes da equaccedilatildeo estendida

de Debye-Huumlckel (Pitzer 1973)

ln 훾 = minus퐴 푍radic퐼

1 + 푏radic퐼+

2푏

ln 1 + 푏radic퐼

(32 - 2)

Sendo que a constante universal empiacuterica b = 12 kg12 mol-12 eacute usada para todos os

eletroacutelitos Jaacute AΦ eacute o paracircmetro de Debye-Huumlckel para o coeficiente osmoacutetico e eacute

dado por

퐴 =13

(2휋푁 휌 ) frasl 푒4휋휀 휀 푘푇

frasl

(32 - 3)

Em que NA eacute a constante de Avogadro ρs eacute a densidade do solvente em g cm-3 e eacute

a carga eletrocircnica (e = 160218 x 10-19 C) ε0 eacute a permissividade do espaccedilo livre (ε0 =

885419 x 10-12 C2 N-1 m-2) εr eacute a constante dieleacutetrica do solvente k aacute constante de

Boltzmann e T eacute a temperatura absoluta Jaacute a carga liacutequida em funccedilatildeo do pH pode

ser calculada como

푍 = 훼 minus 훼

(32 - 4)

Sendo que α+ e α- satildeo dados pelas equaccedilotildees (A - 10) e (A - 16) do Apecircndice A

13 3 Modelo Estendido de Debye-Huumlckel

E a forccedila iocircnica eacute dada pela equaccedilatildeo (32 - 5) descrita abaixo

퐼 = 12

푚 푍

(32 - 5)

Contudo no ponto isoeleacutetrico a carga meacutedia da proteiacutena eacute nula portanto o termo de

Debye-Huumlckel se anula e o coeficiente de atividade se torna unitaacuterio

ln푎 (푝퐼) = ln 푠 (푝퐼)

(32 - 6)

Considerando que a atividade da proteiacutena seja constante com a variaccedilatildeo de pH isto

implica que esta eacute sempre igual agrave solubilidade da proteiacutena no ponto isoeleacutetrico e

portanto vale que

ln푎 (푝퐻) = ln 푠 (푝퐻) + ln 훾(푝퐻) = ln 푠 (푝퐼)

(32 - 7)

Assim

ln 푠 (푝퐻) = ln 푠 (푝퐼) + 퐴휙푍푝퐻2 radic퐼1 + 푏radic퐼

+2푏

ln 1 + 푏radic퐼

(32 - 8)

Esta equaccedilatildeo prevecirc a curva de solubilidade em funccedilatildeo do pH atraveacutes do caacutelculo da

atividade da proteiacutena na fase liacutequida pela equaccedilatildeo estendida de Debye-Huumlckel Para

resolvecirc-la eacute necessaacuterio se utilizar de um meacutetodo numeacuterico pois a forccedila iocircnica

depende da solubilidade naquele pH Optou-se neste trabalho pelo Meacutetodo de

Newton-Raphson para executar o meacutetodo iterativo que eacute exigido pela equaccedilatildeo (32

ndash 8) Para aplicar este meacutetodo arbitrou-se uma funccedilatildeo f(sp) definida aqui como

푓 푠 = minus ln 푠 (푝퐻) + ln 푠 (푝퐼) + 퐴휙푍푝퐻2 radic퐼

1 + 푏radic퐼+

2푏

ln 1 + 푏radic퐼

(32 - 9)

14 3 Modelo Estendido de Debye-Huumlckel

Assim ao calcular o sp que zera esta funccedilatildeo f(sp) saber-se-aacute que eacute a proacutepria

solubilidade que se deseja calcular Para aplicar o Meacutetodo de Newton-Raphson

basta derivar a funccedilatildeo f(sp) e aplicar o seguinte algoritmo de resoluccedilatildeo

푠 = 푠 minus푓(푠 )푓 (푠 )

(32 - 10)

Para calcular frsquo(s) deve-se considerar que a forccedila iocircnica depende da solubilidade

Para isto observando a equaccedilatildeo (32 - 5) vecirc-se que a forccedila iocircnica eacute dada pelo

somatoacuterio das contribuiccedilotildees de todos os iacuteons presentes na soluccedilatildeo por isso aqui

cabe um artifiacutecio de dividir estas contribuiccedilotildees em duas macro-contribuiccedilotildees aquela

devida a todos os iacuteons presentes na soluccedilatildeo exclusive os grupos ionizaacuteveis

presentes nas moleacuteculas da proteiacutena em questatildeo (I0) e que se considera constante

com o pH e aquela que engloba apenas os grupos ionizaacuteveis presentes nas

moleacuteculas da proteiacutena (IP)

퐼 = 퐼 + 퐼 = 퐼 +12푍 푠

(32 - 11)

Considerando a funccedilatildeo w tal que

푤 = radic퐼 = 퐼 +12푍 푠

(32 - 12)

Sendo

푤 =14푍 퐼

(32 - 13)

Entatildeo aplicando-se as devidas regras de derivaccedilatildeo tem-se

15 3 Modelo Estendido de Debye-Huumlckel

푓 (푠 ) = minus1푠 + 퐴 푍

3푤 + 2푤 푏푤(1 + 푏푤)

(32 - 14)

Substituindo as equaccedilotildees (32 - 12) e (32 - 13) na equaccedilatildeo (32 - 14) tem-se que

푓 (푠 ) = minus1푠 + 퐴 푍

15 + 푏radic퐼2radic퐼(1 + 푏radic퐼)

(32 - 15)

Entatildeo o algoritmo deve ser

푠 = 푠 minus

⎜⎛ln 푠 (푝퐼)

푠 + 퐴휙푍푝퐻2 radic퐼

1 + 푏radic퐼+ 2푏 ln 1 + 푏radic퐼

minus 1푠 + 퐴휙푍

15 + 푏radic퐼2radic퐼(1 + 푏radic퐼) ⎠

⎟⎞

(32 - 16)

4 Modelagem Termodinacircmica Proposta

41 Introduccedilatildeo

A condiccedilatildeo de equiliacutebrio entre duas fases (α e β) com m componentes eacute dada por

(Prausnitz et al 1999)

푝 = 푝

(41 ndash 1)

푇 = 푇

(41 ndash 2)

휇 = 휇⋮

휇 = 휇

(41 ndash 3)

Considerando o equiliacutebrio soacutelido-liacutequido (ESL) de sistemas contendo proteiacutenas

sendo que os efeitos da pressatildeo podem ser desprezados que as temperaturas nas

duas fases satildeo iguais e que na fase soacutelida soacute haacute proteiacutena tem-se que para a

proteiacutena a relaccedilatildeo de equiliacutebrio pode ser descrita por

휇 (푇푥) = 휇 (푇)

(41 ndash 4)

Contudo adotando-se a lei de Henry que eacute vaacutelida para baixas concentraccedilotildees de

soluto hipoacutetese que natildeo eacute distante dos valores observados da solubilidade de

proteiacutenas pode se escrever o potencial quiacutemico na fase liacutequida por

휇 (푇푥) = 휇 (푇 푥 ) + 푅푇푙푛푥

(41 ndash 5)

17 4 Modelagem Termodinacircmica Proposta

Entretanto variaccedilotildees de pH natildeo alteram o potencial quiacutemico da fase soacutelida o que

resulta pela relaccedilatildeo (41 ndash 4) que o mesmo natildeo altera tambeacutem o potencial quiacutemico

da fase liacutequida Com isso pela relaccedilatildeo (41 ndash 5) sendo o potencial quiacutemico de

referecircncia constante com o pH uma contradiccedilatildeo emerge a variaccedilatildeo do pH natildeo

poderia alterar o valor da solubilidade poreacutem a observaccedilatildeo experimental mostra o

contraacuterio Assim deve-se lembrar que pelo princiacutepio da eletroneutralidade a fase

soacutelida soacute possui moleacuteculas proteacuteicas eletricamente neutras e portanto o equiliacutebrio

de fases deve se estabelecer apenas entre as moleacuteculas presentes na fase soacutelida e

as moleacuteculas eletricamente neutras em soluccedilatildeo Ou seja como soacute moleacuteculas

eletricamente neutras podem estar na fase soacutelida o equiliacutebrio de fases depende

exclusivamente da fraccedilatildeo de moleacuteculas eletricamente neutras em soluccedilatildeo pois soacute

estas podem precipitar Assim tanto a equaccedilatildeo (41 ndash 4) quanto a equaccedilatildeo (41 ndash

5) devem ser aplicadas natildeo ao conjunto de todas as moleacuteculas de proteiacutena em

soluccedilatildeo mas somente as moleacuteculas proteacuteicas eletricamente neutras Portanto a

concentraccedilatildeo das moleacuteculas de proteiacutena eletricamente neutras em soluccedilatildeo eacute

constante com o pH e pode ser interpretada como a multiplicaccedilatildeo da fraccedilatildeo de

moleacuteculas eletricamente neutras pela concentraccedilatildeo total de proteiacutenas que eacute a

proacutepria solubilidade Assim uma relaccedilatildeo de inversa proporcionalidade eacute definida

quanto maior a fraccedilatildeo de moleacuteculas neutras menor seraacute a solubilidade de uma

proteiacutena em soluccedilatildeo Portanto no ponto isoeleacutetrico no qual haacute o miacutenimo de

solubilidade tem-se o ponto maacuteximo de fraccedilatildeo de moleacuteculas eletricamente neutras

A partir disto eacute possiacutevel escrever a equaccedilatildeo que rege o comportamento da

solubilidade de uma proteiacutena em funccedilatildeo do pH da soluccedilatildeo

휙(푝퐻)푆 (푝퐻) = 휆 = 푐표푛푠푡푎푛푡푒

(41 ndash 6)

18 4 Modelagem Termodinacircmica Proposta

Na equaccedilatildeo (41 ndash 6) o paracircmetro λ pode ser um paracircmetro de ajuste do modelo a

um conjunto de valores experimentais tendo se estabelecido uma funccedilatildeo objetivo ou

ainda dado pelo produto entre a solubilidade no ponto isoeleacutetrico e a fraccedilatildeo de

moleacuteculas eletricamente neutras em soluccedilatildeo tambeacutem no pI neste caso vale a

seguinte equaccedilatildeo

푠 (푝퐻) =휙(푝퐼)푠 (푝퐼)휙(푝퐻)

(41 ndash 7)

Sendo a equaccedilatildeo do modelo ndash equaccedilatildeo (41 ndash 7) ndash extremamente simples a uacutenica

dificuldade reside no caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras

(휙(푝퐻))

42 Caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras

Dentre os aminoaacutecidos que formam atraveacutes de ligaccedilotildees peptiacutedicas as proteiacutenas haacute

aqueles que possuem resiacuteduos com grupos ionizaacuteveis aleacutem dos grupos amina e

aacutecido carboxiacutelico terminais na cadeia Todos estes participam de equiliacutebrios

quiacutemicos com iacuteons H+ presentes na soluccedilatildeo entatildeo ao se alterar o pH da soluccedilatildeo

estes equiliacutebrios satildeo alterados

Assim haacute vaacuterias possibilidades de combinaccedilotildees de estados ionizados destes grupos

ionizaacuteveis que resultam em uma moleacutecula de proteiacutena eletricamente neutra Eacute

importante notar que dada a fraccedilatildeo de uma configuraccedilatildeo de uma moleacutecula neutra

todas as outras fraccedilotildees de configuraccedilotildees possiacuteveis que tambeacutem resultem em

moleacuteculas neutras satildeo proporcionais agrave fraccedilatildeo da configuraccedilatildeo dada pois todas as

configuraccedilotildees participam de equiliacutebrios entre si

19 4 Modelagem Termodinacircmica Proposta

Desta observaccedilatildeo implica-se que basta identificar uma configuraccedilatildeo proteacuteica cuja

soma dos estados ionizados resulte em carga nula para se descrever o equiliacutebrio de

fases em relaccedilatildeo ao pH na regiatildeo do ponto isoeleacutetrico onde esta consideraccedilatildeo eacute

predominante em relaccedilatildeo a outros possiacuteveis fenocircmenos

Contudo eacute necessaacuterio contabilizar a contribuiccedilatildeo de cada grupo ionizaacutevel via

equaccedilatildeo de Henderson-Hasselbach equaccedilatildeo (42 ndash 1)

훼 (푝퐻) =

⎩⎪⎨

⎪⎧ 10

1 + 10 푠푒 휈 = minus1

11 + 10

푠푒 휈 = +1

(42 ndash 1)

Na qual pKAj eacute o co-logaritmo da constante de equiliacutebrio do grupo ionizaacutevel do

resiacuteduo j j eacute estado carregado potencial do resiacuteduo j (-1 para grupos aacutecidos e +1

para grupos baacutesicos) e j eacute a fraccedilatildeo ionizada para o pH dado Para grupos cujo

estado de ionizaccedilatildeo na dada configuraccedilatildeo seja neutro a sua fraccedilatildeo eacute calculada tal

que a soma de sua fraccedilatildeo e da fraccedilatildeo ionizada tenha como resultado o valor

unitaacuterio

Assim a funccedilatildeo Pn pode ser escrita como o produto de cada fraccedilatildeo de cada grupo

ionizaacutevel j naquele estado (-1 0 ou +1) na configuraccedilatildeo neutra k em uma proteiacutena

com n grupos ionizaacuteveis Uma representaccedilatildeo matemaacutetica possiacutevel para esta funccedilatildeo

pode ser escrita como

휙 (푝퐻) = 훼 (푝퐻)

(42 ndash 2)

Na qual a fraccedilatildeo jrsquo(pH) eacute dada por

20 4 Modelagem Termodinacircmica Proposta

훼 (푝퐻) =훼 (푝퐻) 푠푒 휀 = 11 minus 훼 (푝퐻) 푠푒 휀 = 0

(42 ndash 3)

Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (42 ndash 3) e a resultante na equaccedilatildeo

(42 ndash 2) pode-se escrever que

휙 (푝퐻) =1

1 + 10

1 + 휈2 minus 휈 휀 10

minus휈 minus 1

2 minus 휈 휀 푐표푚 휀 = 0

(42 ndash 4)

A equaccedilatildeo (42 ndash 4) junto agrave equaccedilatildeo (41 ndash 7) constituem o modelo termodinacircmico

capaz de predizer a razatildeo entre as fraccedilotildees de moleacuteculas neutras de uma proteiacutena

em funccedilatildeo do pH na regiatildeo do ponto isoeleacutetrico mantendo fixas temperatura e forccedila

iocircnica Substituindo a equaccedilatildeo (42 ndash 4) na equaccedilatildeo (41 ndash 7) obteacutem-se para a

curva de solubilidade

푠 (푝퐻)푠 (푝퐼) =

1 + 101 + 10

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

푐표푚 휀 = 0

(42 ndash 8)

5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

51 Introduccedilatildeo

Segundo Groumlnwall (1941) na fase liacutequida haacute moleacuteculas de proteiacutenas com muitas

configuraccedilotildees k distintas que possuem carga liacutequida i e tambeacutem haacute certas

configuraccedilotildees que tem carga liacutequida nula e satildeo chamadas configuraccedilotildees neutras

Aleacutem disso estas uacuteltimas satildeo aquelas que determinam o equiliacutebrio de fases jaacute que

elas estatildeo em equiliacutebrio com a fase soacutelida na qual soacute haacute moleacuteculas neutras pelo

princiacutepio da eletroneutralidade Eacute tambeacutem afirmado que dado este equiliacutebrio a

atividade das moleacuteculas neutras natildeo se altera com a variaccedilatildeo do pH e eacute

proporcional agraves atividades de qualquer tipo de configuraccedilatildeo neutra

Neste mesmo trabalho eacute atribuiacuteda a Linderstroslashm-Lang o desenvolvimento de uma

teoria de prediccedilatildeo da solubilidade de proteiacutenas com a variaccedilatildeo do pH na regiatildeo do

ponto isoeleacutetrico Este desenvolvimento apresenta um balanccedilo de cargas de um

modo impliacutecito contudo como atestado por Groumlnwall o escasso conhecimento

sobre as estruturas proteacuteicas impediram agravequele tempo uma formulaccedilatildeo mais

pormenorizada do problema

52 Desenvolvimento teoacuterico

A base desta abordagem descrita por Groumlnwall e atribuiacuteda a Linderstroslashm-Lang

reside na hipoacutetese de que a moleacutecula de proteiacutena de configuraccedilatildeo k e carga nula

participa do seguinte equiliacutebrio com os iacuteons H+ e com sua forma de carga i

22 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

푃 + 푖퐻 푃 lowast

(52 ndash 1)

Note-se que o valor de i pode ser negativo A constante do equiliacutebrio quiacutemico

descrita pela equaccedilatildeo (52 ndash 1) pode ser expressa como

퐾 =푎

lowast

푎 푎

(52 ndash 2)

Sabendo que a atividade da moleacutecula de proteiacutena de configuraccedilatildeo k e carga i eacute dada

pelo produto entre sua concentraccedilatildeo e seu coeficiente de atividade tem-se que

푥lowast

= 푎 푎퐾훾

lowast

(52 ndash 3)

Entretanto a solubilidade da proteiacutena eacute soma das concentraccedilotildees de todas as

moleacuteculas de carga i Poreacutem a concentraccedilatildeo das moleacuteculas de carga i eacute a soma das

concentraccedilotildees das moleacuteculas de configuraccedilatildeo k Assim a solubilidade pode ser

escrita como

푠 (푝퐻) = 푎 푎퐾훾

lowast

(52 ndash 4)

Derivando a equaccedilatildeo (52 ndash 4) com respeito agrave atividade do iacuteon H+ considerando

que atividade da moleacutecula neutra eacute constante para qualquer configuraccedilatildeo k e ainda

que o coeficiente de atividade da proteiacutena de carga i independe da atividade do iacuteon

H+ tem-se que

푑푠푑푎 = 푖 ∙ 푎 푎

퐾훾

lowast

(52 ndash 5)

23 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

Sendo

푑 log 푠 (푝퐻)푑(푝퐻) = minus

푎푠 (푝퐻)

푑푠푑푎

(52 ndash 6)

Substituindo as equaccedilotildees (52 ndash 4) e (52 ndash 5) na equaccedilatildeo (52 ndash 6) e

reescrevendo em termos de pH e das concentraccedilotildees das proteiacutenas de carga i tem-

se que

푑 log 푠푑(푝퐻) = minus

sum (푖 ∙ 푥 )sum 푥

(52 ndash 7)

Contudo o termo do lado direito da equaccedilatildeo (52 ndash 7) estaacute associado ao conceito

de valecircncia meacutedia estabelecido por Linderstroslashm-Lang (1924)

횤 =sum (푖 ∙ 푥 )sum 푥

(52 ndash 8)

Os autores natildeo possuiacuteam um modo mais adequado de construir a curva de

solubilidade dada pela equaccedilatildeo (52 ndash 7) do que aproximar por uma funccedilatildeo linear o

perfil de carga liacutequida da proteiacutena obtido experimentalmente e integraacute-lo valendo-se

da analogia entre o conceito de carga liacutequida (Z) e de valecircncia meacutedia ( i ) Entretanto

hoje jaacute se tem uma descriccedilatildeo analiacutetica do perfil de carga liacutequida de proteiacutenas que

pode ser escrita como

푍(푝퐻) = 휈 훼

(52 ndash 9)

Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (52 ndash 9) e a resultante na equaccedilatildeo

(52 ndash 7) tem-se que

24 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

푑 log 푠푑(푝퐻) = minus

12

11 + 10

1 + 휈 + 휈 1 minus 휈 10

(52 ndash 10)

Integrando a equaccedilatildeo (52 ndash 10) de um ponto de referecircncia por exemplo do ponto

isoeleacutetrico (pI) ateacute um pH qualquer tem-se a seguinte relaccedilatildeo

푑 log 푠

( )

( )

= minus12

1

1 + 101 + 휈 + 휈 1 minus 휈 10 푑(푝퐻)

(52 ndash 11)

log푠 (푝퐻)푠 (푝퐼) = minus

12 1 + 휈

11 + 10

푑(푝퐻)

+ 휈 1 minus 휈10

1 + 10푑(푝퐻)

(52 ndash 12)

Fazendo a seguinte substituiccedilatildeo

푢 = 10 푡푎푙 푞푢푒 푑푢푢 = ln 10푑(푝퐻)

(52 ndash 13)

Tem-se que

log푠 (푝퐻)푠 (푝퐼) = minus

12

1 + 휈ln 10

1푢(1 + 푢) 푑푢 +

휈 1 minus 휈ln 10

1(1 + 푢) 푑푢

(52 ndash 14)

log푠 (푝퐻)푠 (푝퐼) = minus

12

1 + 휈ln 10

1푢 푑푢 minus

11 + 푢 푑푢 +

휈 1 minus 휈ln 10

1(1 + 푢) 푑푢

(52 ndash 15)

25 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐼) = minus

12 1 + 휈 log

1010

minus 휈 1 minus 휈 minus 1 + 휈 log1 + 101 + 10

(52 ndash 16)

Sendo

휈 1 minus 휈 minus 1 + 휈 = 휈 minus 휈 minus 1 minus 휈 = minus 1 + 휈 = minus2

(52 ndash 17)

Resultando em

log푠 (푝퐻)푠 (푝퐼) = log

1 + 101 + 10

minus1 + 휈

2 (푝퐻 minus 푝퐼)

(52 ndash 18)

Ainda eacute possiacutevel reescrever a equaccedilatildeo (52 ndash 18) como

log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log

1 + 101 + 10

(52 ndash 19)

Na qual n+ representa o nuacutemero de resiacuteduos ionizaacuteveis que na sua forma carregada

apresentam carga positiva A equaccedilatildeo (52 ndash 19) eacute uma expressatildeo analiacutetica que a

partir de dados da estrutura proteacuteica e de um dado de solubilidade permite predizer

a curva de solubilidade de uma dada proteiacutena em funccedilatildeo do pH na regiatildeo do ponto

isoeleacutetrico mantendo fixas a temperatura e a forccedila iocircnica do sistema

Eacute possiacutevel provar que as equaccedilotildees (42 ndash 8) e (52 ndash 19) satildeo idecircnticas - a prova

disso eacute descrita na seccedilatildeo 6 ndash e assim tem-se que apesar das distintas abordagens

a descriccedilatildeo do fenocircmeno eacute a mesma Note-se que um passo fundamental no

desenvolvimento da Equaccedilatildeo (52 ndash 5) eacute admitir que por hipoacutetese a atividade da

26 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

forma neutra natildeo depende do pH essa hipoacutetese tambeacutem eacute a base da equaccedilatildeo (41

ndash 7) Deve-se registrar o fato de que pelo melhor do nosso conhecimento esta eacute a

primeira vez que uma expressatildeo analiacutetica para o caacutelculo da solubilidade de

proteiacutenas em funccedilatildeo do pH eacute descrita mesmo no limite em que se considera vaacutelida

a lei de Henry

53 Soluccedilatildeo Paraboacutelica da Curva de Solubilidade

Tanto Groumlnwall (1941) quanto Fredericq e Neurath (1950) adotaram a hipoacutetese de

que os perfis de carga liacutequida da -lactoglobulina para um e da insulina para os

outros dois eram lineares na regiatildeo do ponto isoeleacutetrico Esta hipoacutetese eacute bastante

plausiacutevel e simplificadora principalmente a eacutepoca na qual estes trabalhos foram

desenvolvidos em que a estrutura proteacuteica bem como as constantes de ionizaccedilatildeo

dos resiacuteduos com grupos ionizaacuteveis era pouco conhecida De fato ainda hoje a falta

de dados das constantes de ionizaccedilatildeo na cadeia proteacuteica eacute o maior desafio no uso

do modelo rigoroso ndash equaccedilatildeo (52 ndash 18) Por isso o valor desta hipoacutetese de perfil

de carga liacutequida linear eacute notaacutevel

Supondo entatildeo que o perfil de carga seja linear eacute possiacutevel escrevecirc-lo como

푍(푝퐻) = minus퐴(푝퐻 minus 푝퐼) 푐표푚 퐴 gt 0

(53 ndash 1)

Substituindo (53 ndash 1) em (52 ndash 6)

푑 log 푠 (푝퐻)푑(푝퐻) = 퐴(푝퐻 minus 푝퐼)

(53 ndash 2)

Integrando (53 ndash 2) de um pH0 de referecircncia ateacute pH tem-se que

27 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐻 ) = 퐾[푝퐻 minus 2푝퐼(푝퐻 minus 푝퐻 ) minus 푝퐻 ] 푐표푚 퐾 =

퐴2

(53 ndash 3)

Ao se adotar como ponto de referecircncia o ponto isoeleacutetrico a equaccedilatildeo (53 ndash 3)

reduz-se agrave

log푠 (푝퐻)푠 (푝퐼) = 퐾(푝퐻 minus 푝퐼)

(53 ndash 4)

Contudo apesar da soluccedilatildeo quadraacutetica ou paraboacutelica para a equaccedilatildeo estendida de

Linderstroslashm-lang e Groumlnwall expressa na equaccedilatildeo (53 ndash 3) natildeo requerer os dados

das constantes de ionizaccedilatildeo dos resiacuteduos com grupos ionizaacuteveis ela exige a

definiccedilatildeo do paracircmetro A que fisicamente representa a inclinaccedilatildeo da reta de

aproximaccedilatildeo da curva de carga liacutequida e que pode ser calculado por correlaccedilatildeo a

partir de um conjunto de dados experimentais de solubilidade ou de carga liacutequida

6 Identidade entre o Modelo Proposto e a Equaccedilatildeo

Estendida de Linderstroslashm-Lang e Groumlnwall

A equaccedilatildeo final da modelagem termodinacircmica proposta apresentada na seccedilatildeo 4 eacute a

equaccedilatildeo (42 ndash 8) dada por

푠 (푝퐻)푠 (푝퐼) =

1 + 101 + 10

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 1)

Aplicando-se o logaritmo decimal nos dois termos da equaccedilatildeo (6 ndash 1) tem-se que

log푠 (푝퐻)푠 (푝퐼) = log

1 + 101 + 10

+ log

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 2)

Pelo bem da simplificaccedilatildeo desta deduccedilatildeo adotar-se-atildeo as seguintes funccedilotildees

휂 (푝퐻) = log

(6 ndash 3)

휃 (푝퐻) = log

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 4)

Assim pode-se reescrever a equaccedilatildeo (6 ndash 2) por

29 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐼) = 휂 (푝퐻) + 휃 (푝퐻)

(6 ndash 5)

Observando-se a equaccedilatildeo (6 ndash 5) tem-se que a funccedilatildeo j independe do estado de

ionizaccedilatildeo do resiacuteduo j poreacutem a funccedilatildeo jk depende Por isso deve-se analisar esta

funccedilatildeo para cada estado de ionizaccedilatildeo possiacutevel como mostrado na Tabela 61

Tabela 6 1 ndash Anaacutelise da funccedilatildeo jk para cada estado de ionizaccedilatildeo possiacutevel

j jk jk Quantidade de resiacuteduos neste estado

-1 -1 푝퐼 minus 푝퐻 na

0 0 nb

+1 +1 0 nc

0 푝퐼 minus 푝퐻 nd

Pela anaacutelise da Tabela 61 e considerando uma proteiacutena com n resiacuteduos com

grupos ionizaacuteveis infere-se que a equaccedilatildeo (6 ndash 5) pode ser reescrita como

log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)

(6 ndash 6)

Contudo as equaccedilotildees acima descritas satildeo vaacutelidas apenas para configuraccedilotildees

neutras pois apenas as configuraccedilotildees neutras da fase liacutequida estatildeo em equiliacutebrio

com as moleacuteculas de proteiacutena da fase soacutelida Para que uma configuraccedilatildeo seja

neutra vale a seguinte restriccedilatildeo

휀 = 0 hArr 푛 = 푛

(6 ndash 7)

30 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall

Substituindo a restriccedilatildeo dada pela equaccedilatildeo (6 ndash 7) na equaccedilatildeo (6 ndash 6) tem-se que

log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)

(6 ndash 8)

Ora mas a soma de nc e de nd natildeo resulta em outra coisa senatildeo no nuacutemero de

resiacuteduos com grupos ionizaacuteveis da estrutura proteacuteica cujo j seja +1 Assim

substituindo nc mais nd por n+ e substituindo a equaccedilatildeo (6 ndash 3) na equaccedilatildeo (6 ndash 8)

tem-se que

log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log

1 + 101 + 10

(6 ndash 9)

Ao se analisar a equaccedilatildeo (6 ndash 9) observa-se que ela eacute idecircntica a equaccedilatildeo estendida

de Linderstroslashm-Lang e Groumlnwall apresentada pela equaccedilatildeo (52 ndash 19) Com isso

tem-se que apesar das distintas formulaccedilotildees tanto a modelagem termodinacircmica aqui

proposta quanto a extensatildeo a teoria de Linderstroslashm-Lang e Groumlnwall resultam na

mesma descriccedilatildeo do fenocircmeno Aleacutem disso a equaccedilatildeo final dos modelos eacute

extremamente simples e depende apenas de um ponto de referecircncia e dos dados da

estrutura da moleacutecula de proteiacutena cuja solubilidade se deseja estudar

7 Aplicaccedilatildeo dos Modelos Expostos

Para validar o modelo comparando-o com o caacutelculo feito a partir da teoria de Debye-

Huumlckel o criteacuterio que relaciona os pontos calculados pelo modelo com os pontos

experimentais foi estabelecido a partir da seguinte funccedilatildeo objetivo (FO)

퐹푂 =1푁

푠 minus 푠푠

(7 ndash 1)

Contudo a equaccedilatildeo (7 ndash 1) natildeo eacute a melhor definiccedilatildeo de funccedilatildeo objetivo neste caso

pois a derivada da curva de solubilidade eacute razoavelmente grande nos dois lados do

ponto isoeleacutetrico e isso permite que pequenos desvios na direccedilatildeo horizontal

resultem em um grande aumento no valor da funccedilatildeo objetivo Uma soluccedilatildeo possiacutevel

seria substituir essa funccedilatildeo objetivo por uma funccedilatildeo definida pela soma do quadrado

da distacircncia do ponto experimental agrave curva do modelo principalmente se fosse

necessaacuterio calcular algum paracircmetro do modelo via otimizaccedilatildeo da funccedilatildeo objetivo

estipulada Natildeo sendo este o escopo deste trabalho optou-se pelo uso da FO

definida na equaccedilatildeo (7 ndash 1)

71 Solubilidade da Insulina Suiacutena

As Figuras 711 712 e 713 apresentam os graacuteficos da curva de solubilidade

dada pelos pontos experimentais pelo modelo proposto pela abordagem claacutessica e

tambeacutem a curva obtida pela soluccedilatildeo paraboacutelica da Equaccedilatildeo de Linderstroslashm-Lang e

Groumlnwall em trecircs temperaturas distintas

32 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 711 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 25 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

Figura 712 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 15 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

00

40

80

120

160

200

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

00

50

100

150

200

250

300

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

33 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 713 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 5 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

Os desvios da curva obtida pelo modelo proposto para valores de pH distantes do pI

podem ser explicados por ao menos trecircs importantes motivos dois devidos a

hipoacuteteses do modelo e um devido a fenocircmenos intriacutensecos a proteiacutena Sabendo que

no pI a solubilidade eacute miacutenima para valores de pH distantes do pI pode-se ter

solubilidades suficientemente grandes para que a validade da lei de Henry ndash adotada

na formulaccedilatildeo do modelo - seja questionada pois quanto mais distante do pI maior

a solubilidade e menor a validade da lei de Henry jaacute que haacute um aumento da

concentraccedilatildeo do soluto (proteiacutena) na soluccedilatildeo e tambeacutem ao fato do modelo prever

solubilidade infinita quando a fraccedilatildeo de moleacuteculas eletricamente neutras tende a

zero

limrarr푠 = lim

rarr

Φ(푝퐼)푠 (푝퐼)Φ(푝퐻) = +infin

(711 ndash 1)

00

50

100

150

200

250

300

350

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

34 7 Aplicaccedilatildeo dos Modelos Expostos

Todavia ainda haacute um fator de ordem natural que justifica o desvio apresentado para

valores de pH distantes do pI o desnovelamento da cadeia proteacuteica Este fenocircmeno

pode ocorrer de maneira a expor grupos hidroacutefobos resiacuteduos antes natildeo expostos

acrescentando relaccedilotildees de equiliacutebrio quiacutemico natildeo existentes na regiatildeo do pI

alterando o equiliacutebrio de fases e portanto alterando o valor da solubilidade

A Tabela 711 apresenta os valores obtidos para a funccedilatildeo objetivo definida em (7 ndash

1) tanto para o modelo proposto quanto para a abordagem claacutessica para trecircs

diferentes temperaturas

Tabela 711 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada

abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para insulina

suiacutena

T ordmC Abordagem FO

25 P 01857 C 02535

15 P 01981 C 05056

5 P 03595 C 03064

Observando-se a Tabela 711 vecirc-se que o modelo apresentou melhores resultados

do que o caacutelculo efetuado atraveacutes da abordagem claacutessica no que tange a

minimizaccedilatildeo da funccedilatildeo objetivo exceto para os dados a 5 ordmC

Tambeacutem eacute possiacutevel observar que a funccedilatildeo objetivo sofreu aumento com a

diminuiccedilatildeo da temperatura Isto ocorreu principalmente devido agrave dificuldade de

obter dados experimentais de solubilidade a temperaturas baixas o que aumenta o

desvio experimental fazendo com que se tenha um aumento do valor da funccedilatildeo

objetivo como a definida em (5 ndash 1) Um efeito secundaacuterio que tambeacutem pressiona a

35 7 Aplicaccedilatildeo dos Modelos Expostos

funccedilatildeo objetivo eacute o fato dos dados de pKA terem sido obtidos a uma temperatura

especiacutefica o que tende a acrescentar erro no caacutelculo de solubilidades a temperaturas

diferentes ainda que o pKA natildeo varie de forma ab-rupta com a temperatura

Outra observaccedilatildeo que deve ser registrada eacute o fato da funccedilatildeo objetivo para a

abordagem claacutessica na temperatura de 15 ordmC divergir a um valor tatildeo elevado em

relaccedilatildeo aos demais Isto se deve a um ponto experimental especiacutefico a um pH de

45 a solubilidade da insulina suiacutena obtida experimentalmente eacute 230 x 10-5 mol kg-1

enquanto a calculada pelo modelo proposto eacute 230 x 10-5 mol kg-1 e a calculada pela

abordagem claacutessica eacute 520 x 10-5 mol kg-1 Por conta do desvio deste ponto a funccedilatildeo

objetivo para a abordagem claacutessica nesta temperatura tem um aumento significativo

A Tabela 712 apresenta os valores do paracircmetro K da soluccedilatildeo paraboacutelica obtidos

neste trabalho para a insulina suiacutena comparados ao encontrado na literatura

Tabela 712 ndash Valores do paracircmetro K da soluccedilatildeo paraboacutelica para a insulina suiacutena

Referecircncias T ordmC K Fredericq e Neurath (1950) - 081 Neste trabalho 25 104 Neste trabalho 15 101 Neste trabalho 5 145

Pela Tabela 712 pode-se observar que haacute uma diferenccedila pequena entre os

valores do paracircmetro K obtidos neste trabalho e por Fredericq e Neurath (1950) Por

isso natildeo se pode afirmar a que se deve esta diferenccedila se eacute devido a diferenccedilas entre

procedimentos experimentais ou se eacute devido agrave diferenccedila de meacutetodo de caacutelculo do

paracircmetro Apesar de no experimento realizado por Fredericq e Neurath (1950)

haver a presenccedila do acircnion tiocianato e este acircnion interagir com grupos ionizaacuteveis

da cadeia proteacuteica como observado pelos autores do trabalho tambeacutem estes

36 7 Aplicaccedilatildeo dos Modelos Expostos

proacuteprios autores afirmam que a presenccedila deste acircnion natildeo altera a forma da curva

que eacute basicamente determinada pelo paracircmetro K De qualquer modo eacute interessante

observar a proximidade dos valores encontrados neste trabalho com o obtido por

Fredericq e Neurath (1950) pelo menos no que diz respeito agrave ordem de grandeza do

paracircmetro em questatildeo

72 Solubilidade da Lisozima de clara de ovo de galinha

Um modelo para ser validado necessita correlacionar dados experimentais de modo

satisfatoacuterio ou seja um modelo deve buscar fidelidade ao fenocircmeno fiacutesico

observado Assim na procura de dados de solubilidade de proteiacutenas poucos dados

na regiatildeo do pI foram encontrados Este eacute o caso da lisozima de clara de ovo de

galinha que apesar de ter muitos estudos de solubilidade nenhum deles se

encontra na regiatildeo do pI Surgiu assim a necessidade de se obter estes dados

experimentais para poder validar o modelo proposto A escolha da lisozima de clara

de ovo de galinha se deu em parte pela sua importacircncia mas tambeacutem em parte por

ter os valores de pKA conhecidos

A curva de solubilidade da lisozima de clara de ovo de galinha levantada neste

trabalho estaacute apresentada na Figura 721

37 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em

soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e

dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()

Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento

esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH

isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de

soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se

comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto

isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da

soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos

ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente

neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a

solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e

00

10

20

30

40

50

60

70

80

90

100

95 100 105 110 115 120

Solu

bilid

ade

(mg

mL)

pH

38 7 Aplicaccedilatildeo dos Modelos Expostos

alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado

em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo

Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo

a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo

Por conta de falta de dados a este respeito modelou-se apenas a curva de

solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura

722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de

galinha em funccedilatildeo do pH da soluccedilatildeo

Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)

00

10

20

30

40

50

60

70

80

90

96 99 102 105 108 111 114 117 120

Solu

bilid

ade

(mg

mL)

pH

39 7 Aplicaccedilatildeo dos Modelos Expostos

O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721

Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada

abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima

de clara de ovo de galinha

T ordmC Abordagem FO

25 P 4650 C gt7919a

a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado

Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta

aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a

abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca

de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos

anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao

efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de

clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a

variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A

proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de

cargas pontuais de Debye-Huumlckel

8 Conclusotildees

A modelagem termodinacircmica proposta neste trabalho apresentou expressivos

resultados quando comparada a abordagem claacutessica de Debye-Huumlckel

Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o

modelo aproximou melhor os pontos experimentais do que a referida abordagem

comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima

ao ponto isoeleacutetrico

Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica

para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua

construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo

lugar por sua aplicabilidade

Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis

da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva

em regiotildees distantes do ponto isoeleacutetrico

9 Referecircncias Bibliograacuteficas

BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene

Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects

Biophys J 95 1285-1294 2008

FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and

other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72

2684 - 26911950

GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v

93 p 517-542 1931

GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab

Carlsberg v 24 p 185-200 1941

KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native

and mutant insulins pK perturbation of B13-Glu in aggregated species Arch

Biochem Biophys v 283 p 496-502 1990

KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for

the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng

Chem Res v 35 p 4319-4327 1996

42 9 Referecircncias Bibliograacuteficas

KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen

lysozyme J Biochem v 87 p 1215-1219 1980

LADISCH M R Bioseparations Engineering principles practice and

economics John Wiley amp Sons 2001 pp1 116 ndash 117 133

LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab

Carlsberg v 15 p 1-29 1924

PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da

particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas

2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP

PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the

excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte

solutions Fluid Phase Equilib v 269 p 25ndash35 2008

PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-

contribution model involving phase and chemical equilibrium Ind Eng Chem Res

v 33 p 1341-1347 1994

PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277

1973

PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino

acids Fluid Phase Equilib v 152 p 121-132 1998

43 9 Referecircncias Bibliograacuteficas

PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular

Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999

SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of

equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte

solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009

TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J

R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with

carbon dioxide Biotech Bioeng v103 p 909-919 2009

TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer

free energy Biophys J v 95 p 2601-2609 2008

TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in

water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95

2009

Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na

cadeia proteacuteica

Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo

de ionizaccedilatildeo

퐻퐴 퐴 + 퐻

(A ndash 1)

Assim considerando que a constante de equiliacutebrio

퐾 = 푎

(A ndash 2)

Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que

퐾 =[퐴 ][퐻 ]

[퐻퐴]

(A ndash 3)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que

log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]

(A ndash 4)

Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado

por

minus log[휑] = 푝휑

(A ndash 5)

Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que

45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

푝퐾 = log[퐻퐴][퐴 ] + 푝퐻

(A ndash 6)

Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por

훼 =[퐴 ]

[퐻퐴] + [퐴 ]

(A ndash 7)

Reescrevendo (A ndash 7) tem-se que

훼 =[퐴 ] [퐻퐴frasl ]

1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =

훼1 minus 훼

(A ndash 8)

Substituindo (A ndash 8) em (A ndash 6) tem-se que

푝퐾 = log훼

1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10

(A ndash 9)

Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos

훼 =1

1 + 10

(A ndash 10)

Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio

퐴 + 퐻 퐻퐴

(A ndash 11)

Pode se escrever a constante de equiliacutebrio como

퐾 =[퐻퐴 ]

[퐴][퐻 ]

(A ndash 12)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que

46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

log퐾 = minus log[퐴]

[퐻퐴 ] minus log[퐻 ]

(A -13)

Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por

훼 =[퐻퐴 ]

[퐴] + [퐻퐴 ]

(A ndash 14)

Assim a equaccedilatildeo (A ndash 13) fica

훼1 minus 훼 = 10

(A ndash 15)

Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo

훼 =10

1 + 10

(A ndash 16)

Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos

modelos expostos

Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]

48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]

49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)

50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])

51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]

52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])

53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)

54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2

55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO

4 1 Introduccedilatildeo

Os primeiros trabalhos relacionados agrave modelagem da curva de solubilidade de

proteiacutenas em funccedilatildeo do pH datam do iniacutecio do seacuteculo XX Green (1931) propocircs um

modelo para a curva de solubilidade da carboxihemoglobina equumlina considerando

que esta proteiacutena se comportaria tanto como um aacutecido bivalente quanto uma base

bivalente Jaacute Groumlnwall (1941) atribuiu a Linderstroslashm-Lang o desenvolvimento de um

modelo capaz de predizer a curva de solubilidade a partir da integraccedilatildeo do perfil de

carga da proteiacutena Este trabalho de Groumlnwall apesar de esquecido pelo tempo eacute de

extrema importacircncia e relevacircncia tanto para o trabalho aqui apresentado quanto e

aqui um motivo muito mais nobre para o desenvolvimento de modelos a partir das

ferramentas da termodinacircmica claacutessica Quando da exposiccedilatildeo da modelagem aqui

tratada retornar-se-aacute a este trabalho que muito contribuiu ao entendimento do

fenocircmeno estudado

Eacute digno de nota o trabalho de Fredericq e Neurath (1950) no qual uma proposta de

equacionamento para uma correlaccedilatildeo semi-empiacuterica da curva de solubilidade de

insulina eacute apresentada Natildeo haacute de fato algo novo em relaccedilatildeo agrave modelagem do

efeito do pH na curva de solubilidade neste trabalho no entanto apesar de natildeo

haver qualquer menccedilatildeo ou referecircncia quanto agrave origem da equaccedilatildeo proposta nota-se

que eacute uma aplicaccedilatildeo direta da equaccedilatildeo descrita por Groumlnwall (1941) Haacute uma

hipoacutetese impliacutecita no trabalho de que o perfil de carga liacutequida da insulina seja linear

na regiatildeo do ponto isoeleacutetrico o que eacute bastante plausiacutevel para muitas proteiacutenas

Assim pela integraccedilatildeo da equaccedilatildeo diferencial proposta por Groumlwall (1941) uma

correlaccedilatildeo semi-empiacuterica quadraacutetica eacute obtida Reforccedila-se o uso da expressatildeo semi-

empiacuterica devido agrave natureza dual da equaccedilatildeo em parte advinda de um

desenvolvimento teoacuterico descrito por Groumlnwall (1941) e atribuiacutedo a Linderstroslashm-

Lang e em parte pela necessidade de se obter paracircmetros a partir de um ajuste de

5 1 Introduccedilatildeo

um conjunto de dados experimentais Vale observar que resultados expressivos

foram alcanccedilados neste trabalho de modo particular o fato de que a presenccedila do

acircnion tiocianato natildeo altera a forma da curva de solubilidade da insulina mas a

desloca em direccedilatildeo a menores valores de pH e de solubilidade

Contudo os trabalhos mais recentes se concentraram na modelagem da curva de

solubilidade de aminoaacutecidos em funccedilatildeo do pH dando maior enfoque aos modelos

termodinacircmicos para soluccedilotildees natildeo-ideais tanto atraveacutes de equaccedilotildees de estado

como de modelos de energia livre de Gibbs excedente

Destaca-se neste grupo o trabalho de Pinho et al (1994) que aplicaram o modelo

UNIFAC associado ao termo de Debye-Huumlckel para aminoaacutecidos como glicina D-

alanina L-serina e DL-valina Tambeacutem o trabalho de Khoshkbarchi e Vera (1996)

no qual foi desenvolvido um modelo simplificado de esfera riacutegida perturbada para

calcular o coeficiente de atividade de aminoaacutecidos e de peptiacutedeos permite prever a

curva de solubilidade destes em funccedilatildeo do pH Jaacute o modelo NRTL foi aplicado tanto

por Pradhan e Vera (1998) quanto Tseng et al (2009) para aminoaacutecidos Jaacute Seyfi et

al (2009) aplicaram a equaccedilatildeo de estado SAFT para a prediccedilatildeo da curva de

solubilidade da DL-metionina

Entretanto o primeiro trabalho dedicado exclusivamente agrave modelagem e prediccedilatildeo da

curva de solubilidade de proteiacutena propriamente dita em funccedilatildeo do pH foi publicado

por Tjong e Zhou (2008) Neste trabalho a solubilidade foi calculada a partir da

energia livre de transferecircncia da fase soacutelida para a fase liacutequida Para a execuccedilatildeo

deste caacutelculo a energia livre de transferecircncia foi dividida em duas contribuiccedilotildees

uma de natureza eletrostaacutetica calculada pela meacutedia de 100 conformaccedilotildees proteacuteicas

advindas da aplicaccedilatildeo de dinacircmica molecular a pH constante e outra de natureza

natildeo-eletrostaacutetica baseada na aacuterea superficial acessiacutevel ao solvente Poreacutem o

6 1 Introduccedilatildeo

esforccedilo computacional requerido pelo modelo por eles proposto para calcular

apenas alguns pontos da curva natildeo apresenta uma aplicabilidade razoaacutevel Aleacutem

deste trabalho Tashima et al (2009) propuseram uma modelagem termodinacircmica

para prever a curva de solubilidade especificamente da insulina suiacutena aplicando o

modelo de Pitzer truncado apoacutes o segundo coeficiente do virial

No presente trabalho propomos um novo modelo baseado no caacutelculo de estados de

ionizaccedilatildeo e em ferramentas de termodinacircmica claacutessica bem como uma extensatildeo agrave

teoria de Linderstroslashm-Lang e Groumlnwall Vale ressaltar de antematildeo que tanto este

novo modelo proposto quanto a extensatildeo desenvolvida resultam na mesma equaccedilatildeo

para o fenocircmeno apesar das distintas abordagens

2 Materiais e Meacutetodos

21 Meacutetodos computacionais

O coacutedigo-fonte do programa em linguagem C estaacute apresentado no Apecircndice B Os

meacutetodos numeacutericos utilizados se resumem a interpolaccedilatildeo linear o meacutetodo de

Newton-Raphson cujo uso seraacute apresentado na proacutexima seccedilatildeo quando se deduziraacute

o algoritmo do modelo de Debye-Huumlckel e o meacutetodo de busca unidirecional de

miacutenimos de funccedilatildeo pela Seccedilatildeo Aacuteurea

As Tabelas 211 e 212 apresentam os resiacuteduos considerados para cada proteiacutena

considerada bem como os seus valores de pKA que foram obtidos a partir da

literatura e satildeo indispensaacuteveis para execuccedilatildeo dos caacutelculos mais rigorosos

Tabela 211 ndash Resiacuteduos ionizaacuteveis considerados e valores de pKA da insulina suiacutena

Valores extraiacutedos de Kaarsholm et al (1990)

Aminoaacutecido Grupo Ionizaacutevel pKA

A1 ndash Gly -NH2 738 A4 ndash Glu -COOH 437 A14 ndash Tyr Fenol-OH 1020 A17 ndash Glu -COOH 437 A19 ndash Tyr Fenol-OH 1020 A21 ndash Asn -COOH 345

B1 ndash Phe -NH2 738 B5 ndash His Imidazol-NH 598 B10 ndash His Imidazol-NH 598 B 13 ndash Glu -COOH 437 B16 ndash Tyr Fenol-OH 1020 B21 ndash Glu -COOH 437

B22 ndash Arg Guaniacutedio-NH2 1110 B26 ndash Tyr Fenol-OH 1020

B29 ndash Lys -NH2 852 B30 ndashAla -COOH 345

8 2 Materiais e Meacutetodos

Tabela 212 ndash Resiacuteduos ionizaacuteveis considerados e valores de pKA a 25 ordmC da lisozima

de clara de ovo de galinha Valores extraiacutedos de Kuramitsu e Hamaguchi (1980)

Aminoaacutecido Grupo Ionizaacutevel pKA α-NH2 α-NH2 79

Lys1 ε-NH2 108

Arg5 Guaniacutedio-NH2 120 Glu7 -COOH 26

Lys13 ε-NH2 105

Arg14 Guaniacutedio-NH2 120 His15 Imidazol-NH 58 Asp18 -COOH 20 Tyr20 Fenol-OH 103

Arg21 Guaniacutedio-NH2 120 Tyr23 Fenol-OH 98

Lys33 ε-NH2 106 Glu35 -COOH 61

Arg45 Guaniacutedio-NH2 120 Asp48 -COOH 43 Asp52 -COOH 34 Tyr53 Fenol-OH 121

Arg61 Guaniacutedio-NH2 120 Asp66 -COOH 16

Arg68 Guaniacutedio-NH2 120

Arg73 Guaniacutedio-NH2 120 Asp87 -COOH 21

Lys96 ε-NH2 108

Lys97 ε-NH2 103 Asp101 -COOH 45

Arg112 Guaniacutedio-NH2 120

Arg114 Guaniacutedio-NH2 120

Lys116 ε-NH2 104 Asp119 -COOH 25

Arg125 Guaniacutedio-NH2 120

Arg128 Guaniacutedio-NH2 120 α-COOH α-COOH 31

9 2 Materiais e Meacutetodos

22 Curva de solubilidade da lisozima da clara de ovo de galinha

221 Reagentes

Neste experimento de determinaccedilatildeo da curva de solubilidade da lisozima da clara de

ovo de galinha os reagentes utilizados foram cloreto de soacutedio (Reatec P A)

bicarbonato de soacutedio (Research Becto Chemical P A) Na2HPO4 7H2O (Reagen

P A) aacutegua destilada deionizada Milli-Q (Millipore) e lisozima de clara de ovo de

galinha (Sigma min 99)

222 Equipamentos

Neste experimento os equipamentos utilizados foram espectrofotocircmetro UV-Visiacutevel

(Beckman DU-530) centriacutefuga (Eppendorf) banho-teacutermico (Laacutectea) com controlador

de temperatura (Julabo) pHmetro (Micronal) e balanccedila (Mettler Toledo AB204S)

223 Preparaccedilatildeo das soluccedilotildees-tampatildeo

Foram preparadas soluccedilotildees-tampatildeo com valores de pH=96 pH = 98 pH = 100

pH = 102 pH = 104 pH = 106 pH = 108 pH = 110 pH = 112 pH = 114 pH =

116 e pH = 118 a partir de quatro soluccedilotildees uma de hidroacutexido de soacutedio 01 M uma

de cloreto de soacutedio 1 M (para equalizar a forccedila iocircnica) uma de bicarbonato de soacutedio

005 M e outra de Na2HPO4 005 M

A Tabela 2231 apresenta os valores de volume usados no preparo de cada uma

das soluccedilotildees-tampatildeo

10 2 Materiais e Meacutetodos

Tabela 2231 ndash Volumes de hidroacutexido de soacutedio a 01 M adicionados no preparo das

soluccedilotildees-tampatildeo

Tampatildeo pH V NaOH mL

NaHCO3 96 100 005 M 98 152

(para cada soluccedilatildeo-tampatildeo 100 mL 100 214

desta soluccedilatildeo foram adicionados) 102 276

104 330 106 382

108 424

110 454

112 530 114 583

Na2HPO4 110 82

005 M 112 126

(para cada soluccedilatildeo-tampatildeo 100 mL 114 182 desta soluccedilatildeo foram adicionados) 116 270

118 388

224 Procedimento experimental

Foram adicionadas quantidades natildeo definidas de lisozima de clara de ovo de galinha

a 13 mL de cada soluccedilatildeo-tampatildeo em tubos Eppendorf de 2 mL Colocaram-se

entatildeo as amostras apoacutes agitaccedilatildeo vigorosa em banho teacutermico a 250 plusmn 01 ordmC por 24

horas para que os sistemas atingissem o equiliacutebrio termodinacircmico Caso natildeo

houvesse a formaccedilatildeo de precipitado lisozima era adicionada e o procedimento

repetido Ao se observar a formaccedilatildeo de precipitado o sistema era centrifugado a

13000 rpm por 15 minutos Uma aliacutequota do sobrenadante era retirada e sua

concentraccedilatildeo proteacuteica determinada por medida de absorbacircncia a 280 nm Cada

sistema foi feito ao menos em duplicata

3 Modelo Estendido de Debye-Huumlckel

31 Introduccedilatildeo

De fato como descrito por Pessocirca Filho (2002) a equaccedilatildeo de Debye-Huumlckel natildeo

deve ser aplicada agrave modelagem de polieletroacutelitos tais como proteiacutenas porque nestas

moleacuteculas as cargas satildeo distribuiacutedas ao longo da cadeia e portanto natildeo satildeo cargas

pontuais como suposto por Debye-Huumlckel

Contudo nesta modelagem considera-se uma regiatildeo de pH em torno do ponto

isoeleacutetrico (pI) na qual satildeo inerentes duas condiccedilotildees favoraacuteveis a aplicaccedilatildeo da

equaccedilatildeo de Debye-Huumlckel carga liacutequida proacutexima a zero pois Z(pI) = 0 e regiatildeo de

miacutenima solubilidade que significa baixas concentraccedilotildees de proteiacutenas em soluccedilatildeo

Isto significa em primeiro lugar que os efeitos da carga tais como ldquodesnovelamentordquo

da cadeia proteacuteica com exposiccedilatildeo de resiacuteduos outrora blindados podem ser

desprezados em uma regiatildeo proacutexima ao ponto isoeleacutetrico e em segundo lugar

baixas concentraccedilotildees de proteiacutena em soluccedilatildeo significam que os termos de curto

alcance podem ser desprezados e portanto haacute prevalecircncia do termo de longo

alcance que no caso de soluccedilotildees eletroliacuteticas pode ser descrito por uma equaccedilatildeo

estendida de Debye-Huumlckel

Assim o modelo de Debye-Huumlckel foi utilizado natildeo para verificar sua aplicabilidade agrave

modelagem de soluccedilotildees proteacuteicas mas sim para confrontar o modelo proposto com

um modelo usual em modelagem de soluccedilotildees eletroliacuteticas e seraacute referido no texto

sempre como abordagem claacutessica

12 3 Modelo Estendido de Debye-Huumlckel

32 Desenvolvimento teoacuterico

Pode-se escrever a atividade da proteiacutena como o produto entre a solubilidade e o

coeficiente de atividade da mesma como mostrado na equaccedilatildeo (32 - 1)

푎 = 훾푠

(32 - 1)

Na qual pode-se calcular o coeficiente de atividade atraveacutes da equaccedilatildeo estendida

de Debye-Huumlckel (Pitzer 1973)

ln 훾 = minus퐴 푍radic퐼

1 + 푏radic퐼+

2푏

ln 1 + 푏radic퐼

(32 - 2)

Sendo que a constante universal empiacuterica b = 12 kg12 mol-12 eacute usada para todos os

eletroacutelitos Jaacute AΦ eacute o paracircmetro de Debye-Huumlckel para o coeficiente osmoacutetico e eacute

dado por

퐴 =13

(2휋푁 휌 ) frasl 푒4휋휀 휀 푘푇

frasl

(32 - 3)

Em que NA eacute a constante de Avogadro ρs eacute a densidade do solvente em g cm-3 e eacute

a carga eletrocircnica (e = 160218 x 10-19 C) ε0 eacute a permissividade do espaccedilo livre (ε0 =

885419 x 10-12 C2 N-1 m-2) εr eacute a constante dieleacutetrica do solvente k aacute constante de

Boltzmann e T eacute a temperatura absoluta Jaacute a carga liacutequida em funccedilatildeo do pH pode

ser calculada como

푍 = 훼 minus 훼

(32 - 4)

Sendo que α+ e α- satildeo dados pelas equaccedilotildees (A - 10) e (A - 16) do Apecircndice A

13 3 Modelo Estendido de Debye-Huumlckel

E a forccedila iocircnica eacute dada pela equaccedilatildeo (32 - 5) descrita abaixo

퐼 = 12

푚 푍

(32 - 5)

Contudo no ponto isoeleacutetrico a carga meacutedia da proteiacutena eacute nula portanto o termo de

Debye-Huumlckel se anula e o coeficiente de atividade se torna unitaacuterio

ln푎 (푝퐼) = ln 푠 (푝퐼)

(32 - 6)

Considerando que a atividade da proteiacutena seja constante com a variaccedilatildeo de pH isto

implica que esta eacute sempre igual agrave solubilidade da proteiacutena no ponto isoeleacutetrico e

portanto vale que

ln푎 (푝퐻) = ln 푠 (푝퐻) + ln 훾(푝퐻) = ln 푠 (푝퐼)

(32 - 7)

Assim

ln 푠 (푝퐻) = ln 푠 (푝퐼) + 퐴휙푍푝퐻2 radic퐼1 + 푏radic퐼

+2푏

ln 1 + 푏radic퐼

(32 - 8)

Esta equaccedilatildeo prevecirc a curva de solubilidade em funccedilatildeo do pH atraveacutes do caacutelculo da

atividade da proteiacutena na fase liacutequida pela equaccedilatildeo estendida de Debye-Huumlckel Para

resolvecirc-la eacute necessaacuterio se utilizar de um meacutetodo numeacuterico pois a forccedila iocircnica

depende da solubilidade naquele pH Optou-se neste trabalho pelo Meacutetodo de

Newton-Raphson para executar o meacutetodo iterativo que eacute exigido pela equaccedilatildeo (32

ndash 8) Para aplicar este meacutetodo arbitrou-se uma funccedilatildeo f(sp) definida aqui como

푓 푠 = minus ln 푠 (푝퐻) + ln 푠 (푝퐼) + 퐴휙푍푝퐻2 radic퐼

1 + 푏radic퐼+

2푏

ln 1 + 푏radic퐼

(32 - 9)

14 3 Modelo Estendido de Debye-Huumlckel

Assim ao calcular o sp que zera esta funccedilatildeo f(sp) saber-se-aacute que eacute a proacutepria

solubilidade que se deseja calcular Para aplicar o Meacutetodo de Newton-Raphson

basta derivar a funccedilatildeo f(sp) e aplicar o seguinte algoritmo de resoluccedilatildeo

푠 = 푠 minus푓(푠 )푓 (푠 )

(32 - 10)

Para calcular frsquo(s) deve-se considerar que a forccedila iocircnica depende da solubilidade

Para isto observando a equaccedilatildeo (32 - 5) vecirc-se que a forccedila iocircnica eacute dada pelo

somatoacuterio das contribuiccedilotildees de todos os iacuteons presentes na soluccedilatildeo por isso aqui

cabe um artifiacutecio de dividir estas contribuiccedilotildees em duas macro-contribuiccedilotildees aquela

devida a todos os iacuteons presentes na soluccedilatildeo exclusive os grupos ionizaacuteveis

presentes nas moleacuteculas da proteiacutena em questatildeo (I0) e que se considera constante

com o pH e aquela que engloba apenas os grupos ionizaacuteveis presentes nas

moleacuteculas da proteiacutena (IP)

퐼 = 퐼 + 퐼 = 퐼 +12푍 푠

(32 - 11)

Considerando a funccedilatildeo w tal que

푤 = radic퐼 = 퐼 +12푍 푠

(32 - 12)

Sendo

푤 =14푍 퐼

(32 - 13)

Entatildeo aplicando-se as devidas regras de derivaccedilatildeo tem-se

15 3 Modelo Estendido de Debye-Huumlckel

푓 (푠 ) = minus1푠 + 퐴 푍

3푤 + 2푤 푏푤(1 + 푏푤)

(32 - 14)

Substituindo as equaccedilotildees (32 - 12) e (32 - 13) na equaccedilatildeo (32 - 14) tem-se que

푓 (푠 ) = minus1푠 + 퐴 푍

15 + 푏radic퐼2radic퐼(1 + 푏radic퐼)

(32 - 15)

Entatildeo o algoritmo deve ser

푠 = 푠 minus

⎜⎛ln 푠 (푝퐼)

푠 + 퐴휙푍푝퐻2 radic퐼

1 + 푏radic퐼+ 2푏 ln 1 + 푏radic퐼

minus 1푠 + 퐴휙푍

15 + 푏radic퐼2radic퐼(1 + 푏radic퐼) ⎠

⎟⎞

(32 - 16)

4 Modelagem Termodinacircmica Proposta

41 Introduccedilatildeo

A condiccedilatildeo de equiliacutebrio entre duas fases (α e β) com m componentes eacute dada por

(Prausnitz et al 1999)

푝 = 푝

(41 ndash 1)

푇 = 푇

(41 ndash 2)

휇 = 휇⋮

휇 = 휇

(41 ndash 3)

Considerando o equiliacutebrio soacutelido-liacutequido (ESL) de sistemas contendo proteiacutenas

sendo que os efeitos da pressatildeo podem ser desprezados que as temperaturas nas

duas fases satildeo iguais e que na fase soacutelida soacute haacute proteiacutena tem-se que para a

proteiacutena a relaccedilatildeo de equiliacutebrio pode ser descrita por

휇 (푇푥) = 휇 (푇)

(41 ndash 4)

Contudo adotando-se a lei de Henry que eacute vaacutelida para baixas concentraccedilotildees de

soluto hipoacutetese que natildeo eacute distante dos valores observados da solubilidade de

proteiacutenas pode se escrever o potencial quiacutemico na fase liacutequida por

휇 (푇푥) = 휇 (푇 푥 ) + 푅푇푙푛푥

(41 ndash 5)

17 4 Modelagem Termodinacircmica Proposta

Entretanto variaccedilotildees de pH natildeo alteram o potencial quiacutemico da fase soacutelida o que

resulta pela relaccedilatildeo (41 ndash 4) que o mesmo natildeo altera tambeacutem o potencial quiacutemico

da fase liacutequida Com isso pela relaccedilatildeo (41 ndash 5) sendo o potencial quiacutemico de

referecircncia constante com o pH uma contradiccedilatildeo emerge a variaccedilatildeo do pH natildeo

poderia alterar o valor da solubilidade poreacutem a observaccedilatildeo experimental mostra o

contraacuterio Assim deve-se lembrar que pelo princiacutepio da eletroneutralidade a fase

soacutelida soacute possui moleacuteculas proteacuteicas eletricamente neutras e portanto o equiliacutebrio

de fases deve se estabelecer apenas entre as moleacuteculas presentes na fase soacutelida e

as moleacuteculas eletricamente neutras em soluccedilatildeo Ou seja como soacute moleacuteculas

eletricamente neutras podem estar na fase soacutelida o equiliacutebrio de fases depende

exclusivamente da fraccedilatildeo de moleacuteculas eletricamente neutras em soluccedilatildeo pois soacute

estas podem precipitar Assim tanto a equaccedilatildeo (41 ndash 4) quanto a equaccedilatildeo (41 ndash

5) devem ser aplicadas natildeo ao conjunto de todas as moleacuteculas de proteiacutena em

soluccedilatildeo mas somente as moleacuteculas proteacuteicas eletricamente neutras Portanto a

concentraccedilatildeo das moleacuteculas de proteiacutena eletricamente neutras em soluccedilatildeo eacute

constante com o pH e pode ser interpretada como a multiplicaccedilatildeo da fraccedilatildeo de

moleacuteculas eletricamente neutras pela concentraccedilatildeo total de proteiacutenas que eacute a

proacutepria solubilidade Assim uma relaccedilatildeo de inversa proporcionalidade eacute definida

quanto maior a fraccedilatildeo de moleacuteculas neutras menor seraacute a solubilidade de uma

proteiacutena em soluccedilatildeo Portanto no ponto isoeleacutetrico no qual haacute o miacutenimo de

solubilidade tem-se o ponto maacuteximo de fraccedilatildeo de moleacuteculas eletricamente neutras

A partir disto eacute possiacutevel escrever a equaccedilatildeo que rege o comportamento da

solubilidade de uma proteiacutena em funccedilatildeo do pH da soluccedilatildeo

휙(푝퐻)푆 (푝퐻) = 휆 = 푐표푛푠푡푎푛푡푒

(41 ndash 6)

18 4 Modelagem Termodinacircmica Proposta

Na equaccedilatildeo (41 ndash 6) o paracircmetro λ pode ser um paracircmetro de ajuste do modelo a

um conjunto de valores experimentais tendo se estabelecido uma funccedilatildeo objetivo ou

ainda dado pelo produto entre a solubilidade no ponto isoeleacutetrico e a fraccedilatildeo de

moleacuteculas eletricamente neutras em soluccedilatildeo tambeacutem no pI neste caso vale a

seguinte equaccedilatildeo

푠 (푝퐻) =휙(푝퐼)푠 (푝퐼)휙(푝퐻)

(41 ndash 7)

Sendo a equaccedilatildeo do modelo ndash equaccedilatildeo (41 ndash 7) ndash extremamente simples a uacutenica

dificuldade reside no caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras

(휙(푝퐻))

42 Caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras

Dentre os aminoaacutecidos que formam atraveacutes de ligaccedilotildees peptiacutedicas as proteiacutenas haacute

aqueles que possuem resiacuteduos com grupos ionizaacuteveis aleacutem dos grupos amina e

aacutecido carboxiacutelico terminais na cadeia Todos estes participam de equiliacutebrios

quiacutemicos com iacuteons H+ presentes na soluccedilatildeo entatildeo ao se alterar o pH da soluccedilatildeo

estes equiliacutebrios satildeo alterados

Assim haacute vaacuterias possibilidades de combinaccedilotildees de estados ionizados destes grupos

ionizaacuteveis que resultam em uma moleacutecula de proteiacutena eletricamente neutra Eacute

importante notar que dada a fraccedilatildeo de uma configuraccedilatildeo de uma moleacutecula neutra

todas as outras fraccedilotildees de configuraccedilotildees possiacuteveis que tambeacutem resultem em

moleacuteculas neutras satildeo proporcionais agrave fraccedilatildeo da configuraccedilatildeo dada pois todas as

configuraccedilotildees participam de equiliacutebrios entre si

19 4 Modelagem Termodinacircmica Proposta

Desta observaccedilatildeo implica-se que basta identificar uma configuraccedilatildeo proteacuteica cuja

soma dos estados ionizados resulte em carga nula para se descrever o equiliacutebrio de

fases em relaccedilatildeo ao pH na regiatildeo do ponto isoeleacutetrico onde esta consideraccedilatildeo eacute

predominante em relaccedilatildeo a outros possiacuteveis fenocircmenos

Contudo eacute necessaacuterio contabilizar a contribuiccedilatildeo de cada grupo ionizaacutevel via

equaccedilatildeo de Henderson-Hasselbach equaccedilatildeo (42 ndash 1)

훼 (푝퐻) =

⎩⎪⎨

⎪⎧ 10

1 + 10 푠푒 휈 = minus1

11 + 10

푠푒 휈 = +1

(42 ndash 1)

Na qual pKAj eacute o co-logaritmo da constante de equiliacutebrio do grupo ionizaacutevel do

resiacuteduo j j eacute estado carregado potencial do resiacuteduo j (-1 para grupos aacutecidos e +1

para grupos baacutesicos) e j eacute a fraccedilatildeo ionizada para o pH dado Para grupos cujo

estado de ionizaccedilatildeo na dada configuraccedilatildeo seja neutro a sua fraccedilatildeo eacute calculada tal

que a soma de sua fraccedilatildeo e da fraccedilatildeo ionizada tenha como resultado o valor

unitaacuterio

Assim a funccedilatildeo Pn pode ser escrita como o produto de cada fraccedilatildeo de cada grupo

ionizaacutevel j naquele estado (-1 0 ou +1) na configuraccedilatildeo neutra k em uma proteiacutena

com n grupos ionizaacuteveis Uma representaccedilatildeo matemaacutetica possiacutevel para esta funccedilatildeo

pode ser escrita como

휙 (푝퐻) = 훼 (푝퐻)

(42 ndash 2)

Na qual a fraccedilatildeo jrsquo(pH) eacute dada por

20 4 Modelagem Termodinacircmica Proposta

훼 (푝퐻) =훼 (푝퐻) 푠푒 휀 = 11 minus 훼 (푝퐻) 푠푒 휀 = 0

(42 ndash 3)

Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (42 ndash 3) e a resultante na equaccedilatildeo

(42 ndash 2) pode-se escrever que

휙 (푝퐻) =1

1 + 10

1 + 휈2 minus 휈 휀 10

minus휈 minus 1

2 minus 휈 휀 푐표푚 휀 = 0

(42 ndash 4)

A equaccedilatildeo (42 ndash 4) junto agrave equaccedilatildeo (41 ndash 7) constituem o modelo termodinacircmico

capaz de predizer a razatildeo entre as fraccedilotildees de moleacuteculas neutras de uma proteiacutena

em funccedilatildeo do pH na regiatildeo do ponto isoeleacutetrico mantendo fixas temperatura e forccedila

iocircnica Substituindo a equaccedilatildeo (42 ndash 4) na equaccedilatildeo (41 ndash 7) obteacutem-se para a

curva de solubilidade

푠 (푝퐻)푠 (푝퐼) =

1 + 101 + 10

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

푐표푚 휀 = 0

(42 ndash 8)

5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

51 Introduccedilatildeo

Segundo Groumlnwall (1941) na fase liacutequida haacute moleacuteculas de proteiacutenas com muitas

configuraccedilotildees k distintas que possuem carga liacutequida i e tambeacutem haacute certas

configuraccedilotildees que tem carga liacutequida nula e satildeo chamadas configuraccedilotildees neutras

Aleacutem disso estas uacuteltimas satildeo aquelas que determinam o equiliacutebrio de fases jaacute que

elas estatildeo em equiliacutebrio com a fase soacutelida na qual soacute haacute moleacuteculas neutras pelo

princiacutepio da eletroneutralidade Eacute tambeacutem afirmado que dado este equiliacutebrio a

atividade das moleacuteculas neutras natildeo se altera com a variaccedilatildeo do pH e eacute

proporcional agraves atividades de qualquer tipo de configuraccedilatildeo neutra

Neste mesmo trabalho eacute atribuiacuteda a Linderstroslashm-Lang o desenvolvimento de uma

teoria de prediccedilatildeo da solubilidade de proteiacutenas com a variaccedilatildeo do pH na regiatildeo do

ponto isoeleacutetrico Este desenvolvimento apresenta um balanccedilo de cargas de um

modo impliacutecito contudo como atestado por Groumlnwall o escasso conhecimento

sobre as estruturas proteacuteicas impediram agravequele tempo uma formulaccedilatildeo mais

pormenorizada do problema

52 Desenvolvimento teoacuterico

A base desta abordagem descrita por Groumlnwall e atribuiacuteda a Linderstroslashm-Lang

reside na hipoacutetese de que a moleacutecula de proteiacutena de configuraccedilatildeo k e carga nula

participa do seguinte equiliacutebrio com os iacuteons H+ e com sua forma de carga i

22 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

푃 + 푖퐻 푃 lowast

(52 ndash 1)

Note-se que o valor de i pode ser negativo A constante do equiliacutebrio quiacutemico

descrita pela equaccedilatildeo (52 ndash 1) pode ser expressa como

퐾 =푎

lowast

푎 푎

(52 ndash 2)

Sabendo que a atividade da moleacutecula de proteiacutena de configuraccedilatildeo k e carga i eacute dada

pelo produto entre sua concentraccedilatildeo e seu coeficiente de atividade tem-se que

푥lowast

= 푎 푎퐾훾

lowast

(52 ndash 3)

Entretanto a solubilidade da proteiacutena eacute soma das concentraccedilotildees de todas as

moleacuteculas de carga i Poreacutem a concentraccedilatildeo das moleacuteculas de carga i eacute a soma das

concentraccedilotildees das moleacuteculas de configuraccedilatildeo k Assim a solubilidade pode ser

escrita como

푠 (푝퐻) = 푎 푎퐾훾

lowast

(52 ndash 4)

Derivando a equaccedilatildeo (52 ndash 4) com respeito agrave atividade do iacuteon H+ considerando

que atividade da moleacutecula neutra eacute constante para qualquer configuraccedilatildeo k e ainda

que o coeficiente de atividade da proteiacutena de carga i independe da atividade do iacuteon

H+ tem-se que

푑푠푑푎 = 푖 ∙ 푎 푎

퐾훾

lowast

(52 ndash 5)

23 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

Sendo

푑 log 푠 (푝퐻)푑(푝퐻) = minus

푎푠 (푝퐻)

푑푠푑푎

(52 ndash 6)

Substituindo as equaccedilotildees (52 ndash 4) e (52 ndash 5) na equaccedilatildeo (52 ndash 6) e

reescrevendo em termos de pH e das concentraccedilotildees das proteiacutenas de carga i tem-

se que

푑 log 푠푑(푝퐻) = minus

sum (푖 ∙ 푥 )sum 푥

(52 ndash 7)

Contudo o termo do lado direito da equaccedilatildeo (52 ndash 7) estaacute associado ao conceito

de valecircncia meacutedia estabelecido por Linderstroslashm-Lang (1924)

횤 =sum (푖 ∙ 푥 )sum 푥

(52 ndash 8)

Os autores natildeo possuiacuteam um modo mais adequado de construir a curva de

solubilidade dada pela equaccedilatildeo (52 ndash 7) do que aproximar por uma funccedilatildeo linear o

perfil de carga liacutequida da proteiacutena obtido experimentalmente e integraacute-lo valendo-se

da analogia entre o conceito de carga liacutequida (Z) e de valecircncia meacutedia ( i ) Entretanto

hoje jaacute se tem uma descriccedilatildeo analiacutetica do perfil de carga liacutequida de proteiacutenas que

pode ser escrita como

푍(푝퐻) = 휈 훼

(52 ndash 9)

Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (52 ndash 9) e a resultante na equaccedilatildeo

(52 ndash 7) tem-se que

24 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

푑 log 푠푑(푝퐻) = minus

12

11 + 10

1 + 휈 + 휈 1 minus 휈 10

(52 ndash 10)

Integrando a equaccedilatildeo (52 ndash 10) de um ponto de referecircncia por exemplo do ponto

isoeleacutetrico (pI) ateacute um pH qualquer tem-se a seguinte relaccedilatildeo

푑 log 푠

( )

( )

= minus12

1

1 + 101 + 휈 + 휈 1 minus 휈 10 푑(푝퐻)

(52 ndash 11)

log푠 (푝퐻)푠 (푝퐼) = minus

12 1 + 휈

11 + 10

푑(푝퐻)

+ 휈 1 minus 휈10

1 + 10푑(푝퐻)

(52 ndash 12)

Fazendo a seguinte substituiccedilatildeo

푢 = 10 푡푎푙 푞푢푒 푑푢푢 = ln 10푑(푝퐻)

(52 ndash 13)

Tem-se que

log푠 (푝퐻)푠 (푝퐼) = minus

12

1 + 휈ln 10

1푢(1 + 푢) 푑푢 +

휈 1 minus 휈ln 10

1(1 + 푢) 푑푢

(52 ndash 14)

log푠 (푝퐻)푠 (푝퐼) = minus

12

1 + 휈ln 10

1푢 푑푢 minus

11 + 푢 푑푢 +

휈 1 minus 휈ln 10

1(1 + 푢) 푑푢

(52 ndash 15)

25 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐼) = minus

12 1 + 휈 log

1010

minus 휈 1 minus 휈 minus 1 + 휈 log1 + 101 + 10

(52 ndash 16)

Sendo

휈 1 minus 휈 minus 1 + 휈 = 휈 minus 휈 minus 1 minus 휈 = minus 1 + 휈 = minus2

(52 ndash 17)

Resultando em

log푠 (푝퐻)푠 (푝퐼) = log

1 + 101 + 10

minus1 + 휈

2 (푝퐻 minus 푝퐼)

(52 ndash 18)

Ainda eacute possiacutevel reescrever a equaccedilatildeo (52 ndash 18) como

log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log

1 + 101 + 10

(52 ndash 19)

Na qual n+ representa o nuacutemero de resiacuteduos ionizaacuteveis que na sua forma carregada

apresentam carga positiva A equaccedilatildeo (52 ndash 19) eacute uma expressatildeo analiacutetica que a

partir de dados da estrutura proteacuteica e de um dado de solubilidade permite predizer

a curva de solubilidade de uma dada proteiacutena em funccedilatildeo do pH na regiatildeo do ponto

isoeleacutetrico mantendo fixas a temperatura e a forccedila iocircnica do sistema

Eacute possiacutevel provar que as equaccedilotildees (42 ndash 8) e (52 ndash 19) satildeo idecircnticas - a prova

disso eacute descrita na seccedilatildeo 6 ndash e assim tem-se que apesar das distintas abordagens

a descriccedilatildeo do fenocircmeno eacute a mesma Note-se que um passo fundamental no

desenvolvimento da Equaccedilatildeo (52 ndash 5) eacute admitir que por hipoacutetese a atividade da

26 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

forma neutra natildeo depende do pH essa hipoacutetese tambeacutem eacute a base da equaccedilatildeo (41

ndash 7) Deve-se registrar o fato de que pelo melhor do nosso conhecimento esta eacute a

primeira vez que uma expressatildeo analiacutetica para o caacutelculo da solubilidade de

proteiacutenas em funccedilatildeo do pH eacute descrita mesmo no limite em que se considera vaacutelida

a lei de Henry

53 Soluccedilatildeo Paraboacutelica da Curva de Solubilidade

Tanto Groumlnwall (1941) quanto Fredericq e Neurath (1950) adotaram a hipoacutetese de

que os perfis de carga liacutequida da -lactoglobulina para um e da insulina para os

outros dois eram lineares na regiatildeo do ponto isoeleacutetrico Esta hipoacutetese eacute bastante

plausiacutevel e simplificadora principalmente a eacutepoca na qual estes trabalhos foram

desenvolvidos em que a estrutura proteacuteica bem como as constantes de ionizaccedilatildeo

dos resiacuteduos com grupos ionizaacuteveis era pouco conhecida De fato ainda hoje a falta

de dados das constantes de ionizaccedilatildeo na cadeia proteacuteica eacute o maior desafio no uso

do modelo rigoroso ndash equaccedilatildeo (52 ndash 18) Por isso o valor desta hipoacutetese de perfil

de carga liacutequida linear eacute notaacutevel

Supondo entatildeo que o perfil de carga seja linear eacute possiacutevel escrevecirc-lo como

푍(푝퐻) = minus퐴(푝퐻 minus 푝퐼) 푐표푚 퐴 gt 0

(53 ndash 1)

Substituindo (53 ndash 1) em (52 ndash 6)

푑 log 푠 (푝퐻)푑(푝퐻) = 퐴(푝퐻 minus 푝퐼)

(53 ndash 2)

Integrando (53 ndash 2) de um pH0 de referecircncia ateacute pH tem-se que

27 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐻 ) = 퐾[푝퐻 minus 2푝퐼(푝퐻 minus 푝퐻 ) minus 푝퐻 ] 푐표푚 퐾 =

퐴2

(53 ndash 3)

Ao se adotar como ponto de referecircncia o ponto isoeleacutetrico a equaccedilatildeo (53 ndash 3)

reduz-se agrave

log푠 (푝퐻)푠 (푝퐼) = 퐾(푝퐻 minus 푝퐼)

(53 ndash 4)

Contudo apesar da soluccedilatildeo quadraacutetica ou paraboacutelica para a equaccedilatildeo estendida de

Linderstroslashm-lang e Groumlnwall expressa na equaccedilatildeo (53 ndash 3) natildeo requerer os dados

das constantes de ionizaccedilatildeo dos resiacuteduos com grupos ionizaacuteveis ela exige a

definiccedilatildeo do paracircmetro A que fisicamente representa a inclinaccedilatildeo da reta de

aproximaccedilatildeo da curva de carga liacutequida e que pode ser calculado por correlaccedilatildeo a

partir de um conjunto de dados experimentais de solubilidade ou de carga liacutequida

6 Identidade entre o Modelo Proposto e a Equaccedilatildeo

Estendida de Linderstroslashm-Lang e Groumlnwall

A equaccedilatildeo final da modelagem termodinacircmica proposta apresentada na seccedilatildeo 4 eacute a

equaccedilatildeo (42 ndash 8) dada por

푠 (푝퐻)푠 (푝퐼) =

1 + 101 + 10

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 1)

Aplicando-se o logaritmo decimal nos dois termos da equaccedilatildeo (6 ndash 1) tem-se que

log푠 (푝퐻)푠 (푝퐼) = log

1 + 101 + 10

+ log

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 2)

Pelo bem da simplificaccedilatildeo desta deduccedilatildeo adotar-se-atildeo as seguintes funccedilotildees

휂 (푝퐻) = log

(6 ndash 3)

휃 (푝퐻) = log

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 4)

Assim pode-se reescrever a equaccedilatildeo (6 ndash 2) por

29 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐼) = 휂 (푝퐻) + 휃 (푝퐻)

(6 ndash 5)

Observando-se a equaccedilatildeo (6 ndash 5) tem-se que a funccedilatildeo j independe do estado de

ionizaccedilatildeo do resiacuteduo j poreacutem a funccedilatildeo jk depende Por isso deve-se analisar esta

funccedilatildeo para cada estado de ionizaccedilatildeo possiacutevel como mostrado na Tabela 61

Tabela 6 1 ndash Anaacutelise da funccedilatildeo jk para cada estado de ionizaccedilatildeo possiacutevel

j jk jk Quantidade de resiacuteduos neste estado

-1 -1 푝퐼 minus 푝퐻 na

0 0 nb

+1 +1 0 nc

0 푝퐼 minus 푝퐻 nd

Pela anaacutelise da Tabela 61 e considerando uma proteiacutena com n resiacuteduos com

grupos ionizaacuteveis infere-se que a equaccedilatildeo (6 ndash 5) pode ser reescrita como

log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)

(6 ndash 6)

Contudo as equaccedilotildees acima descritas satildeo vaacutelidas apenas para configuraccedilotildees

neutras pois apenas as configuraccedilotildees neutras da fase liacutequida estatildeo em equiliacutebrio

com as moleacuteculas de proteiacutena da fase soacutelida Para que uma configuraccedilatildeo seja

neutra vale a seguinte restriccedilatildeo

휀 = 0 hArr 푛 = 푛

(6 ndash 7)

30 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall

Substituindo a restriccedilatildeo dada pela equaccedilatildeo (6 ndash 7) na equaccedilatildeo (6 ndash 6) tem-se que

log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)

(6 ndash 8)

Ora mas a soma de nc e de nd natildeo resulta em outra coisa senatildeo no nuacutemero de

resiacuteduos com grupos ionizaacuteveis da estrutura proteacuteica cujo j seja +1 Assim

substituindo nc mais nd por n+ e substituindo a equaccedilatildeo (6 ndash 3) na equaccedilatildeo (6 ndash 8)

tem-se que

log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log

1 + 101 + 10

(6 ndash 9)

Ao se analisar a equaccedilatildeo (6 ndash 9) observa-se que ela eacute idecircntica a equaccedilatildeo estendida

de Linderstroslashm-Lang e Groumlnwall apresentada pela equaccedilatildeo (52 ndash 19) Com isso

tem-se que apesar das distintas formulaccedilotildees tanto a modelagem termodinacircmica aqui

proposta quanto a extensatildeo a teoria de Linderstroslashm-Lang e Groumlnwall resultam na

mesma descriccedilatildeo do fenocircmeno Aleacutem disso a equaccedilatildeo final dos modelos eacute

extremamente simples e depende apenas de um ponto de referecircncia e dos dados da

estrutura da moleacutecula de proteiacutena cuja solubilidade se deseja estudar

7 Aplicaccedilatildeo dos Modelos Expostos

Para validar o modelo comparando-o com o caacutelculo feito a partir da teoria de Debye-

Huumlckel o criteacuterio que relaciona os pontos calculados pelo modelo com os pontos

experimentais foi estabelecido a partir da seguinte funccedilatildeo objetivo (FO)

퐹푂 =1푁

푠 minus 푠푠

(7 ndash 1)

Contudo a equaccedilatildeo (7 ndash 1) natildeo eacute a melhor definiccedilatildeo de funccedilatildeo objetivo neste caso

pois a derivada da curva de solubilidade eacute razoavelmente grande nos dois lados do

ponto isoeleacutetrico e isso permite que pequenos desvios na direccedilatildeo horizontal

resultem em um grande aumento no valor da funccedilatildeo objetivo Uma soluccedilatildeo possiacutevel

seria substituir essa funccedilatildeo objetivo por uma funccedilatildeo definida pela soma do quadrado

da distacircncia do ponto experimental agrave curva do modelo principalmente se fosse

necessaacuterio calcular algum paracircmetro do modelo via otimizaccedilatildeo da funccedilatildeo objetivo

estipulada Natildeo sendo este o escopo deste trabalho optou-se pelo uso da FO

definida na equaccedilatildeo (7 ndash 1)

71 Solubilidade da Insulina Suiacutena

As Figuras 711 712 e 713 apresentam os graacuteficos da curva de solubilidade

dada pelos pontos experimentais pelo modelo proposto pela abordagem claacutessica e

tambeacutem a curva obtida pela soluccedilatildeo paraboacutelica da Equaccedilatildeo de Linderstroslashm-Lang e

Groumlnwall em trecircs temperaturas distintas

32 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 711 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 25 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

Figura 712 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 15 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

00

40

80

120

160

200

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

00

50

100

150

200

250

300

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

33 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 713 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 5 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

Os desvios da curva obtida pelo modelo proposto para valores de pH distantes do pI

podem ser explicados por ao menos trecircs importantes motivos dois devidos a

hipoacuteteses do modelo e um devido a fenocircmenos intriacutensecos a proteiacutena Sabendo que

no pI a solubilidade eacute miacutenima para valores de pH distantes do pI pode-se ter

solubilidades suficientemente grandes para que a validade da lei de Henry ndash adotada

na formulaccedilatildeo do modelo - seja questionada pois quanto mais distante do pI maior

a solubilidade e menor a validade da lei de Henry jaacute que haacute um aumento da

concentraccedilatildeo do soluto (proteiacutena) na soluccedilatildeo e tambeacutem ao fato do modelo prever

solubilidade infinita quando a fraccedilatildeo de moleacuteculas eletricamente neutras tende a

zero

limrarr푠 = lim

rarr

Φ(푝퐼)푠 (푝퐼)Φ(푝퐻) = +infin

(711 ndash 1)

00

50

100

150

200

250

300

350

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

34 7 Aplicaccedilatildeo dos Modelos Expostos

Todavia ainda haacute um fator de ordem natural que justifica o desvio apresentado para

valores de pH distantes do pI o desnovelamento da cadeia proteacuteica Este fenocircmeno

pode ocorrer de maneira a expor grupos hidroacutefobos resiacuteduos antes natildeo expostos

acrescentando relaccedilotildees de equiliacutebrio quiacutemico natildeo existentes na regiatildeo do pI

alterando o equiliacutebrio de fases e portanto alterando o valor da solubilidade

A Tabela 711 apresenta os valores obtidos para a funccedilatildeo objetivo definida em (7 ndash

1) tanto para o modelo proposto quanto para a abordagem claacutessica para trecircs

diferentes temperaturas

Tabela 711 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada

abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para insulina

suiacutena

T ordmC Abordagem FO

25 P 01857 C 02535

15 P 01981 C 05056

5 P 03595 C 03064

Observando-se a Tabela 711 vecirc-se que o modelo apresentou melhores resultados

do que o caacutelculo efetuado atraveacutes da abordagem claacutessica no que tange a

minimizaccedilatildeo da funccedilatildeo objetivo exceto para os dados a 5 ordmC

Tambeacutem eacute possiacutevel observar que a funccedilatildeo objetivo sofreu aumento com a

diminuiccedilatildeo da temperatura Isto ocorreu principalmente devido agrave dificuldade de

obter dados experimentais de solubilidade a temperaturas baixas o que aumenta o

desvio experimental fazendo com que se tenha um aumento do valor da funccedilatildeo

objetivo como a definida em (5 ndash 1) Um efeito secundaacuterio que tambeacutem pressiona a

35 7 Aplicaccedilatildeo dos Modelos Expostos

funccedilatildeo objetivo eacute o fato dos dados de pKA terem sido obtidos a uma temperatura

especiacutefica o que tende a acrescentar erro no caacutelculo de solubilidades a temperaturas

diferentes ainda que o pKA natildeo varie de forma ab-rupta com a temperatura

Outra observaccedilatildeo que deve ser registrada eacute o fato da funccedilatildeo objetivo para a

abordagem claacutessica na temperatura de 15 ordmC divergir a um valor tatildeo elevado em

relaccedilatildeo aos demais Isto se deve a um ponto experimental especiacutefico a um pH de

45 a solubilidade da insulina suiacutena obtida experimentalmente eacute 230 x 10-5 mol kg-1

enquanto a calculada pelo modelo proposto eacute 230 x 10-5 mol kg-1 e a calculada pela

abordagem claacutessica eacute 520 x 10-5 mol kg-1 Por conta do desvio deste ponto a funccedilatildeo

objetivo para a abordagem claacutessica nesta temperatura tem um aumento significativo

A Tabela 712 apresenta os valores do paracircmetro K da soluccedilatildeo paraboacutelica obtidos

neste trabalho para a insulina suiacutena comparados ao encontrado na literatura

Tabela 712 ndash Valores do paracircmetro K da soluccedilatildeo paraboacutelica para a insulina suiacutena

Referecircncias T ordmC K Fredericq e Neurath (1950) - 081 Neste trabalho 25 104 Neste trabalho 15 101 Neste trabalho 5 145

Pela Tabela 712 pode-se observar que haacute uma diferenccedila pequena entre os

valores do paracircmetro K obtidos neste trabalho e por Fredericq e Neurath (1950) Por

isso natildeo se pode afirmar a que se deve esta diferenccedila se eacute devido a diferenccedilas entre

procedimentos experimentais ou se eacute devido agrave diferenccedila de meacutetodo de caacutelculo do

paracircmetro Apesar de no experimento realizado por Fredericq e Neurath (1950)

haver a presenccedila do acircnion tiocianato e este acircnion interagir com grupos ionizaacuteveis

da cadeia proteacuteica como observado pelos autores do trabalho tambeacutem estes

36 7 Aplicaccedilatildeo dos Modelos Expostos

proacuteprios autores afirmam que a presenccedila deste acircnion natildeo altera a forma da curva

que eacute basicamente determinada pelo paracircmetro K De qualquer modo eacute interessante

observar a proximidade dos valores encontrados neste trabalho com o obtido por

Fredericq e Neurath (1950) pelo menos no que diz respeito agrave ordem de grandeza do

paracircmetro em questatildeo

72 Solubilidade da Lisozima de clara de ovo de galinha

Um modelo para ser validado necessita correlacionar dados experimentais de modo

satisfatoacuterio ou seja um modelo deve buscar fidelidade ao fenocircmeno fiacutesico

observado Assim na procura de dados de solubilidade de proteiacutenas poucos dados

na regiatildeo do pI foram encontrados Este eacute o caso da lisozima de clara de ovo de

galinha que apesar de ter muitos estudos de solubilidade nenhum deles se

encontra na regiatildeo do pI Surgiu assim a necessidade de se obter estes dados

experimentais para poder validar o modelo proposto A escolha da lisozima de clara

de ovo de galinha se deu em parte pela sua importacircncia mas tambeacutem em parte por

ter os valores de pKA conhecidos

A curva de solubilidade da lisozima de clara de ovo de galinha levantada neste

trabalho estaacute apresentada na Figura 721

37 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em

soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e

dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()

Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento

esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH

isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de

soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se

comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto

isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da

soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos

ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente

neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a

solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e

00

10

20

30

40

50

60

70

80

90

100

95 100 105 110 115 120

Solu

bilid

ade

(mg

mL)

pH

38 7 Aplicaccedilatildeo dos Modelos Expostos

alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado

em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo

Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo

a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo

Por conta de falta de dados a este respeito modelou-se apenas a curva de

solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura

722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de

galinha em funccedilatildeo do pH da soluccedilatildeo

Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)

00

10

20

30

40

50

60

70

80

90

96 99 102 105 108 111 114 117 120

Solu

bilid

ade

(mg

mL)

pH

39 7 Aplicaccedilatildeo dos Modelos Expostos

O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721

Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada

abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima

de clara de ovo de galinha

T ordmC Abordagem FO

25 P 4650 C gt7919a

a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado

Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta

aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a

abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca

de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos

anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao

efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de

clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a

variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A

proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de

cargas pontuais de Debye-Huumlckel

8 Conclusotildees

A modelagem termodinacircmica proposta neste trabalho apresentou expressivos

resultados quando comparada a abordagem claacutessica de Debye-Huumlckel

Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o

modelo aproximou melhor os pontos experimentais do que a referida abordagem

comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima

ao ponto isoeleacutetrico

Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica

para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua

construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo

lugar por sua aplicabilidade

Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis

da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva

em regiotildees distantes do ponto isoeleacutetrico

9 Referecircncias Bibliograacuteficas

BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene

Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects

Biophys J 95 1285-1294 2008

FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and

other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72

2684 - 26911950

GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v

93 p 517-542 1931

GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab

Carlsberg v 24 p 185-200 1941

KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native

and mutant insulins pK perturbation of B13-Glu in aggregated species Arch

Biochem Biophys v 283 p 496-502 1990

KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for

the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng

Chem Res v 35 p 4319-4327 1996

42 9 Referecircncias Bibliograacuteficas

KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen

lysozyme J Biochem v 87 p 1215-1219 1980

LADISCH M R Bioseparations Engineering principles practice and

economics John Wiley amp Sons 2001 pp1 116 ndash 117 133

LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab

Carlsberg v 15 p 1-29 1924

PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da

particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas

2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP

PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the

excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte

solutions Fluid Phase Equilib v 269 p 25ndash35 2008

PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-

contribution model involving phase and chemical equilibrium Ind Eng Chem Res

v 33 p 1341-1347 1994

PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277

1973

PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino

acids Fluid Phase Equilib v 152 p 121-132 1998

43 9 Referecircncias Bibliograacuteficas

PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular

Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999

SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of

equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte

solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009

TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J

R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with

carbon dioxide Biotech Bioeng v103 p 909-919 2009

TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer

free energy Biophys J v 95 p 2601-2609 2008

TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in

water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95

2009

Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na

cadeia proteacuteica

Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo

de ionizaccedilatildeo

퐻퐴 퐴 + 퐻

(A ndash 1)

Assim considerando que a constante de equiliacutebrio

퐾 = 푎

(A ndash 2)

Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que

퐾 =[퐴 ][퐻 ]

[퐻퐴]

(A ndash 3)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que

log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]

(A ndash 4)

Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado

por

minus log[휑] = 푝휑

(A ndash 5)

Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que

45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

푝퐾 = log[퐻퐴][퐴 ] + 푝퐻

(A ndash 6)

Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por

훼 =[퐴 ]

[퐻퐴] + [퐴 ]

(A ndash 7)

Reescrevendo (A ndash 7) tem-se que

훼 =[퐴 ] [퐻퐴frasl ]

1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =

훼1 minus 훼

(A ndash 8)

Substituindo (A ndash 8) em (A ndash 6) tem-se que

푝퐾 = log훼

1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10

(A ndash 9)

Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos

훼 =1

1 + 10

(A ndash 10)

Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio

퐴 + 퐻 퐻퐴

(A ndash 11)

Pode se escrever a constante de equiliacutebrio como

퐾 =[퐻퐴 ]

[퐴][퐻 ]

(A ndash 12)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que

46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

log퐾 = minus log[퐴]

[퐻퐴 ] minus log[퐻 ]

(A -13)

Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por

훼 =[퐻퐴 ]

[퐴] + [퐻퐴 ]

(A ndash 14)

Assim a equaccedilatildeo (A ndash 13) fica

훼1 minus 훼 = 10

(A ndash 15)

Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo

훼 =10

1 + 10

(A ndash 16)

Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos

modelos expostos

Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]

48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]

49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)

50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])

51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]

52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])

53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)

54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2

55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO

5 1 Introduccedilatildeo

um conjunto de dados experimentais Vale observar que resultados expressivos

foram alcanccedilados neste trabalho de modo particular o fato de que a presenccedila do

acircnion tiocianato natildeo altera a forma da curva de solubilidade da insulina mas a

desloca em direccedilatildeo a menores valores de pH e de solubilidade

Contudo os trabalhos mais recentes se concentraram na modelagem da curva de

solubilidade de aminoaacutecidos em funccedilatildeo do pH dando maior enfoque aos modelos

termodinacircmicos para soluccedilotildees natildeo-ideais tanto atraveacutes de equaccedilotildees de estado

como de modelos de energia livre de Gibbs excedente

Destaca-se neste grupo o trabalho de Pinho et al (1994) que aplicaram o modelo

UNIFAC associado ao termo de Debye-Huumlckel para aminoaacutecidos como glicina D-

alanina L-serina e DL-valina Tambeacutem o trabalho de Khoshkbarchi e Vera (1996)

no qual foi desenvolvido um modelo simplificado de esfera riacutegida perturbada para

calcular o coeficiente de atividade de aminoaacutecidos e de peptiacutedeos permite prever a

curva de solubilidade destes em funccedilatildeo do pH Jaacute o modelo NRTL foi aplicado tanto

por Pradhan e Vera (1998) quanto Tseng et al (2009) para aminoaacutecidos Jaacute Seyfi et

al (2009) aplicaram a equaccedilatildeo de estado SAFT para a prediccedilatildeo da curva de

solubilidade da DL-metionina

Entretanto o primeiro trabalho dedicado exclusivamente agrave modelagem e prediccedilatildeo da

curva de solubilidade de proteiacutena propriamente dita em funccedilatildeo do pH foi publicado

por Tjong e Zhou (2008) Neste trabalho a solubilidade foi calculada a partir da

energia livre de transferecircncia da fase soacutelida para a fase liacutequida Para a execuccedilatildeo

deste caacutelculo a energia livre de transferecircncia foi dividida em duas contribuiccedilotildees

uma de natureza eletrostaacutetica calculada pela meacutedia de 100 conformaccedilotildees proteacuteicas

advindas da aplicaccedilatildeo de dinacircmica molecular a pH constante e outra de natureza

natildeo-eletrostaacutetica baseada na aacuterea superficial acessiacutevel ao solvente Poreacutem o

6 1 Introduccedilatildeo

esforccedilo computacional requerido pelo modelo por eles proposto para calcular

apenas alguns pontos da curva natildeo apresenta uma aplicabilidade razoaacutevel Aleacutem

deste trabalho Tashima et al (2009) propuseram uma modelagem termodinacircmica

para prever a curva de solubilidade especificamente da insulina suiacutena aplicando o

modelo de Pitzer truncado apoacutes o segundo coeficiente do virial

No presente trabalho propomos um novo modelo baseado no caacutelculo de estados de

ionizaccedilatildeo e em ferramentas de termodinacircmica claacutessica bem como uma extensatildeo agrave

teoria de Linderstroslashm-Lang e Groumlnwall Vale ressaltar de antematildeo que tanto este

novo modelo proposto quanto a extensatildeo desenvolvida resultam na mesma equaccedilatildeo

para o fenocircmeno apesar das distintas abordagens

2 Materiais e Meacutetodos

21 Meacutetodos computacionais

O coacutedigo-fonte do programa em linguagem C estaacute apresentado no Apecircndice B Os

meacutetodos numeacutericos utilizados se resumem a interpolaccedilatildeo linear o meacutetodo de

Newton-Raphson cujo uso seraacute apresentado na proacutexima seccedilatildeo quando se deduziraacute

o algoritmo do modelo de Debye-Huumlckel e o meacutetodo de busca unidirecional de

miacutenimos de funccedilatildeo pela Seccedilatildeo Aacuteurea

As Tabelas 211 e 212 apresentam os resiacuteduos considerados para cada proteiacutena

considerada bem como os seus valores de pKA que foram obtidos a partir da

literatura e satildeo indispensaacuteveis para execuccedilatildeo dos caacutelculos mais rigorosos

Tabela 211 ndash Resiacuteduos ionizaacuteveis considerados e valores de pKA da insulina suiacutena

Valores extraiacutedos de Kaarsholm et al (1990)

Aminoaacutecido Grupo Ionizaacutevel pKA

A1 ndash Gly -NH2 738 A4 ndash Glu -COOH 437 A14 ndash Tyr Fenol-OH 1020 A17 ndash Glu -COOH 437 A19 ndash Tyr Fenol-OH 1020 A21 ndash Asn -COOH 345

B1 ndash Phe -NH2 738 B5 ndash His Imidazol-NH 598 B10 ndash His Imidazol-NH 598 B 13 ndash Glu -COOH 437 B16 ndash Tyr Fenol-OH 1020 B21 ndash Glu -COOH 437

B22 ndash Arg Guaniacutedio-NH2 1110 B26 ndash Tyr Fenol-OH 1020

B29 ndash Lys -NH2 852 B30 ndashAla -COOH 345

8 2 Materiais e Meacutetodos

Tabela 212 ndash Resiacuteduos ionizaacuteveis considerados e valores de pKA a 25 ordmC da lisozima

de clara de ovo de galinha Valores extraiacutedos de Kuramitsu e Hamaguchi (1980)

Aminoaacutecido Grupo Ionizaacutevel pKA α-NH2 α-NH2 79

Lys1 ε-NH2 108

Arg5 Guaniacutedio-NH2 120 Glu7 -COOH 26

Lys13 ε-NH2 105

Arg14 Guaniacutedio-NH2 120 His15 Imidazol-NH 58 Asp18 -COOH 20 Tyr20 Fenol-OH 103

Arg21 Guaniacutedio-NH2 120 Tyr23 Fenol-OH 98

Lys33 ε-NH2 106 Glu35 -COOH 61

Arg45 Guaniacutedio-NH2 120 Asp48 -COOH 43 Asp52 -COOH 34 Tyr53 Fenol-OH 121

Arg61 Guaniacutedio-NH2 120 Asp66 -COOH 16

Arg68 Guaniacutedio-NH2 120

Arg73 Guaniacutedio-NH2 120 Asp87 -COOH 21

Lys96 ε-NH2 108

Lys97 ε-NH2 103 Asp101 -COOH 45

Arg112 Guaniacutedio-NH2 120

Arg114 Guaniacutedio-NH2 120

Lys116 ε-NH2 104 Asp119 -COOH 25

Arg125 Guaniacutedio-NH2 120

Arg128 Guaniacutedio-NH2 120 α-COOH α-COOH 31

9 2 Materiais e Meacutetodos

22 Curva de solubilidade da lisozima da clara de ovo de galinha

221 Reagentes

Neste experimento de determinaccedilatildeo da curva de solubilidade da lisozima da clara de

ovo de galinha os reagentes utilizados foram cloreto de soacutedio (Reatec P A)

bicarbonato de soacutedio (Research Becto Chemical P A) Na2HPO4 7H2O (Reagen

P A) aacutegua destilada deionizada Milli-Q (Millipore) e lisozima de clara de ovo de

galinha (Sigma min 99)

222 Equipamentos

Neste experimento os equipamentos utilizados foram espectrofotocircmetro UV-Visiacutevel

(Beckman DU-530) centriacutefuga (Eppendorf) banho-teacutermico (Laacutectea) com controlador

de temperatura (Julabo) pHmetro (Micronal) e balanccedila (Mettler Toledo AB204S)

223 Preparaccedilatildeo das soluccedilotildees-tampatildeo

Foram preparadas soluccedilotildees-tampatildeo com valores de pH=96 pH = 98 pH = 100

pH = 102 pH = 104 pH = 106 pH = 108 pH = 110 pH = 112 pH = 114 pH =

116 e pH = 118 a partir de quatro soluccedilotildees uma de hidroacutexido de soacutedio 01 M uma

de cloreto de soacutedio 1 M (para equalizar a forccedila iocircnica) uma de bicarbonato de soacutedio

005 M e outra de Na2HPO4 005 M

A Tabela 2231 apresenta os valores de volume usados no preparo de cada uma

das soluccedilotildees-tampatildeo

10 2 Materiais e Meacutetodos

Tabela 2231 ndash Volumes de hidroacutexido de soacutedio a 01 M adicionados no preparo das

soluccedilotildees-tampatildeo

Tampatildeo pH V NaOH mL

NaHCO3 96 100 005 M 98 152

(para cada soluccedilatildeo-tampatildeo 100 mL 100 214

desta soluccedilatildeo foram adicionados) 102 276

104 330 106 382

108 424

110 454

112 530 114 583

Na2HPO4 110 82

005 M 112 126

(para cada soluccedilatildeo-tampatildeo 100 mL 114 182 desta soluccedilatildeo foram adicionados) 116 270

118 388

224 Procedimento experimental

Foram adicionadas quantidades natildeo definidas de lisozima de clara de ovo de galinha

a 13 mL de cada soluccedilatildeo-tampatildeo em tubos Eppendorf de 2 mL Colocaram-se

entatildeo as amostras apoacutes agitaccedilatildeo vigorosa em banho teacutermico a 250 plusmn 01 ordmC por 24

horas para que os sistemas atingissem o equiliacutebrio termodinacircmico Caso natildeo

houvesse a formaccedilatildeo de precipitado lisozima era adicionada e o procedimento

repetido Ao se observar a formaccedilatildeo de precipitado o sistema era centrifugado a

13000 rpm por 15 minutos Uma aliacutequota do sobrenadante era retirada e sua

concentraccedilatildeo proteacuteica determinada por medida de absorbacircncia a 280 nm Cada

sistema foi feito ao menos em duplicata

3 Modelo Estendido de Debye-Huumlckel

31 Introduccedilatildeo

De fato como descrito por Pessocirca Filho (2002) a equaccedilatildeo de Debye-Huumlckel natildeo

deve ser aplicada agrave modelagem de polieletroacutelitos tais como proteiacutenas porque nestas

moleacuteculas as cargas satildeo distribuiacutedas ao longo da cadeia e portanto natildeo satildeo cargas

pontuais como suposto por Debye-Huumlckel

Contudo nesta modelagem considera-se uma regiatildeo de pH em torno do ponto

isoeleacutetrico (pI) na qual satildeo inerentes duas condiccedilotildees favoraacuteveis a aplicaccedilatildeo da

equaccedilatildeo de Debye-Huumlckel carga liacutequida proacutexima a zero pois Z(pI) = 0 e regiatildeo de

miacutenima solubilidade que significa baixas concentraccedilotildees de proteiacutenas em soluccedilatildeo

Isto significa em primeiro lugar que os efeitos da carga tais como ldquodesnovelamentordquo

da cadeia proteacuteica com exposiccedilatildeo de resiacuteduos outrora blindados podem ser

desprezados em uma regiatildeo proacutexima ao ponto isoeleacutetrico e em segundo lugar

baixas concentraccedilotildees de proteiacutena em soluccedilatildeo significam que os termos de curto

alcance podem ser desprezados e portanto haacute prevalecircncia do termo de longo

alcance que no caso de soluccedilotildees eletroliacuteticas pode ser descrito por uma equaccedilatildeo

estendida de Debye-Huumlckel

Assim o modelo de Debye-Huumlckel foi utilizado natildeo para verificar sua aplicabilidade agrave

modelagem de soluccedilotildees proteacuteicas mas sim para confrontar o modelo proposto com

um modelo usual em modelagem de soluccedilotildees eletroliacuteticas e seraacute referido no texto

sempre como abordagem claacutessica

12 3 Modelo Estendido de Debye-Huumlckel

32 Desenvolvimento teoacuterico

Pode-se escrever a atividade da proteiacutena como o produto entre a solubilidade e o

coeficiente de atividade da mesma como mostrado na equaccedilatildeo (32 - 1)

푎 = 훾푠

(32 - 1)

Na qual pode-se calcular o coeficiente de atividade atraveacutes da equaccedilatildeo estendida

de Debye-Huumlckel (Pitzer 1973)

ln 훾 = minus퐴 푍radic퐼

1 + 푏radic퐼+

2푏

ln 1 + 푏radic퐼

(32 - 2)

Sendo que a constante universal empiacuterica b = 12 kg12 mol-12 eacute usada para todos os

eletroacutelitos Jaacute AΦ eacute o paracircmetro de Debye-Huumlckel para o coeficiente osmoacutetico e eacute

dado por

퐴 =13

(2휋푁 휌 ) frasl 푒4휋휀 휀 푘푇

frasl

(32 - 3)

Em que NA eacute a constante de Avogadro ρs eacute a densidade do solvente em g cm-3 e eacute

a carga eletrocircnica (e = 160218 x 10-19 C) ε0 eacute a permissividade do espaccedilo livre (ε0 =

885419 x 10-12 C2 N-1 m-2) εr eacute a constante dieleacutetrica do solvente k aacute constante de

Boltzmann e T eacute a temperatura absoluta Jaacute a carga liacutequida em funccedilatildeo do pH pode

ser calculada como

푍 = 훼 minus 훼

(32 - 4)

Sendo que α+ e α- satildeo dados pelas equaccedilotildees (A - 10) e (A - 16) do Apecircndice A

13 3 Modelo Estendido de Debye-Huumlckel

E a forccedila iocircnica eacute dada pela equaccedilatildeo (32 - 5) descrita abaixo

퐼 = 12

푚 푍

(32 - 5)

Contudo no ponto isoeleacutetrico a carga meacutedia da proteiacutena eacute nula portanto o termo de

Debye-Huumlckel se anula e o coeficiente de atividade se torna unitaacuterio

ln푎 (푝퐼) = ln 푠 (푝퐼)

(32 - 6)

Considerando que a atividade da proteiacutena seja constante com a variaccedilatildeo de pH isto

implica que esta eacute sempre igual agrave solubilidade da proteiacutena no ponto isoeleacutetrico e

portanto vale que

ln푎 (푝퐻) = ln 푠 (푝퐻) + ln 훾(푝퐻) = ln 푠 (푝퐼)

(32 - 7)

Assim

ln 푠 (푝퐻) = ln 푠 (푝퐼) + 퐴휙푍푝퐻2 radic퐼1 + 푏radic퐼

+2푏

ln 1 + 푏radic퐼

(32 - 8)

Esta equaccedilatildeo prevecirc a curva de solubilidade em funccedilatildeo do pH atraveacutes do caacutelculo da

atividade da proteiacutena na fase liacutequida pela equaccedilatildeo estendida de Debye-Huumlckel Para

resolvecirc-la eacute necessaacuterio se utilizar de um meacutetodo numeacuterico pois a forccedila iocircnica

depende da solubilidade naquele pH Optou-se neste trabalho pelo Meacutetodo de

Newton-Raphson para executar o meacutetodo iterativo que eacute exigido pela equaccedilatildeo (32

ndash 8) Para aplicar este meacutetodo arbitrou-se uma funccedilatildeo f(sp) definida aqui como

푓 푠 = minus ln 푠 (푝퐻) + ln 푠 (푝퐼) + 퐴휙푍푝퐻2 radic퐼

1 + 푏radic퐼+

2푏

ln 1 + 푏radic퐼

(32 - 9)

14 3 Modelo Estendido de Debye-Huumlckel

Assim ao calcular o sp que zera esta funccedilatildeo f(sp) saber-se-aacute que eacute a proacutepria

solubilidade que se deseja calcular Para aplicar o Meacutetodo de Newton-Raphson

basta derivar a funccedilatildeo f(sp) e aplicar o seguinte algoritmo de resoluccedilatildeo

푠 = 푠 minus푓(푠 )푓 (푠 )

(32 - 10)

Para calcular frsquo(s) deve-se considerar que a forccedila iocircnica depende da solubilidade

Para isto observando a equaccedilatildeo (32 - 5) vecirc-se que a forccedila iocircnica eacute dada pelo

somatoacuterio das contribuiccedilotildees de todos os iacuteons presentes na soluccedilatildeo por isso aqui

cabe um artifiacutecio de dividir estas contribuiccedilotildees em duas macro-contribuiccedilotildees aquela

devida a todos os iacuteons presentes na soluccedilatildeo exclusive os grupos ionizaacuteveis

presentes nas moleacuteculas da proteiacutena em questatildeo (I0) e que se considera constante

com o pH e aquela que engloba apenas os grupos ionizaacuteveis presentes nas

moleacuteculas da proteiacutena (IP)

퐼 = 퐼 + 퐼 = 퐼 +12푍 푠

(32 - 11)

Considerando a funccedilatildeo w tal que

푤 = radic퐼 = 퐼 +12푍 푠

(32 - 12)

Sendo

푤 =14푍 퐼

(32 - 13)

Entatildeo aplicando-se as devidas regras de derivaccedilatildeo tem-se

15 3 Modelo Estendido de Debye-Huumlckel

푓 (푠 ) = minus1푠 + 퐴 푍

3푤 + 2푤 푏푤(1 + 푏푤)

(32 - 14)

Substituindo as equaccedilotildees (32 - 12) e (32 - 13) na equaccedilatildeo (32 - 14) tem-se que

푓 (푠 ) = minus1푠 + 퐴 푍

15 + 푏radic퐼2radic퐼(1 + 푏radic퐼)

(32 - 15)

Entatildeo o algoritmo deve ser

푠 = 푠 minus

⎜⎛ln 푠 (푝퐼)

푠 + 퐴휙푍푝퐻2 radic퐼

1 + 푏radic퐼+ 2푏 ln 1 + 푏radic퐼

minus 1푠 + 퐴휙푍

15 + 푏radic퐼2radic퐼(1 + 푏radic퐼) ⎠

⎟⎞

(32 - 16)

4 Modelagem Termodinacircmica Proposta

41 Introduccedilatildeo

A condiccedilatildeo de equiliacutebrio entre duas fases (α e β) com m componentes eacute dada por

(Prausnitz et al 1999)

푝 = 푝

(41 ndash 1)

푇 = 푇

(41 ndash 2)

휇 = 휇⋮

휇 = 휇

(41 ndash 3)

Considerando o equiliacutebrio soacutelido-liacutequido (ESL) de sistemas contendo proteiacutenas

sendo que os efeitos da pressatildeo podem ser desprezados que as temperaturas nas

duas fases satildeo iguais e que na fase soacutelida soacute haacute proteiacutena tem-se que para a

proteiacutena a relaccedilatildeo de equiliacutebrio pode ser descrita por

휇 (푇푥) = 휇 (푇)

(41 ndash 4)

Contudo adotando-se a lei de Henry que eacute vaacutelida para baixas concentraccedilotildees de

soluto hipoacutetese que natildeo eacute distante dos valores observados da solubilidade de

proteiacutenas pode se escrever o potencial quiacutemico na fase liacutequida por

휇 (푇푥) = 휇 (푇 푥 ) + 푅푇푙푛푥

(41 ndash 5)

17 4 Modelagem Termodinacircmica Proposta

Entretanto variaccedilotildees de pH natildeo alteram o potencial quiacutemico da fase soacutelida o que

resulta pela relaccedilatildeo (41 ndash 4) que o mesmo natildeo altera tambeacutem o potencial quiacutemico

da fase liacutequida Com isso pela relaccedilatildeo (41 ndash 5) sendo o potencial quiacutemico de

referecircncia constante com o pH uma contradiccedilatildeo emerge a variaccedilatildeo do pH natildeo

poderia alterar o valor da solubilidade poreacutem a observaccedilatildeo experimental mostra o

contraacuterio Assim deve-se lembrar que pelo princiacutepio da eletroneutralidade a fase

soacutelida soacute possui moleacuteculas proteacuteicas eletricamente neutras e portanto o equiliacutebrio

de fases deve se estabelecer apenas entre as moleacuteculas presentes na fase soacutelida e

as moleacuteculas eletricamente neutras em soluccedilatildeo Ou seja como soacute moleacuteculas

eletricamente neutras podem estar na fase soacutelida o equiliacutebrio de fases depende

exclusivamente da fraccedilatildeo de moleacuteculas eletricamente neutras em soluccedilatildeo pois soacute

estas podem precipitar Assim tanto a equaccedilatildeo (41 ndash 4) quanto a equaccedilatildeo (41 ndash

5) devem ser aplicadas natildeo ao conjunto de todas as moleacuteculas de proteiacutena em

soluccedilatildeo mas somente as moleacuteculas proteacuteicas eletricamente neutras Portanto a

concentraccedilatildeo das moleacuteculas de proteiacutena eletricamente neutras em soluccedilatildeo eacute

constante com o pH e pode ser interpretada como a multiplicaccedilatildeo da fraccedilatildeo de

moleacuteculas eletricamente neutras pela concentraccedilatildeo total de proteiacutenas que eacute a

proacutepria solubilidade Assim uma relaccedilatildeo de inversa proporcionalidade eacute definida

quanto maior a fraccedilatildeo de moleacuteculas neutras menor seraacute a solubilidade de uma

proteiacutena em soluccedilatildeo Portanto no ponto isoeleacutetrico no qual haacute o miacutenimo de

solubilidade tem-se o ponto maacuteximo de fraccedilatildeo de moleacuteculas eletricamente neutras

A partir disto eacute possiacutevel escrever a equaccedilatildeo que rege o comportamento da

solubilidade de uma proteiacutena em funccedilatildeo do pH da soluccedilatildeo

휙(푝퐻)푆 (푝퐻) = 휆 = 푐표푛푠푡푎푛푡푒

(41 ndash 6)

18 4 Modelagem Termodinacircmica Proposta

Na equaccedilatildeo (41 ndash 6) o paracircmetro λ pode ser um paracircmetro de ajuste do modelo a

um conjunto de valores experimentais tendo se estabelecido uma funccedilatildeo objetivo ou

ainda dado pelo produto entre a solubilidade no ponto isoeleacutetrico e a fraccedilatildeo de

moleacuteculas eletricamente neutras em soluccedilatildeo tambeacutem no pI neste caso vale a

seguinte equaccedilatildeo

푠 (푝퐻) =휙(푝퐼)푠 (푝퐼)휙(푝퐻)

(41 ndash 7)

Sendo a equaccedilatildeo do modelo ndash equaccedilatildeo (41 ndash 7) ndash extremamente simples a uacutenica

dificuldade reside no caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras

(휙(푝퐻))

42 Caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras

Dentre os aminoaacutecidos que formam atraveacutes de ligaccedilotildees peptiacutedicas as proteiacutenas haacute

aqueles que possuem resiacuteduos com grupos ionizaacuteveis aleacutem dos grupos amina e

aacutecido carboxiacutelico terminais na cadeia Todos estes participam de equiliacutebrios

quiacutemicos com iacuteons H+ presentes na soluccedilatildeo entatildeo ao se alterar o pH da soluccedilatildeo

estes equiliacutebrios satildeo alterados

Assim haacute vaacuterias possibilidades de combinaccedilotildees de estados ionizados destes grupos

ionizaacuteveis que resultam em uma moleacutecula de proteiacutena eletricamente neutra Eacute

importante notar que dada a fraccedilatildeo de uma configuraccedilatildeo de uma moleacutecula neutra

todas as outras fraccedilotildees de configuraccedilotildees possiacuteveis que tambeacutem resultem em

moleacuteculas neutras satildeo proporcionais agrave fraccedilatildeo da configuraccedilatildeo dada pois todas as

configuraccedilotildees participam de equiliacutebrios entre si

19 4 Modelagem Termodinacircmica Proposta

Desta observaccedilatildeo implica-se que basta identificar uma configuraccedilatildeo proteacuteica cuja

soma dos estados ionizados resulte em carga nula para se descrever o equiliacutebrio de

fases em relaccedilatildeo ao pH na regiatildeo do ponto isoeleacutetrico onde esta consideraccedilatildeo eacute

predominante em relaccedilatildeo a outros possiacuteveis fenocircmenos

Contudo eacute necessaacuterio contabilizar a contribuiccedilatildeo de cada grupo ionizaacutevel via

equaccedilatildeo de Henderson-Hasselbach equaccedilatildeo (42 ndash 1)

훼 (푝퐻) =

⎩⎪⎨

⎪⎧ 10

1 + 10 푠푒 휈 = minus1

11 + 10

푠푒 휈 = +1

(42 ndash 1)

Na qual pKAj eacute o co-logaritmo da constante de equiliacutebrio do grupo ionizaacutevel do

resiacuteduo j j eacute estado carregado potencial do resiacuteduo j (-1 para grupos aacutecidos e +1

para grupos baacutesicos) e j eacute a fraccedilatildeo ionizada para o pH dado Para grupos cujo

estado de ionizaccedilatildeo na dada configuraccedilatildeo seja neutro a sua fraccedilatildeo eacute calculada tal

que a soma de sua fraccedilatildeo e da fraccedilatildeo ionizada tenha como resultado o valor

unitaacuterio

Assim a funccedilatildeo Pn pode ser escrita como o produto de cada fraccedilatildeo de cada grupo

ionizaacutevel j naquele estado (-1 0 ou +1) na configuraccedilatildeo neutra k em uma proteiacutena

com n grupos ionizaacuteveis Uma representaccedilatildeo matemaacutetica possiacutevel para esta funccedilatildeo

pode ser escrita como

휙 (푝퐻) = 훼 (푝퐻)

(42 ndash 2)

Na qual a fraccedilatildeo jrsquo(pH) eacute dada por

20 4 Modelagem Termodinacircmica Proposta

훼 (푝퐻) =훼 (푝퐻) 푠푒 휀 = 11 minus 훼 (푝퐻) 푠푒 휀 = 0

(42 ndash 3)

Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (42 ndash 3) e a resultante na equaccedilatildeo

(42 ndash 2) pode-se escrever que

휙 (푝퐻) =1

1 + 10

1 + 휈2 minus 휈 휀 10

minus휈 minus 1

2 minus 휈 휀 푐표푚 휀 = 0

(42 ndash 4)

A equaccedilatildeo (42 ndash 4) junto agrave equaccedilatildeo (41 ndash 7) constituem o modelo termodinacircmico

capaz de predizer a razatildeo entre as fraccedilotildees de moleacuteculas neutras de uma proteiacutena

em funccedilatildeo do pH na regiatildeo do ponto isoeleacutetrico mantendo fixas temperatura e forccedila

iocircnica Substituindo a equaccedilatildeo (42 ndash 4) na equaccedilatildeo (41 ndash 7) obteacutem-se para a

curva de solubilidade

푠 (푝퐻)푠 (푝퐼) =

1 + 101 + 10

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

푐표푚 휀 = 0

(42 ndash 8)

5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

51 Introduccedilatildeo

Segundo Groumlnwall (1941) na fase liacutequida haacute moleacuteculas de proteiacutenas com muitas

configuraccedilotildees k distintas que possuem carga liacutequida i e tambeacutem haacute certas

configuraccedilotildees que tem carga liacutequida nula e satildeo chamadas configuraccedilotildees neutras

Aleacutem disso estas uacuteltimas satildeo aquelas que determinam o equiliacutebrio de fases jaacute que

elas estatildeo em equiliacutebrio com a fase soacutelida na qual soacute haacute moleacuteculas neutras pelo

princiacutepio da eletroneutralidade Eacute tambeacutem afirmado que dado este equiliacutebrio a

atividade das moleacuteculas neutras natildeo se altera com a variaccedilatildeo do pH e eacute

proporcional agraves atividades de qualquer tipo de configuraccedilatildeo neutra

Neste mesmo trabalho eacute atribuiacuteda a Linderstroslashm-Lang o desenvolvimento de uma

teoria de prediccedilatildeo da solubilidade de proteiacutenas com a variaccedilatildeo do pH na regiatildeo do

ponto isoeleacutetrico Este desenvolvimento apresenta um balanccedilo de cargas de um

modo impliacutecito contudo como atestado por Groumlnwall o escasso conhecimento

sobre as estruturas proteacuteicas impediram agravequele tempo uma formulaccedilatildeo mais

pormenorizada do problema

52 Desenvolvimento teoacuterico

A base desta abordagem descrita por Groumlnwall e atribuiacuteda a Linderstroslashm-Lang

reside na hipoacutetese de que a moleacutecula de proteiacutena de configuraccedilatildeo k e carga nula

participa do seguinte equiliacutebrio com os iacuteons H+ e com sua forma de carga i

22 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

푃 + 푖퐻 푃 lowast

(52 ndash 1)

Note-se que o valor de i pode ser negativo A constante do equiliacutebrio quiacutemico

descrita pela equaccedilatildeo (52 ndash 1) pode ser expressa como

퐾 =푎

lowast

푎 푎

(52 ndash 2)

Sabendo que a atividade da moleacutecula de proteiacutena de configuraccedilatildeo k e carga i eacute dada

pelo produto entre sua concentraccedilatildeo e seu coeficiente de atividade tem-se que

푥lowast

= 푎 푎퐾훾

lowast

(52 ndash 3)

Entretanto a solubilidade da proteiacutena eacute soma das concentraccedilotildees de todas as

moleacuteculas de carga i Poreacutem a concentraccedilatildeo das moleacuteculas de carga i eacute a soma das

concentraccedilotildees das moleacuteculas de configuraccedilatildeo k Assim a solubilidade pode ser

escrita como

푠 (푝퐻) = 푎 푎퐾훾

lowast

(52 ndash 4)

Derivando a equaccedilatildeo (52 ndash 4) com respeito agrave atividade do iacuteon H+ considerando

que atividade da moleacutecula neutra eacute constante para qualquer configuraccedilatildeo k e ainda

que o coeficiente de atividade da proteiacutena de carga i independe da atividade do iacuteon

H+ tem-se que

푑푠푑푎 = 푖 ∙ 푎 푎

퐾훾

lowast

(52 ndash 5)

23 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

Sendo

푑 log 푠 (푝퐻)푑(푝퐻) = minus

푎푠 (푝퐻)

푑푠푑푎

(52 ndash 6)

Substituindo as equaccedilotildees (52 ndash 4) e (52 ndash 5) na equaccedilatildeo (52 ndash 6) e

reescrevendo em termos de pH e das concentraccedilotildees das proteiacutenas de carga i tem-

se que

푑 log 푠푑(푝퐻) = minus

sum (푖 ∙ 푥 )sum 푥

(52 ndash 7)

Contudo o termo do lado direito da equaccedilatildeo (52 ndash 7) estaacute associado ao conceito

de valecircncia meacutedia estabelecido por Linderstroslashm-Lang (1924)

횤 =sum (푖 ∙ 푥 )sum 푥

(52 ndash 8)

Os autores natildeo possuiacuteam um modo mais adequado de construir a curva de

solubilidade dada pela equaccedilatildeo (52 ndash 7) do que aproximar por uma funccedilatildeo linear o

perfil de carga liacutequida da proteiacutena obtido experimentalmente e integraacute-lo valendo-se

da analogia entre o conceito de carga liacutequida (Z) e de valecircncia meacutedia ( i ) Entretanto

hoje jaacute se tem uma descriccedilatildeo analiacutetica do perfil de carga liacutequida de proteiacutenas que

pode ser escrita como

푍(푝퐻) = 휈 훼

(52 ndash 9)

Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (52 ndash 9) e a resultante na equaccedilatildeo

(52 ndash 7) tem-se que

24 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

푑 log 푠푑(푝퐻) = minus

12

11 + 10

1 + 휈 + 휈 1 minus 휈 10

(52 ndash 10)

Integrando a equaccedilatildeo (52 ndash 10) de um ponto de referecircncia por exemplo do ponto

isoeleacutetrico (pI) ateacute um pH qualquer tem-se a seguinte relaccedilatildeo

푑 log 푠

( )

( )

= minus12

1

1 + 101 + 휈 + 휈 1 minus 휈 10 푑(푝퐻)

(52 ndash 11)

log푠 (푝퐻)푠 (푝퐼) = minus

12 1 + 휈

11 + 10

푑(푝퐻)

+ 휈 1 minus 휈10

1 + 10푑(푝퐻)

(52 ndash 12)

Fazendo a seguinte substituiccedilatildeo

푢 = 10 푡푎푙 푞푢푒 푑푢푢 = ln 10푑(푝퐻)

(52 ndash 13)

Tem-se que

log푠 (푝퐻)푠 (푝퐼) = minus

12

1 + 휈ln 10

1푢(1 + 푢) 푑푢 +

휈 1 minus 휈ln 10

1(1 + 푢) 푑푢

(52 ndash 14)

log푠 (푝퐻)푠 (푝퐼) = minus

12

1 + 휈ln 10

1푢 푑푢 minus

11 + 푢 푑푢 +

휈 1 minus 휈ln 10

1(1 + 푢) 푑푢

(52 ndash 15)

25 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐼) = minus

12 1 + 휈 log

1010

minus 휈 1 minus 휈 minus 1 + 휈 log1 + 101 + 10

(52 ndash 16)

Sendo

휈 1 minus 휈 minus 1 + 휈 = 휈 minus 휈 minus 1 minus 휈 = minus 1 + 휈 = minus2

(52 ndash 17)

Resultando em

log푠 (푝퐻)푠 (푝퐼) = log

1 + 101 + 10

minus1 + 휈

2 (푝퐻 minus 푝퐼)

(52 ndash 18)

Ainda eacute possiacutevel reescrever a equaccedilatildeo (52 ndash 18) como

log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log

1 + 101 + 10

(52 ndash 19)

Na qual n+ representa o nuacutemero de resiacuteduos ionizaacuteveis que na sua forma carregada

apresentam carga positiva A equaccedilatildeo (52 ndash 19) eacute uma expressatildeo analiacutetica que a

partir de dados da estrutura proteacuteica e de um dado de solubilidade permite predizer

a curva de solubilidade de uma dada proteiacutena em funccedilatildeo do pH na regiatildeo do ponto

isoeleacutetrico mantendo fixas a temperatura e a forccedila iocircnica do sistema

Eacute possiacutevel provar que as equaccedilotildees (42 ndash 8) e (52 ndash 19) satildeo idecircnticas - a prova

disso eacute descrita na seccedilatildeo 6 ndash e assim tem-se que apesar das distintas abordagens

a descriccedilatildeo do fenocircmeno eacute a mesma Note-se que um passo fundamental no

desenvolvimento da Equaccedilatildeo (52 ndash 5) eacute admitir que por hipoacutetese a atividade da

26 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

forma neutra natildeo depende do pH essa hipoacutetese tambeacutem eacute a base da equaccedilatildeo (41

ndash 7) Deve-se registrar o fato de que pelo melhor do nosso conhecimento esta eacute a

primeira vez que uma expressatildeo analiacutetica para o caacutelculo da solubilidade de

proteiacutenas em funccedilatildeo do pH eacute descrita mesmo no limite em que se considera vaacutelida

a lei de Henry

53 Soluccedilatildeo Paraboacutelica da Curva de Solubilidade

Tanto Groumlnwall (1941) quanto Fredericq e Neurath (1950) adotaram a hipoacutetese de

que os perfis de carga liacutequida da -lactoglobulina para um e da insulina para os

outros dois eram lineares na regiatildeo do ponto isoeleacutetrico Esta hipoacutetese eacute bastante

plausiacutevel e simplificadora principalmente a eacutepoca na qual estes trabalhos foram

desenvolvidos em que a estrutura proteacuteica bem como as constantes de ionizaccedilatildeo

dos resiacuteduos com grupos ionizaacuteveis era pouco conhecida De fato ainda hoje a falta

de dados das constantes de ionizaccedilatildeo na cadeia proteacuteica eacute o maior desafio no uso

do modelo rigoroso ndash equaccedilatildeo (52 ndash 18) Por isso o valor desta hipoacutetese de perfil

de carga liacutequida linear eacute notaacutevel

Supondo entatildeo que o perfil de carga seja linear eacute possiacutevel escrevecirc-lo como

푍(푝퐻) = minus퐴(푝퐻 minus 푝퐼) 푐표푚 퐴 gt 0

(53 ndash 1)

Substituindo (53 ndash 1) em (52 ndash 6)

푑 log 푠 (푝퐻)푑(푝퐻) = 퐴(푝퐻 minus 푝퐼)

(53 ndash 2)

Integrando (53 ndash 2) de um pH0 de referecircncia ateacute pH tem-se que

27 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐻 ) = 퐾[푝퐻 minus 2푝퐼(푝퐻 minus 푝퐻 ) minus 푝퐻 ] 푐표푚 퐾 =

퐴2

(53 ndash 3)

Ao se adotar como ponto de referecircncia o ponto isoeleacutetrico a equaccedilatildeo (53 ndash 3)

reduz-se agrave

log푠 (푝퐻)푠 (푝퐼) = 퐾(푝퐻 minus 푝퐼)

(53 ndash 4)

Contudo apesar da soluccedilatildeo quadraacutetica ou paraboacutelica para a equaccedilatildeo estendida de

Linderstroslashm-lang e Groumlnwall expressa na equaccedilatildeo (53 ndash 3) natildeo requerer os dados

das constantes de ionizaccedilatildeo dos resiacuteduos com grupos ionizaacuteveis ela exige a

definiccedilatildeo do paracircmetro A que fisicamente representa a inclinaccedilatildeo da reta de

aproximaccedilatildeo da curva de carga liacutequida e que pode ser calculado por correlaccedilatildeo a

partir de um conjunto de dados experimentais de solubilidade ou de carga liacutequida

6 Identidade entre o Modelo Proposto e a Equaccedilatildeo

Estendida de Linderstroslashm-Lang e Groumlnwall

A equaccedilatildeo final da modelagem termodinacircmica proposta apresentada na seccedilatildeo 4 eacute a

equaccedilatildeo (42 ndash 8) dada por

푠 (푝퐻)푠 (푝퐼) =

1 + 101 + 10

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 1)

Aplicando-se o logaritmo decimal nos dois termos da equaccedilatildeo (6 ndash 1) tem-se que

log푠 (푝퐻)푠 (푝퐼) = log

1 + 101 + 10

+ log

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 2)

Pelo bem da simplificaccedilatildeo desta deduccedilatildeo adotar-se-atildeo as seguintes funccedilotildees

휂 (푝퐻) = log

(6 ndash 3)

휃 (푝퐻) = log

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 4)

Assim pode-se reescrever a equaccedilatildeo (6 ndash 2) por

29 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐼) = 휂 (푝퐻) + 휃 (푝퐻)

(6 ndash 5)

Observando-se a equaccedilatildeo (6 ndash 5) tem-se que a funccedilatildeo j independe do estado de

ionizaccedilatildeo do resiacuteduo j poreacutem a funccedilatildeo jk depende Por isso deve-se analisar esta

funccedilatildeo para cada estado de ionizaccedilatildeo possiacutevel como mostrado na Tabela 61

Tabela 6 1 ndash Anaacutelise da funccedilatildeo jk para cada estado de ionizaccedilatildeo possiacutevel

j jk jk Quantidade de resiacuteduos neste estado

-1 -1 푝퐼 minus 푝퐻 na

0 0 nb

+1 +1 0 nc

0 푝퐼 minus 푝퐻 nd

Pela anaacutelise da Tabela 61 e considerando uma proteiacutena com n resiacuteduos com

grupos ionizaacuteveis infere-se que a equaccedilatildeo (6 ndash 5) pode ser reescrita como

log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)

(6 ndash 6)

Contudo as equaccedilotildees acima descritas satildeo vaacutelidas apenas para configuraccedilotildees

neutras pois apenas as configuraccedilotildees neutras da fase liacutequida estatildeo em equiliacutebrio

com as moleacuteculas de proteiacutena da fase soacutelida Para que uma configuraccedilatildeo seja

neutra vale a seguinte restriccedilatildeo

휀 = 0 hArr 푛 = 푛

(6 ndash 7)

30 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall

Substituindo a restriccedilatildeo dada pela equaccedilatildeo (6 ndash 7) na equaccedilatildeo (6 ndash 6) tem-se que

log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)

(6 ndash 8)

Ora mas a soma de nc e de nd natildeo resulta em outra coisa senatildeo no nuacutemero de

resiacuteduos com grupos ionizaacuteveis da estrutura proteacuteica cujo j seja +1 Assim

substituindo nc mais nd por n+ e substituindo a equaccedilatildeo (6 ndash 3) na equaccedilatildeo (6 ndash 8)

tem-se que

log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log

1 + 101 + 10

(6 ndash 9)

Ao se analisar a equaccedilatildeo (6 ndash 9) observa-se que ela eacute idecircntica a equaccedilatildeo estendida

de Linderstroslashm-Lang e Groumlnwall apresentada pela equaccedilatildeo (52 ndash 19) Com isso

tem-se que apesar das distintas formulaccedilotildees tanto a modelagem termodinacircmica aqui

proposta quanto a extensatildeo a teoria de Linderstroslashm-Lang e Groumlnwall resultam na

mesma descriccedilatildeo do fenocircmeno Aleacutem disso a equaccedilatildeo final dos modelos eacute

extremamente simples e depende apenas de um ponto de referecircncia e dos dados da

estrutura da moleacutecula de proteiacutena cuja solubilidade se deseja estudar

7 Aplicaccedilatildeo dos Modelos Expostos

Para validar o modelo comparando-o com o caacutelculo feito a partir da teoria de Debye-

Huumlckel o criteacuterio que relaciona os pontos calculados pelo modelo com os pontos

experimentais foi estabelecido a partir da seguinte funccedilatildeo objetivo (FO)

퐹푂 =1푁

푠 minus 푠푠

(7 ndash 1)

Contudo a equaccedilatildeo (7 ndash 1) natildeo eacute a melhor definiccedilatildeo de funccedilatildeo objetivo neste caso

pois a derivada da curva de solubilidade eacute razoavelmente grande nos dois lados do

ponto isoeleacutetrico e isso permite que pequenos desvios na direccedilatildeo horizontal

resultem em um grande aumento no valor da funccedilatildeo objetivo Uma soluccedilatildeo possiacutevel

seria substituir essa funccedilatildeo objetivo por uma funccedilatildeo definida pela soma do quadrado

da distacircncia do ponto experimental agrave curva do modelo principalmente se fosse

necessaacuterio calcular algum paracircmetro do modelo via otimizaccedilatildeo da funccedilatildeo objetivo

estipulada Natildeo sendo este o escopo deste trabalho optou-se pelo uso da FO

definida na equaccedilatildeo (7 ndash 1)

71 Solubilidade da Insulina Suiacutena

As Figuras 711 712 e 713 apresentam os graacuteficos da curva de solubilidade

dada pelos pontos experimentais pelo modelo proposto pela abordagem claacutessica e

tambeacutem a curva obtida pela soluccedilatildeo paraboacutelica da Equaccedilatildeo de Linderstroslashm-Lang e

Groumlnwall em trecircs temperaturas distintas

32 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 711 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 25 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

Figura 712 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 15 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

00

40

80

120

160

200

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

00

50

100

150

200

250

300

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

33 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 713 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 5 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

Os desvios da curva obtida pelo modelo proposto para valores de pH distantes do pI

podem ser explicados por ao menos trecircs importantes motivos dois devidos a

hipoacuteteses do modelo e um devido a fenocircmenos intriacutensecos a proteiacutena Sabendo que

no pI a solubilidade eacute miacutenima para valores de pH distantes do pI pode-se ter

solubilidades suficientemente grandes para que a validade da lei de Henry ndash adotada

na formulaccedilatildeo do modelo - seja questionada pois quanto mais distante do pI maior

a solubilidade e menor a validade da lei de Henry jaacute que haacute um aumento da

concentraccedilatildeo do soluto (proteiacutena) na soluccedilatildeo e tambeacutem ao fato do modelo prever

solubilidade infinita quando a fraccedilatildeo de moleacuteculas eletricamente neutras tende a

zero

limrarr푠 = lim

rarr

Φ(푝퐼)푠 (푝퐼)Φ(푝퐻) = +infin

(711 ndash 1)

00

50

100

150

200

250

300

350

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

34 7 Aplicaccedilatildeo dos Modelos Expostos

Todavia ainda haacute um fator de ordem natural que justifica o desvio apresentado para

valores de pH distantes do pI o desnovelamento da cadeia proteacuteica Este fenocircmeno

pode ocorrer de maneira a expor grupos hidroacutefobos resiacuteduos antes natildeo expostos

acrescentando relaccedilotildees de equiliacutebrio quiacutemico natildeo existentes na regiatildeo do pI

alterando o equiliacutebrio de fases e portanto alterando o valor da solubilidade

A Tabela 711 apresenta os valores obtidos para a funccedilatildeo objetivo definida em (7 ndash

1) tanto para o modelo proposto quanto para a abordagem claacutessica para trecircs

diferentes temperaturas

Tabela 711 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada

abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para insulina

suiacutena

T ordmC Abordagem FO

25 P 01857 C 02535

15 P 01981 C 05056

5 P 03595 C 03064

Observando-se a Tabela 711 vecirc-se que o modelo apresentou melhores resultados

do que o caacutelculo efetuado atraveacutes da abordagem claacutessica no que tange a

minimizaccedilatildeo da funccedilatildeo objetivo exceto para os dados a 5 ordmC

Tambeacutem eacute possiacutevel observar que a funccedilatildeo objetivo sofreu aumento com a

diminuiccedilatildeo da temperatura Isto ocorreu principalmente devido agrave dificuldade de

obter dados experimentais de solubilidade a temperaturas baixas o que aumenta o

desvio experimental fazendo com que se tenha um aumento do valor da funccedilatildeo

objetivo como a definida em (5 ndash 1) Um efeito secundaacuterio que tambeacutem pressiona a

35 7 Aplicaccedilatildeo dos Modelos Expostos

funccedilatildeo objetivo eacute o fato dos dados de pKA terem sido obtidos a uma temperatura

especiacutefica o que tende a acrescentar erro no caacutelculo de solubilidades a temperaturas

diferentes ainda que o pKA natildeo varie de forma ab-rupta com a temperatura

Outra observaccedilatildeo que deve ser registrada eacute o fato da funccedilatildeo objetivo para a

abordagem claacutessica na temperatura de 15 ordmC divergir a um valor tatildeo elevado em

relaccedilatildeo aos demais Isto se deve a um ponto experimental especiacutefico a um pH de

45 a solubilidade da insulina suiacutena obtida experimentalmente eacute 230 x 10-5 mol kg-1

enquanto a calculada pelo modelo proposto eacute 230 x 10-5 mol kg-1 e a calculada pela

abordagem claacutessica eacute 520 x 10-5 mol kg-1 Por conta do desvio deste ponto a funccedilatildeo

objetivo para a abordagem claacutessica nesta temperatura tem um aumento significativo

A Tabela 712 apresenta os valores do paracircmetro K da soluccedilatildeo paraboacutelica obtidos

neste trabalho para a insulina suiacutena comparados ao encontrado na literatura

Tabela 712 ndash Valores do paracircmetro K da soluccedilatildeo paraboacutelica para a insulina suiacutena

Referecircncias T ordmC K Fredericq e Neurath (1950) - 081 Neste trabalho 25 104 Neste trabalho 15 101 Neste trabalho 5 145

Pela Tabela 712 pode-se observar que haacute uma diferenccedila pequena entre os

valores do paracircmetro K obtidos neste trabalho e por Fredericq e Neurath (1950) Por

isso natildeo se pode afirmar a que se deve esta diferenccedila se eacute devido a diferenccedilas entre

procedimentos experimentais ou se eacute devido agrave diferenccedila de meacutetodo de caacutelculo do

paracircmetro Apesar de no experimento realizado por Fredericq e Neurath (1950)

haver a presenccedila do acircnion tiocianato e este acircnion interagir com grupos ionizaacuteveis

da cadeia proteacuteica como observado pelos autores do trabalho tambeacutem estes

36 7 Aplicaccedilatildeo dos Modelos Expostos

proacuteprios autores afirmam que a presenccedila deste acircnion natildeo altera a forma da curva

que eacute basicamente determinada pelo paracircmetro K De qualquer modo eacute interessante

observar a proximidade dos valores encontrados neste trabalho com o obtido por

Fredericq e Neurath (1950) pelo menos no que diz respeito agrave ordem de grandeza do

paracircmetro em questatildeo

72 Solubilidade da Lisozima de clara de ovo de galinha

Um modelo para ser validado necessita correlacionar dados experimentais de modo

satisfatoacuterio ou seja um modelo deve buscar fidelidade ao fenocircmeno fiacutesico

observado Assim na procura de dados de solubilidade de proteiacutenas poucos dados

na regiatildeo do pI foram encontrados Este eacute o caso da lisozima de clara de ovo de

galinha que apesar de ter muitos estudos de solubilidade nenhum deles se

encontra na regiatildeo do pI Surgiu assim a necessidade de se obter estes dados

experimentais para poder validar o modelo proposto A escolha da lisozima de clara

de ovo de galinha se deu em parte pela sua importacircncia mas tambeacutem em parte por

ter os valores de pKA conhecidos

A curva de solubilidade da lisozima de clara de ovo de galinha levantada neste

trabalho estaacute apresentada na Figura 721

37 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em

soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e

dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()

Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento

esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH

isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de

soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se

comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto

isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da

soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos

ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente

neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a

solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e

00

10

20

30

40

50

60

70

80

90

100

95 100 105 110 115 120

Solu

bilid

ade

(mg

mL)

pH

38 7 Aplicaccedilatildeo dos Modelos Expostos

alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado

em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo

Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo

a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo

Por conta de falta de dados a este respeito modelou-se apenas a curva de

solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura

722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de

galinha em funccedilatildeo do pH da soluccedilatildeo

Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)

00

10

20

30

40

50

60

70

80

90

96 99 102 105 108 111 114 117 120

Solu

bilid

ade

(mg

mL)

pH

39 7 Aplicaccedilatildeo dos Modelos Expostos

O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721

Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada

abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima

de clara de ovo de galinha

T ordmC Abordagem FO

25 P 4650 C gt7919a

a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado

Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta

aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a

abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca

de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos

anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao

efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de

clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a

variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A

proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de

cargas pontuais de Debye-Huumlckel

8 Conclusotildees

A modelagem termodinacircmica proposta neste trabalho apresentou expressivos

resultados quando comparada a abordagem claacutessica de Debye-Huumlckel

Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o

modelo aproximou melhor os pontos experimentais do que a referida abordagem

comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima

ao ponto isoeleacutetrico

Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica

para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua

construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo

lugar por sua aplicabilidade

Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis

da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva

em regiotildees distantes do ponto isoeleacutetrico

9 Referecircncias Bibliograacuteficas

BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene

Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects

Biophys J 95 1285-1294 2008

FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and

other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72

2684 - 26911950

GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v

93 p 517-542 1931

GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab

Carlsberg v 24 p 185-200 1941

KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native

and mutant insulins pK perturbation of B13-Glu in aggregated species Arch

Biochem Biophys v 283 p 496-502 1990

KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for

the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng

Chem Res v 35 p 4319-4327 1996

42 9 Referecircncias Bibliograacuteficas

KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen

lysozyme J Biochem v 87 p 1215-1219 1980

LADISCH M R Bioseparations Engineering principles practice and

economics John Wiley amp Sons 2001 pp1 116 ndash 117 133

LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab

Carlsberg v 15 p 1-29 1924

PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da

particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas

2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP

PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the

excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte

solutions Fluid Phase Equilib v 269 p 25ndash35 2008

PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-

contribution model involving phase and chemical equilibrium Ind Eng Chem Res

v 33 p 1341-1347 1994

PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277

1973

PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino

acids Fluid Phase Equilib v 152 p 121-132 1998

43 9 Referecircncias Bibliograacuteficas

PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular

Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999

SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of

equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte

solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009

TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J

R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with

carbon dioxide Biotech Bioeng v103 p 909-919 2009

TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer

free energy Biophys J v 95 p 2601-2609 2008

TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in

water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95

2009

Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na

cadeia proteacuteica

Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo

de ionizaccedilatildeo

퐻퐴 퐴 + 퐻

(A ndash 1)

Assim considerando que a constante de equiliacutebrio

퐾 = 푎

(A ndash 2)

Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que

퐾 =[퐴 ][퐻 ]

[퐻퐴]

(A ndash 3)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que

log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]

(A ndash 4)

Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado

por

minus log[휑] = 푝휑

(A ndash 5)

Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que

45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

푝퐾 = log[퐻퐴][퐴 ] + 푝퐻

(A ndash 6)

Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por

훼 =[퐴 ]

[퐻퐴] + [퐴 ]

(A ndash 7)

Reescrevendo (A ndash 7) tem-se que

훼 =[퐴 ] [퐻퐴frasl ]

1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =

훼1 minus 훼

(A ndash 8)

Substituindo (A ndash 8) em (A ndash 6) tem-se que

푝퐾 = log훼

1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10

(A ndash 9)

Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos

훼 =1

1 + 10

(A ndash 10)

Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio

퐴 + 퐻 퐻퐴

(A ndash 11)

Pode se escrever a constante de equiliacutebrio como

퐾 =[퐻퐴 ]

[퐴][퐻 ]

(A ndash 12)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que

46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

log퐾 = minus log[퐴]

[퐻퐴 ] minus log[퐻 ]

(A -13)

Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por

훼 =[퐻퐴 ]

[퐴] + [퐻퐴 ]

(A ndash 14)

Assim a equaccedilatildeo (A ndash 13) fica

훼1 minus 훼 = 10

(A ndash 15)

Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo

훼 =10

1 + 10

(A ndash 16)

Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos

modelos expostos

Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]

48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]

49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)

50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])

51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]

52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])

53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)

54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2

55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO

6 1 Introduccedilatildeo

esforccedilo computacional requerido pelo modelo por eles proposto para calcular

apenas alguns pontos da curva natildeo apresenta uma aplicabilidade razoaacutevel Aleacutem

deste trabalho Tashima et al (2009) propuseram uma modelagem termodinacircmica

para prever a curva de solubilidade especificamente da insulina suiacutena aplicando o

modelo de Pitzer truncado apoacutes o segundo coeficiente do virial

No presente trabalho propomos um novo modelo baseado no caacutelculo de estados de

ionizaccedilatildeo e em ferramentas de termodinacircmica claacutessica bem como uma extensatildeo agrave

teoria de Linderstroslashm-Lang e Groumlnwall Vale ressaltar de antematildeo que tanto este

novo modelo proposto quanto a extensatildeo desenvolvida resultam na mesma equaccedilatildeo

para o fenocircmeno apesar das distintas abordagens

2 Materiais e Meacutetodos

21 Meacutetodos computacionais

O coacutedigo-fonte do programa em linguagem C estaacute apresentado no Apecircndice B Os

meacutetodos numeacutericos utilizados se resumem a interpolaccedilatildeo linear o meacutetodo de

Newton-Raphson cujo uso seraacute apresentado na proacutexima seccedilatildeo quando se deduziraacute

o algoritmo do modelo de Debye-Huumlckel e o meacutetodo de busca unidirecional de

miacutenimos de funccedilatildeo pela Seccedilatildeo Aacuteurea

As Tabelas 211 e 212 apresentam os resiacuteduos considerados para cada proteiacutena

considerada bem como os seus valores de pKA que foram obtidos a partir da

literatura e satildeo indispensaacuteveis para execuccedilatildeo dos caacutelculos mais rigorosos

Tabela 211 ndash Resiacuteduos ionizaacuteveis considerados e valores de pKA da insulina suiacutena

Valores extraiacutedos de Kaarsholm et al (1990)

Aminoaacutecido Grupo Ionizaacutevel pKA

A1 ndash Gly -NH2 738 A4 ndash Glu -COOH 437 A14 ndash Tyr Fenol-OH 1020 A17 ndash Glu -COOH 437 A19 ndash Tyr Fenol-OH 1020 A21 ndash Asn -COOH 345

B1 ndash Phe -NH2 738 B5 ndash His Imidazol-NH 598 B10 ndash His Imidazol-NH 598 B 13 ndash Glu -COOH 437 B16 ndash Tyr Fenol-OH 1020 B21 ndash Glu -COOH 437

B22 ndash Arg Guaniacutedio-NH2 1110 B26 ndash Tyr Fenol-OH 1020

B29 ndash Lys -NH2 852 B30 ndashAla -COOH 345

8 2 Materiais e Meacutetodos

Tabela 212 ndash Resiacuteduos ionizaacuteveis considerados e valores de pKA a 25 ordmC da lisozima

de clara de ovo de galinha Valores extraiacutedos de Kuramitsu e Hamaguchi (1980)

Aminoaacutecido Grupo Ionizaacutevel pKA α-NH2 α-NH2 79

Lys1 ε-NH2 108

Arg5 Guaniacutedio-NH2 120 Glu7 -COOH 26

Lys13 ε-NH2 105

Arg14 Guaniacutedio-NH2 120 His15 Imidazol-NH 58 Asp18 -COOH 20 Tyr20 Fenol-OH 103

Arg21 Guaniacutedio-NH2 120 Tyr23 Fenol-OH 98

Lys33 ε-NH2 106 Glu35 -COOH 61

Arg45 Guaniacutedio-NH2 120 Asp48 -COOH 43 Asp52 -COOH 34 Tyr53 Fenol-OH 121

Arg61 Guaniacutedio-NH2 120 Asp66 -COOH 16

Arg68 Guaniacutedio-NH2 120

Arg73 Guaniacutedio-NH2 120 Asp87 -COOH 21

Lys96 ε-NH2 108

Lys97 ε-NH2 103 Asp101 -COOH 45

Arg112 Guaniacutedio-NH2 120

Arg114 Guaniacutedio-NH2 120

Lys116 ε-NH2 104 Asp119 -COOH 25

Arg125 Guaniacutedio-NH2 120

Arg128 Guaniacutedio-NH2 120 α-COOH α-COOH 31

9 2 Materiais e Meacutetodos

22 Curva de solubilidade da lisozima da clara de ovo de galinha

221 Reagentes

Neste experimento de determinaccedilatildeo da curva de solubilidade da lisozima da clara de

ovo de galinha os reagentes utilizados foram cloreto de soacutedio (Reatec P A)

bicarbonato de soacutedio (Research Becto Chemical P A) Na2HPO4 7H2O (Reagen

P A) aacutegua destilada deionizada Milli-Q (Millipore) e lisozima de clara de ovo de

galinha (Sigma min 99)

222 Equipamentos

Neste experimento os equipamentos utilizados foram espectrofotocircmetro UV-Visiacutevel

(Beckman DU-530) centriacutefuga (Eppendorf) banho-teacutermico (Laacutectea) com controlador

de temperatura (Julabo) pHmetro (Micronal) e balanccedila (Mettler Toledo AB204S)

223 Preparaccedilatildeo das soluccedilotildees-tampatildeo

Foram preparadas soluccedilotildees-tampatildeo com valores de pH=96 pH = 98 pH = 100

pH = 102 pH = 104 pH = 106 pH = 108 pH = 110 pH = 112 pH = 114 pH =

116 e pH = 118 a partir de quatro soluccedilotildees uma de hidroacutexido de soacutedio 01 M uma

de cloreto de soacutedio 1 M (para equalizar a forccedila iocircnica) uma de bicarbonato de soacutedio

005 M e outra de Na2HPO4 005 M

A Tabela 2231 apresenta os valores de volume usados no preparo de cada uma

das soluccedilotildees-tampatildeo

10 2 Materiais e Meacutetodos

Tabela 2231 ndash Volumes de hidroacutexido de soacutedio a 01 M adicionados no preparo das

soluccedilotildees-tampatildeo

Tampatildeo pH V NaOH mL

NaHCO3 96 100 005 M 98 152

(para cada soluccedilatildeo-tampatildeo 100 mL 100 214

desta soluccedilatildeo foram adicionados) 102 276

104 330 106 382

108 424

110 454

112 530 114 583

Na2HPO4 110 82

005 M 112 126

(para cada soluccedilatildeo-tampatildeo 100 mL 114 182 desta soluccedilatildeo foram adicionados) 116 270

118 388

224 Procedimento experimental

Foram adicionadas quantidades natildeo definidas de lisozima de clara de ovo de galinha

a 13 mL de cada soluccedilatildeo-tampatildeo em tubos Eppendorf de 2 mL Colocaram-se

entatildeo as amostras apoacutes agitaccedilatildeo vigorosa em banho teacutermico a 250 plusmn 01 ordmC por 24

horas para que os sistemas atingissem o equiliacutebrio termodinacircmico Caso natildeo

houvesse a formaccedilatildeo de precipitado lisozima era adicionada e o procedimento

repetido Ao se observar a formaccedilatildeo de precipitado o sistema era centrifugado a

13000 rpm por 15 minutos Uma aliacutequota do sobrenadante era retirada e sua

concentraccedilatildeo proteacuteica determinada por medida de absorbacircncia a 280 nm Cada

sistema foi feito ao menos em duplicata

3 Modelo Estendido de Debye-Huumlckel

31 Introduccedilatildeo

De fato como descrito por Pessocirca Filho (2002) a equaccedilatildeo de Debye-Huumlckel natildeo

deve ser aplicada agrave modelagem de polieletroacutelitos tais como proteiacutenas porque nestas

moleacuteculas as cargas satildeo distribuiacutedas ao longo da cadeia e portanto natildeo satildeo cargas

pontuais como suposto por Debye-Huumlckel

Contudo nesta modelagem considera-se uma regiatildeo de pH em torno do ponto

isoeleacutetrico (pI) na qual satildeo inerentes duas condiccedilotildees favoraacuteveis a aplicaccedilatildeo da

equaccedilatildeo de Debye-Huumlckel carga liacutequida proacutexima a zero pois Z(pI) = 0 e regiatildeo de

miacutenima solubilidade que significa baixas concentraccedilotildees de proteiacutenas em soluccedilatildeo

Isto significa em primeiro lugar que os efeitos da carga tais como ldquodesnovelamentordquo

da cadeia proteacuteica com exposiccedilatildeo de resiacuteduos outrora blindados podem ser

desprezados em uma regiatildeo proacutexima ao ponto isoeleacutetrico e em segundo lugar

baixas concentraccedilotildees de proteiacutena em soluccedilatildeo significam que os termos de curto

alcance podem ser desprezados e portanto haacute prevalecircncia do termo de longo

alcance que no caso de soluccedilotildees eletroliacuteticas pode ser descrito por uma equaccedilatildeo

estendida de Debye-Huumlckel

Assim o modelo de Debye-Huumlckel foi utilizado natildeo para verificar sua aplicabilidade agrave

modelagem de soluccedilotildees proteacuteicas mas sim para confrontar o modelo proposto com

um modelo usual em modelagem de soluccedilotildees eletroliacuteticas e seraacute referido no texto

sempre como abordagem claacutessica

12 3 Modelo Estendido de Debye-Huumlckel

32 Desenvolvimento teoacuterico

Pode-se escrever a atividade da proteiacutena como o produto entre a solubilidade e o

coeficiente de atividade da mesma como mostrado na equaccedilatildeo (32 - 1)

푎 = 훾푠

(32 - 1)

Na qual pode-se calcular o coeficiente de atividade atraveacutes da equaccedilatildeo estendida

de Debye-Huumlckel (Pitzer 1973)

ln 훾 = minus퐴 푍radic퐼

1 + 푏radic퐼+

2푏

ln 1 + 푏radic퐼

(32 - 2)

Sendo que a constante universal empiacuterica b = 12 kg12 mol-12 eacute usada para todos os

eletroacutelitos Jaacute AΦ eacute o paracircmetro de Debye-Huumlckel para o coeficiente osmoacutetico e eacute

dado por

퐴 =13

(2휋푁 휌 ) frasl 푒4휋휀 휀 푘푇

frasl

(32 - 3)

Em que NA eacute a constante de Avogadro ρs eacute a densidade do solvente em g cm-3 e eacute

a carga eletrocircnica (e = 160218 x 10-19 C) ε0 eacute a permissividade do espaccedilo livre (ε0 =

885419 x 10-12 C2 N-1 m-2) εr eacute a constante dieleacutetrica do solvente k aacute constante de

Boltzmann e T eacute a temperatura absoluta Jaacute a carga liacutequida em funccedilatildeo do pH pode

ser calculada como

푍 = 훼 minus 훼

(32 - 4)

Sendo que α+ e α- satildeo dados pelas equaccedilotildees (A - 10) e (A - 16) do Apecircndice A

13 3 Modelo Estendido de Debye-Huumlckel

E a forccedila iocircnica eacute dada pela equaccedilatildeo (32 - 5) descrita abaixo

퐼 = 12

푚 푍

(32 - 5)

Contudo no ponto isoeleacutetrico a carga meacutedia da proteiacutena eacute nula portanto o termo de

Debye-Huumlckel se anula e o coeficiente de atividade se torna unitaacuterio

ln푎 (푝퐼) = ln 푠 (푝퐼)

(32 - 6)

Considerando que a atividade da proteiacutena seja constante com a variaccedilatildeo de pH isto

implica que esta eacute sempre igual agrave solubilidade da proteiacutena no ponto isoeleacutetrico e

portanto vale que

ln푎 (푝퐻) = ln 푠 (푝퐻) + ln 훾(푝퐻) = ln 푠 (푝퐼)

(32 - 7)

Assim

ln 푠 (푝퐻) = ln 푠 (푝퐼) + 퐴휙푍푝퐻2 radic퐼1 + 푏radic퐼

+2푏

ln 1 + 푏radic퐼

(32 - 8)

Esta equaccedilatildeo prevecirc a curva de solubilidade em funccedilatildeo do pH atraveacutes do caacutelculo da

atividade da proteiacutena na fase liacutequida pela equaccedilatildeo estendida de Debye-Huumlckel Para

resolvecirc-la eacute necessaacuterio se utilizar de um meacutetodo numeacuterico pois a forccedila iocircnica

depende da solubilidade naquele pH Optou-se neste trabalho pelo Meacutetodo de

Newton-Raphson para executar o meacutetodo iterativo que eacute exigido pela equaccedilatildeo (32

ndash 8) Para aplicar este meacutetodo arbitrou-se uma funccedilatildeo f(sp) definida aqui como

푓 푠 = minus ln 푠 (푝퐻) + ln 푠 (푝퐼) + 퐴휙푍푝퐻2 radic퐼

1 + 푏radic퐼+

2푏

ln 1 + 푏radic퐼

(32 - 9)

14 3 Modelo Estendido de Debye-Huumlckel

Assim ao calcular o sp que zera esta funccedilatildeo f(sp) saber-se-aacute que eacute a proacutepria

solubilidade que se deseja calcular Para aplicar o Meacutetodo de Newton-Raphson

basta derivar a funccedilatildeo f(sp) e aplicar o seguinte algoritmo de resoluccedilatildeo

푠 = 푠 minus푓(푠 )푓 (푠 )

(32 - 10)

Para calcular frsquo(s) deve-se considerar que a forccedila iocircnica depende da solubilidade

Para isto observando a equaccedilatildeo (32 - 5) vecirc-se que a forccedila iocircnica eacute dada pelo

somatoacuterio das contribuiccedilotildees de todos os iacuteons presentes na soluccedilatildeo por isso aqui

cabe um artifiacutecio de dividir estas contribuiccedilotildees em duas macro-contribuiccedilotildees aquela

devida a todos os iacuteons presentes na soluccedilatildeo exclusive os grupos ionizaacuteveis

presentes nas moleacuteculas da proteiacutena em questatildeo (I0) e que se considera constante

com o pH e aquela que engloba apenas os grupos ionizaacuteveis presentes nas

moleacuteculas da proteiacutena (IP)

퐼 = 퐼 + 퐼 = 퐼 +12푍 푠

(32 - 11)

Considerando a funccedilatildeo w tal que

푤 = radic퐼 = 퐼 +12푍 푠

(32 - 12)

Sendo

푤 =14푍 퐼

(32 - 13)

Entatildeo aplicando-se as devidas regras de derivaccedilatildeo tem-se

15 3 Modelo Estendido de Debye-Huumlckel

푓 (푠 ) = minus1푠 + 퐴 푍

3푤 + 2푤 푏푤(1 + 푏푤)

(32 - 14)

Substituindo as equaccedilotildees (32 - 12) e (32 - 13) na equaccedilatildeo (32 - 14) tem-se que

푓 (푠 ) = minus1푠 + 퐴 푍

15 + 푏radic퐼2radic퐼(1 + 푏radic퐼)

(32 - 15)

Entatildeo o algoritmo deve ser

푠 = 푠 minus

⎜⎛ln 푠 (푝퐼)

푠 + 퐴휙푍푝퐻2 radic퐼

1 + 푏radic퐼+ 2푏 ln 1 + 푏radic퐼

minus 1푠 + 퐴휙푍

15 + 푏radic퐼2radic퐼(1 + 푏radic퐼) ⎠

⎟⎞

(32 - 16)

4 Modelagem Termodinacircmica Proposta

41 Introduccedilatildeo

A condiccedilatildeo de equiliacutebrio entre duas fases (α e β) com m componentes eacute dada por

(Prausnitz et al 1999)

푝 = 푝

(41 ndash 1)

푇 = 푇

(41 ndash 2)

휇 = 휇⋮

휇 = 휇

(41 ndash 3)

Considerando o equiliacutebrio soacutelido-liacutequido (ESL) de sistemas contendo proteiacutenas

sendo que os efeitos da pressatildeo podem ser desprezados que as temperaturas nas

duas fases satildeo iguais e que na fase soacutelida soacute haacute proteiacutena tem-se que para a

proteiacutena a relaccedilatildeo de equiliacutebrio pode ser descrita por

휇 (푇푥) = 휇 (푇)

(41 ndash 4)

Contudo adotando-se a lei de Henry que eacute vaacutelida para baixas concentraccedilotildees de

soluto hipoacutetese que natildeo eacute distante dos valores observados da solubilidade de

proteiacutenas pode se escrever o potencial quiacutemico na fase liacutequida por

휇 (푇푥) = 휇 (푇 푥 ) + 푅푇푙푛푥

(41 ndash 5)

17 4 Modelagem Termodinacircmica Proposta

Entretanto variaccedilotildees de pH natildeo alteram o potencial quiacutemico da fase soacutelida o que

resulta pela relaccedilatildeo (41 ndash 4) que o mesmo natildeo altera tambeacutem o potencial quiacutemico

da fase liacutequida Com isso pela relaccedilatildeo (41 ndash 5) sendo o potencial quiacutemico de

referecircncia constante com o pH uma contradiccedilatildeo emerge a variaccedilatildeo do pH natildeo

poderia alterar o valor da solubilidade poreacutem a observaccedilatildeo experimental mostra o

contraacuterio Assim deve-se lembrar que pelo princiacutepio da eletroneutralidade a fase

soacutelida soacute possui moleacuteculas proteacuteicas eletricamente neutras e portanto o equiliacutebrio

de fases deve se estabelecer apenas entre as moleacuteculas presentes na fase soacutelida e

as moleacuteculas eletricamente neutras em soluccedilatildeo Ou seja como soacute moleacuteculas

eletricamente neutras podem estar na fase soacutelida o equiliacutebrio de fases depende

exclusivamente da fraccedilatildeo de moleacuteculas eletricamente neutras em soluccedilatildeo pois soacute

estas podem precipitar Assim tanto a equaccedilatildeo (41 ndash 4) quanto a equaccedilatildeo (41 ndash

5) devem ser aplicadas natildeo ao conjunto de todas as moleacuteculas de proteiacutena em

soluccedilatildeo mas somente as moleacuteculas proteacuteicas eletricamente neutras Portanto a

concentraccedilatildeo das moleacuteculas de proteiacutena eletricamente neutras em soluccedilatildeo eacute

constante com o pH e pode ser interpretada como a multiplicaccedilatildeo da fraccedilatildeo de

moleacuteculas eletricamente neutras pela concentraccedilatildeo total de proteiacutenas que eacute a

proacutepria solubilidade Assim uma relaccedilatildeo de inversa proporcionalidade eacute definida

quanto maior a fraccedilatildeo de moleacuteculas neutras menor seraacute a solubilidade de uma

proteiacutena em soluccedilatildeo Portanto no ponto isoeleacutetrico no qual haacute o miacutenimo de

solubilidade tem-se o ponto maacuteximo de fraccedilatildeo de moleacuteculas eletricamente neutras

A partir disto eacute possiacutevel escrever a equaccedilatildeo que rege o comportamento da

solubilidade de uma proteiacutena em funccedilatildeo do pH da soluccedilatildeo

휙(푝퐻)푆 (푝퐻) = 휆 = 푐표푛푠푡푎푛푡푒

(41 ndash 6)

18 4 Modelagem Termodinacircmica Proposta

Na equaccedilatildeo (41 ndash 6) o paracircmetro λ pode ser um paracircmetro de ajuste do modelo a

um conjunto de valores experimentais tendo se estabelecido uma funccedilatildeo objetivo ou

ainda dado pelo produto entre a solubilidade no ponto isoeleacutetrico e a fraccedilatildeo de

moleacuteculas eletricamente neutras em soluccedilatildeo tambeacutem no pI neste caso vale a

seguinte equaccedilatildeo

푠 (푝퐻) =휙(푝퐼)푠 (푝퐼)휙(푝퐻)

(41 ndash 7)

Sendo a equaccedilatildeo do modelo ndash equaccedilatildeo (41 ndash 7) ndash extremamente simples a uacutenica

dificuldade reside no caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras

(휙(푝퐻))

42 Caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras

Dentre os aminoaacutecidos que formam atraveacutes de ligaccedilotildees peptiacutedicas as proteiacutenas haacute

aqueles que possuem resiacuteduos com grupos ionizaacuteveis aleacutem dos grupos amina e

aacutecido carboxiacutelico terminais na cadeia Todos estes participam de equiliacutebrios

quiacutemicos com iacuteons H+ presentes na soluccedilatildeo entatildeo ao se alterar o pH da soluccedilatildeo

estes equiliacutebrios satildeo alterados

Assim haacute vaacuterias possibilidades de combinaccedilotildees de estados ionizados destes grupos

ionizaacuteveis que resultam em uma moleacutecula de proteiacutena eletricamente neutra Eacute

importante notar que dada a fraccedilatildeo de uma configuraccedilatildeo de uma moleacutecula neutra

todas as outras fraccedilotildees de configuraccedilotildees possiacuteveis que tambeacutem resultem em

moleacuteculas neutras satildeo proporcionais agrave fraccedilatildeo da configuraccedilatildeo dada pois todas as

configuraccedilotildees participam de equiliacutebrios entre si

19 4 Modelagem Termodinacircmica Proposta

Desta observaccedilatildeo implica-se que basta identificar uma configuraccedilatildeo proteacuteica cuja

soma dos estados ionizados resulte em carga nula para se descrever o equiliacutebrio de

fases em relaccedilatildeo ao pH na regiatildeo do ponto isoeleacutetrico onde esta consideraccedilatildeo eacute

predominante em relaccedilatildeo a outros possiacuteveis fenocircmenos

Contudo eacute necessaacuterio contabilizar a contribuiccedilatildeo de cada grupo ionizaacutevel via

equaccedilatildeo de Henderson-Hasselbach equaccedilatildeo (42 ndash 1)

훼 (푝퐻) =

⎩⎪⎨

⎪⎧ 10

1 + 10 푠푒 휈 = minus1

11 + 10

푠푒 휈 = +1

(42 ndash 1)

Na qual pKAj eacute o co-logaritmo da constante de equiliacutebrio do grupo ionizaacutevel do

resiacuteduo j j eacute estado carregado potencial do resiacuteduo j (-1 para grupos aacutecidos e +1

para grupos baacutesicos) e j eacute a fraccedilatildeo ionizada para o pH dado Para grupos cujo

estado de ionizaccedilatildeo na dada configuraccedilatildeo seja neutro a sua fraccedilatildeo eacute calculada tal

que a soma de sua fraccedilatildeo e da fraccedilatildeo ionizada tenha como resultado o valor

unitaacuterio

Assim a funccedilatildeo Pn pode ser escrita como o produto de cada fraccedilatildeo de cada grupo

ionizaacutevel j naquele estado (-1 0 ou +1) na configuraccedilatildeo neutra k em uma proteiacutena

com n grupos ionizaacuteveis Uma representaccedilatildeo matemaacutetica possiacutevel para esta funccedilatildeo

pode ser escrita como

휙 (푝퐻) = 훼 (푝퐻)

(42 ndash 2)

Na qual a fraccedilatildeo jrsquo(pH) eacute dada por

20 4 Modelagem Termodinacircmica Proposta

훼 (푝퐻) =훼 (푝퐻) 푠푒 휀 = 11 minus 훼 (푝퐻) 푠푒 휀 = 0

(42 ndash 3)

Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (42 ndash 3) e a resultante na equaccedilatildeo

(42 ndash 2) pode-se escrever que

휙 (푝퐻) =1

1 + 10

1 + 휈2 minus 휈 휀 10

minus휈 minus 1

2 minus 휈 휀 푐표푚 휀 = 0

(42 ndash 4)

A equaccedilatildeo (42 ndash 4) junto agrave equaccedilatildeo (41 ndash 7) constituem o modelo termodinacircmico

capaz de predizer a razatildeo entre as fraccedilotildees de moleacuteculas neutras de uma proteiacutena

em funccedilatildeo do pH na regiatildeo do ponto isoeleacutetrico mantendo fixas temperatura e forccedila

iocircnica Substituindo a equaccedilatildeo (42 ndash 4) na equaccedilatildeo (41 ndash 7) obteacutem-se para a

curva de solubilidade

푠 (푝퐻)푠 (푝퐼) =

1 + 101 + 10

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

푐표푚 휀 = 0

(42 ndash 8)

5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

51 Introduccedilatildeo

Segundo Groumlnwall (1941) na fase liacutequida haacute moleacuteculas de proteiacutenas com muitas

configuraccedilotildees k distintas que possuem carga liacutequida i e tambeacutem haacute certas

configuraccedilotildees que tem carga liacutequida nula e satildeo chamadas configuraccedilotildees neutras

Aleacutem disso estas uacuteltimas satildeo aquelas que determinam o equiliacutebrio de fases jaacute que

elas estatildeo em equiliacutebrio com a fase soacutelida na qual soacute haacute moleacuteculas neutras pelo

princiacutepio da eletroneutralidade Eacute tambeacutem afirmado que dado este equiliacutebrio a

atividade das moleacuteculas neutras natildeo se altera com a variaccedilatildeo do pH e eacute

proporcional agraves atividades de qualquer tipo de configuraccedilatildeo neutra

Neste mesmo trabalho eacute atribuiacuteda a Linderstroslashm-Lang o desenvolvimento de uma

teoria de prediccedilatildeo da solubilidade de proteiacutenas com a variaccedilatildeo do pH na regiatildeo do

ponto isoeleacutetrico Este desenvolvimento apresenta um balanccedilo de cargas de um

modo impliacutecito contudo como atestado por Groumlnwall o escasso conhecimento

sobre as estruturas proteacuteicas impediram agravequele tempo uma formulaccedilatildeo mais

pormenorizada do problema

52 Desenvolvimento teoacuterico

A base desta abordagem descrita por Groumlnwall e atribuiacuteda a Linderstroslashm-Lang

reside na hipoacutetese de que a moleacutecula de proteiacutena de configuraccedilatildeo k e carga nula

participa do seguinte equiliacutebrio com os iacuteons H+ e com sua forma de carga i

22 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

푃 + 푖퐻 푃 lowast

(52 ndash 1)

Note-se que o valor de i pode ser negativo A constante do equiliacutebrio quiacutemico

descrita pela equaccedilatildeo (52 ndash 1) pode ser expressa como

퐾 =푎

lowast

푎 푎

(52 ndash 2)

Sabendo que a atividade da moleacutecula de proteiacutena de configuraccedilatildeo k e carga i eacute dada

pelo produto entre sua concentraccedilatildeo e seu coeficiente de atividade tem-se que

푥lowast

= 푎 푎퐾훾

lowast

(52 ndash 3)

Entretanto a solubilidade da proteiacutena eacute soma das concentraccedilotildees de todas as

moleacuteculas de carga i Poreacutem a concentraccedilatildeo das moleacuteculas de carga i eacute a soma das

concentraccedilotildees das moleacuteculas de configuraccedilatildeo k Assim a solubilidade pode ser

escrita como

푠 (푝퐻) = 푎 푎퐾훾

lowast

(52 ndash 4)

Derivando a equaccedilatildeo (52 ndash 4) com respeito agrave atividade do iacuteon H+ considerando

que atividade da moleacutecula neutra eacute constante para qualquer configuraccedilatildeo k e ainda

que o coeficiente de atividade da proteiacutena de carga i independe da atividade do iacuteon

H+ tem-se que

푑푠푑푎 = 푖 ∙ 푎 푎

퐾훾

lowast

(52 ndash 5)

23 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

Sendo

푑 log 푠 (푝퐻)푑(푝퐻) = minus

푎푠 (푝퐻)

푑푠푑푎

(52 ndash 6)

Substituindo as equaccedilotildees (52 ndash 4) e (52 ndash 5) na equaccedilatildeo (52 ndash 6) e

reescrevendo em termos de pH e das concentraccedilotildees das proteiacutenas de carga i tem-

se que

푑 log 푠푑(푝퐻) = minus

sum (푖 ∙ 푥 )sum 푥

(52 ndash 7)

Contudo o termo do lado direito da equaccedilatildeo (52 ndash 7) estaacute associado ao conceito

de valecircncia meacutedia estabelecido por Linderstroslashm-Lang (1924)

횤 =sum (푖 ∙ 푥 )sum 푥

(52 ndash 8)

Os autores natildeo possuiacuteam um modo mais adequado de construir a curva de

solubilidade dada pela equaccedilatildeo (52 ndash 7) do que aproximar por uma funccedilatildeo linear o

perfil de carga liacutequida da proteiacutena obtido experimentalmente e integraacute-lo valendo-se

da analogia entre o conceito de carga liacutequida (Z) e de valecircncia meacutedia ( i ) Entretanto

hoje jaacute se tem uma descriccedilatildeo analiacutetica do perfil de carga liacutequida de proteiacutenas que

pode ser escrita como

푍(푝퐻) = 휈 훼

(52 ndash 9)

Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (52 ndash 9) e a resultante na equaccedilatildeo

(52 ndash 7) tem-se que

24 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

푑 log 푠푑(푝퐻) = minus

12

11 + 10

1 + 휈 + 휈 1 minus 휈 10

(52 ndash 10)

Integrando a equaccedilatildeo (52 ndash 10) de um ponto de referecircncia por exemplo do ponto

isoeleacutetrico (pI) ateacute um pH qualquer tem-se a seguinte relaccedilatildeo

푑 log 푠

( )

( )

= minus12

1

1 + 101 + 휈 + 휈 1 minus 휈 10 푑(푝퐻)

(52 ndash 11)

log푠 (푝퐻)푠 (푝퐼) = minus

12 1 + 휈

11 + 10

푑(푝퐻)

+ 휈 1 minus 휈10

1 + 10푑(푝퐻)

(52 ndash 12)

Fazendo a seguinte substituiccedilatildeo

푢 = 10 푡푎푙 푞푢푒 푑푢푢 = ln 10푑(푝퐻)

(52 ndash 13)

Tem-se que

log푠 (푝퐻)푠 (푝퐼) = minus

12

1 + 휈ln 10

1푢(1 + 푢) 푑푢 +

휈 1 minus 휈ln 10

1(1 + 푢) 푑푢

(52 ndash 14)

log푠 (푝퐻)푠 (푝퐼) = minus

12

1 + 휈ln 10

1푢 푑푢 minus

11 + 푢 푑푢 +

휈 1 minus 휈ln 10

1(1 + 푢) 푑푢

(52 ndash 15)

25 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐼) = minus

12 1 + 휈 log

1010

minus 휈 1 minus 휈 minus 1 + 휈 log1 + 101 + 10

(52 ndash 16)

Sendo

휈 1 minus 휈 minus 1 + 휈 = 휈 minus 휈 minus 1 minus 휈 = minus 1 + 휈 = minus2

(52 ndash 17)

Resultando em

log푠 (푝퐻)푠 (푝퐼) = log

1 + 101 + 10

minus1 + 휈

2 (푝퐻 minus 푝퐼)

(52 ndash 18)

Ainda eacute possiacutevel reescrever a equaccedilatildeo (52 ndash 18) como

log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log

1 + 101 + 10

(52 ndash 19)

Na qual n+ representa o nuacutemero de resiacuteduos ionizaacuteveis que na sua forma carregada

apresentam carga positiva A equaccedilatildeo (52 ndash 19) eacute uma expressatildeo analiacutetica que a

partir de dados da estrutura proteacuteica e de um dado de solubilidade permite predizer

a curva de solubilidade de uma dada proteiacutena em funccedilatildeo do pH na regiatildeo do ponto

isoeleacutetrico mantendo fixas a temperatura e a forccedila iocircnica do sistema

Eacute possiacutevel provar que as equaccedilotildees (42 ndash 8) e (52 ndash 19) satildeo idecircnticas - a prova

disso eacute descrita na seccedilatildeo 6 ndash e assim tem-se que apesar das distintas abordagens

a descriccedilatildeo do fenocircmeno eacute a mesma Note-se que um passo fundamental no

desenvolvimento da Equaccedilatildeo (52 ndash 5) eacute admitir que por hipoacutetese a atividade da

26 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

forma neutra natildeo depende do pH essa hipoacutetese tambeacutem eacute a base da equaccedilatildeo (41

ndash 7) Deve-se registrar o fato de que pelo melhor do nosso conhecimento esta eacute a

primeira vez que uma expressatildeo analiacutetica para o caacutelculo da solubilidade de

proteiacutenas em funccedilatildeo do pH eacute descrita mesmo no limite em que se considera vaacutelida

a lei de Henry

53 Soluccedilatildeo Paraboacutelica da Curva de Solubilidade

Tanto Groumlnwall (1941) quanto Fredericq e Neurath (1950) adotaram a hipoacutetese de

que os perfis de carga liacutequida da -lactoglobulina para um e da insulina para os

outros dois eram lineares na regiatildeo do ponto isoeleacutetrico Esta hipoacutetese eacute bastante

plausiacutevel e simplificadora principalmente a eacutepoca na qual estes trabalhos foram

desenvolvidos em que a estrutura proteacuteica bem como as constantes de ionizaccedilatildeo

dos resiacuteduos com grupos ionizaacuteveis era pouco conhecida De fato ainda hoje a falta

de dados das constantes de ionizaccedilatildeo na cadeia proteacuteica eacute o maior desafio no uso

do modelo rigoroso ndash equaccedilatildeo (52 ndash 18) Por isso o valor desta hipoacutetese de perfil

de carga liacutequida linear eacute notaacutevel

Supondo entatildeo que o perfil de carga seja linear eacute possiacutevel escrevecirc-lo como

푍(푝퐻) = minus퐴(푝퐻 minus 푝퐼) 푐표푚 퐴 gt 0

(53 ndash 1)

Substituindo (53 ndash 1) em (52 ndash 6)

푑 log 푠 (푝퐻)푑(푝퐻) = 퐴(푝퐻 minus 푝퐼)

(53 ndash 2)

Integrando (53 ndash 2) de um pH0 de referecircncia ateacute pH tem-se que

27 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐻 ) = 퐾[푝퐻 minus 2푝퐼(푝퐻 minus 푝퐻 ) minus 푝퐻 ] 푐표푚 퐾 =

퐴2

(53 ndash 3)

Ao se adotar como ponto de referecircncia o ponto isoeleacutetrico a equaccedilatildeo (53 ndash 3)

reduz-se agrave

log푠 (푝퐻)푠 (푝퐼) = 퐾(푝퐻 minus 푝퐼)

(53 ndash 4)

Contudo apesar da soluccedilatildeo quadraacutetica ou paraboacutelica para a equaccedilatildeo estendida de

Linderstroslashm-lang e Groumlnwall expressa na equaccedilatildeo (53 ndash 3) natildeo requerer os dados

das constantes de ionizaccedilatildeo dos resiacuteduos com grupos ionizaacuteveis ela exige a

definiccedilatildeo do paracircmetro A que fisicamente representa a inclinaccedilatildeo da reta de

aproximaccedilatildeo da curva de carga liacutequida e que pode ser calculado por correlaccedilatildeo a

partir de um conjunto de dados experimentais de solubilidade ou de carga liacutequida

6 Identidade entre o Modelo Proposto e a Equaccedilatildeo

Estendida de Linderstroslashm-Lang e Groumlnwall

A equaccedilatildeo final da modelagem termodinacircmica proposta apresentada na seccedilatildeo 4 eacute a

equaccedilatildeo (42 ndash 8) dada por

푠 (푝퐻)푠 (푝퐼) =

1 + 101 + 10

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 1)

Aplicando-se o logaritmo decimal nos dois termos da equaccedilatildeo (6 ndash 1) tem-se que

log푠 (푝퐻)푠 (푝퐼) = log

1 + 101 + 10

+ log

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 2)

Pelo bem da simplificaccedilatildeo desta deduccedilatildeo adotar-se-atildeo as seguintes funccedilotildees

휂 (푝퐻) = log

(6 ndash 3)

휃 (푝퐻) = log

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 4)

Assim pode-se reescrever a equaccedilatildeo (6 ndash 2) por

29 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐼) = 휂 (푝퐻) + 휃 (푝퐻)

(6 ndash 5)

Observando-se a equaccedilatildeo (6 ndash 5) tem-se que a funccedilatildeo j independe do estado de

ionizaccedilatildeo do resiacuteduo j poreacutem a funccedilatildeo jk depende Por isso deve-se analisar esta

funccedilatildeo para cada estado de ionizaccedilatildeo possiacutevel como mostrado na Tabela 61

Tabela 6 1 ndash Anaacutelise da funccedilatildeo jk para cada estado de ionizaccedilatildeo possiacutevel

j jk jk Quantidade de resiacuteduos neste estado

-1 -1 푝퐼 minus 푝퐻 na

0 0 nb

+1 +1 0 nc

0 푝퐼 minus 푝퐻 nd

Pela anaacutelise da Tabela 61 e considerando uma proteiacutena com n resiacuteduos com

grupos ionizaacuteveis infere-se que a equaccedilatildeo (6 ndash 5) pode ser reescrita como

log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)

(6 ndash 6)

Contudo as equaccedilotildees acima descritas satildeo vaacutelidas apenas para configuraccedilotildees

neutras pois apenas as configuraccedilotildees neutras da fase liacutequida estatildeo em equiliacutebrio

com as moleacuteculas de proteiacutena da fase soacutelida Para que uma configuraccedilatildeo seja

neutra vale a seguinte restriccedilatildeo

휀 = 0 hArr 푛 = 푛

(6 ndash 7)

30 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall

Substituindo a restriccedilatildeo dada pela equaccedilatildeo (6 ndash 7) na equaccedilatildeo (6 ndash 6) tem-se que

log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)

(6 ndash 8)

Ora mas a soma de nc e de nd natildeo resulta em outra coisa senatildeo no nuacutemero de

resiacuteduos com grupos ionizaacuteveis da estrutura proteacuteica cujo j seja +1 Assim

substituindo nc mais nd por n+ e substituindo a equaccedilatildeo (6 ndash 3) na equaccedilatildeo (6 ndash 8)

tem-se que

log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log

1 + 101 + 10

(6 ndash 9)

Ao se analisar a equaccedilatildeo (6 ndash 9) observa-se que ela eacute idecircntica a equaccedilatildeo estendida

de Linderstroslashm-Lang e Groumlnwall apresentada pela equaccedilatildeo (52 ndash 19) Com isso

tem-se que apesar das distintas formulaccedilotildees tanto a modelagem termodinacircmica aqui

proposta quanto a extensatildeo a teoria de Linderstroslashm-Lang e Groumlnwall resultam na

mesma descriccedilatildeo do fenocircmeno Aleacutem disso a equaccedilatildeo final dos modelos eacute

extremamente simples e depende apenas de um ponto de referecircncia e dos dados da

estrutura da moleacutecula de proteiacutena cuja solubilidade se deseja estudar

7 Aplicaccedilatildeo dos Modelos Expostos

Para validar o modelo comparando-o com o caacutelculo feito a partir da teoria de Debye-

Huumlckel o criteacuterio que relaciona os pontos calculados pelo modelo com os pontos

experimentais foi estabelecido a partir da seguinte funccedilatildeo objetivo (FO)

퐹푂 =1푁

푠 minus 푠푠

(7 ndash 1)

Contudo a equaccedilatildeo (7 ndash 1) natildeo eacute a melhor definiccedilatildeo de funccedilatildeo objetivo neste caso

pois a derivada da curva de solubilidade eacute razoavelmente grande nos dois lados do

ponto isoeleacutetrico e isso permite que pequenos desvios na direccedilatildeo horizontal

resultem em um grande aumento no valor da funccedilatildeo objetivo Uma soluccedilatildeo possiacutevel

seria substituir essa funccedilatildeo objetivo por uma funccedilatildeo definida pela soma do quadrado

da distacircncia do ponto experimental agrave curva do modelo principalmente se fosse

necessaacuterio calcular algum paracircmetro do modelo via otimizaccedilatildeo da funccedilatildeo objetivo

estipulada Natildeo sendo este o escopo deste trabalho optou-se pelo uso da FO

definida na equaccedilatildeo (7 ndash 1)

71 Solubilidade da Insulina Suiacutena

As Figuras 711 712 e 713 apresentam os graacuteficos da curva de solubilidade

dada pelos pontos experimentais pelo modelo proposto pela abordagem claacutessica e

tambeacutem a curva obtida pela soluccedilatildeo paraboacutelica da Equaccedilatildeo de Linderstroslashm-Lang e

Groumlnwall em trecircs temperaturas distintas

32 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 711 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 25 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

Figura 712 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 15 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

00

40

80

120

160

200

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

00

50

100

150

200

250

300

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

33 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 713 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 5 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

Os desvios da curva obtida pelo modelo proposto para valores de pH distantes do pI

podem ser explicados por ao menos trecircs importantes motivos dois devidos a

hipoacuteteses do modelo e um devido a fenocircmenos intriacutensecos a proteiacutena Sabendo que

no pI a solubilidade eacute miacutenima para valores de pH distantes do pI pode-se ter

solubilidades suficientemente grandes para que a validade da lei de Henry ndash adotada

na formulaccedilatildeo do modelo - seja questionada pois quanto mais distante do pI maior

a solubilidade e menor a validade da lei de Henry jaacute que haacute um aumento da

concentraccedilatildeo do soluto (proteiacutena) na soluccedilatildeo e tambeacutem ao fato do modelo prever

solubilidade infinita quando a fraccedilatildeo de moleacuteculas eletricamente neutras tende a

zero

limrarr푠 = lim

rarr

Φ(푝퐼)푠 (푝퐼)Φ(푝퐻) = +infin

(711 ndash 1)

00

50

100

150

200

250

300

350

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

34 7 Aplicaccedilatildeo dos Modelos Expostos

Todavia ainda haacute um fator de ordem natural que justifica o desvio apresentado para

valores de pH distantes do pI o desnovelamento da cadeia proteacuteica Este fenocircmeno

pode ocorrer de maneira a expor grupos hidroacutefobos resiacuteduos antes natildeo expostos

acrescentando relaccedilotildees de equiliacutebrio quiacutemico natildeo existentes na regiatildeo do pI

alterando o equiliacutebrio de fases e portanto alterando o valor da solubilidade

A Tabela 711 apresenta os valores obtidos para a funccedilatildeo objetivo definida em (7 ndash

1) tanto para o modelo proposto quanto para a abordagem claacutessica para trecircs

diferentes temperaturas

Tabela 711 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada

abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para insulina

suiacutena

T ordmC Abordagem FO

25 P 01857 C 02535

15 P 01981 C 05056

5 P 03595 C 03064

Observando-se a Tabela 711 vecirc-se que o modelo apresentou melhores resultados

do que o caacutelculo efetuado atraveacutes da abordagem claacutessica no que tange a

minimizaccedilatildeo da funccedilatildeo objetivo exceto para os dados a 5 ordmC

Tambeacutem eacute possiacutevel observar que a funccedilatildeo objetivo sofreu aumento com a

diminuiccedilatildeo da temperatura Isto ocorreu principalmente devido agrave dificuldade de

obter dados experimentais de solubilidade a temperaturas baixas o que aumenta o

desvio experimental fazendo com que se tenha um aumento do valor da funccedilatildeo

objetivo como a definida em (5 ndash 1) Um efeito secundaacuterio que tambeacutem pressiona a

35 7 Aplicaccedilatildeo dos Modelos Expostos

funccedilatildeo objetivo eacute o fato dos dados de pKA terem sido obtidos a uma temperatura

especiacutefica o que tende a acrescentar erro no caacutelculo de solubilidades a temperaturas

diferentes ainda que o pKA natildeo varie de forma ab-rupta com a temperatura

Outra observaccedilatildeo que deve ser registrada eacute o fato da funccedilatildeo objetivo para a

abordagem claacutessica na temperatura de 15 ordmC divergir a um valor tatildeo elevado em

relaccedilatildeo aos demais Isto se deve a um ponto experimental especiacutefico a um pH de

45 a solubilidade da insulina suiacutena obtida experimentalmente eacute 230 x 10-5 mol kg-1

enquanto a calculada pelo modelo proposto eacute 230 x 10-5 mol kg-1 e a calculada pela

abordagem claacutessica eacute 520 x 10-5 mol kg-1 Por conta do desvio deste ponto a funccedilatildeo

objetivo para a abordagem claacutessica nesta temperatura tem um aumento significativo

A Tabela 712 apresenta os valores do paracircmetro K da soluccedilatildeo paraboacutelica obtidos

neste trabalho para a insulina suiacutena comparados ao encontrado na literatura

Tabela 712 ndash Valores do paracircmetro K da soluccedilatildeo paraboacutelica para a insulina suiacutena

Referecircncias T ordmC K Fredericq e Neurath (1950) - 081 Neste trabalho 25 104 Neste trabalho 15 101 Neste trabalho 5 145

Pela Tabela 712 pode-se observar que haacute uma diferenccedila pequena entre os

valores do paracircmetro K obtidos neste trabalho e por Fredericq e Neurath (1950) Por

isso natildeo se pode afirmar a que se deve esta diferenccedila se eacute devido a diferenccedilas entre

procedimentos experimentais ou se eacute devido agrave diferenccedila de meacutetodo de caacutelculo do

paracircmetro Apesar de no experimento realizado por Fredericq e Neurath (1950)

haver a presenccedila do acircnion tiocianato e este acircnion interagir com grupos ionizaacuteveis

da cadeia proteacuteica como observado pelos autores do trabalho tambeacutem estes

36 7 Aplicaccedilatildeo dos Modelos Expostos

proacuteprios autores afirmam que a presenccedila deste acircnion natildeo altera a forma da curva

que eacute basicamente determinada pelo paracircmetro K De qualquer modo eacute interessante

observar a proximidade dos valores encontrados neste trabalho com o obtido por

Fredericq e Neurath (1950) pelo menos no que diz respeito agrave ordem de grandeza do

paracircmetro em questatildeo

72 Solubilidade da Lisozima de clara de ovo de galinha

Um modelo para ser validado necessita correlacionar dados experimentais de modo

satisfatoacuterio ou seja um modelo deve buscar fidelidade ao fenocircmeno fiacutesico

observado Assim na procura de dados de solubilidade de proteiacutenas poucos dados

na regiatildeo do pI foram encontrados Este eacute o caso da lisozima de clara de ovo de

galinha que apesar de ter muitos estudos de solubilidade nenhum deles se

encontra na regiatildeo do pI Surgiu assim a necessidade de se obter estes dados

experimentais para poder validar o modelo proposto A escolha da lisozima de clara

de ovo de galinha se deu em parte pela sua importacircncia mas tambeacutem em parte por

ter os valores de pKA conhecidos

A curva de solubilidade da lisozima de clara de ovo de galinha levantada neste

trabalho estaacute apresentada na Figura 721

37 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em

soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e

dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()

Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento

esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH

isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de

soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se

comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto

isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da

soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos

ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente

neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a

solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e

00

10

20

30

40

50

60

70

80

90

100

95 100 105 110 115 120

Solu

bilid

ade

(mg

mL)

pH

38 7 Aplicaccedilatildeo dos Modelos Expostos

alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado

em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo

Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo

a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo

Por conta de falta de dados a este respeito modelou-se apenas a curva de

solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura

722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de

galinha em funccedilatildeo do pH da soluccedilatildeo

Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)

00

10

20

30

40

50

60

70

80

90

96 99 102 105 108 111 114 117 120

Solu

bilid

ade

(mg

mL)

pH

39 7 Aplicaccedilatildeo dos Modelos Expostos

O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721

Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada

abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima

de clara de ovo de galinha

T ordmC Abordagem FO

25 P 4650 C gt7919a

a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado

Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta

aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a

abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca

de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos

anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao

efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de

clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a

variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A

proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de

cargas pontuais de Debye-Huumlckel

8 Conclusotildees

A modelagem termodinacircmica proposta neste trabalho apresentou expressivos

resultados quando comparada a abordagem claacutessica de Debye-Huumlckel

Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o

modelo aproximou melhor os pontos experimentais do que a referida abordagem

comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima

ao ponto isoeleacutetrico

Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica

para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua

construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo

lugar por sua aplicabilidade

Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis

da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva

em regiotildees distantes do ponto isoeleacutetrico

9 Referecircncias Bibliograacuteficas

BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene

Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects

Biophys J 95 1285-1294 2008

FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and

other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72

2684 - 26911950

GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v

93 p 517-542 1931

GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab

Carlsberg v 24 p 185-200 1941

KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native

and mutant insulins pK perturbation of B13-Glu in aggregated species Arch

Biochem Biophys v 283 p 496-502 1990

KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for

the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng

Chem Res v 35 p 4319-4327 1996

42 9 Referecircncias Bibliograacuteficas

KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen

lysozyme J Biochem v 87 p 1215-1219 1980

LADISCH M R Bioseparations Engineering principles practice and

economics John Wiley amp Sons 2001 pp1 116 ndash 117 133

LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab

Carlsberg v 15 p 1-29 1924

PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da

particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas

2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP

PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the

excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte

solutions Fluid Phase Equilib v 269 p 25ndash35 2008

PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-

contribution model involving phase and chemical equilibrium Ind Eng Chem Res

v 33 p 1341-1347 1994

PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277

1973

PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino

acids Fluid Phase Equilib v 152 p 121-132 1998

43 9 Referecircncias Bibliograacuteficas

PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular

Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999

SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of

equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte

solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009

TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J

R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with

carbon dioxide Biotech Bioeng v103 p 909-919 2009

TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer

free energy Biophys J v 95 p 2601-2609 2008

TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in

water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95

2009

Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na

cadeia proteacuteica

Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo

de ionizaccedilatildeo

퐻퐴 퐴 + 퐻

(A ndash 1)

Assim considerando que a constante de equiliacutebrio

퐾 = 푎

(A ndash 2)

Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que

퐾 =[퐴 ][퐻 ]

[퐻퐴]

(A ndash 3)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que

log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]

(A ndash 4)

Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado

por

minus log[휑] = 푝휑

(A ndash 5)

Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que

45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

푝퐾 = log[퐻퐴][퐴 ] + 푝퐻

(A ndash 6)

Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por

훼 =[퐴 ]

[퐻퐴] + [퐴 ]

(A ndash 7)

Reescrevendo (A ndash 7) tem-se que

훼 =[퐴 ] [퐻퐴frasl ]

1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =

훼1 minus 훼

(A ndash 8)

Substituindo (A ndash 8) em (A ndash 6) tem-se que

푝퐾 = log훼

1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10

(A ndash 9)

Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos

훼 =1

1 + 10

(A ndash 10)

Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio

퐴 + 퐻 퐻퐴

(A ndash 11)

Pode se escrever a constante de equiliacutebrio como

퐾 =[퐻퐴 ]

[퐴][퐻 ]

(A ndash 12)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que

46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

log퐾 = minus log[퐴]

[퐻퐴 ] minus log[퐻 ]

(A -13)

Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por

훼 =[퐻퐴 ]

[퐴] + [퐻퐴 ]

(A ndash 14)

Assim a equaccedilatildeo (A ndash 13) fica

훼1 minus 훼 = 10

(A ndash 15)

Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo

훼 =10

1 + 10

(A ndash 16)

Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos

modelos expostos

Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]

48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]

49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)

50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])

51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]

52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])

53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)

54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2

55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO

2 Materiais e Meacutetodos

21 Meacutetodos computacionais

O coacutedigo-fonte do programa em linguagem C estaacute apresentado no Apecircndice B Os

meacutetodos numeacutericos utilizados se resumem a interpolaccedilatildeo linear o meacutetodo de

Newton-Raphson cujo uso seraacute apresentado na proacutexima seccedilatildeo quando se deduziraacute

o algoritmo do modelo de Debye-Huumlckel e o meacutetodo de busca unidirecional de

miacutenimos de funccedilatildeo pela Seccedilatildeo Aacuteurea

As Tabelas 211 e 212 apresentam os resiacuteduos considerados para cada proteiacutena

considerada bem como os seus valores de pKA que foram obtidos a partir da

literatura e satildeo indispensaacuteveis para execuccedilatildeo dos caacutelculos mais rigorosos

Tabela 211 ndash Resiacuteduos ionizaacuteveis considerados e valores de pKA da insulina suiacutena

Valores extraiacutedos de Kaarsholm et al (1990)

Aminoaacutecido Grupo Ionizaacutevel pKA

A1 ndash Gly -NH2 738 A4 ndash Glu -COOH 437 A14 ndash Tyr Fenol-OH 1020 A17 ndash Glu -COOH 437 A19 ndash Tyr Fenol-OH 1020 A21 ndash Asn -COOH 345

B1 ndash Phe -NH2 738 B5 ndash His Imidazol-NH 598 B10 ndash His Imidazol-NH 598 B 13 ndash Glu -COOH 437 B16 ndash Tyr Fenol-OH 1020 B21 ndash Glu -COOH 437

B22 ndash Arg Guaniacutedio-NH2 1110 B26 ndash Tyr Fenol-OH 1020

B29 ndash Lys -NH2 852 B30 ndashAla -COOH 345

8 2 Materiais e Meacutetodos

Tabela 212 ndash Resiacuteduos ionizaacuteveis considerados e valores de pKA a 25 ordmC da lisozima

de clara de ovo de galinha Valores extraiacutedos de Kuramitsu e Hamaguchi (1980)

Aminoaacutecido Grupo Ionizaacutevel pKA α-NH2 α-NH2 79

Lys1 ε-NH2 108

Arg5 Guaniacutedio-NH2 120 Glu7 -COOH 26

Lys13 ε-NH2 105

Arg14 Guaniacutedio-NH2 120 His15 Imidazol-NH 58 Asp18 -COOH 20 Tyr20 Fenol-OH 103

Arg21 Guaniacutedio-NH2 120 Tyr23 Fenol-OH 98

Lys33 ε-NH2 106 Glu35 -COOH 61

Arg45 Guaniacutedio-NH2 120 Asp48 -COOH 43 Asp52 -COOH 34 Tyr53 Fenol-OH 121

Arg61 Guaniacutedio-NH2 120 Asp66 -COOH 16

Arg68 Guaniacutedio-NH2 120

Arg73 Guaniacutedio-NH2 120 Asp87 -COOH 21

Lys96 ε-NH2 108

Lys97 ε-NH2 103 Asp101 -COOH 45

Arg112 Guaniacutedio-NH2 120

Arg114 Guaniacutedio-NH2 120

Lys116 ε-NH2 104 Asp119 -COOH 25

Arg125 Guaniacutedio-NH2 120

Arg128 Guaniacutedio-NH2 120 α-COOH α-COOH 31

9 2 Materiais e Meacutetodos

22 Curva de solubilidade da lisozima da clara de ovo de galinha

221 Reagentes

Neste experimento de determinaccedilatildeo da curva de solubilidade da lisozima da clara de

ovo de galinha os reagentes utilizados foram cloreto de soacutedio (Reatec P A)

bicarbonato de soacutedio (Research Becto Chemical P A) Na2HPO4 7H2O (Reagen

P A) aacutegua destilada deionizada Milli-Q (Millipore) e lisozima de clara de ovo de

galinha (Sigma min 99)

222 Equipamentos

Neste experimento os equipamentos utilizados foram espectrofotocircmetro UV-Visiacutevel

(Beckman DU-530) centriacutefuga (Eppendorf) banho-teacutermico (Laacutectea) com controlador

de temperatura (Julabo) pHmetro (Micronal) e balanccedila (Mettler Toledo AB204S)

223 Preparaccedilatildeo das soluccedilotildees-tampatildeo

Foram preparadas soluccedilotildees-tampatildeo com valores de pH=96 pH = 98 pH = 100

pH = 102 pH = 104 pH = 106 pH = 108 pH = 110 pH = 112 pH = 114 pH =

116 e pH = 118 a partir de quatro soluccedilotildees uma de hidroacutexido de soacutedio 01 M uma

de cloreto de soacutedio 1 M (para equalizar a forccedila iocircnica) uma de bicarbonato de soacutedio

005 M e outra de Na2HPO4 005 M

A Tabela 2231 apresenta os valores de volume usados no preparo de cada uma

das soluccedilotildees-tampatildeo

10 2 Materiais e Meacutetodos

Tabela 2231 ndash Volumes de hidroacutexido de soacutedio a 01 M adicionados no preparo das

soluccedilotildees-tampatildeo

Tampatildeo pH V NaOH mL

NaHCO3 96 100 005 M 98 152

(para cada soluccedilatildeo-tampatildeo 100 mL 100 214

desta soluccedilatildeo foram adicionados) 102 276

104 330 106 382

108 424

110 454

112 530 114 583

Na2HPO4 110 82

005 M 112 126

(para cada soluccedilatildeo-tampatildeo 100 mL 114 182 desta soluccedilatildeo foram adicionados) 116 270

118 388

224 Procedimento experimental

Foram adicionadas quantidades natildeo definidas de lisozima de clara de ovo de galinha

a 13 mL de cada soluccedilatildeo-tampatildeo em tubos Eppendorf de 2 mL Colocaram-se

entatildeo as amostras apoacutes agitaccedilatildeo vigorosa em banho teacutermico a 250 plusmn 01 ordmC por 24

horas para que os sistemas atingissem o equiliacutebrio termodinacircmico Caso natildeo

houvesse a formaccedilatildeo de precipitado lisozima era adicionada e o procedimento

repetido Ao se observar a formaccedilatildeo de precipitado o sistema era centrifugado a

13000 rpm por 15 minutos Uma aliacutequota do sobrenadante era retirada e sua

concentraccedilatildeo proteacuteica determinada por medida de absorbacircncia a 280 nm Cada

sistema foi feito ao menos em duplicata

3 Modelo Estendido de Debye-Huumlckel

31 Introduccedilatildeo

De fato como descrito por Pessocirca Filho (2002) a equaccedilatildeo de Debye-Huumlckel natildeo

deve ser aplicada agrave modelagem de polieletroacutelitos tais como proteiacutenas porque nestas

moleacuteculas as cargas satildeo distribuiacutedas ao longo da cadeia e portanto natildeo satildeo cargas

pontuais como suposto por Debye-Huumlckel

Contudo nesta modelagem considera-se uma regiatildeo de pH em torno do ponto

isoeleacutetrico (pI) na qual satildeo inerentes duas condiccedilotildees favoraacuteveis a aplicaccedilatildeo da

equaccedilatildeo de Debye-Huumlckel carga liacutequida proacutexima a zero pois Z(pI) = 0 e regiatildeo de

miacutenima solubilidade que significa baixas concentraccedilotildees de proteiacutenas em soluccedilatildeo

Isto significa em primeiro lugar que os efeitos da carga tais como ldquodesnovelamentordquo

da cadeia proteacuteica com exposiccedilatildeo de resiacuteduos outrora blindados podem ser

desprezados em uma regiatildeo proacutexima ao ponto isoeleacutetrico e em segundo lugar

baixas concentraccedilotildees de proteiacutena em soluccedilatildeo significam que os termos de curto

alcance podem ser desprezados e portanto haacute prevalecircncia do termo de longo

alcance que no caso de soluccedilotildees eletroliacuteticas pode ser descrito por uma equaccedilatildeo

estendida de Debye-Huumlckel

Assim o modelo de Debye-Huumlckel foi utilizado natildeo para verificar sua aplicabilidade agrave

modelagem de soluccedilotildees proteacuteicas mas sim para confrontar o modelo proposto com

um modelo usual em modelagem de soluccedilotildees eletroliacuteticas e seraacute referido no texto

sempre como abordagem claacutessica

12 3 Modelo Estendido de Debye-Huumlckel

32 Desenvolvimento teoacuterico

Pode-se escrever a atividade da proteiacutena como o produto entre a solubilidade e o

coeficiente de atividade da mesma como mostrado na equaccedilatildeo (32 - 1)

푎 = 훾푠

(32 - 1)

Na qual pode-se calcular o coeficiente de atividade atraveacutes da equaccedilatildeo estendida

de Debye-Huumlckel (Pitzer 1973)

ln 훾 = minus퐴 푍radic퐼

1 + 푏radic퐼+

2푏

ln 1 + 푏radic퐼

(32 - 2)

Sendo que a constante universal empiacuterica b = 12 kg12 mol-12 eacute usada para todos os

eletroacutelitos Jaacute AΦ eacute o paracircmetro de Debye-Huumlckel para o coeficiente osmoacutetico e eacute

dado por

퐴 =13

(2휋푁 휌 ) frasl 푒4휋휀 휀 푘푇

frasl

(32 - 3)

Em que NA eacute a constante de Avogadro ρs eacute a densidade do solvente em g cm-3 e eacute

a carga eletrocircnica (e = 160218 x 10-19 C) ε0 eacute a permissividade do espaccedilo livre (ε0 =

885419 x 10-12 C2 N-1 m-2) εr eacute a constante dieleacutetrica do solvente k aacute constante de

Boltzmann e T eacute a temperatura absoluta Jaacute a carga liacutequida em funccedilatildeo do pH pode

ser calculada como

푍 = 훼 minus 훼

(32 - 4)

Sendo que α+ e α- satildeo dados pelas equaccedilotildees (A - 10) e (A - 16) do Apecircndice A

13 3 Modelo Estendido de Debye-Huumlckel

E a forccedila iocircnica eacute dada pela equaccedilatildeo (32 - 5) descrita abaixo

퐼 = 12

푚 푍

(32 - 5)

Contudo no ponto isoeleacutetrico a carga meacutedia da proteiacutena eacute nula portanto o termo de

Debye-Huumlckel se anula e o coeficiente de atividade se torna unitaacuterio

ln푎 (푝퐼) = ln 푠 (푝퐼)

(32 - 6)

Considerando que a atividade da proteiacutena seja constante com a variaccedilatildeo de pH isto

implica que esta eacute sempre igual agrave solubilidade da proteiacutena no ponto isoeleacutetrico e

portanto vale que

ln푎 (푝퐻) = ln 푠 (푝퐻) + ln 훾(푝퐻) = ln 푠 (푝퐼)

(32 - 7)

Assim

ln 푠 (푝퐻) = ln 푠 (푝퐼) + 퐴휙푍푝퐻2 radic퐼1 + 푏radic퐼

+2푏

ln 1 + 푏radic퐼

(32 - 8)

Esta equaccedilatildeo prevecirc a curva de solubilidade em funccedilatildeo do pH atraveacutes do caacutelculo da

atividade da proteiacutena na fase liacutequida pela equaccedilatildeo estendida de Debye-Huumlckel Para

resolvecirc-la eacute necessaacuterio se utilizar de um meacutetodo numeacuterico pois a forccedila iocircnica

depende da solubilidade naquele pH Optou-se neste trabalho pelo Meacutetodo de

Newton-Raphson para executar o meacutetodo iterativo que eacute exigido pela equaccedilatildeo (32

ndash 8) Para aplicar este meacutetodo arbitrou-se uma funccedilatildeo f(sp) definida aqui como

푓 푠 = minus ln 푠 (푝퐻) + ln 푠 (푝퐼) + 퐴휙푍푝퐻2 radic퐼

1 + 푏radic퐼+

2푏

ln 1 + 푏radic퐼

(32 - 9)

14 3 Modelo Estendido de Debye-Huumlckel

Assim ao calcular o sp que zera esta funccedilatildeo f(sp) saber-se-aacute que eacute a proacutepria

solubilidade que se deseja calcular Para aplicar o Meacutetodo de Newton-Raphson

basta derivar a funccedilatildeo f(sp) e aplicar o seguinte algoritmo de resoluccedilatildeo

푠 = 푠 minus푓(푠 )푓 (푠 )

(32 - 10)

Para calcular frsquo(s) deve-se considerar que a forccedila iocircnica depende da solubilidade

Para isto observando a equaccedilatildeo (32 - 5) vecirc-se que a forccedila iocircnica eacute dada pelo

somatoacuterio das contribuiccedilotildees de todos os iacuteons presentes na soluccedilatildeo por isso aqui

cabe um artifiacutecio de dividir estas contribuiccedilotildees em duas macro-contribuiccedilotildees aquela

devida a todos os iacuteons presentes na soluccedilatildeo exclusive os grupos ionizaacuteveis

presentes nas moleacuteculas da proteiacutena em questatildeo (I0) e que se considera constante

com o pH e aquela que engloba apenas os grupos ionizaacuteveis presentes nas

moleacuteculas da proteiacutena (IP)

퐼 = 퐼 + 퐼 = 퐼 +12푍 푠

(32 - 11)

Considerando a funccedilatildeo w tal que

푤 = radic퐼 = 퐼 +12푍 푠

(32 - 12)

Sendo

푤 =14푍 퐼

(32 - 13)

Entatildeo aplicando-se as devidas regras de derivaccedilatildeo tem-se

15 3 Modelo Estendido de Debye-Huumlckel

푓 (푠 ) = minus1푠 + 퐴 푍

3푤 + 2푤 푏푤(1 + 푏푤)

(32 - 14)

Substituindo as equaccedilotildees (32 - 12) e (32 - 13) na equaccedilatildeo (32 - 14) tem-se que

푓 (푠 ) = minus1푠 + 퐴 푍

15 + 푏radic퐼2radic퐼(1 + 푏radic퐼)

(32 - 15)

Entatildeo o algoritmo deve ser

푠 = 푠 minus

⎜⎛ln 푠 (푝퐼)

푠 + 퐴휙푍푝퐻2 radic퐼

1 + 푏radic퐼+ 2푏 ln 1 + 푏radic퐼

minus 1푠 + 퐴휙푍

15 + 푏radic퐼2radic퐼(1 + 푏radic퐼) ⎠

⎟⎞

(32 - 16)

4 Modelagem Termodinacircmica Proposta

41 Introduccedilatildeo

A condiccedilatildeo de equiliacutebrio entre duas fases (α e β) com m componentes eacute dada por

(Prausnitz et al 1999)

푝 = 푝

(41 ndash 1)

푇 = 푇

(41 ndash 2)

휇 = 휇⋮

휇 = 휇

(41 ndash 3)

Considerando o equiliacutebrio soacutelido-liacutequido (ESL) de sistemas contendo proteiacutenas

sendo que os efeitos da pressatildeo podem ser desprezados que as temperaturas nas

duas fases satildeo iguais e que na fase soacutelida soacute haacute proteiacutena tem-se que para a

proteiacutena a relaccedilatildeo de equiliacutebrio pode ser descrita por

휇 (푇푥) = 휇 (푇)

(41 ndash 4)

Contudo adotando-se a lei de Henry que eacute vaacutelida para baixas concentraccedilotildees de

soluto hipoacutetese que natildeo eacute distante dos valores observados da solubilidade de

proteiacutenas pode se escrever o potencial quiacutemico na fase liacutequida por

휇 (푇푥) = 휇 (푇 푥 ) + 푅푇푙푛푥

(41 ndash 5)

17 4 Modelagem Termodinacircmica Proposta

Entretanto variaccedilotildees de pH natildeo alteram o potencial quiacutemico da fase soacutelida o que

resulta pela relaccedilatildeo (41 ndash 4) que o mesmo natildeo altera tambeacutem o potencial quiacutemico

da fase liacutequida Com isso pela relaccedilatildeo (41 ndash 5) sendo o potencial quiacutemico de

referecircncia constante com o pH uma contradiccedilatildeo emerge a variaccedilatildeo do pH natildeo

poderia alterar o valor da solubilidade poreacutem a observaccedilatildeo experimental mostra o

contraacuterio Assim deve-se lembrar que pelo princiacutepio da eletroneutralidade a fase

soacutelida soacute possui moleacuteculas proteacuteicas eletricamente neutras e portanto o equiliacutebrio

de fases deve se estabelecer apenas entre as moleacuteculas presentes na fase soacutelida e

as moleacuteculas eletricamente neutras em soluccedilatildeo Ou seja como soacute moleacuteculas

eletricamente neutras podem estar na fase soacutelida o equiliacutebrio de fases depende

exclusivamente da fraccedilatildeo de moleacuteculas eletricamente neutras em soluccedilatildeo pois soacute

estas podem precipitar Assim tanto a equaccedilatildeo (41 ndash 4) quanto a equaccedilatildeo (41 ndash

5) devem ser aplicadas natildeo ao conjunto de todas as moleacuteculas de proteiacutena em

soluccedilatildeo mas somente as moleacuteculas proteacuteicas eletricamente neutras Portanto a

concentraccedilatildeo das moleacuteculas de proteiacutena eletricamente neutras em soluccedilatildeo eacute

constante com o pH e pode ser interpretada como a multiplicaccedilatildeo da fraccedilatildeo de

moleacuteculas eletricamente neutras pela concentraccedilatildeo total de proteiacutenas que eacute a

proacutepria solubilidade Assim uma relaccedilatildeo de inversa proporcionalidade eacute definida

quanto maior a fraccedilatildeo de moleacuteculas neutras menor seraacute a solubilidade de uma

proteiacutena em soluccedilatildeo Portanto no ponto isoeleacutetrico no qual haacute o miacutenimo de

solubilidade tem-se o ponto maacuteximo de fraccedilatildeo de moleacuteculas eletricamente neutras

A partir disto eacute possiacutevel escrever a equaccedilatildeo que rege o comportamento da

solubilidade de uma proteiacutena em funccedilatildeo do pH da soluccedilatildeo

휙(푝퐻)푆 (푝퐻) = 휆 = 푐표푛푠푡푎푛푡푒

(41 ndash 6)

18 4 Modelagem Termodinacircmica Proposta

Na equaccedilatildeo (41 ndash 6) o paracircmetro λ pode ser um paracircmetro de ajuste do modelo a

um conjunto de valores experimentais tendo se estabelecido uma funccedilatildeo objetivo ou

ainda dado pelo produto entre a solubilidade no ponto isoeleacutetrico e a fraccedilatildeo de

moleacuteculas eletricamente neutras em soluccedilatildeo tambeacutem no pI neste caso vale a

seguinte equaccedilatildeo

푠 (푝퐻) =휙(푝퐼)푠 (푝퐼)휙(푝퐻)

(41 ndash 7)

Sendo a equaccedilatildeo do modelo ndash equaccedilatildeo (41 ndash 7) ndash extremamente simples a uacutenica

dificuldade reside no caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras

(휙(푝퐻))

42 Caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras

Dentre os aminoaacutecidos que formam atraveacutes de ligaccedilotildees peptiacutedicas as proteiacutenas haacute

aqueles que possuem resiacuteduos com grupos ionizaacuteveis aleacutem dos grupos amina e

aacutecido carboxiacutelico terminais na cadeia Todos estes participam de equiliacutebrios

quiacutemicos com iacuteons H+ presentes na soluccedilatildeo entatildeo ao se alterar o pH da soluccedilatildeo

estes equiliacutebrios satildeo alterados

Assim haacute vaacuterias possibilidades de combinaccedilotildees de estados ionizados destes grupos

ionizaacuteveis que resultam em uma moleacutecula de proteiacutena eletricamente neutra Eacute

importante notar que dada a fraccedilatildeo de uma configuraccedilatildeo de uma moleacutecula neutra

todas as outras fraccedilotildees de configuraccedilotildees possiacuteveis que tambeacutem resultem em

moleacuteculas neutras satildeo proporcionais agrave fraccedilatildeo da configuraccedilatildeo dada pois todas as

configuraccedilotildees participam de equiliacutebrios entre si

19 4 Modelagem Termodinacircmica Proposta

Desta observaccedilatildeo implica-se que basta identificar uma configuraccedilatildeo proteacuteica cuja

soma dos estados ionizados resulte em carga nula para se descrever o equiliacutebrio de

fases em relaccedilatildeo ao pH na regiatildeo do ponto isoeleacutetrico onde esta consideraccedilatildeo eacute

predominante em relaccedilatildeo a outros possiacuteveis fenocircmenos

Contudo eacute necessaacuterio contabilizar a contribuiccedilatildeo de cada grupo ionizaacutevel via

equaccedilatildeo de Henderson-Hasselbach equaccedilatildeo (42 ndash 1)

훼 (푝퐻) =

⎩⎪⎨

⎪⎧ 10

1 + 10 푠푒 휈 = minus1

11 + 10

푠푒 휈 = +1

(42 ndash 1)

Na qual pKAj eacute o co-logaritmo da constante de equiliacutebrio do grupo ionizaacutevel do

resiacuteduo j j eacute estado carregado potencial do resiacuteduo j (-1 para grupos aacutecidos e +1

para grupos baacutesicos) e j eacute a fraccedilatildeo ionizada para o pH dado Para grupos cujo

estado de ionizaccedilatildeo na dada configuraccedilatildeo seja neutro a sua fraccedilatildeo eacute calculada tal

que a soma de sua fraccedilatildeo e da fraccedilatildeo ionizada tenha como resultado o valor

unitaacuterio

Assim a funccedilatildeo Pn pode ser escrita como o produto de cada fraccedilatildeo de cada grupo

ionizaacutevel j naquele estado (-1 0 ou +1) na configuraccedilatildeo neutra k em uma proteiacutena

com n grupos ionizaacuteveis Uma representaccedilatildeo matemaacutetica possiacutevel para esta funccedilatildeo

pode ser escrita como

휙 (푝퐻) = 훼 (푝퐻)

(42 ndash 2)

Na qual a fraccedilatildeo jrsquo(pH) eacute dada por

20 4 Modelagem Termodinacircmica Proposta

훼 (푝퐻) =훼 (푝퐻) 푠푒 휀 = 11 minus 훼 (푝퐻) 푠푒 휀 = 0

(42 ndash 3)

Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (42 ndash 3) e a resultante na equaccedilatildeo

(42 ndash 2) pode-se escrever que

휙 (푝퐻) =1

1 + 10

1 + 휈2 minus 휈 휀 10

minus휈 minus 1

2 minus 휈 휀 푐표푚 휀 = 0

(42 ndash 4)

A equaccedilatildeo (42 ndash 4) junto agrave equaccedilatildeo (41 ndash 7) constituem o modelo termodinacircmico

capaz de predizer a razatildeo entre as fraccedilotildees de moleacuteculas neutras de uma proteiacutena

em funccedilatildeo do pH na regiatildeo do ponto isoeleacutetrico mantendo fixas temperatura e forccedila

iocircnica Substituindo a equaccedilatildeo (42 ndash 4) na equaccedilatildeo (41 ndash 7) obteacutem-se para a

curva de solubilidade

푠 (푝퐻)푠 (푝퐼) =

1 + 101 + 10

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

푐표푚 휀 = 0

(42 ndash 8)

5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

51 Introduccedilatildeo

Segundo Groumlnwall (1941) na fase liacutequida haacute moleacuteculas de proteiacutenas com muitas

configuraccedilotildees k distintas que possuem carga liacutequida i e tambeacutem haacute certas

configuraccedilotildees que tem carga liacutequida nula e satildeo chamadas configuraccedilotildees neutras

Aleacutem disso estas uacuteltimas satildeo aquelas que determinam o equiliacutebrio de fases jaacute que

elas estatildeo em equiliacutebrio com a fase soacutelida na qual soacute haacute moleacuteculas neutras pelo

princiacutepio da eletroneutralidade Eacute tambeacutem afirmado que dado este equiliacutebrio a

atividade das moleacuteculas neutras natildeo se altera com a variaccedilatildeo do pH e eacute

proporcional agraves atividades de qualquer tipo de configuraccedilatildeo neutra

Neste mesmo trabalho eacute atribuiacuteda a Linderstroslashm-Lang o desenvolvimento de uma

teoria de prediccedilatildeo da solubilidade de proteiacutenas com a variaccedilatildeo do pH na regiatildeo do

ponto isoeleacutetrico Este desenvolvimento apresenta um balanccedilo de cargas de um

modo impliacutecito contudo como atestado por Groumlnwall o escasso conhecimento

sobre as estruturas proteacuteicas impediram agravequele tempo uma formulaccedilatildeo mais

pormenorizada do problema

52 Desenvolvimento teoacuterico

A base desta abordagem descrita por Groumlnwall e atribuiacuteda a Linderstroslashm-Lang

reside na hipoacutetese de que a moleacutecula de proteiacutena de configuraccedilatildeo k e carga nula

participa do seguinte equiliacutebrio com os iacuteons H+ e com sua forma de carga i

22 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

푃 + 푖퐻 푃 lowast

(52 ndash 1)

Note-se que o valor de i pode ser negativo A constante do equiliacutebrio quiacutemico

descrita pela equaccedilatildeo (52 ndash 1) pode ser expressa como

퐾 =푎

lowast

푎 푎

(52 ndash 2)

Sabendo que a atividade da moleacutecula de proteiacutena de configuraccedilatildeo k e carga i eacute dada

pelo produto entre sua concentraccedilatildeo e seu coeficiente de atividade tem-se que

푥lowast

= 푎 푎퐾훾

lowast

(52 ndash 3)

Entretanto a solubilidade da proteiacutena eacute soma das concentraccedilotildees de todas as

moleacuteculas de carga i Poreacutem a concentraccedilatildeo das moleacuteculas de carga i eacute a soma das

concentraccedilotildees das moleacuteculas de configuraccedilatildeo k Assim a solubilidade pode ser

escrita como

푠 (푝퐻) = 푎 푎퐾훾

lowast

(52 ndash 4)

Derivando a equaccedilatildeo (52 ndash 4) com respeito agrave atividade do iacuteon H+ considerando

que atividade da moleacutecula neutra eacute constante para qualquer configuraccedilatildeo k e ainda

que o coeficiente de atividade da proteiacutena de carga i independe da atividade do iacuteon

H+ tem-se que

푑푠푑푎 = 푖 ∙ 푎 푎

퐾훾

lowast

(52 ndash 5)

23 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

Sendo

푑 log 푠 (푝퐻)푑(푝퐻) = minus

푎푠 (푝퐻)

푑푠푑푎

(52 ndash 6)

Substituindo as equaccedilotildees (52 ndash 4) e (52 ndash 5) na equaccedilatildeo (52 ndash 6) e

reescrevendo em termos de pH e das concentraccedilotildees das proteiacutenas de carga i tem-

se que

푑 log 푠푑(푝퐻) = minus

sum (푖 ∙ 푥 )sum 푥

(52 ndash 7)

Contudo o termo do lado direito da equaccedilatildeo (52 ndash 7) estaacute associado ao conceito

de valecircncia meacutedia estabelecido por Linderstroslashm-Lang (1924)

횤 =sum (푖 ∙ 푥 )sum 푥

(52 ndash 8)

Os autores natildeo possuiacuteam um modo mais adequado de construir a curva de

solubilidade dada pela equaccedilatildeo (52 ndash 7) do que aproximar por uma funccedilatildeo linear o

perfil de carga liacutequida da proteiacutena obtido experimentalmente e integraacute-lo valendo-se

da analogia entre o conceito de carga liacutequida (Z) e de valecircncia meacutedia ( i ) Entretanto

hoje jaacute se tem uma descriccedilatildeo analiacutetica do perfil de carga liacutequida de proteiacutenas que

pode ser escrita como

푍(푝퐻) = 휈 훼

(52 ndash 9)

Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (52 ndash 9) e a resultante na equaccedilatildeo

(52 ndash 7) tem-se que

24 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

푑 log 푠푑(푝퐻) = minus

12

11 + 10

1 + 휈 + 휈 1 minus 휈 10

(52 ndash 10)

Integrando a equaccedilatildeo (52 ndash 10) de um ponto de referecircncia por exemplo do ponto

isoeleacutetrico (pI) ateacute um pH qualquer tem-se a seguinte relaccedilatildeo

푑 log 푠

( )

( )

= minus12

1

1 + 101 + 휈 + 휈 1 minus 휈 10 푑(푝퐻)

(52 ndash 11)

log푠 (푝퐻)푠 (푝퐼) = minus

12 1 + 휈

11 + 10

푑(푝퐻)

+ 휈 1 minus 휈10

1 + 10푑(푝퐻)

(52 ndash 12)

Fazendo a seguinte substituiccedilatildeo

푢 = 10 푡푎푙 푞푢푒 푑푢푢 = ln 10푑(푝퐻)

(52 ndash 13)

Tem-se que

log푠 (푝퐻)푠 (푝퐼) = minus

12

1 + 휈ln 10

1푢(1 + 푢) 푑푢 +

휈 1 minus 휈ln 10

1(1 + 푢) 푑푢

(52 ndash 14)

log푠 (푝퐻)푠 (푝퐼) = minus

12

1 + 휈ln 10

1푢 푑푢 minus

11 + 푢 푑푢 +

휈 1 minus 휈ln 10

1(1 + 푢) 푑푢

(52 ndash 15)

25 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐼) = minus

12 1 + 휈 log

1010

minus 휈 1 minus 휈 minus 1 + 휈 log1 + 101 + 10

(52 ndash 16)

Sendo

휈 1 minus 휈 minus 1 + 휈 = 휈 minus 휈 minus 1 minus 휈 = minus 1 + 휈 = minus2

(52 ndash 17)

Resultando em

log푠 (푝퐻)푠 (푝퐼) = log

1 + 101 + 10

minus1 + 휈

2 (푝퐻 minus 푝퐼)

(52 ndash 18)

Ainda eacute possiacutevel reescrever a equaccedilatildeo (52 ndash 18) como

log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log

1 + 101 + 10

(52 ndash 19)

Na qual n+ representa o nuacutemero de resiacuteduos ionizaacuteveis que na sua forma carregada

apresentam carga positiva A equaccedilatildeo (52 ndash 19) eacute uma expressatildeo analiacutetica que a

partir de dados da estrutura proteacuteica e de um dado de solubilidade permite predizer

a curva de solubilidade de uma dada proteiacutena em funccedilatildeo do pH na regiatildeo do ponto

isoeleacutetrico mantendo fixas a temperatura e a forccedila iocircnica do sistema

Eacute possiacutevel provar que as equaccedilotildees (42 ndash 8) e (52 ndash 19) satildeo idecircnticas - a prova

disso eacute descrita na seccedilatildeo 6 ndash e assim tem-se que apesar das distintas abordagens

a descriccedilatildeo do fenocircmeno eacute a mesma Note-se que um passo fundamental no

desenvolvimento da Equaccedilatildeo (52 ndash 5) eacute admitir que por hipoacutetese a atividade da

26 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

forma neutra natildeo depende do pH essa hipoacutetese tambeacutem eacute a base da equaccedilatildeo (41

ndash 7) Deve-se registrar o fato de que pelo melhor do nosso conhecimento esta eacute a

primeira vez que uma expressatildeo analiacutetica para o caacutelculo da solubilidade de

proteiacutenas em funccedilatildeo do pH eacute descrita mesmo no limite em que se considera vaacutelida

a lei de Henry

53 Soluccedilatildeo Paraboacutelica da Curva de Solubilidade

Tanto Groumlnwall (1941) quanto Fredericq e Neurath (1950) adotaram a hipoacutetese de

que os perfis de carga liacutequida da -lactoglobulina para um e da insulina para os

outros dois eram lineares na regiatildeo do ponto isoeleacutetrico Esta hipoacutetese eacute bastante

plausiacutevel e simplificadora principalmente a eacutepoca na qual estes trabalhos foram

desenvolvidos em que a estrutura proteacuteica bem como as constantes de ionizaccedilatildeo

dos resiacuteduos com grupos ionizaacuteveis era pouco conhecida De fato ainda hoje a falta

de dados das constantes de ionizaccedilatildeo na cadeia proteacuteica eacute o maior desafio no uso

do modelo rigoroso ndash equaccedilatildeo (52 ndash 18) Por isso o valor desta hipoacutetese de perfil

de carga liacutequida linear eacute notaacutevel

Supondo entatildeo que o perfil de carga seja linear eacute possiacutevel escrevecirc-lo como

푍(푝퐻) = minus퐴(푝퐻 minus 푝퐼) 푐표푚 퐴 gt 0

(53 ndash 1)

Substituindo (53 ndash 1) em (52 ndash 6)

푑 log 푠 (푝퐻)푑(푝퐻) = 퐴(푝퐻 minus 푝퐼)

(53 ndash 2)

Integrando (53 ndash 2) de um pH0 de referecircncia ateacute pH tem-se que

27 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐻 ) = 퐾[푝퐻 minus 2푝퐼(푝퐻 minus 푝퐻 ) minus 푝퐻 ] 푐표푚 퐾 =

퐴2

(53 ndash 3)

Ao se adotar como ponto de referecircncia o ponto isoeleacutetrico a equaccedilatildeo (53 ndash 3)

reduz-se agrave

log푠 (푝퐻)푠 (푝퐼) = 퐾(푝퐻 minus 푝퐼)

(53 ndash 4)

Contudo apesar da soluccedilatildeo quadraacutetica ou paraboacutelica para a equaccedilatildeo estendida de

Linderstroslashm-lang e Groumlnwall expressa na equaccedilatildeo (53 ndash 3) natildeo requerer os dados

das constantes de ionizaccedilatildeo dos resiacuteduos com grupos ionizaacuteveis ela exige a

definiccedilatildeo do paracircmetro A que fisicamente representa a inclinaccedilatildeo da reta de

aproximaccedilatildeo da curva de carga liacutequida e que pode ser calculado por correlaccedilatildeo a

partir de um conjunto de dados experimentais de solubilidade ou de carga liacutequida

6 Identidade entre o Modelo Proposto e a Equaccedilatildeo

Estendida de Linderstroslashm-Lang e Groumlnwall

A equaccedilatildeo final da modelagem termodinacircmica proposta apresentada na seccedilatildeo 4 eacute a

equaccedilatildeo (42 ndash 8) dada por

푠 (푝퐻)푠 (푝퐼) =

1 + 101 + 10

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 1)

Aplicando-se o logaritmo decimal nos dois termos da equaccedilatildeo (6 ndash 1) tem-se que

log푠 (푝퐻)푠 (푝퐼) = log

1 + 101 + 10

+ log

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 2)

Pelo bem da simplificaccedilatildeo desta deduccedilatildeo adotar-se-atildeo as seguintes funccedilotildees

휂 (푝퐻) = log

(6 ndash 3)

휃 (푝퐻) = log

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 4)

Assim pode-se reescrever a equaccedilatildeo (6 ndash 2) por

29 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐼) = 휂 (푝퐻) + 휃 (푝퐻)

(6 ndash 5)

Observando-se a equaccedilatildeo (6 ndash 5) tem-se que a funccedilatildeo j independe do estado de

ionizaccedilatildeo do resiacuteduo j poreacutem a funccedilatildeo jk depende Por isso deve-se analisar esta

funccedilatildeo para cada estado de ionizaccedilatildeo possiacutevel como mostrado na Tabela 61

Tabela 6 1 ndash Anaacutelise da funccedilatildeo jk para cada estado de ionizaccedilatildeo possiacutevel

j jk jk Quantidade de resiacuteduos neste estado

-1 -1 푝퐼 minus 푝퐻 na

0 0 nb

+1 +1 0 nc

0 푝퐼 minus 푝퐻 nd

Pela anaacutelise da Tabela 61 e considerando uma proteiacutena com n resiacuteduos com

grupos ionizaacuteveis infere-se que a equaccedilatildeo (6 ndash 5) pode ser reescrita como

log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)

(6 ndash 6)

Contudo as equaccedilotildees acima descritas satildeo vaacutelidas apenas para configuraccedilotildees

neutras pois apenas as configuraccedilotildees neutras da fase liacutequida estatildeo em equiliacutebrio

com as moleacuteculas de proteiacutena da fase soacutelida Para que uma configuraccedilatildeo seja

neutra vale a seguinte restriccedilatildeo

휀 = 0 hArr 푛 = 푛

(6 ndash 7)

30 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall

Substituindo a restriccedilatildeo dada pela equaccedilatildeo (6 ndash 7) na equaccedilatildeo (6 ndash 6) tem-se que

log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)

(6 ndash 8)

Ora mas a soma de nc e de nd natildeo resulta em outra coisa senatildeo no nuacutemero de

resiacuteduos com grupos ionizaacuteveis da estrutura proteacuteica cujo j seja +1 Assim

substituindo nc mais nd por n+ e substituindo a equaccedilatildeo (6 ndash 3) na equaccedilatildeo (6 ndash 8)

tem-se que

log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log

1 + 101 + 10

(6 ndash 9)

Ao se analisar a equaccedilatildeo (6 ndash 9) observa-se que ela eacute idecircntica a equaccedilatildeo estendida

de Linderstroslashm-Lang e Groumlnwall apresentada pela equaccedilatildeo (52 ndash 19) Com isso

tem-se que apesar das distintas formulaccedilotildees tanto a modelagem termodinacircmica aqui

proposta quanto a extensatildeo a teoria de Linderstroslashm-Lang e Groumlnwall resultam na

mesma descriccedilatildeo do fenocircmeno Aleacutem disso a equaccedilatildeo final dos modelos eacute

extremamente simples e depende apenas de um ponto de referecircncia e dos dados da

estrutura da moleacutecula de proteiacutena cuja solubilidade se deseja estudar

7 Aplicaccedilatildeo dos Modelos Expostos

Para validar o modelo comparando-o com o caacutelculo feito a partir da teoria de Debye-

Huumlckel o criteacuterio que relaciona os pontos calculados pelo modelo com os pontos

experimentais foi estabelecido a partir da seguinte funccedilatildeo objetivo (FO)

퐹푂 =1푁

푠 minus 푠푠

(7 ndash 1)

Contudo a equaccedilatildeo (7 ndash 1) natildeo eacute a melhor definiccedilatildeo de funccedilatildeo objetivo neste caso

pois a derivada da curva de solubilidade eacute razoavelmente grande nos dois lados do

ponto isoeleacutetrico e isso permite que pequenos desvios na direccedilatildeo horizontal

resultem em um grande aumento no valor da funccedilatildeo objetivo Uma soluccedilatildeo possiacutevel

seria substituir essa funccedilatildeo objetivo por uma funccedilatildeo definida pela soma do quadrado

da distacircncia do ponto experimental agrave curva do modelo principalmente se fosse

necessaacuterio calcular algum paracircmetro do modelo via otimizaccedilatildeo da funccedilatildeo objetivo

estipulada Natildeo sendo este o escopo deste trabalho optou-se pelo uso da FO

definida na equaccedilatildeo (7 ndash 1)

71 Solubilidade da Insulina Suiacutena

As Figuras 711 712 e 713 apresentam os graacuteficos da curva de solubilidade

dada pelos pontos experimentais pelo modelo proposto pela abordagem claacutessica e

tambeacutem a curva obtida pela soluccedilatildeo paraboacutelica da Equaccedilatildeo de Linderstroslashm-Lang e

Groumlnwall em trecircs temperaturas distintas

32 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 711 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 25 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

Figura 712 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 15 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

00

40

80

120

160

200

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

00

50

100

150

200

250

300

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

33 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 713 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 5 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

Os desvios da curva obtida pelo modelo proposto para valores de pH distantes do pI

podem ser explicados por ao menos trecircs importantes motivos dois devidos a

hipoacuteteses do modelo e um devido a fenocircmenos intriacutensecos a proteiacutena Sabendo que

no pI a solubilidade eacute miacutenima para valores de pH distantes do pI pode-se ter

solubilidades suficientemente grandes para que a validade da lei de Henry ndash adotada

na formulaccedilatildeo do modelo - seja questionada pois quanto mais distante do pI maior

a solubilidade e menor a validade da lei de Henry jaacute que haacute um aumento da

concentraccedilatildeo do soluto (proteiacutena) na soluccedilatildeo e tambeacutem ao fato do modelo prever

solubilidade infinita quando a fraccedilatildeo de moleacuteculas eletricamente neutras tende a

zero

limrarr푠 = lim

rarr

Φ(푝퐼)푠 (푝퐼)Φ(푝퐻) = +infin

(711 ndash 1)

00

50

100

150

200

250

300

350

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

34 7 Aplicaccedilatildeo dos Modelos Expostos

Todavia ainda haacute um fator de ordem natural que justifica o desvio apresentado para

valores de pH distantes do pI o desnovelamento da cadeia proteacuteica Este fenocircmeno

pode ocorrer de maneira a expor grupos hidroacutefobos resiacuteduos antes natildeo expostos

acrescentando relaccedilotildees de equiliacutebrio quiacutemico natildeo existentes na regiatildeo do pI

alterando o equiliacutebrio de fases e portanto alterando o valor da solubilidade

A Tabela 711 apresenta os valores obtidos para a funccedilatildeo objetivo definida em (7 ndash

1) tanto para o modelo proposto quanto para a abordagem claacutessica para trecircs

diferentes temperaturas

Tabela 711 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada

abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para insulina

suiacutena

T ordmC Abordagem FO

25 P 01857 C 02535

15 P 01981 C 05056

5 P 03595 C 03064

Observando-se a Tabela 711 vecirc-se que o modelo apresentou melhores resultados

do que o caacutelculo efetuado atraveacutes da abordagem claacutessica no que tange a

minimizaccedilatildeo da funccedilatildeo objetivo exceto para os dados a 5 ordmC

Tambeacutem eacute possiacutevel observar que a funccedilatildeo objetivo sofreu aumento com a

diminuiccedilatildeo da temperatura Isto ocorreu principalmente devido agrave dificuldade de

obter dados experimentais de solubilidade a temperaturas baixas o que aumenta o

desvio experimental fazendo com que se tenha um aumento do valor da funccedilatildeo

objetivo como a definida em (5 ndash 1) Um efeito secundaacuterio que tambeacutem pressiona a

35 7 Aplicaccedilatildeo dos Modelos Expostos

funccedilatildeo objetivo eacute o fato dos dados de pKA terem sido obtidos a uma temperatura

especiacutefica o que tende a acrescentar erro no caacutelculo de solubilidades a temperaturas

diferentes ainda que o pKA natildeo varie de forma ab-rupta com a temperatura

Outra observaccedilatildeo que deve ser registrada eacute o fato da funccedilatildeo objetivo para a

abordagem claacutessica na temperatura de 15 ordmC divergir a um valor tatildeo elevado em

relaccedilatildeo aos demais Isto se deve a um ponto experimental especiacutefico a um pH de

45 a solubilidade da insulina suiacutena obtida experimentalmente eacute 230 x 10-5 mol kg-1

enquanto a calculada pelo modelo proposto eacute 230 x 10-5 mol kg-1 e a calculada pela

abordagem claacutessica eacute 520 x 10-5 mol kg-1 Por conta do desvio deste ponto a funccedilatildeo

objetivo para a abordagem claacutessica nesta temperatura tem um aumento significativo

A Tabela 712 apresenta os valores do paracircmetro K da soluccedilatildeo paraboacutelica obtidos

neste trabalho para a insulina suiacutena comparados ao encontrado na literatura

Tabela 712 ndash Valores do paracircmetro K da soluccedilatildeo paraboacutelica para a insulina suiacutena

Referecircncias T ordmC K Fredericq e Neurath (1950) - 081 Neste trabalho 25 104 Neste trabalho 15 101 Neste trabalho 5 145

Pela Tabela 712 pode-se observar que haacute uma diferenccedila pequena entre os

valores do paracircmetro K obtidos neste trabalho e por Fredericq e Neurath (1950) Por

isso natildeo se pode afirmar a que se deve esta diferenccedila se eacute devido a diferenccedilas entre

procedimentos experimentais ou se eacute devido agrave diferenccedila de meacutetodo de caacutelculo do

paracircmetro Apesar de no experimento realizado por Fredericq e Neurath (1950)

haver a presenccedila do acircnion tiocianato e este acircnion interagir com grupos ionizaacuteveis

da cadeia proteacuteica como observado pelos autores do trabalho tambeacutem estes

36 7 Aplicaccedilatildeo dos Modelos Expostos

proacuteprios autores afirmam que a presenccedila deste acircnion natildeo altera a forma da curva

que eacute basicamente determinada pelo paracircmetro K De qualquer modo eacute interessante

observar a proximidade dos valores encontrados neste trabalho com o obtido por

Fredericq e Neurath (1950) pelo menos no que diz respeito agrave ordem de grandeza do

paracircmetro em questatildeo

72 Solubilidade da Lisozima de clara de ovo de galinha

Um modelo para ser validado necessita correlacionar dados experimentais de modo

satisfatoacuterio ou seja um modelo deve buscar fidelidade ao fenocircmeno fiacutesico

observado Assim na procura de dados de solubilidade de proteiacutenas poucos dados

na regiatildeo do pI foram encontrados Este eacute o caso da lisozima de clara de ovo de

galinha que apesar de ter muitos estudos de solubilidade nenhum deles se

encontra na regiatildeo do pI Surgiu assim a necessidade de se obter estes dados

experimentais para poder validar o modelo proposto A escolha da lisozima de clara

de ovo de galinha se deu em parte pela sua importacircncia mas tambeacutem em parte por

ter os valores de pKA conhecidos

A curva de solubilidade da lisozima de clara de ovo de galinha levantada neste

trabalho estaacute apresentada na Figura 721

37 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em

soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e

dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()

Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento

esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH

isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de

soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se

comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto

isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da

soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos

ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente

neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a

solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e

00

10

20

30

40

50

60

70

80

90

100

95 100 105 110 115 120

Solu

bilid

ade

(mg

mL)

pH

38 7 Aplicaccedilatildeo dos Modelos Expostos

alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado

em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo

Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo

a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo

Por conta de falta de dados a este respeito modelou-se apenas a curva de

solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura

722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de

galinha em funccedilatildeo do pH da soluccedilatildeo

Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)

00

10

20

30

40

50

60

70

80

90

96 99 102 105 108 111 114 117 120

Solu

bilid

ade

(mg

mL)

pH

39 7 Aplicaccedilatildeo dos Modelos Expostos

O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721

Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada

abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima

de clara de ovo de galinha

T ordmC Abordagem FO

25 P 4650 C gt7919a

a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado

Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta

aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a

abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca

de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos

anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao

efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de

clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a

variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A

proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de

cargas pontuais de Debye-Huumlckel

8 Conclusotildees

A modelagem termodinacircmica proposta neste trabalho apresentou expressivos

resultados quando comparada a abordagem claacutessica de Debye-Huumlckel

Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o

modelo aproximou melhor os pontos experimentais do que a referida abordagem

comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima

ao ponto isoeleacutetrico

Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica

para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua

construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo

lugar por sua aplicabilidade

Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis

da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva

em regiotildees distantes do ponto isoeleacutetrico

9 Referecircncias Bibliograacuteficas

BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene

Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects

Biophys J 95 1285-1294 2008

FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and

other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72

2684 - 26911950

GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v

93 p 517-542 1931

GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab

Carlsberg v 24 p 185-200 1941

KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native

and mutant insulins pK perturbation of B13-Glu in aggregated species Arch

Biochem Biophys v 283 p 496-502 1990

KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for

the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng

Chem Res v 35 p 4319-4327 1996

42 9 Referecircncias Bibliograacuteficas

KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen

lysozyme J Biochem v 87 p 1215-1219 1980

LADISCH M R Bioseparations Engineering principles practice and

economics John Wiley amp Sons 2001 pp1 116 ndash 117 133

LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab

Carlsberg v 15 p 1-29 1924

PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da

particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas

2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP

PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the

excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte

solutions Fluid Phase Equilib v 269 p 25ndash35 2008

PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-

contribution model involving phase and chemical equilibrium Ind Eng Chem Res

v 33 p 1341-1347 1994

PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277

1973

PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino

acids Fluid Phase Equilib v 152 p 121-132 1998

43 9 Referecircncias Bibliograacuteficas

PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular

Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999

SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of

equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte

solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009

TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J

R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with

carbon dioxide Biotech Bioeng v103 p 909-919 2009

TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer

free energy Biophys J v 95 p 2601-2609 2008

TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in

water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95

2009

Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na

cadeia proteacuteica

Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo

de ionizaccedilatildeo

퐻퐴 퐴 + 퐻

(A ndash 1)

Assim considerando que a constante de equiliacutebrio

퐾 = 푎

(A ndash 2)

Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que

퐾 =[퐴 ][퐻 ]

[퐻퐴]

(A ndash 3)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que

log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]

(A ndash 4)

Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado

por

minus log[휑] = 푝휑

(A ndash 5)

Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que

45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

푝퐾 = log[퐻퐴][퐴 ] + 푝퐻

(A ndash 6)

Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por

훼 =[퐴 ]

[퐻퐴] + [퐴 ]

(A ndash 7)

Reescrevendo (A ndash 7) tem-se que

훼 =[퐴 ] [퐻퐴frasl ]

1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =

훼1 minus 훼

(A ndash 8)

Substituindo (A ndash 8) em (A ndash 6) tem-se que

푝퐾 = log훼

1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10

(A ndash 9)

Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos

훼 =1

1 + 10

(A ndash 10)

Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio

퐴 + 퐻 퐻퐴

(A ndash 11)

Pode se escrever a constante de equiliacutebrio como

퐾 =[퐻퐴 ]

[퐴][퐻 ]

(A ndash 12)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que

46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

log퐾 = minus log[퐴]

[퐻퐴 ] minus log[퐻 ]

(A -13)

Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por

훼 =[퐻퐴 ]

[퐴] + [퐻퐴 ]

(A ndash 14)

Assim a equaccedilatildeo (A ndash 13) fica

훼1 minus 훼 = 10

(A ndash 15)

Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo

훼 =10

1 + 10

(A ndash 16)

Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos

modelos expostos

Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]

48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]

49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)

50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])

51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]

52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])

53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)

54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2

55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO

8 2 Materiais e Meacutetodos

Tabela 212 ndash Resiacuteduos ionizaacuteveis considerados e valores de pKA a 25 ordmC da lisozima

de clara de ovo de galinha Valores extraiacutedos de Kuramitsu e Hamaguchi (1980)

Aminoaacutecido Grupo Ionizaacutevel pKA α-NH2 α-NH2 79

Lys1 ε-NH2 108

Arg5 Guaniacutedio-NH2 120 Glu7 -COOH 26

Lys13 ε-NH2 105

Arg14 Guaniacutedio-NH2 120 His15 Imidazol-NH 58 Asp18 -COOH 20 Tyr20 Fenol-OH 103

Arg21 Guaniacutedio-NH2 120 Tyr23 Fenol-OH 98

Lys33 ε-NH2 106 Glu35 -COOH 61

Arg45 Guaniacutedio-NH2 120 Asp48 -COOH 43 Asp52 -COOH 34 Tyr53 Fenol-OH 121

Arg61 Guaniacutedio-NH2 120 Asp66 -COOH 16

Arg68 Guaniacutedio-NH2 120

Arg73 Guaniacutedio-NH2 120 Asp87 -COOH 21

Lys96 ε-NH2 108

Lys97 ε-NH2 103 Asp101 -COOH 45

Arg112 Guaniacutedio-NH2 120

Arg114 Guaniacutedio-NH2 120

Lys116 ε-NH2 104 Asp119 -COOH 25

Arg125 Guaniacutedio-NH2 120

Arg128 Guaniacutedio-NH2 120 α-COOH α-COOH 31

9 2 Materiais e Meacutetodos

22 Curva de solubilidade da lisozima da clara de ovo de galinha

221 Reagentes

Neste experimento de determinaccedilatildeo da curva de solubilidade da lisozima da clara de

ovo de galinha os reagentes utilizados foram cloreto de soacutedio (Reatec P A)

bicarbonato de soacutedio (Research Becto Chemical P A) Na2HPO4 7H2O (Reagen

P A) aacutegua destilada deionizada Milli-Q (Millipore) e lisozima de clara de ovo de

galinha (Sigma min 99)

222 Equipamentos

Neste experimento os equipamentos utilizados foram espectrofotocircmetro UV-Visiacutevel

(Beckman DU-530) centriacutefuga (Eppendorf) banho-teacutermico (Laacutectea) com controlador

de temperatura (Julabo) pHmetro (Micronal) e balanccedila (Mettler Toledo AB204S)

223 Preparaccedilatildeo das soluccedilotildees-tampatildeo

Foram preparadas soluccedilotildees-tampatildeo com valores de pH=96 pH = 98 pH = 100

pH = 102 pH = 104 pH = 106 pH = 108 pH = 110 pH = 112 pH = 114 pH =

116 e pH = 118 a partir de quatro soluccedilotildees uma de hidroacutexido de soacutedio 01 M uma

de cloreto de soacutedio 1 M (para equalizar a forccedila iocircnica) uma de bicarbonato de soacutedio

005 M e outra de Na2HPO4 005 M

A Tabela 2231 apresenta os valores de volume usados no preparo de cada uma

das soluccedilotildees-tampatildeo

10 2 Materiais e Meacutetodos

Tabela 2231 ndash Volumes de hidroacutexido de soacutedio a 01 M adicionados no preparo das

soluccedilotildees-tampatildeo

Tampatildeo pH V NaOH mL

NaHCO3 96 100 005 M 98 152

(para cada soluccedilatildeo-tampatildeo 100 mL 100 214

desta soluccedilatildeo foram adicionados) 102 276

104 330 106 382

108 424

110 454

112 530 114 583

Na2HPO4 110 82

005 M 112 126

(para cada soluccedilatildeo-tampatildeo 100 mL 114 182 desta soluccedilatildeo foram adicionados) 116 270

118 388

224 Procedimento experimental

Foram adicionadas quantidades natildeo definidas de lisozima de clara de ovo de galinha

a 13 mL de cada soluccedilatildeo-tampatildeo em tubos Eppendorf de 2 mL Colocaram-se

entatildeo as amostras apoacutes agitaccedilatildeo vigorosa em banho teacutermico a 250 plusmn 01 ordmC por 24

horas para que os sistemas atingissem o equiliacutebrio termodinacircmico Caso natildeo

houvesse a formaccedilatildeo de precipitado lisozima era adicionada e o procedimento

repetido Ao se observar a formaccedilatildeo de precipitado o sistema era centrifugado a

13000 rpm por 15 minutos Uma aliacutequota do sobrenadante era retirada e sua

concentraccedilatildeo proteacuteica determinada por medida de absorbacircncia a 280 nm Cada

sistema foi feito ao menos em duplicata

3 Modelo Estendido de Debye-Huumlckel

31 Introduccedilatildeo

De fato como descrito por Pessocirca Filho (2002) a equaccedilatildeo de Debye-Huumlckel natildeo

deve ser aplicada agrave modelagem de polieletroacutelitos tais como proteiacutenas porque nestas

moleacuteculas as cargas satildeo distribuiacutedas ao longo da cadeia e portanto natildeo satildeo cargas

pontuais como suposto por Debye-Huumlckel

Contudo nesta modelagem considera-se uma regiatildeo de pH em torno do ponto

isoeleacutetrico (pI) na qual satildeo inerentes duas condiccedilotildees favoraacuteveis a aplicaccedilatildeo da

equaccedilatildeo de Debye-Huumlckel carga liacutequida proacutexima a zero pois Z(pI) = 0 e regiatildeo de

miacutenima solubilidade que significa baixas concentraccedilotildees de proteiacutenas em soluccedilatildeo

Isto significa em primeiro lugar que os efeitos da carga tais como ldquodesnovelamentordquo

da cadeia proteacuteica com exposiccedilatildeo de resiacuteduos outrora blindados podem ser

desprezados em uma regiatildeo proacutexima ao ponto isoeleacutetrico e em segundo lugar

baixas concentraccedilotildees de proteiacutena em soluccedilatildeo significam que os termos de curto

alcance podem ser desprezados e portanto haacute prevalecircncia do termo de longo

alcance que no caso de soluccedilotildees eletroliacuteticas pode ser descrito por uma equaccedilatildeo

estendida de Debye-Huumlckel

Assim o modelo de Debye-Huumlckel foi utilizado natildeo para verificar sua aplicabilidade agrave

modelagem de soluccedilotildees proteacuteicas mas sim para confrontar o modelo proposto com

um modelo usual em modelagem de soluccedilotildees eletroliacuteticas e seraacute referido no texto

sempre como abordagem claacutessica

12 3 Modelo Estendido de Debye-Huumlckel

32 Desenvolvimento teoacuterico

Pode-se escrever a atividade da proteiacutena como o produto entre a solubilidade e o

coeficiente de atividade da mesma como mostrado na equaccedilatildeo (32 - 1)

푎 = 훾푠

(32 - 1)

Na qual pode-se calcular o coeficiente de atividade atraveacutes da equaccedilatildeo estendida

de Debye-Huumlckel (Pitzer 1973)

ln 훾 = minus퐴 푍radic퐼

1 + 푏radic퐼+

2푏

ln 1 + 푏radic퐼

(32 - 2)

Sendo que a constante universal empiacuterica b = 12 kg12 mol-12 eacute usada para todos os

eletroacutelitos Jaacute AΦ eacute o paracircmetro de Debye-Huumlckel para o coeficiente osmoacutetico e eacute

dado por

퐴 =13

(2휋푁 휌 ) frasl 푒4휋휀 휀 푘푇

frasl

(32 - 3)

Em que NA eacute a constante de Avogadro ρs eacute a densidade do solvente em g cm-3 e eacute

a carga eletrocircnica (e = 160218 x 10-19 C) ε0 eacute a permissividade do espaccedilo livre (ε0 =

885419 x 10-12 C2 N-1 m-2) εr eacute a constante dieleacutetrica do solvente k aacute constante de

Boltzmann e T eacute a temperatura absoluta Jaacute a carga liacutequida em funccedilatildeo do pH pode

ser calculada como

푍 = 훼 minus 훼

(32 - 4)

Sendo que α+ e α- satildeo dados pelas equaccedilotildees (A - 10) e (A - 16) do Apecircndice A

13 3 Modelo Estendido de Debye-Huumlckel

E a forccedila iocircnica eacute dada pela equaccedilatildeo (32 - 5) descrita abaixo

퐼 = 12

푚 푍

(32 - 5)

Contudo no ponto isoeleacutetrico a carga meacutedia da proteiacutena eacute nula portanto o termo de

Debye-Huumlckel se anula e o coeficiente de atividade se torna unitaacuterio

ln푎 (푝퐼) = ln 푠 (푝퐼)

(32 - 6)

Considerando que a atividade da proteiacutena seja constante com a variaccedilatildeo de pH isto

implica que esta eacute sempre igual agrave solubilidade da proteiacutena no ponto isoeleacutetrico e

portanto vale que

ln푎 (푝퐻) = ln 푠 (푝퐻) + ln 훾(푝퐻) = ln 푠 (푝퐼)

(32 - 7)

Assim

ln 푠 (푝퐻) = ln 푠 (푝퐼) + 퐴휙푍푝퐻2 radic퐼1 + 푏radic퐼

+2푏

ln 1 + 푏radic퐼

(32 - 8)

Esta equaccedilatildeo prevecirc a curva de solubilidade em funccedilatildeo do pH atraveacutes do caacutelculo da

atividade da proteiacutena na fase liacutequida pela equaccedilatildeo estendida de Debye-Huumlckel Para

resolvecirc-la eacute necessaacuterio se utilizar de um meacutetodo numeacuterico pois a forccedila iocircnica

depende da solubilidade naquele pH Optou-se neste trabalho pelo Meacutetodo de

Newton-Raphson para executar o meacutetodo iterativo que eacute exigido pela equaccedilatildeo (32

ndash 8) Para aplicar este meacutetodo arbitrou-se uma funccedilatildeo f(sp) definida aqui como

푓 푠 = minus ln 푠 (푝퐻) + ln 푠 (푝퐼) + 퐴휙푍푝퐻2 radic퐼

1 + 푏radic퐼+

2푏

ln 1 + 푏radic퐼

(32 - 9)

14 3 Modelo Estendido de Debye-Huumlckel

Assim ao calcular o sp que zera esta funccedilatildeo f(sp) saber-se-aacute que eacute a proacutepria

solubilidade que se deseja calcular Para aplicar o Meacutetodo de Newton-Raphson

basta derivar a funccedilatildeo f(sp) e aplicar o seguinte algoritmo de resoluccedilatildeo

푠 = 푠 minus푓(푠 )푓 (푠 )

(32 - 10)

Para calcular frsquo(s) deve-se considerar que a forccedila iocircnica depende da solubilidade

Para isto observando a equaccedilatildeo (32 - 5) vecirc-se que a forccedila iocircnica eacute dada pelo

somatoacuterio das contribuiccedilotildees de todos os iacuteons presentes na soluccedilatildeo por isso aqui

cabe um artifiacutecio de dividir estas contribuiccedilotildees em duas macro-contribuiccedilotildees aquela

devida a todos os iacuteons presentes na soluccedilatildeo exclusive os grupos ionizaacuteveis

presentes nas moleacuteculas da proteiacutena em questatildeo (I0) e que se considera constante

com o pH e aquela que engloba apenas os grupos ionizaacuteveis presentes nas

moleacuteculas da proteiacutena (IP)

퐼 = 퐼 + 퐼 = 퐼 +12푍 푠

(32 - 11)

Considerando a funccedilatildeo w tal que

푤 = radic퐼 = 퐼 +12푍 푠

(32 - 12)

Sendo

푤 =14푍 퐼

(32 - 13)

Entatildeo aplicando-se as devidas regras de derivaccedilatildeo tem-se

15 3 Modelo Estendido de Debye-Huumlckel

푓 (푠 ) = minus1푠 + 퐴 푍

3푤 + 2푤 푏푤(1 + 푏푤)

(32 - 14)

Substituindo as equaccedilotildees (32 - 12) e (32 - 13) na equaccedilatildeo (32 - 14) tem-se que

푓 (푠 ) = minus1푠 + 퐴 푍

15 + 푏radic퐼2radic퐼(1 + 푏radic퐼)

(32 - 15)

Entatildeo o algoritmo deve ser

푠 = 푠 minus

⎜⎛ln 푠 (푝퐼)

푠 + 퐴휙푍푝퐻2 radic퐼

1 + 푏radic퐼+ 2푏 ln 1 + 푏radic퐼

minus 1푠 + 퐴휙푍

15 + 푏radic퐼2radic퐼(1 + 푏radic퐼) ⎠

⎟⎞

(32 - 16)

4 Modelagem Termodinacircmica Proposta

41 Introduccedilatildeo

A condiccedilatildeo de equiliacutebrio entre duas fases (α e β) com m componentes eacute dada por

(Prausnitz et al 1999)

푝 = 푝

(41 ndash 1)

푇 = 푇

(41 ndash 2)

휇 = 휇⋮

휇 = 휇

(41 ndash 3)

Considerando o equiliacutebrio soacutelido-liacutequido (ESL) de sistemas contendo proteiacutenas

sendo que os efeitos da pressatildeo podem ser desprezados que as temperaturas nas

duas fases satildeo iguais e que na fase soacutelida soacute haacute proteiacutena tem-se que para a

proteiacutena a relaccedilatildeo de equiliacutebrio pode ser descrita por

휇 (푇푥) = 휇 (푇)

(41 ndash 4)

Contudo adotando-se a lei de Henry que eacute vaacutelida para baixas concentraccedilotildees de

soluto hipoacutetese que natildeo eacute distante dos valores observados da solubilidade de

proteiacutenas pode se escrever o potencial quiacutemico na fase liacutequida por

휇 (푇푥) = 휇 (푇 푥 ) + 푅푇푙푛푥

(41 ndash 5)

17 4 Modelagem Termodinacircmica Proposta

Entretanto variaccedilotildees de pH natildeo alteram o potencial quiacutemico da fase soacutelida o que

resulta pela relaccedilatildeo (41 ndash 4) que o mesmo natildeo altera tambeacutem o potencial quiacutemico

da fase liacutequida Com isso pela relaccedilatildeo (41 ndash 5) sendo o potencial quiacutemico de

referecircncia constante com o pH uma contradiccedilatildeo emerge a variaccedilatildeo do pH natildeo

poderia alterar o valor da solubilidade poreacutem a observaccedilatildeo experimental mostra o

contraacuterio Assim deve-se lembrar que pelo princiacutepio da eletroneutralidade a fase

soacutelida soacute possui moleacuteculas proteacuteicas eletricamente neutras e portanto o equiliacutebrio

de fases deve se estabelecer apenas entre as moleacuteculas presentes na fase soacutelida e

as moleacuteculas eletricamente neutras em soluccedilatildeo Ou seja como soacute moleacuteculas

eletricamente neutras podem estar na fase soacutelida o equiliacutebrio de fases depende

exclusivamente da fraccedilatildeo de moleacuteculas eletricamente neutras em soluccedilatildeo pois soacute

estas podem precipitar Assim tanto a equaccedilatildeo (41 ndash 4) quanto a equaccedilatildeo (41 ndash

5) devem ser aplicadas natildeo ao conjunto de todas as moleacuteculas de proteiacutena em

soluccedilatildeo mas somente as moleacuteculas proteacuteicas eletricamente neutras Portanto a

concentraccedilatildeo das moleacuteculas de proteiacutena eletricamente neutras em soluccedilatildeo eacute

constante com o pH e pode ser interpretada como a multiplicaccedilatildeo da fraccedilatildeo de

moleacuteculas eletricamente neutras pela concentraccedilatildeo total de proteiacutenas que eacute a

proacutepria solubilidade Assim uma relaccedilatildeo de inversa proporcionalidade eacute definida

quanto maior a fraccedilatildeo de moleacuteculas neutras menor seraacute a solubilidade de uma

proteiacutena em soluccedilatildeo Portanto no ponto isoeleacutetrico no qual haacute o miacutenimo de

solubilidade tem-se o ponto maacuteximo de fraccedilatildeo de moleacuteculas eletricamente neutras

A partir disto eacute possiacutevel escrever a equaccedilatildeo que rege o comportamento da

solubilidade de uma proteiacutena em funccedilatildeo do pH da soluccedilatildeo

휙(푝퐻)푆 (푝퐻) = 휆 = 푐표푛푠푡푎푛푡푒

(41 ndash 6)

18 4 Modelagem Termodinacircmica Proposta

Na equaccedilatildeo (41 ndash 6) o paracircmetro λ pode ser um paracircmetro de ajuste do modelo a

um conjunto de valores experimentais tendo se estabelecido uma funccedilatildeo objetivo ou

ainda dado pelo produto entre a solubilidade no ponto isoeleacutetrico e a fraccedilatildeo de

moleacuteculas eletricamente neutras em soluccedilatildeo tambeacutem no pI neste caso vale a

seguinte equaccedilatildeo

푠 (푝퐻) =휙(푝퐼)푠 (푝퐼)휙(푝퐻)

(41 ndash 7)

Sendo a equaccedilatildeo do modelo ndash equaccedilatildeo (41 ndash 7) ndash extremamente simples a uacutenica

dificuldade reside no caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras

(휙(푝퐻))

42 Caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras

Dentre os aminoaacutecidos que formam atraveacutes de ligaccedilotildees peptiacutedicas as proteiacutenas haacute

aqueles que possuem resiacuteduos com grupos ionizaacuteveis aleacutem dos grupos amina e

aacutecido carboxiacutelico terminais na cadeia Todos estes participam de equiliacutebrios

quiacutemicos com iacuteons H+ presentes na soluccedilatildeo entatildeo ao se alterar o pH da soluccedilatildeo

estes equiliacutebrios satildeo alterados

Assim haacute vaacuterias possibilidades de combinaccedilotildees de estados ionizados destes grupos

ionizaacuteveis que resultam em uma moleacutecula de proteiacutena eletricamente neutra Eacute

importante notar que dada a fraccedilatildeo de uma configuraccedilatildeo de uma moleacutecula neutra

todas as outras fraccedilotildees de configuraccedilotildees possiacuteveis que tambeacutem resultem em

moleacuteculas neutras satildeo proporcionais agrave fraccedilatildeo da configuraccedilatildeo dada pois todas as

configuraccedilotildees participam de equiliacutebrios entre si

19 4 Modelagem Termodinacircmica Proposta

Desta observaccedilatildeo implica-se que basta identificar uma configuraccedilatildeo proteacuteica cuja

soma dos estados ionizados resulte em carga nula para se descrever o equiliacutebrio de

fases em relaccedilatildeo ao pH na regiatildeo do ponto isoeleacutetrico onde esta consideraccedilatildeo eacute

predominante em relaccedilatildeo a outros possiacuteveis fenocircmenos

Contudo eacute necessaacuterio contabilizar a contribuiccedilatildeo de cada grupo ionizaacutevel via

equaccedilatildeo de Henderson-Hasselbach equaccedilatildeo (42 ndash 1)

훼 (푝퐻) =

⎩⎪⎨

⎪⎧ 10

1 + 10 푠푒 휈 = minus1

11 + 10

푠푒 휈 = +1

(42 ndash 1)

Na qual pKAj eacute o co-logaritmo da constante de equiliacutebrio do grupo ionizaacutevel do

resiacuteduo j j eacute estado carregado potencial do resiacuteduo j (-1 para grupos aacutecidos e +1

para grupos baacutesicos) e j eacute a fraccedilatildeo ionizada para o pH dado Para grupos cujo

estado de ionizaccedilatildeo na dada configuraccedilatildeo seja neutro a sua fraccedilatildeo eacute calculada tal

que a soma de sua fraccedilatildeo e da fraccedilatildeo ionizada tenha como resultado o valor

unitaacuterio

Assim a funccedilatildeo Pn pode ser escrita como o produto de cada fraccedilatildeo de cada grupo

ionizaacutevel j naquele estado (-1 0 ou +1) na configuraccedilatildeo neutra k em uma proteiacutena

com n grupos ionizaacuteveis Uma representaccedilatildeo matemaacutetica possiacutevel para esta funccedilatildeo

pode ser escrita como

휙 (푝퐻) = 훼 (푝퐻)

(42 ndash 2)

Na qual a fraccedilatildeo jrsquo(pH) eacute dada por

20 4 Modelagem Termodinacircmica Proposta

훼 (푝퐻) =훼 (푝퐻) 푠푒 휀 = 11 minus 훼 (푝퐻) 푠푒 휀 = 0

(42 ndash 3)

Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (42 ndash 3) e a resultante na equaccedilatildeo

(42 ndash 2) pode-se escrever que

휙 (푝퐻) =1

1 + 10

1 + 휈2 minus 휈 휀 10

minus휈 minus 1

2 minus 휈 휀 푐표푚 휀 = 0

(42 ndash 4)

A equaccedilatildeo (42 ndash 4) junto agrave equaccedilatildeo (41 ndash 7) constituem o modelo termodinacircmico

capaz de predizer a razatildeo entre as fraccedilotildees de moleacuteculas neutras de uma proteiacutena

em funccedilatildeo do pH na regiatildeo do ponto isoeleacutetrico mantendo fixas temperatura e forccedila

iocircnica Substituindo a equaccedilatildeo (42 ndash 4) na equaccedilatildeo (41 ndash 7) obteacutem-se para a

curva de solubilidade

푠 (푝퐻)푠 (푝퐼) =

1 + 101 + 10

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

푐표푚 휀 = 0

(42 ndash 8)

5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

51 Introduccedilatildeo

Segundo Groumlnwall (1941) na fase liacutequida haacute moleacuteculas de proteiacutenas com muitas

configuraccedilotildees k distintas que possuem carga liacutequida i e tambeacutem haacute certas

configuraccedilotildees que tem carga liacutequida nula e satildeo chamadas configuraccedilotildees neutras

Aleacutem disso estas uacuteltimas satildeo aquelas que determinam o equiliacutebrio de fases jaacute que

elas estatildeo em equiliacutebrio com a fase soacutelida na qual soacute haacute moleacuteculas neutras pelo

princiacutepio da eletroneutralidade Eacute tambeacutem afirmado que dado este equiliacutebrio a

atividade das moleacuteculas neutras natildeo se altera com a variaccedilatildeo do pH e eacute

proporcional agraves atividades de qualquer tipo de configuraccedilatildeo neutra

Neste mesmo trabalho eacute atribuiacuteda a Linderstroslashm-Lang o desenvolvimento de uma

teoria de prediccedilatildeo da solubilidade de proteiacutenas com a variaccedilatildeo do pH na regiatildeo do

ponto isoeleacutetrico Este desenvolvimento apresenta um balanccedilo de cargas de um

modo impliacutecito contudo como atestado por Groumlnwall o escasso conhecimento

sobre as estruturas proteacuteicas impediram agravequele tempo uma formulaccedilatildeo mais

pormenorizada do problema

52 Desenvolvimento teoacuterico

A base desta abordagem descrita por Groumlnwall e atribuiacuteda a Linderstroslashm-Lang

reside na hipoacutetese de que a moleacutecula de proteiacutena de configuraccedilatildeo k e carga nula

participa do seguinte equiliacutebrio com os iacuteons H+ e com sua forma de carga i

22 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

푃 + 푖퐻 푃 lowast

(52 ndash 1)

Note-se que o valor de i pode ser negativo A constante do equiliacutebrio quiacutemico

descrita pela equaccedilatildeo (52 ndash 1) pode ser expressa como

퐾 =푎

lowast

푎 푎

(52 ndash 2)

Sabendo que a atividade da moleacutecula de proteiacutena de configuraccedilatildeo k e carga i eacute dada

pelo produto entre sua concentraccedilatildeo e seu coeficiente de atividade tem-se que

푥lowast

= 푎 푎퐾훾

lowast

(52 ndash 3)

Entretanto a solubilidade da proteiacutena eacute soma das concentraccedilotildees de todas as

moleacuteculas de carga i Poreacutem a concentraccedilatildeo das moleacuteculas de carga i eacute a soma das

concentraccedilotildees das moleacuteculas de configuraccedilatildeo k Assim a solubilidade pode ser

escrita como

푠 (푝퐻) = 푎 푎퐾훾

lowast

(52 ndash 4)

Derivando a equaccedilatildeo (52 ndash 4) com respeito agrave atividade do iacuteon H+ considerando

que atividade da moleacutecula neutra eacute constante para qualquer configuraccedilatildeo k e ainda

que o coeficiente de atividade da proteiacutena de carga i independe da atividade do iacuteon

H+ tem-se que

푑푠푑푎 = 푖 ∙ 푎 푎

퐾훾

lowast

(52 ndash 5)

23 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

Sendo

푑 log 푠 (푝퐻)푑(푝퐻) = minus

푎푠 (푝퐻)

푑푠푑푎

(52 ndash 6)

Substituindo as equaccedilotildees (52 ndash 4) e (52 ndash 5) na equaccedilatildeo (52 ndash 6) e

reescrevendo em termos de pH e das concentraccedilotildees das proteiacutenas de carga i tem-

se que

푑 log 푠푑(푝퐻) = minus

sum (푖 ∙ 푥 )sum 푥

(52 ndash 7)

Contudo o termo do lado direito da equaccedilatildeo (52 ndash 7) estaacute associado ao conceito

de valecircncia meacutedia estabelecido por Linderstroslashm-Lang (1924)

횤 =sum (푖 ∙ 푥 )sum 푥

(52 ndash 8)

Os autores natildeo possuiacuteam um modo mais adequado de construir a curva de

solubilidade dada pela equaccedilatildeo (52 ndash 7) do que aproximar por uma funccedilatildeo linear o

perfil de carga liacutequida da proteiacutena obtido experimentalmente e integraacute-lo valendo-se

da analogia entre o conceito de carga liacutequida (Z) e de valecircncia meacutedia ( i ) Entretanto

hoje jaacute se tem uma descriccedilatildeo analiacutetica do perfil de carga liacutequida de proteiacutenas que

pode ser escrita como

푍(푝퐻) = 휈 훼

(52 ndash 9)

Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (52 ndash 9) e a resultante na equaccedilatildeo

(52 ndash 7) tem-se que

24 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

푑 log 푠푑(푝퐻) = minus

12

11 + 10

1 + 휈 + 휈 1 minus 휈 10

(52 ndash 10)

Integrando a equaccedilatildeo (52 ndash 10) de um ponto de referecircncia por exemplo do ponto

isoeleacutetrico (pI) ateacute um pH qualquer tem-se a seguinte relaccedilatildeo

푑 log 푠

( )

( )

= minus12

1

1 + 101 + 휈 + 휈 1 minus 휈 10 푑(푝퐻)

(52 ndash 11)

log푠 (푝퐻)푠 (푝퐼) = minus

12 1 + 휈

11 + 10

푑(푝퐻)

+ 휈 1 minus 휈10

1 + 10푑(푝퐻)

(52 ndash 12)

Fazendo a seguinte substituiccedilatildeo

푢 = 10 푡푎푙 푞푢푒 푑푢푢 = ln 10푑(푝퐻)

(52 ndash 13)

Tem-se que

log푠 (푝퐻)푠 (푝퐼) = minus

12

1 + 휈ln 10

1푢(1 + 푢) 푑푢 +

휈 1 minus 휈ln 10

1(1 + 푢) 푑푢

(52 ndash 14)

log푠 (푝퐻)푠 (푝퐼) = minus

12

1 + 휈ln 10

1푢 푑푢 minus

11 + 푢 푑푢 +

휈 1 minus 휈ln 10

1(1 + 푢) 푑푢

(52 ndash 15)

25 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐼) = minus

12 1 + 휈 log

1010

minus 휈 1 minus 휈 minus 1 + 휈 log1 + 101 + 10

(52 ndash 16)

Sendo

휈 1 minus 휈 minus 1 + 휈 = 휈 minus 휈 minus 1 minus 휈 = minus 1 + 휈 = minus2

(52 ndash 17)

Resultando em

log푠 (푝퐻)푠 (푝퐼) = log

1 + 101 + 10

minus1 + 휈

2 (푝퐻 minus 푝퐼)

(52 ndash 18)

Ainda eacute possiacutevel reescrever a equaccedilatildeo (52 ndash 18) como

log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log

1 + 101 + 10

(52 ndash 19)

Na qual n+ representa o nuacutemero de resiacuteduos ionizaacuteveis que na sua forma carregada

apresentam carga positiva A equaccedilatildeo (52 ndash 19) eacute uma expressatildeo analiacutetica que a

partir de dados da estrutura proteacuteica e de um dado de solubilidade permite predizer

a curva de solubilidade de uma dada proteiacutena em funccedilatildeo do pH na regiatildeo do ponto

isoeleacutetrico mantendo fixas a temperatura e a forccedila iocircnica do sistema

Eacute possiacutevel provar que as equaccedilotildees (42 ndash 8) e (52 ndash 19) satildeo idecircnticas - a prova

disso eacute descrita na seccedilatildeo 6 ndash e assim tem-se que apesar das distintas abordagens

a descriccedilatildeo do fenocircmeno eacute a mesma Note-se que um passo fundamental no

desenvolvimento da Equaccedilatildeo (52 ndash 5) eacute admitir que por hipoacutetese a atividade da

26 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

forma neutra natildeo depende do pH essa hipoacutetese tambeacutem eacute a base da equaccedilatildeo (41

ndash 7) Deve-se registrar o fato de que pelo melhor do nosso conhecimento esta eacute a

primeira vez que uma expressatildeo analiacutetica para o caacutelculo da solubilidade de

proteiacutenas em funccedilatildeo do pH eacute descrita mesmo no limite em que se considera vaacutelida

a lei de Henry

53 Soluccedilatildeo Paraboacutelica da Curva de Solubilidade

Tanto Groumlnwall (1941) quanto Fredericq e Neurath (1950) adotaram a hipoacutetese de

que os perfis de carga liacutequida da -lactoglobulina para um e da insulina para os

outros dois eram lineares na regiatildeo do ponto isoeleacutetrico Esta hipoacutetese eacute bastante

plausiacutevel e simplificadora principalmente a eacutepoca na qual estes trabalhos foram

desenvolvidos em que a estrutura proteacuteica bem como as constantes de ionizaccedilatildeo

dos resiacuteduos com grupos ionizaacuteveis era pouco conhecida De fato ainda hoje a falta

de dados das constantes de ionizaccedilatildeo na cadeia proteacuteica eacute o maior desafio no uso

do modelo rigoroso ndash equaccedilatildeo (52 ndash 18) Por isso o valor desta hipoacutetese de perfil

de carga liacutequida linear eacute notaacutevel

Supondo entatildeo que o perfil de carga seja linear eacute possiacutevel escrevecirc-lo como

푍(푝퐻) = minus퐴(푝퐻 minus 푝퐼) 푐표푚 퐴 gt 0

(53 ndash 1)

Substituindo (53 ndash 1) em (52 ndash 6)

푑 log 푠 (푝퐻)푑(푝퐻) = 퐴(푝퐻 minus 푝퐼)

(53 ndash 2)

Integrando (53 ndash 2) de um pH0 de referecircncia ateacute pH tem-se que

27 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐻 ) = 퐾[푝퐻 minus 2푝퐼(푝퐻 minus 푝퐻 ) minus 푝퐻 ] 푐표푚 퐾 =

퐴2

(53 ndash 3)

Ao se adotar como ponto de referecircncia o ponto isoeleacutetrico a equaccedilatildeo (53 ndash 3)

reduz-se agrave

log푠 (푝퐻)푠 (푝퐼) = 퐾(푝퐻 minus 푝퐼)

(53 ndash 4)

Contudo apesar da soluccedilatildeo quadraacutetica ou paraboacutelica para a equaccedilatildeo estendida de

Linderstroslashm-lang e Groumlnwall expressa na equaccedilatildeo (53 ndash 3) natildeo requerer os dados

das constantes de ionizaccedilatildeo dos resiacuteduos com grupos ionizaacuteveis ela exige a

definiccedilatildeo do paracircmetro A que fisicamente representa a inclinaccedilatildeo da reta de

aproximaccedilatildeo da curva de carga liacutequida e que pode ser calculado por correlaccedilatildeo a

partir de um conjunto de dados experimentais de solubilidade ou de carga liacutequida

6 Identidade entre o Modelo Proposto e a Equaccedilatildeo

Estendida de Linderstroslashm-Lang e Groumlnwall

A equaccedilatildeo final da modelagem termodinacircmica proposta apresentada na seccedilatildeo 4 eacute a

equaccedilatildeo (42 ndash 8) dada por

푠 (푝퐻)푠 (푝퐼) =

1 + 101 + 10

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 1)

Aplicando-se o logaritmo decimal nos dois termos da equaccedilatildeo (6 ndash 1) tem-se que

log푠 (푝퐻)푠 (푝퐼) = log

1 + 101 + 10

+ log

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 2)

Pelo bem da simplificaccedilatildeo desta deduccedilatildeo adotar-se-atildeo as seguintes funccedilotildees

휂 (푝퐻) = log

(6 ndash 3)

휃 (푝퐻) = log

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 4)

Assim pode-se reescrever a equaccedilatildeo (6 ndash 2) por

29 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐼) = 휂 (푝퐻) + 휃 (푝퐻)

(6 ndash 5)

Observando-se a equaccedilatildeo (6 ndash 5) tem-se que a funccedilatildeo j independe do estado de

ionizaccedilatildeo do resiacuteduo j poreacutem a funccedilatildeo jk depende Por isso deve-se analisar esta

funccedilatildeo para cada estado de ionizaccedilatildeo possiacutevel como mostrado na Tabela 61

Tabela 6 1 ndash Anaacutelise da funccedilatildeo jk para cada estado de ionizaccedilatildeo possiacutevel

j jk jk Quantidade de resiacuteduos neste estado

-1 -1 푝퐼 minus 푝퐻 na

0 0 nb

+1 +1 0 nc

0 푝퐼 minus 푝퐻 nd

Pela anaacutelise da Tabela 61 e considerando uma proteiacutena com n resiacuteduos com

grupos ionizaacuteveis infere-se que a equaccedilatildeo (6 ndash 5) pode ser reescrita como

log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)

(6 ndash 6)

Contudo as equaccedilotildees acima descritas satildeo vaacutelidas apenas para configuraccedilotildees

neutras pois apenas as configuraccedilotildees neutras da fase liacutequida estatildeo em equiliacutebrio

com as moleacuteculas de proteiacutena da fase soacutelida Para que uma configuraccedilatildeo seja

neutra vale a seguinte restriccedilatildeo

휀 = 0 hArr 푛 = 푛

(6 ndash 7)

30 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall

Substituindo a restriccedilatildeo dada pela equaccedilatildeo (6 ndash 7) na equaccedilatildeo (6 ndash 6) tem-se que

log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)

(6 ndash 8)

Ora mas a soma de nc e de nd natildeo resulta em outra coisa senatildeo no nuacutemero de

resiacuteduos com grupos ionizaacuteveis da estrutura proteacuteica cujo j seja +1 Assim

substituindo nc mais nd por n+ e substituindo a equaccedilatildeo (6 ndash 3) na equaccedilatildeo (6 ndash 8)

tem-se que

log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log

1 + 101 + 10

(6 ndash 9)

Ao se analisar a equaccedilatildeo (6 ndash 9) observa-se que ela eacute idecircntica a equaccedilatildeo estendida

de Linderstroslashm-Lang e Groumlnwall apresentada pela equaccedilatildeo (52 ndash 19) Com isso

tem-se que apesar das distintas formulaccedilotildees tanto a modelagem termodinacircmica aqui

proposta quanto a extensatildeo a teoria de Linderstroslashm-Lang e Groumlnwall resultam na

mesma descriccedilatildeo do fenocircmeno Aleacutem disso a equaccedilatildeo final dos modelos eacute

extremamente simples e depende apenas de um ponto de referecircncia e dos dados da

estrutura da moleacutecula de proteiacutena cuja solubilidade se deseja estudar

7 Aplicaccedilatildeo dos Modelos Expostos

Para validar o modelo comparando-o com o caacutelculo feito a partir da teoria de Debye-

Huumlckel o criteacuterio que relaciona os pontos calculados pelo modelo com os pontos

experimentais foi estabelecido a partir da seguinte funccedilatildeo objetivo (FO)

퐹푂 =1푁

푠 minus 푠푠

(7 ndash 1)

Contudo a equaccedilatildeo (7 ndash 1) natildeo eacute a melhor definiccedilatildeo de funccedilatildeo objetivo neste caso

pois a derivada da curva de solubilidade eacute razoavelmente grande nos dois lados do

ponto isoeleacutetrico e isso permite que pequenos desvios na direccedilatildeo horizontal

resultem em um grande aumento no valor da funccedilatildeo objetivo Uma soluccedilatildeo possiacutevel

seria substituir essa funccedilatildeo objetivo por uma funccedilatildeo definida pela soma do quadrado

da distacircncia do ponto experimental agrave curva do modelo principalmente se fosse

necessaacuterio calcular algum paracircmetro do modelo via otimizaccedilatildeo da funccedilatildeo objetivo

estipulada Natildeo sendo este o escopo deste trabalho optou-se pelo uso da FO

definida na equaccedilatildeo (7 ndash 1)

71 Solubilidade da Insulina Suiacutena

As Figuras 711 712 e 713 apresentam os graacuteficos da curva de solubilidade

dada pelos pontos experimentais pelo modelo proposto pela abordagem claacutessica e

tambeacutem a curva obtida pela soluccedilatildeo paraboacutelica da Equaccedilatildeo de Linderstroslashm-Lang e

Groumlnwall em trecircs temperaturas distintas

32 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 711 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 25 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

Figura 712 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 15 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

00

40

80

120

160

200

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

00

50

100

150

200

250

300

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

33 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 713 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 5 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

Os desvios da curva obtida pelo modelo proposto para valores de pH distantes do pI

podem ser explicados por ao menos trecircs importantes motivos dois devidos a

hipoacuteteses do modelo e um devido a fenocircmenos intriacutensecos a proteiacutena Sabendo que

no pI a solubilidade eacute miacutenima para valores de pH distantes do pI pode-se ter

solubilidades suficientemente grandes para que a validade da lei de Henry ndash adotada

na formulaccedilatildeo do modelo - seja questionada pois quanto mais distante do pI maior

a solubilidade e menor a validade da lei de Henry jaacute que haacute um aumento da

concentraccedilatildeo do soluto (proteiacutena) na soluccedilatildeo e tambeacutem ao fato do modelo prever

solubilidade infinita quando a fraccedilatildeo de moleacuteculas eletricamente neutras tende a

zero

limrarr푠 = lim

rarr

Φ(푝퐼)푠 (푝퐼)Φ(푝퐻) = +infin

(711 ndash 1)

00

50

100

150

200

250

300

350

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

34 7 Aplicaccedilatildeo dos Modelos Expostos

Todavia ainda haacute um fator de ordem natural que justifica o desvio apresentado para

valores de pH distantes do pI o desnovelamento da cadeia proteacuteica Este fenocircmeno

pode ocorrer de maneira a expor grupos hidroacutefobos resiacuteduos antes natildeo expostos

acrescentando relaccedilotildees de equiliacutebrio quiacutemico natildeo existentes na regiatildeo do pI

alterando o equiliacutebrio de fases e portanto alterando o valor da solubilidade

A Tabela 711 apresenta os valores obtidos para a funccedilatildeo objetivo definida em (7 ndash

1) tanto para o modelo proposto quanto para a abordagem claacutessica para trecircs

diferentes temperaturas

Tabela 711 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada

abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para insulina

suiacutena

T ordmC Abordagem FO

25 P 01857 C 02535

15 P 01981 C 05056

5 P 03595 C 03064

Observando-se a Tabela 711 vecirc-se que o modelo apresentou melhores resultados

do que o caacutelculo efetuado atraveacutes da abordagem claacutessica no que tange a

minimizaccedilatildeo da funccedilatildeo objetivo exceto para os dados a 5 ordmC

Tambeacutem eacute possiacutevel observar que a funccedilatildeo objetivo sofreu aumento com a

diminuiccedilatildeo da temperatura Isto ocorreu principalmente devido agrave dificuldade de

obter dados experimentais de solubilidade a temperaturas baixas o que aumenta o

desvio experimental fazendo com que se tenha um aumento do valor da funccedilatildeo

objetivo como a definida em (5 ndash 1) Um efeito secundaacuterio que tambeacutem pressiona a

35 7 Aplicaccedilatildeo dos Modelos Expostos

funccedilatildeo objetivo eacute o fato dos dados de pKA terem sido obtidos a uma temperatura

especiacutefica o que tende a acrescentar erro no caacutelculo de solubilidades a temperaturas

diferentes ainda que o pKA natildeo varie de forma ab-rupta com a temperatura

Outra observaccedilatildeo que deve ser registrada eacute o fato da funccedilatildeo objetivo para a

abordagem claacutessica na temperatura de 15 ordmC divergir a um valor tatildeo elevado em

relaccedilatildeo aos demais Isto se deve a um ponto experimental especiacutefico a um pH de

45 a solubilidade da insulina suiacutena obtida experimentalmente eacute 230 x 10-5 mol kg-1

enquanto a calculada pelo modelo proposto eacute 230 x 10-5 mol kg-1 e a calculada pela

abordagem claacutessica eacute 520 x 10-5 mol kg-1 Por conta do desvio deste ponto a funccedilatildeo

objetivo para a abordagem claacutessica nesta temperatura tem um aumento significativo

A Tabela 712 apresenta os valores do paracircmetro K da soluccedilatildeo paraboacutelica obtidos

neste trabalho para a insulina suiacutena comparados ao encontrado na literatura

Tabela 712 ndash Valores do paracircmetro K da soluccedilatildeo paraboacutelica para a insulina suiacutena

Referecircncias T ordmC K Fredericq e Neurath (1950) - 081 Neste trabalho 25 104 Neste trabalho 15 101 Neste trabalho 5 145

Pela Tabela 712 pode-se observar que haacute uma diferenccedila pequena entre os

valores do paracircmetro K obtidos neste trabalho e por Fredericq e Neurath (1950) Por

isso natildeo se pode afirmar a que se deve esta diferenccedila se eacute devido a diferenccedilas entre

procedimentos experimentais ou se eacute devido agrave diferenccedila de meacutetodo de caacutelculo do

paracircmetro Apesar de no experimento realizado por Fredericq e Neurath (1950)

haver a presenccedila do acircnion tiocianato e este acircnion interagir com grupos ionizaacuteveis

da cadeia proteacuteica como observado pelos autores do trabalho tambeacutem estes

36 7 Aplicaccedilatildeo dos Modelos Expostos

proacuteprios autores afirmam que a presenccedila deste acircnion natildeo altera a forma da curva

que eacute basicamente determinada pelo paracircmetro K De qualquer modo eacute interessante

observar a proximidade dos valores encontrados neste trabalho com o obtido por

Fredericq e Neurath (1950) pelo menos no que diz respeito agrave ordem de grandeza do

paracircmetro em questatildeo

72 Solubilidade da Lisozima de clara de ovo de galinha

Um modelo para ser validado necessita correlacionar dados experimentais de modo

satisfatoacuterio ou seja um modelo deve buscar fidelidade ao fenocircmeno fiacutesico

observado Assim na procura de dados de solubilidade de proteiacutenas poucos dados

na regiatildeo do pI foram encontrados Este eacute o caso da lisozima de clara de ovo de

galinha que apesar de ter muitos estudos de solubilidade nenhum deles se

encontra na regiatildeo do pI Surgiu assim a necessidade de se obter estes dados

experimentais para poder validar o modelo proposto A escolha da lisozima de clara

de ovo de galinha se deu em parte pela sua importacircncia mas tambeacutem em parte por

ter os valores de pKA conhecidos

A curva de solubilidade da lisozima de clara de ovo de galinha levantada neste

trabalho estaacute apresentada na Figura 721

37 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em

soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e

dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()

Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento

esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH

isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de

soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se

comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto

isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da

soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos

ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente

neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a

solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e

00

10

20

30

40

50

60

70

80

90

100

95 100 105 110 115 120

Solu

bilid

ade

(mg

mL)

pH

38 7 Aplicaccedilatildeo dos Modelos Expostos

alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado

em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo

Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo

a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo

Por conta de falta de dados a este respeito modelou-se apenas a curva de

solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura

722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de

galinha em funccedilatildeo do pH da soluccedilatildeo

Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)

00

10

20

30

40

50

60

70

80

90

96 99 102 105 108 111 114 117 120

Solu

bilid

ade

(mg

mL)

pH

39 7 Aplicaccedilatildeo dos Modelos Expostos

O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721

Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada

abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima

de clara de ovo de galinha

T ordmC Abordagem FO

25 P 4650 C gt7919a

a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado

Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta

aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a

abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca

de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos

anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao

efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de

clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a

variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A

proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de

cargas pontuais de Debye-Huumlckel

8 Conclusotildees

A modelagem termodinacircmica proposta neste trabalho apresentou expressivos

resultados quando comparada a abordagem claacutessica de Debye-Huumlckel

Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o

modelo aproximou melhor os pontos experimentais do que a referida abordagem

comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima

ao ponto isoeleacutetrico

Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica

para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua

construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo

lugar por sua aplicabilidade

Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis

da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva

em regiotildees distantes do ponto isoeleacutetrico

9 Referecircncias Bibliograacuteficas

BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene

Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects

Biophys J 95 1285-1294 2008

FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and

other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72

2684 - 26911950

GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v

93 p 517-542 1931

GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab

Carlsberg v 24 p 185-200 1941

KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native

and mutant insulins pK perturbation of B13-Glu in aggregated species Arch

Biochem Biophys v 283 p 496-502 1990

KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for

the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng

Chem Res v 35 p 4319-4327 1996

42 9 Referecircncias Bibliograacuteficas

KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen

lysozyme J Biochem v 87 p 1215-1219 1980

LADISCH M R Bioseparations Engineering principles practice and

economics John Wiley amp Sons 2001 pp1 116 ndash 117 133

LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab

Carlsberg v 15 p 1-29 1924

PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da

particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas

2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP

PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the

excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte

solutions Fluid Phase Equilib v 269 p 25ndash35 2008

PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-

contribution model involving phase and chemical equilibrium Ind Eng Chem Res

v 33 p 1341-1347 1994

PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277

1973

PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino

acids Fluid Phase Equilib v 152 p 121-132 1998

43 9 Referecircncias Bibliograacuteficas

PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular

Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999

SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of

equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte

solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009

TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J

R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with

carbon dioxide Biotech Bioeng v103 p 909-919 2009

TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer

free energy Biophys J v 95 p 2601-2609 2008

TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in

water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95

2009

Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na

cadeia proteacuteica

Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo

de ionizaccedilatildeo

퐻퐴 퐴 + 퐻

(A ndash 1)

Assim considerando que a constante de equiliacutebrio

퐾 = 푎

(A ndash 2)

Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que

퐾 =[퐴 ][퐻 ]

[퐻퐴]

(A ndash 3)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que

log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]

(A ndash 4)

Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado

por

minus log[휑] = 푝휑

(A ndash 5)

Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que

45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

푝퐾 = log[퐻퐴][퐴 ] + 푝퐻

(A ndash 6)

Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por

훼 =[퐴 ]

[퐻퐴] + [퐴 ]

(A ndash 7)

Reescrevendo (A ndash 7) tem-se que

훼 =[퐴 ] [퐻퐴frasl ]

1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =

훼1 minus 훼

(A ndash 8)

Substituindo (A ndash 8) em (A ndash 6) tem-se que

푝퐾 = log훼

1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10

(A ndash 9)

Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos

훼 =1

1 + 10

(A ndash 10)

Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio

퐴 + 퐻 퐻퐴

(A ndash 11)

Pode se escrever a constante de equiliacutebrio como

퐾 =[퐻퐴 ]

[퐴][퐻 ]

(A ndash 12)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que

46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

log퐾 = minus log[퐴]

[퐻퐴 ] minus log[퐻 ]

(A -13)

Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por

훼 =[퐻퐴 ]

[퐴] + [퐻퐴 ]

(A ndash 14)

Assim a equaccedilatildeo (A ndash 13) fica

훼1 minus 훼 = 10

(A ndash 15)

Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo

훼 =10

1 + 10

(A ndash 16)

Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos

modelos expostos

Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]

48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]

49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)

50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])

51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]

52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])

53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)

54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2

55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO

9 2 Materiais e Meacutetodos

22 Curva de solubilidade da lisozima da clara de ovo de galinha

221 Reagentes

Neste experimento de determinaccedilatildeo da curva de solubilidade da lisozima da clara de

ovo de galinha os reagentes utilizados foram cloreto de soacutedio (Reatec P A)

bicarbonato de soacutedio (Research Becto Chemical P A) Na2HPO4 7H2O (Reagen

P A) aacutegua destilada deionizada Milli-Q (Millipore) e lisozima de clara de ovo de

galinha (Sigma min 99)

222 Equipamentos

Neste experimento os equipamentos utilizados foram espectrofotocircmetro UV-Visiacutevel

(Beckman DU-530) centriacutefuga (Eppendorf) banho-teacutermico (Laacutectea) com controlador

de temperatura (Julabo) pHmetro (Micronal) e balanccedila (Mettler Toledo AB204S)

223 Preparaccedilatildeo das soluccedilotildees-tampatildeo

Foram preparadas soluccedilotildees-tampatildeo com valores de pH=96 pH = 98 pH = 100

pH = 102 pH = 104 pH = 106 pH = 108 pH = 110 pH = 112 pH = 114 pH =

116 e pH = 118 a partir de quatro soluccedilotildees uma de hidroacutexido de soacutedio 01 M uma

de cloreto de soacutedio 1 M (para equalizar a forccedila iocircnica) uma de bicarbonato de soacutedio

005 M e outra de Na2HPO4 005 M

A Tabela 2231 apresenta os valores de volume usados no preparo de cada uma

das soluccedilotildees-tampatildeo

10 2 Materiais e Meacutetodos

Tabela 2231 ndash Volumes de hidroacutexido de soacutedio a 01 M adicionados no preparo das

soluccedilotildees-tampatildeo

Tampatildeo pH V NaOH mL

NaHCO3 96 100 005 M 98 152

(para cada soluccedilatildeo-tampatildeo 100 mL 100 214

desta soluccedilatildeo foram adicionados) 102 276

104 330 106 382

108 424

110 454

112 530 114 583

Na2HPO4 110 82

005 M 112 126

(para cada soluccedilatildeo-tampatildeo 100 mL 114 182 desta soluccedilatildeo foram adicionados) 116 270

118 388

224 Procedimento experimental

Foram adicionadas quantidades natildeo definidas de lisozima de clara de ovo de galinha

a 13 mL de cada soluccedilatildeo-tampatildeo em tubos Eppendorf de 2 mL Colocaram-se

entatildeo as amostras apoacutes agitaccedilatildeo vigorosa em banho teacutermico a 250 plusmn 01 ordmC por 24

horas para que os sistemas atingissem o equiliacutebrio termodinacircmico Caso natildeo

houvesse a formaccedilatildeo de precipitado lisozima era adicionada e o procedimento

repetido Ao se observar a formaccedilatildeo de precipitado o sistema era centrifugado a

13000 rpm por 15 minutos Uma aliacutequota do sobrenadante era retirada e sua

concentraccedilatildeo proteacuteica determinada por medida de absorbacircncia a 280 nm Cada

sistema foi feito ao menos em duplicata

3 Modelo Estendido de Debye-Huumlckel

31 Introduccedilatildeo

De fato como descrito por Pessocirca Filho (2002) a equaccedilatildeo de Debye-Huumlckel natildeo

deve ser aplicada agrave modelagem de polieletroacutelitos tais como proteiacutenas porque nestas

moleacuteculas as cargas satildeo distribuiacutedas ao longo da cadeia e portanto natildeo satildeo cargas

pontuais como suposto por Debye-Huumlckel

Contudo nesta modelagem considera-se uma regiatildeo de pH em torno do ponto

isoeleacutetrico (pI) na qual satildeo inerentes duas condiccedilotildees favoraacuteveis a aplicaccedilatildeo da

equaccedilatildeo de Debye-Huumlckel carga liacutequida proacutexima a zero pois Z(pI) = 0 e regiatildeo de

miacutenima solubilidade que significa baixas concentraccedilotildees de proteiacutenas em soluccedilatildeo

Isto significa em primeiro lugar que os efeitos da carga tais como ldquodesnovelamentordquo

da cadeia proteacuteica com exposiccedilatildeo de resiacuteduos outrora blindados podem ser

desprezados em uma regiatildeo proacutexima ao ponto isoeleacutetrico e em segundo lugar

baixas concentraccedilotildees de proteiacutena em soluccedilatildeo significam que os termos de curto

alcance podem ser desprezados e portanto haacute prevalecircncia do termo de longo

alcance que no caso de soluccedilotildees eletroliacuteticas pode ser descrito por uma equaccedilatildeo

estendida de Debye-Huumlckel

Assim o modelo de Debye-Huumlckel foi utilizado natildeo para verificar sua aplicabilidade agrave

modelagem de soluccedilotildees proteacuteicas mas sim para confrontar o modelo proposto com

um modelo usual em modelagem de soluccedilotildees eletroliacuteticas e seraacute referido no texto

sempre como abordagem claacutessica

12 3 Modelo Estendido de Debye-Huumlckel

32 Desenvolvimento teoacuterico

Pode-se escrever a atividade da proteiacutena como o produto entre a solubilidade e o

coeficiente de atividade da mesma como mostrado na equaccedilatildeo (32 - 1)

푎 = 훾푠

(32 - 1)

Na qual pode-se calcular o coeficiente de atividade atraveacutes da equaccedilatildeo estendida

de Debye-Huumlckel (Pitzer 1973)

ln 훾 = minus퐴 푍radic퐼

1 + 푏radic퐼+

2푏

ln 1 + 푏radic퐼

(32 - 2)

Sendo que a constante universal empiacuterica b = 12 kg12 mol-12 eacute usada para todos os

eletroacutelitos Jaacute AΦ eacute o paracircmetro de Debye-Huumlckel para o coeficiente osmoacutetico e eacute

dado por

퐴 =13

(2휋푁 휌 ) frasl 푒4휋휀 휀 푘푇

frasl

(32 - 3)

Em que NA eacute a constante de Avogadro ρs eacute a densidade do solvente em g cm-3 e eacute

a carga eletrocircnica (e = 160218 x 10-19 C) ε0 eacute a permissividade do espaccedilo livre (ε0 =

885419 x 10-12 C2 N-1 m-2) εr eacute a constante dieleacutetrica do solvente k aacute constante de

Boltzmann e T eacute a temperatura absoluta Jaacute a carga liacutequida em funccedilatildeo do pH pode

ser calculada como

푍 = 훼 minus 훼

(32 - 4)

Sendo que α+ e α- satildeo dados pelas equaccedilotildees (A - 10) e (A - 16) do Apecircndice A

13 3 Modelo Estendido de Debye-Huumlckel

E a forccedila iocircnica eacute dada pela equaccedilatildeo (32 - 5) descrita abaixo

퐼 = 12

푚 푍

(32 - 5)

Contudo no ponto isoeleacutetrico a carga meacutedia da proteiacutena eacute nula portanto o termo de

Debye-Huumlckel se anula e o coeficiente de atividade se torna unitaacuterio

ln푎 (푝퐼) = ln 푠 (푝퐼)

(32 - 6)

Considerando que a atividade da proteiacutena seja constante com a variaccedilatildeo de pH isto

implica que esta eacute sempre igual agrave solubilidade da proteiacutena no ponto isoeleacutetrico e

portanto vale que

ln푎 (푝퐻) = ln 푠 (푝퐻) + ln 훾(푝퐻) = ln 푠 (푝퐼)

(32 - 7)

Assim

ln 푠 (푝퐻) = ln 푠 (푝퐼) + 퐴휙푍푝퐻2 radic퐼1 + 푏radic퐼

+2푏

ln 1 + 푏radic퐼

(32 - 8)

Esta equaccedilatildeo prevecirc a curva de solubilidade em funccedilatildeo do pH atraveacutes do caacutelculo da

atividade da proteiacutena na fase liacutequida pela equaccedilatildeo estendida de Debye-Huumlckel Para

resolvecirc-la eacute necessaacuterio se utilizar de um meacutetodo numeacuterico pois a forccedila iocircnica

depende da solubilidade naquele pH Optou-se neste trabalho pelo Meacutetodo de

Newton-Raphson para executar o meacutetodo iterativo que eacute exigido pela equaccedilatildeo (32

ndash 8) Para aplicar este meacutetodo arbitrou-se uma funccedilatildeo f(sp) definida aqui como

푓 푠 = minus ln 푠 (푝퐻) + ln 푠 (푝퐼) + 퐴휙푍푝퐻2 radic퐼

1 + 푏radic퐼+

2푏

ln 1 + 푏radic퐼

(32 - 9)

14 3 Modelo Estendido de Debye-Huumlckel

Assim ao calcular o sp que zera esta funccedilatildeo f(sp) saber-se-aacute que eacute a proacutepria

solubilidade que se deseja calcular Para aplicar o Meacutetodo de Newton-Raphson

basta derivar a funccedilatildeo f(sp) e aplicar o seguinte algoritmo de resoluccedilatildeo

푠 = 푠 minus푓(푠 )푓 (푠 )

(32 - 10)

Para calcular frsquo(s) deve-se considerar que a forccedila iocircnica depende da solubilidade

Para isto observando a equaccedilatildeo (32 - 5) vecirc-se que a forccedila iocircnica eacute dada pelo

somatoacuterio das contribuiccedilotildees de todos os iacuteons presentes na soluccedilatildeo por isso aqui

cabe um artifiacutecio de dividir estas contribuiccedilotildees em duas macro-contribuiccedilotildees aquela

devida a todos os iacuteons presentes na soluccedilatildeo exclusive os grupos ionizaacuteveis

presentes nas moleacuteculas da proteiacutena em questatildeo (I0) e que se considera constante

com o pH e aquela que engloba apenas os grupos ionizaacuteveis presentes nas

moleacuteculas da proteiacutena (IP)

퐼 = 퐼 + 퐼 = 퐼 +12푍 푠

(32 - 11)

Considerando a funccedilatildeo w tal que

푤 = radic퐼 = 퐼 +12푍 푠

(32 - 12)

Sendo

푤 =14푍 퐼

(32 - 13)

Entatildeo aplicando-se as devidas regras de derivaccedilatildeo tem-se

15 3 Modelo Estendido de Debye-Huumlckel

푓 (푠 ) = minus1푠 + 퐴 푍

3푤 + 2푤 푏푤(1 + 푏푤)

(32 - 14)

Substituindo as equaccedilotildees (32 - 12) e (32 - 13) na equaccedilatildeo (32 - 14) tem-se que

푓 (푠 ) = minus1푠 + 퐴 푍

15 + 푏radic퐼2radic퐼(1 + 푏radic퐼)

(32 - 15)

Entatildeo o algoritmo deve ser

푠 = 푠 minus

⎜⎛ln 푠 (푝퐼)

푠 + 퐴휙푍푝퐻2 radic퐼

1 + 푏radic퐼+ 2푏 ln 1 + 푏radic퐼

minus 1푠 + 퐴휙푍

15 + 푏radic퐼2radic퐼(1 + 푏radic퐼) ⎠

⎟⎞

(32 - 16)

4 Modelagem Termodinacircmica Proposta

41 Introduccedilatildeo

A condiccedilatildeo de equiliacutebrio entre duas fases (α e β) com m componentes eacute dada por

(Prausnitz et al 1999)

푝 = 푝

(41 ndash 1)

푇 = 푇

(41 ndash 2)

휇 = 휇⋮

휇 = 휇

(41 ndash 3)

Considerando o equiliacutebrio soacutelido-liacutequido (ESL) de sistemas contendo proteiacutenas

sendo que os efeitos da pressatildeo podem ser desprezados que as temperaturas nas

duas fases satildeo iguais e que na fase soacutelida soacute haacute proteiacutena tem-se que para a

proteiacutena a relaccedilatildeo de equiliacutebrio pode ser descrita por

휇 (푇푥) = 휇 (푇)

(41 ndash 4)

Contudo adotando-se a lei de Henry que eacute vaacutelida para baixas concentraccedilotildees de

soluto hipoacutetese que natildeo eacute distante dos valores observados da solubilidade de

proteiacutenas pode se escrever o potencial quiacutemico na fase liacutequida por

휇 (푇푥) = 휇 (푇 푥 ) + 푅푇푙푛푥

(41 ndash 5)

17 4 Modelagem Termodinacircmica Proposta

Entretanto variaccedilotildees de pH natildeo alteram o potencial quiacutemico da fase soacutelida o que

resulta pela relaccedilatildeo (41 ndash 4) que o mesmo natildeo altera tambeacutem o potencial quiacutemico

da fase liacutequida Com isso pela relaccedilatildeo (41 ndash 5) sendo o potencial quiacutemico de

referecircncia constante com o pH uma contradiccedilatildeo emerge a variaccedilatildeo do pH natildeo

poderia alterar o valor da solubilidade poreacutem a observaccedilatildeo experimental mostra o

contraacuterio Assim deve-se lembrar que pelo princiacutepio da eletroneutralidade a fase

soacutelida soacute possui moleacuteculas proteacuteicas eletricamente neutras e portanto o equiliacutebrio

de fases deve se estabelecer apenas entre as moleacuteculas presentes na fase soacutelida e

as moleacuteculas eletricamente neutras em soluccedilatildeo Ou seja como soacute moleacuteculas

eletricamente neutras podem estar na fase soacutelida o equiliacutebrio de fases depende

exclusivamente da fraccedilatildeo de moleacuteculas eletricamente neutras em soluccedilatildeo pois soacute

estas podem precipitar Assim tanto a equaccedilatildeo (41 ndash 4) quanto a equaccedilatildeo (41 ndash

5) devem ser aplicadas natildeo ao conjunto de todas as moleacuteculas de proteiacutena em

soluccedilatildeo mas somente as moleacuteculas proteacuteicas eletricamente neutras Portanto a

concentraccedilatildeo das moleacuteculas de proteiacutena eletricamente neutras em soluccedilatildeo eacute

constante com o pH e pode ser interpretada como a multiplicaccedilatildeo da fraccedilatildeo de

moleacuteculas eletricamente neutras pela concentraccedilatildeo total de proteiacutenas que eacute a

proacutepria solubilidade Assim uma relaccedilatildeo de inversa proporcionalidade eacute definida

quanto maior a fraccedilatildeo de moleacuteculas neutras menor seraacute a solubilidade de uma

proteiacutena em soluccedilatildeo Portanto no ponto isoeleacutetrico no qual haacute o miacutenimo de

solubilidade tem-se o ponto maacuteximo de fraccedilatildeo de moleacuteculas eletricamente neutras

A partir disto eacute possiacutevel escrever a equaccedilatildeo que rege o comportamento da

solubilidade de uma proteiacutena em funccedilatildeo do pH da soluccedilatildeo

휙(푝퐻)푆 (푝퐻) = 휆 = 푐표푛푠푡푎푛푡푒

(41 ndash 6)

18 4 Modelagem Termodinacircmica Proposta

Na equaccedilatildeo (41 ndash 6) o paracircmetro λ pode ser um paracircmetro de ajuste do modelo a

um conjunto de valores experimentais tendo se estabelecido uma funccedilatildeo objetivo ou

ainda dado pelo produto entre a solubilidade no ponto isoeleacutetrico e a fraccedilatildeo de

moleacuteculas eletricamente neutras em soluccedilatildeo tambeacutem no pI neste caso vale a

seguinte equaccedilatildeo

푠 (푝퐻) =휙(푝퐼)푠 (푝퐼)휙(푝퐻)

(41 ndash 7)

Sendo a equaccedilatildeo do modelo ndash equaccedilatildeo (41 ndash 7) ndash extremamente simples a uacutenica

dificuldade reside no caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras

(휙(푝퐻))

42 Caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras

Dentre os aminoaacutecidos que formam atraveacutes de ligaccedilotildees peptiacutedicas as proteiacutenas haacute

aqueles que possuem resiacuteduos com grupos ionizaacuteveis aleacutem dos grupos amina e

aacutecido carboxiacutelico terminais na cadeia Todos estes participam de equiliacutebrios

quiacutemicos com iacuteons H+ presentes na soluccedilatildeo entatildeo ao se alterar o pH da soluccedilatildeo

estes equiliacutebrios satildeo alterados

Assim haacute vaacuterias possibilidades de combinaccedilotildees de estados ionizados destes grupos

ionizaacuteveis que resultam em uma moleacutecula de proteiacutena eletricamente neutra Eacute

importante notar que dada a fraccedilatildeo de uma configuraccedilatildeo de uma moleacutecula neutra

todas as outras fraccedilotildees de configuraccedilotildees possiacuteveis que tambeacutem resultem em

moleacuteculas neutras satildeo proporcionais agrave fraccedilatildeo da configuraccedilatildeo dada pois todas as

configuraccedilotildees participam de equiliacutebrios entre si

19 4 Modelagem Termodinacircmica Proposta

Desta observaccedilatildeo implica-se que basta identificar uma configuraccedilatildeo proteacuteica cuja

soma dos estados ionizados resulte em carga nula para se descrever o equiliacutebrio de

fases em relaccedilatildeo ao pH na regiatildeo do ponto isoeleacutetrico onde esta consideraccedilatildeo eacute

predominante em relaccedilatildeo a outros possiacuteveis fenocircmenos

Contudo eacute necessaacuterio contabilizar a contribuiccedilatildeo de cada grupo ionizaacutevel via

equaccedilatildeo de Henderson-Hasselbach equaccedilatildeo (42 ndash 1)

훼 (푝퐻) =

⎩⎪⎨

⎪⎧ 10

1 + 10 푠푒 휈 = minus1

11 + 10

푠푒 휈 = +1

(42 ndash 1)

Na qual pKAj eacute o co-logaritmo da constante de equiliacutebrio do grupo ionizaacutevel do

resiacuteduo j j eacute estado carregado potencial do resiacuteduo j (-1 para grupos aacutecidos e +1

para grupos baacutesicos) e j eacute a fraccedilatildeo ionizada para o pH dado Para grupos cujo

estado de ionizaccedilatildeo na dada configuraccedilatildeo seja neutro a sua fraccedilatildeo eacute calculada tal

que a soma de sua fraccedilatildeo e da fraccedilatildeo ionizada tenha como resultado o valor

unitaacuterio

Assim a funccedilatildeo Pn pode ser escrita como o produto de cada fraccedilatildeo de cada grupo

ionizaacutevel j naquele estado (-1 0 ou +1) na configuraccedilatildeo neutra k em uma proteiacutena

com n grupos ionizaacuteveis Uma representaccedilatildeo matemaacutetica possiacutevel para esta funccedilatildeo

pode ser escrita como

휙 (푝퐻) = 훼 (푝퐻)

(42 ndash 2)

Na qual a fraccedilatildeo jrsquo(pH) eacute dada por

20 4 Modelagem Termodinacircmica Proposta

훼 (푝퐻) =훼 (푝퐻) 푠푒 휀 = 11 minus 훼 (푝퐻) 푠푒 휀 = 0

(42 ndash 3)

Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (42 ndash 3) e a resultante na equaccedilatildeo

(42 ndash 2) pode-se escrever que

휙 (푝퐻) =1

1 + 10

1 + 휈2 minus 휈 휀 10

minus휈 minus 1

2 minus 휈 휀 푐표푚 휀 = 0

(42 ndash 4)

A equaccedilatildeo (42 ndash 4) junto agrave equaccedilatildeo (41 ndash 7) constituem o modelo termodinacircmico

capaz de predizer a razatildeo entre as fraccedilotildees de moleacuteculas neutras de uma proteiacutena

em funccedilatildeo do pH na regiatildeo do ponto isoeleacutetrico mantendo fixas temperatura e forccedila

iocircnica Substituindo a equaccedilatildeo (42 ndash 4) na equaccedilatildeo (41 ndash 7) obteacutem-se para a

curva de solubilidade

푠 (푝퐻)푠 (푝퐼) =

1 + 101 + 10

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

푐표푚 휀 = 0

(42 ndash 8)

5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

51 Introduccedilatildeo

Segundo Groumlnwall (1941) na fase liacutequida haacute moleacuteculas de proteiacutenas com muitas

configuraccedilotildees k distintas que possuem carga liacutequida i e tambeacutem haacute certas

configuraccedilotildees que tem carga liacutequida nula e satildeo chamadas configuraccedilotildees neutras

Aleacutem disso estas uacuteltimas satildeo aquelas que determinam o equiliacutebrio de fases jaacute que

elas estatildeo em equiliacutebrio com a fase soacutelida na qual soacute haacute moleacuteculas neutras pelo

princiacutepio da eletroneutralidade Eacute tambeacutem afirmado que dado este equiliacutebrio a

atividade das moleacuteculas neutras natildeo se altera com a variaccedilatildeo do pH e eacute

proporcional agraves atividades de qualquer tipo de configuraccedilatildeo neutra

Neste mesmo trabalho eacute atribuiacuteda a Linderstroslashm-Lang o desenvolvimento de uma

teoria de prediccedilatildeo da solubilidade de proteiacutenas com a variaccedilatildeo do pH na regiatildeo do

ponto isoeleacutetrico Este desenvolvimento apresenta um balanccedilo de cargas de um

modo impliacutecito contudo como atestado por Groumlnwall o escasso conhecimento

sobre as estruturas proteacuteicas impediram agravequele tempo uma formulaccedilatildeo mais

pormenorizada do problema

52 Desenvolvimento teoacuterico

A base desta abordagem descrita por Groumlnwall e atribuiacuteda a Linderstroslashm-Lang

reside na hipoacutetese de que a moleacutecula de proteiacutena de configuraccedilatildeo k e carga nula

participa do seguinte equiliacutebrio com os iacuteons H+ e com sua forma de carga i

22 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

푃 + 푖퐻 푃 lowast

(52 ndash 1)

Note-se que o valor de i pode ser negativo A constante do equiliacutebrio quiacutemico

descrita pela equaccedilatildeo (52 ndash 1) pode ser expressa como

퐾 =푎

lowast

푎 푎

(52 ndash 2)

Sabendo que a atividade da moleacutecula de proteiacutena de configuraccedilatildeo k e carga i eacute dada

pelo produto entre sua concentraccedilatildeo e seu coeficiente de atividade tem-se que

푥lowast

= 푎 푎퐾훾

lowast

(52 ndash 3)

Entretanto a solubilidade da proteiacutena eacute soma das concentraccedilotildees de todas as

moleacuteculas de carga i Poreacutem a concentraccedilatildeo das moleacuteculas de carga i eacute a soma das

concentraccedilotildees das moleacuteculas de configuraccedilatildeo k Assim a solubilidade pode ser

escrita como

푠 (푝퐻) = 푎 푎퐾훾

lowast

(52 ndash 4)

Derivando a equaccedilatildeo (52 ndash 4) com respeito agrave atividade do iacuteon H+ considerando

que atividade da moleacutecula neutra eacute constante para qualquer configuraccedilatildeo k e ainda

que o coeficiente de atividade da proteiacutena de carga i independe da atividade do iacuteon

H+ tem-se que

푑푠푑푎 = 푖 ∙ 푎 푎

퐾훾

lowast

(52 ndash 5)

23 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

Sendo

푑 log 푠 (푝퐻)푑(푝퐻) = minus

푎푠 (푝퐻)

푑푠푑푎

(52 ndash 6)

Substituindo as equaccedilotildees (52 ndash 4) e (52 ndash 5) na equaccedilatildeo (52 ndash 6) e

reescrevendo em termos de pH e das concentraccedilotildees das proteiacutenas de carga i tem-

se que

푑 log 푠푑(푝퐻) = minus

sum (푖 ∙ 푥 )sum 푥

(52 ndash 7)

Contudo o termo do lado direito da equaccedilatildeo (52 ndash 7) estaacute associado ao conceito

de valecircncia meacutedia estabelecido por Linderstroslashm-Lang (1924)

횤 =sum (푖 ∙ 푥 )sum 푥

(52 ndash 8)

Os autores natildeo possuiacuteam um modo mais adequado de construir a curva de

solubilidade dada pela equaccedilatildeo (52 ndash 7) do que aproximar por uma funccedilatildeo linear o

perfil de carga liacutequida da proteiacutena obtido experimentalmente e integraacute-lo valendo-se

da analogia entre o conceito de carga liacutequida (Z) e de valecircncia meacutedia ( i ) Entretanto

hoje jaacute se tem uma descriccedilatildeo analiacutetica do perfil de carga liacutequida de proteiacutenas que

pode ser escrita como

푍(푝퐻) = 휈 훼

(52 ndash 9)

Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (52 ndash 9) e a resultante na equaccedilatildeo

(52 ndash 7) tem-se que

24 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

푑 log 푠푑(푝퐻) = minus

12

11 + 10

1 + 휈 + 휈 1 minus 휈 10

(52 ndash 10)

Integrando a equaccedilatildeo (52 ndash 10) de um ponto de referecircncia por exemplo do ponto

isoeleacutetrico (pI) ateacute um pH qualquer tem-se a seguinte relaccedilatildeo

푑 log 푠

( )

( )

= minus12

1

1 + 101 + 휈 + 휈 1 minus 휈 10 푑(푝퐻)

(52 ndash 11)

log푠 (푝퐻)푠 (푝퐼) = minus

12 1 + 휈

11 + 10

푑(푝퐻)

+ 휈 1 minus 휈10

1 + 10푑(푝퐻)

(52 ndash 12)

Fazendo a seguinte substituiccedilatildeo

푢 = 10 푡푎푙 푞푢푒 푑푢푢 = ln 10푑(푝퐻)

(52 ndash 13)

Tem-se que

log푠 (푝퐻)푠 (푝퐼) = minus

12

1 + 휈ln 10

1푢(1 + 푢) 푑푢 +

휈 1 minus 휈ln 10

1(1 + 푢) 푑푢

(52 ndash 14)

log푠 (푝퐻)푠 (푝퐼) = minus

12

1 + 휈ln 10

1푢 푑푢 minus

11 + 푢 푑푢 +

휈 1 minus 휈ln 10

1(1 + 푢) 푑푢

(52 ndash 15)

25 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐼) = minus

12 1 + 휈 log

1010

minus 휈 1 minus 휈 minus 1 + 휈 log1 + 101 + 10

(52 ndash 16)

Sendo

휈 1 minus 휈 minus 1 + 휈 = 휈 minus 휈 minus 1 minus 휈 = minus 1 + 휈 = minus2

(52 ndash 17)

Resultando em

log푠 (푝퐻)푠 (푝퐼) = log

1 + 101 + 10

minus1 + 휈

2 (푝퐻 minus 푝퐼)

(52 ndash 18)

Ainda eacute possiacutevel reescrever a equaccedilatildeo (52 ndash 18) como

log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log

1 + 101 + 10

(52 ndash 19)

Na qual n+ representa o nuacutemero de resiacuteduos ionizaacuteveis que na sua forma carregada

apresentam carga positiva A equaccedilatildeo (52 ndash 19) eacute uma expressatildeo analiacutetica que a

partir de dados da estrutura proteacuteica e de um dado de solubilidade permite predizer

a curva de solubilidade de uma dada proteiacutena em funccedilatildeo do pH na regiatildeo do ponto

isoeleacutetrico mantendo fixas a temperatura e a forccedila iocircnica do sistema

Eacute possiacutevel provar que as equaccedilotildees (42 ndash 8) e (52 ndash 19) satildeo idecircnticas - a prova

disso eacute descrita na seccedilatildeo 6 ndash e assim tem-se que apesar das distintas abordagens

a descriccedilatildeo do fenocircmeno eacute a mesma Note-se que um passo fundamental no

desenvolvimento da Equaccedilatildeo (52 ndash 5) eacute admitir que por hipoacutetese a atividade da

26 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

forma neutra natildeo depende do pH essa hipoacutetese tambeacutem eacute a base da equaccedilatildeo (41

ndash 7) Deve-se registrar o fato de que pelo melhor do nosso conhecimento esta eacute a

primeira vez que uma expressatildeo analiacutetica para o caacutelculo da solubilidade de

proteiacutenas em funccedilatildeo do pH eacute descrita mesmo no limite em que se considera vaacutelida

a lei de Henry

53 Soluccedilatildeo Paraboacutelica da Curva de Solubilidade

Tanto Groumlnwall (1941) quanto Fredericq e Neurath (1950) adotaram a hipoacutetese de

que os perfis de carga liacutequida da -lactoglobulina para um e da insulina para os

outros dois eram lineares na regiatildeo do ponto isoeleacutetrico Esta hipoacutetese eacute bastante

plausiacutevel e simplificadora principalmente a eacutepoca na qual estes trabalhos foram

desenvolvidos em que a estrutura proteacuteica bem como as constantes de ionizaccedilatildeo

dos resiacuteduos com grupos ionizaacuteveis era pouco conhecida De fato ainda hoje a falta

de dados das constantes de ionizaccedilatildeo na cadeia proteacuteica eacute o maior desafio no uso

do modelo rigoroso ndash equaccedilatildeo (52 ndash 18) Por isso o valor desta hipoacutetese de perfil

de carga liacutequida linear eacute notaacutevel

Supondo entatildeo que o perfil de carga seja linear eacute possiacutevel escrevecirc-lo como

푍(푝퐻) = minus퐴(푝퐻 minus 푝퐼) 푐표푚 퐴 gt 0

(53 ndash 1)

Substituindo (53 ndash 1) em (52 ndash 6)

푑 log 푠 (푝퐻)푑(푝퐻) = 퐴(푝퐻 minus 푝퐼)

(53 ndash 2)

Integrando (53 ndash 2) de um pH0 de referecircncia ateacute pH tem-se que

27 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐻 ) = 퐾[푝퐻 minus 2푝퐼(푝퐻 minus 푝퐻 ) minus 푝퐻 ] 푐표푚 퐾 =

퐴2

(53 ndash 3)

Ao se adotar como ponto de referecircncia o ponto isoeleacutetrico a equaccedilatildeo (53 ndash 3)

reduz-se agrave

log푠 (푝퐻)푠 (푝퐼) = 퐾(푝퐻 minus 푝퐼)

(53 ndash 4)

Contudo apesar da soluccedilatildeo quadraacutetica ou paraboacutelica para a equaccedilatildeo estendida de

Linderstroslashm-lang e Groumlnwall expressa na equaccedilatildeo (53 ndash 3) natildeo requerer os dados

das constantes de ionizaccedilatildeo dos resiacuteduos com grupos ionizaacuteveis ela exige a

definiccedilatildeo do paracircmetro A que fisicamente representa a inclinaccedilatildeo da reta de

aproximaccedilatildeo da curva de carga liacutequida e que pode ser calculado por correlaccedilatildeo a

partir de um conjunto de dados experimentais de solubilidade ou de carga liacutequida

6 Identidade entre o Modelo Proposto e a Equaccedilatildeo

Estendida de Linderstroslashm-Lang e Groumlnwall

A equaccedilatildeo final da modelagem termodinacircmica proposta apresentada na seccedilatildeo 4 eacute a

equaccedilatildeo (42 ndash 8) dada por

푠 (푝퐻)푠 (푝퐼) =

1 + 101 + 10

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 1)

Aplicando-se o logaritmo decimal nos dois termos da equaccedilatildeo (6 ndash 1) tem-se que

log푠 (푝퐻)푠 (푝퐼) = log

1 + 101 + 10

+ log

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 2)

Pelo bem da simplificaccedilatildeo desta deduccedilatildeo adotar-se-atildeo as seguintes funccedilotildees

휂 (푝퐻) = log

(6 ndash 3)

휃 (푝퐻) = log

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 4)

Assim pode-se reescrever a equaccedilatildeo (6 ndash 2) por

29 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐼) = 휂 (푝퐻) + 휃 (푝퐻)

(6 ndash 5)

Observando-se a equaccedilatildeo (6 ndash 5) tem-se que a funccedilatildeo j independe do estado de

ionizaccedilatildeo do resiacuteduo j poreacutem a funccedilatildeo jk depende Por isso deve-se analisar esta

funccedilatildeo para cada estado de ionizaccedilatildeo possiacutevel como mostrado na Tabela 61

Tabela 6 1 ndash Anaacutelise da funccedilatildeo jk para cada estado de ionizaccedilatildeo possiacutevel

j jk jk Quantidade de resiacuteduos neste estado

-1 -1 푝퐼 minus 푝퐻 na

0 0 nb

+1 +1 0 nc

0 푝퐼 minus 푝퐻 nd

Pela anaacutelise da Tabela 61 e considerando uma proteiacutena com n resiacuteduos com

grupos ionizaacuteveis infere-se que a equaccedilatildeo (6 ndash 5) pode ser reescrita como

log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)

(6 ndash 6)

Contudo as equaccedilotildees acima descritas satildeo vaacutelidas apenas para configuraccedilotildees

neutras pois apenas as configuraccedilotildees neutras da fase liacutequida estatildeo em equiliacutebrio

com as moleacuteculas de proteiacutena da fase soacutelida Para que uma configuraccedilatildeo seja

neutra vale a seguinte restriccedilatildeo

휀 = 0 hArr 푛 = 푛

(6 ndash 7)

30 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall

Substituindo a restriccedilatildeo dada pela equaccedilatildeo (6 ndash 7) na equaccedilatildeo (6 ndash 6) tem-se que

log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)

(6 ndash 8)

Ora mas a soma de nc e de nd natildeo resulta em outra coisa senatildeo no nuacutemero de

resiacuteduos com grupos ionizaacuteveis da estrutura proteacuteica cujo j seja +1 Assim

substituindo nc mais nd por n+ e substituindo a equaccedilatildeo (6 ndash 3) na equaccedilatildeo (6 ndash 8)

tem-se que

log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log

1 + 101 + 10

(6 ndash 9)

Ao se analisar a equaccedilatildeo (6 ndash 9) observa-se que ela eacute idecircntica a equaccedilatildeo estendida

de Linderstroslashm-Lang e Groumlnwall apresentada pela equaccedilatildeo (52 ndash 19) Com isso

tem-se que apesar das distintas formulaccedilotildees tanto a modelagem termodinacircmica aqui

proposta quanto a extensatildeo a teoria de Linderstroslashm-Lang e Groumlnwall resultam na

mesma descriccedilatildeo do fenocircmeno Aleacutem disso a equaccedilatildeo final dos modelos eacute

extremamente simples e depende apenas de um ponto de referecircncia e dos dados da

estrutura da moleacutecula de proteiacutena cuja solubilidade se deseja estudar

7 Aplicaccedilatildeo dos Modelos Expostos

Para validar o modelo comparando-o com o caacutelculo feito a partir da teoria de Debye-

Huumlckel o criteacuterio que relaciona os pontos calculados pelo modelo com os pontos

experimentais foi estabelecido a partir da seguinte funccedilatildeo objetivo (FO)

퐹푂 =1푁

푠 minus 푠푠

(7 ndash 1)

Contudo a equaccedilatildeo (7 ndash 1) natildeo eacute a melhor definiccedilatildeo de funccedilatildeo objetivo neste caso

pois a derivada da curva de solubilidade eacute razoavelmente grande nos dois lados do

ponto isoeleacutetrico e isso permite que pequenos desvios na direccedilatildeo horizontal

resultem em um grande aumento no valor da funccedilatildeo objetivo Uma soluccedilatildeo possiacutevel

seria substituir essa funccedilatildeo objetivo por uma funccedilatildeo definida pela soma do quadrado

da distacircncia do ponto experimental agrave curva do modelo principalmente se fosse

necessaacuterio calcular algum paracircmetro do modelo via otimizaccedilatildeo da funccedilatildeo objetivo

estipulada Natildeo sendo este o escopo deste trabalho optou-se pelo uso da FO

definida na equaccedilatildeo (7 ndash 1)

71 Solubilidade da Insulina Suiacutena

As Figuras 711 712 e 713 apresentam os graacuteficos da curva de solubilidade

dada pelos pontos experimentais pelo modelo proposto pela abordagem claacutessica e

tambeacutem a curva obtida pela soluccedilatildeo paraboacutelica da Equaccedilatildeo de Linderstroslashm-Lang e

Groumlnwall em trecircs temperaturas distintas

32 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 711 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 25 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

Figura 712 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 15 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

00

40

80

120

160

200

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

00

50

100

150

200

250

300

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

33 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 713 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 5 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

Os desvios da curva obtida pelo modelo proposto para valores de pH distantes do pI

podem ser explicados por ao menos trecircs importantes motivos dois devidos a

hipoacuteteses do modelo e um devido a fenocircmenos intriacutensecos a proteiacutena Sabendo que

no pI a solubilidade eacute miacutenima para valores de pH distantes do pI pode-se ter

solubilidades suficientemente grandes para que a validade da lei de Henry ndash adotada

na formulaccedilatildeo do modelo - seja questionada pois quanto mais distante do pI maior

a solubilidade e menor a validade da lei de Henry jaacute que haacute um aumento da

concentraccedilatildeo do soluto (proteiacutena) na soluccedilatildeo e tambeacutem ao fato do modelo prever

solubilidade infinita quando a fraccedilatildeo de moleacuteculas eletricamente neutras tende a

zero

limrarr푠 = lim

rarr

Φ(푝퐼)푠 (푝퐼)Φ(푝퐻) = +infin

(711 ndash 1)

00

50

100

150

200

250

300

350

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

34 7 Aplicaccedilatildeo dos Modelos Expostos

Todavia ainda haacute um fator de ordem natural que justifica o desvio apresentado para

valores de pH distantes do pI o desnovelamento da cadeia proteacuteica Este fenocircmeno

pode ocorrer de maneira a expor grupos hidroacutefobos resiacuteduos antes natildeo expostos

acrescentando relaccedilotildees de equiliacutebrio quiacutemico natildeo existentes na regiatildeo do pI

alterando o equiliacutebrio de fases e portanto alterando o valor da solubilidade

A Tabela 711 apresenta os valores obtidos para a funccedilatildeo objetivo definida em (7 ndash

1) tanto para o modelo proposto quanto para a abordagem claacutessica para trecircs

diferentes temperaturas

Tabela 711 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada

abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para insulina

suiacutena

T ordmC Abordagem FO

25 P 01857 C 02535

15 P 01981 C 05056

5 P 03595 C 03064

Observando-se a Tabela 711 vecirc-se que o modelo apresentou melhores resultados

do que o caacutelculo efetuado atraveacutes da abordagem claacutessica no que tange a

minimizaccedilatildeo da funccedilatildeo objetivo exceto para os dados a 5 ordmC

Tambeacutem eacute possiacutevel observar que a funccedilatildeo objetivo sofreu aumento com a

diminuiccedilatildeo da temperatura Isto ocorreu principalmente devido agrave dificuldade de

obter dados experimentais de solubilidade a temperaturas baixas o que aumenta o

desvio experimental fazendo com que se tenha um aumento do valor da funccedilatildeo

objetivo como a definida em (5 ndash 1) Um efeito secundaacuterio que tambeacutem pressiona a

35 7 Aplicaccedilatildeo dos Modelos Expostos

funccedilatildeo objetivo eacute o fato dos dados de pKA terem sido obtidos a uma temperatura

especiacutefica o que tende a acrescentar erro no caacutelculo de solubilidades a temperaturas

diferentes ainda que o pKA natildeo varie de forma ab-rupta com a temperatura

Outra observaccedilatildeo que deve ser registrada eacute o fato da funccedilatildeo objetivo para a

abordagem claacutessica na temperatura de 15 ordmC divergir a um valor tatildeo elevado em

relaccedilatildeo aos demais Isto se deve a um ponto experimental especiacutefico a um pH de

45 a solubilidade da insulina suiacutena obtida experimentalmente eacute 230 x 10-5 mol kg-1

enquanto a calculada pelo modelo proposto eacute 230 x 10-5 mol kg-1 e a calculada pela

abordagem claacutessica eacute 520 x 10-5 mol kg-1 Por conta do desvio deste ponto a funccedilatildeo

objetivo para a abordagem claacutessica nesta temperatura tem um aumento significativo

A Tabela 712 apresenta os valores do paracircmetro K da soluccedilatildeo paraboacutelica obtidos

neste trabalho para a insulina suiacutena comparados ao encontrado na literatura

Tabela 712 ndash Valores do paracircmetro K da soluccedilatildeo paraboacutelica para a insulina suiacutena

Referecircncias T ordmC K Fredericq e Neurath (1950) - 081 Neste trabalho 25 104 Neste trabalho 15 101 Neste trabalho 5 145

Pela Tabela 712 pode-se observar que haacute uma diferenccedila pequena entre os

valores do paracircmetro K obtidos neste trabalho e por Fredericq e Neurath (1950) Por

isso natildeo se pode afirmar a que se deve esta diferenccedila se eacute devido a diferenccedilas entre

procedimentos experimentais ou se eacute devido agrave diferenccedila de meacutetodo de caacutelculo do

paracircmetro Apesar de no experimento realizado por Fredericq e Neurath (1950)

haver a presenccedila do acircnion tiocianato e este acircnion interagir com grupos ionizaacuteveis

da cadeia proteacuteica como observado pelos autores do trabalho tambeacutem estes

36 7 Aplicaccedilatildeo dos Modelos Expostos

proacuteprios autores afirmam que a presenccedila deste acircnion natildeo altera a forma da curva

que eacute basicamente determinada pelo paracircmetro K De qualquer modo eacute interessante

observar a proximidade dos valores encontrados neste trabalho com o obtido por

Fredericq e Neurath (1950) pelo menos no que diz respeito agrave ordem de grandeza do

paracircmetro em questatildeo

72 Solubilidade da Lisozima de clara de ovo de galinha

Um modelo para ser validado necessita correlacionar dados experimentais de modo

satisfatoacuterio ou seja um modelo deve buscar fidelidade ao fenocircmeno fiacutesico

observado Assim na procura de dados de solubilidade de proteiacutenas poucos dados

na regiatildeo do pI foram encontrados Este eacute o caso da lisozima de clara de ovo de

galinha que apesar de ter muitos estudos de solubilidade nenhum deles se

encontra na regiatildeo do pI Surgiu assim a necessidade de se obter estes dados

experimentais para poder validar o modelo proposto A escolha da lisozima de clara

de ovo de galinha se deu em parte pela sua importacircncia mas tambeacutem em parte por

ter os valores de pKA conhecidos

A curva de solubilidade da lisozima de clara de ovo de galinha levantada neste

trabalho estaacute apresentada na Figura 721

37 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em

soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e

dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()

Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento

esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH

isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de

soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se

comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto

isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da

soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos

ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente

neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a

solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e

00

10

20

30

40

50

60

70

80

90

100

95 100 105 110 115 120

Solu

bilid

ade

(mg

mL)

pH

38 7 Aplicaccedilatildeo dos Modelos Expostos

alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado

em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo

Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo

a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo

Por conta de falta de dados a este respeito modelou-se apenas a curva de

solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura

722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de

galinha em funccedilatildeo do pH da soluccedilatildeo

Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)

00

10

20

30

40

50

60

70

80

90

96 99 102 105 108 111 114 117 120

Solu

bilid

ade

(mg

mL)

pH

39 7 Aplicaccedilatildeo dos Modelos Expostos

O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721

Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada

abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima

de clara de ovo de galinha

T ordmC Abordagem FO

25 P 4650 C gt7919a

a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado

Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta

aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a

abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca

de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos

anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao

efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de

clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a

variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A

proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de

cargas pontuais de Debye-Huumlckel

8 Conclusotildees

A modelagem termodinacircmica proposta neste trabalho apresentou expressivos

resultados quando comparada a abordagem claacutessica de Debye-Huumlckel

Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o

modelo aproximou melhor os pontos experimentais do que a referida abordagem

comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima

ao ponto isoeleacutetrico

Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica

para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua

construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo

lugar por sua aplicabilidade

Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis

da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva

em regiotildees distantes do ponto isoeleacutetrico

9 Referecircncias Bibliograacuteficas

BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene

Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects

Biophys J 95 1285-1294 2008

FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and

other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72

2684 - 26911950

GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v

93 p 517-542 1931

GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab

Carlsberg v 24 p 185-200 1941

KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native

and mutant insulins pK perturbation of B13-Glu in aggregated species Arch

Biochem Biophys v 283 p 496-502 1990

KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for

the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng

Chem Res v 35 p 4319-4327 1996

42 9 Referecircncias Bibliograacuteficas

KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen

lysozyme J Biochem v 87 p 1215-1219 1980

LADISCH M R Bioseparations Engineering principles practice and

economics John Wiley amp Sons 2001 pp1 116 ndash 117 133

LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab

Carlsberg v 15 p 1-29 1924

PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da

particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas

2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP

PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the

excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte

solutions Fluid Phase Equilib v 269 p 25ndash35 2008

PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-

contribution model involving phase and chemical equilibrium Ind Eng Chem Res

v 33 p 1341-1347 1994

PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277

1973

PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino

acids Fluid Phase Equilib v 152 p 121-132 1998

43 9 Referecircncias Bibliograacuteficas

PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular

Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999

SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of

equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte

solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009

TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J

R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with

carbon dioxide Biotech Bioeng v103 p 909-919 2009

TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer

free energy Biophys J v 95 p 2601-2609 2008

TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in

water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95

2009

Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na

cadeia proteacuteica

Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo

de ionizaccedilatildeo

퐻퐴 퐴 + 퐻

(A ndash 1)

Assim considerando que a constante de equiliacutebrio

퐾 = 푎

(A ndash 2)

Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que

퐾 =[퐴 ][퐻 ]

[퐻퐴]

(A ndash 3)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que

log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]

(A ndash 4)

Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado

por

minus log[휑] = 푝휑

(A ndash 5)

Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que

45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

푝퐾 = log[퐻퐴][퐴 ] + 푝퐻

(A ndash 6)

Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por

훼 =[퐴 ]

[퐻퐴] + [퐴 ]

(A ndash 7)

Reescrevendo (A ndash 7) tem-se que

훼 =[퐴 ] [퐻퐴frasl ]

1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =

훼1 minus 훼

(A ndash 8)

Substituindo (A ndash 8) em (A ndash 6) tem-se que

푝퐾 = log훼

1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10

(A ndash 9)

Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos

훼 =1

1 + 10

(A ndash 10)

Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio

퐴 + 퐻 퐻퐴

(A ndash 11)

Pode se escrever a constante de equiliacutebrio como

퐾 =[퐻퐴 ]

[퐴][퐻 ]

(A ndash 12)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que

46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

log퐾 = minus log[퐴]

[퐻퐴 ] minus log[퐻 ]

(A -13)

Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por

훼 =[퐻퐴 ]

[퐴] + [퐻퐴 ]

(A ndash 14)

Assim a equaccedilatildeo (A ndash 13) fica

훼1 minus 훼 = 10

(A ndash 15)

Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo

훼 =10

1 + 10

(A ndash 16)

Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos

modelos expostos

Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]

48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]

49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)

50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])

51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]

52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])

53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)

54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2

55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO

10 2 Materiais e Meacutetodos

Tabela 2231 ndash Volumes de hidroacutexido de soacutedio a 01 M adicionados no preparo das

soluccedilotildees-tampatildeo

Tampatildeo pH V NaOH mL

NaHCO3 96 100 005 M 98 152

(para cada soluccedilatildeo-tampatildeo 100 mL 100 214

desta soluccedilatildeo foram adicionados) 102 276

104 330 106 382

108 424

110 454

112 530 114 583

Na2HPO4 110 82

005 M 112 126

(para cada soluccedilatildeo-tampatildeo 100 mL 114 182 desta soluccedilatildeo foram adicionados) 116 270

118 388

224 Procedimento experimental

Foram adicionadas quantidades natildeo definidas de lisozima de clara de ovo de galinha

a 13 mL de cada soluccedilatildeo-tampatildeo em tubos Eppendorf de 2 mL Colocaram-se

entatildeo as amostras apoacutes agitaccedilatildeo vigorosa em banho teacutermico a 250 plusmn 01 ordmC por 24

horas para que os sistemas atingissem o equiliacutebrio termodinacircmico Caso natildeo

houvesse a formaccedilatildeo de precipitado lisozima era adicionada e o procedimento

repetido Ao se observar a formaccedilatildeo de precipitado o sistema era centrifugado a

13000 rpm por 15 minutos Uma aliacutequota do sobrenadante era retirada e sua

concentraccedilatildeo proteacuteica determinada por medida de absorbacircncia a 280 nm Cada

sistema foi feito ao menos em duplicata

3 Modelo Estendido de Debye-Huumlckel

31 Introduccedilatildeo

De fato como descrito por Pessocirca Filho (2002) a equaccedilatildeo de Debye-Huumlckel natildeo

deve ser aplicada agrave modelagem de polieletroacutelitos tais como proteiacutenas porque nestas

moleacuteculas as cargas satildeo distribuiacutedas ao longo da cadeia e portanto natildeo satildeo cargas

pontuais como suposto por Debye-Huumlckel

Contudo nesta modelagem considera-se uma regiatildeo de pH em torno do ponto

isoeleacutetrico (pI) na qual satildeo inerentes duas condiccedilotildees favoraacuteveis a aplicaccedilatildeo da

equaccedilatildeo de Debye-Huumlckel carga liacutequida proacutexima a zero pois Z(pI) = 0 e regiatildeo de

miacutenima solubilidade que significa baixas concentraccedilotildees de proteiacutenas em soluccedilatildeo

Isto significa em primeiro lugar que os efeitos da carga tais como ldquodesnovelamentordquo

da cadeia proteacuteica com exposiccedilatildeo de resiacuteduos outrora blindados podem ser

desprezados em uma regiatildeo proacutexima ao ponto isoeleacutetrico e em segundo lugar

baixas concentraccedilotildees de proteiacutena em soluccedilatildeo significam que os termos de curto

alcance podem ser desprezados e portanto haacute prevalecircncia do termo de longo

alcance que no caso de soluccedilotildees eletroliacuteticas pode ser descrito por uma equaccedilatildeo

estendida de Debye-Huumlckel

Assim o modelo de Debye-Huumlckel foi utilizado natildeo para verificar sua aplicabilidade agrave

modelagem de soluccedilotildees proteacuteicas mas sim para confrontar o modelo proposto com

um modelo usual em modelagem de soluccedilotildees eletroliacuteticas e seraacute referido no texto

sempre como abordagem claacutessica

12 3 Modelo Estendido de Debye-Huumlckel

32 Desenvolvimento teoacuterico

Pode-se escrever a atividade da proteiacutena como o produto entre a solubilidade e o

coeficiente de atividade da mesma como mostrado na equaccedilatildeo (32 - 1)

푎 = 훾푠

(32 - 1)

Na qual pode-se calcular o coeficiente de atividade atraveacutes da equaccedilatildeo estendida

de Debye-Huumlckel (Pitzer 1973)

ln 훾 = minus퐴 푍radic퐼

1 + 푏radic퐼+

2푏

ln 1 + 푏radic퐼

(32 - 2)

Sendo que a constante universal empiacuterica b = 12 kg12 mol-12 eacute usada para todos os

eletroacutelitos Jaacute AΦ eacute o paracircmetro de Debye-Huumlckel para o coeficiente osmoacutetico e eacute

dado por

퐴 =13

(2휋푁 휌 ) frasl 푒4휋휀 휀 푘푇

frasl

(32 - 3)

Em que NA eacute a constante de Avogadro ρs eacute a densidade do solvente em g cm-3 e eacute

a carga eletrocircnica (e = 160218 x 10-19 C) ε0 eacute a permissividade do espaccedilo livre (ε0 =

885419 x 10-12 C2 N-1 m-2) εr eacute a constante dieleacutetrica do solvente k aacute constante de

Boltzmann e T eacute a temperatura absoluta Jaacute a carga liacutequida em funccedilatildeo do pH pode

ser calculada como

푍 = 훼 minus 훼

(32 - 4)

Sendo que α+ e α- satildeo dados pelas equaccedilotildees (A - 10) e (A - 16) do Apecircndice A

13 3 Modelo Estendido de Debye-Huumlckel

E a forccedila iocircnica eacute dada pela equaccedilatildeo (32 - 5) descrita abaixo

퐼 = 12

푚 푍

(32 - 5)

Contudo no ponto isoeleacutetrico a carga meacutedia da proteiacutena eacute nula portanto o termo de

Debye-Huumlckel se anula e o coeficiente de atividade se torna unitaacuterio

ln푎 (푝퐼) = ln 푠 (푝퐼)

(32 - 6)

Considerando que a atividade da proteiacutena seja constante com a variaccedilatildeo de pH isto

implica que esta eacute sempre igual agrave solubilidade da proteiacutena no ponto isoeleacutetrico e

portanto vale que

ln푎 (푝퐻) = ln 푠 (푝퐻) + ln 훾(푝퐻) = ln 푠 (푝퐼)

(32 - 7)

Assim

ln 푠 (푝퐻) = ln 푠 (푝퐼) + 퐴휙푍푝퐻2 radic퐼1 + 푏radic퐼

+2푏

ln 1 + 푏radic퐼

(32 - 8)

Esta equaccedilatildeo prevecirc a curva de solubilidade em funccedilatildeo do pH atraveacutes do caacutelculo da

atividade da proteiacutena na fase liacutequida pela equaccedilatildeo estendida de Debye-Huumlckel Para

resolvecirc-la eacute necessaacuterio se utilizar de um meacutetodo numeacuterico pois a forccedila iocircnica

depende da solubilidade naquele pH Optou-se neste trabalho pelo Meacutetodo de

Newton-Raphson para executar o meacutetodo iterativo que eacute exigido pela equaccedilatildeo (32

ndash 8) Para aplicar este meacutetodo arbitrou-se uma funccedilatildeo f(sp) definida aqui como

푓 푠 = minus ln 푠 (푝퐻) + ln 푠 (푝퐼) + 퐴휙푍푝퐻2 radic퐼

1 + 푏radic퐼+

2푏

ln 1 + 푏radic퐼

(32 - 9)

14 3 Modelo Estendido de Debye-Huumlckel

Assim ao calcular o sp que zera esta funccedilatildeo f(sp) saber-se-aacute que eacute a proacutepria

solubilidade que se deseja calcular Para aplicar o Meacutetodo de Newton-Raphson

basta derivar a funccedilatildeo f(sp) e aplicar o seguinte algoritmo de resoluccedilatildeo

푠 = 푠 minus푓(푠 )푓 (푠 )

(32 - 10)

Para calcular frsquo(s) deve-se considerar que a forccedila iocircnica depende da solubilidade

Para isto observando a equaccedilatildeo (32 - 5) vecirc-se que a forccedila iocircnica eacute dada pelo

somatoacuterio das contribuiccedilotildees de todos os iacuteons presentes na soluccedilatildeo por isso aqui

cabe um artifiacutecio de dividir estas contribuiccedilotildees em duas macro-contribuiccedilotildees aquela

devida a todos os iacuteons presentes na soluccedilatildeo exclusive os grupos ionizaacuteveis

presentes nas moleacuteculas da proteiacutena em questatildeo (I0) e que se considera constante

com o pH e aquela que engloba apenas os grupos ionizaacuteveis presentes nas

moleacuteculas da proteiacutena (IP)

퐼 = 퐼 + 퐼 = 퐼 +12푍 푠

(32 - 11)

Considerando a funccedilatildeo w tal que

푤 = radic퐼 = 퐼 +12푍 푠

(32 - 12)

Sendo

푤 =14푍 퐼

(32 - 13)

Entatildeo aplicando-se as devidas regras de derivaccedilatildeo tem-se

15 3 Modelo Estendido de Debye-Huumlckel

푓 (푠 ) = minus1푠 + 퐴 푍

3푤 + 2푤 푏푤(1 + 푏푤)

(32 - 14)

Substituindo as equaccedilotildees (32 - 12) e (32 - 13) na equaccedilatildeo (32 - 14) tem-se que

푓 (푠 ) = minus1푠 + 퐴 푍

15 + 푏radic퐼2radic퐼(1 + 푏radic퐼)

(32 - 15)

Entatildeo o algoritmo deve ser

푠 = 푠 minus

⎜⎛ln 푠 (푝퐼)

푠 + 퐴휙푍푝퐻2 radic퐼

1 + 푏radic퐼+ 2푏 ln 1 + 푏radic퐼

minus 1푠 + 퐴휙푍

15 + 푏radic퐼2radic퐼(1 + 푏radic퐼) ⎠

⎟⎞

(32 - 16)

4 Modelagem Termodinacircmica Proposta

41 Introduccedilatildeo

A condiccedilatildeo de equiliacutebrio entre duas fases (α e β) com m componentes eacute dada por

(Prausnitz et al 1999)

푝 = 푝

(41 ndash 1)

푇 = 푇

(41 ndash 2)

휇 = 휇⋮

휇 = 휇

(41 ndash 3)

Considerando o equiliacutebrio soacutelido-liacutequido (ESL) de sistemas contendo proteiacutenas

sendo que os efeitos da pressatildeo podem ser desprezados que as temperaturas nas

duas fases satildeo iguais e que na fase soacutelida soacute haacute proteiacutena tem-se que para a

proteiacutena a relaccedilatildeo de equiliacutebrio pode ser descrita por

휇 (푇푥) = 휇 (푇)

(41 ndash 4)

Contudo adotando-se a lei de Henry que eacute vaacutelida para baixas concentraccedilotildees de

soluto hipoacutetese que natildeo eacute distante dos valores observados da solubilidade de

proteiacutenas pode se escrever o potencial quiacutemico na fase liacutequida por

휇 (푇푥) = 휇 (푇 푥 ) + 푅푇푙푛푥

(41 ndash 5)

17 4 Modelagem Termodinacircmica Proposta

Entretanto variaccedilotildees de pH natildeo alteram o potencial quiacutemico da fase soacutelida o que

resulta pela relaccedilatildeo (41 ndash 4) que o mesmo natildeo altera tambeacutem o potencial quiacutemico

da fase liacutequida Com isso pela relaccedilatildeo (41 ndash 5) sendo o potencial quiacutemico de

referecircncia constante com o pH uma contradiccedilatildeo emerge a variaccedilatildeo do pH natildeo

poderia alterar o valor da solubilidade poreacutem a observaccedilatildeo experimental mostra o

contraacuterio Assim deve-se lembrar que pelo princiacutepio da eletroneutralidade a fase

soacutelida soacute possui moleacuteculas proteacuteicas eletricamente neutras e portanto o equiliacutebrio

de fases deve se estabelecer apenas entre as moleacuteculas presentes na fase soacutelida e

as moleacuteculas eletricamente neutras em soluccedilatildeo Ou seja como soacute moleacuteculas

eletricamente neutras podem estar na fase soacutelida o equiliacutebrio de fases depende

exclusivamente da fraccedilatildeo de moleacuteculas eletricamente neutras em soluccedilatildeo pois soacute

estas podem precipitar Assim tanto a equaccedilatildeo (41 ndash 4) quanto a equaccedilatildeo (41 ndash

5) devem ser aplicadas natildeo ao conjunto de todas as moleacuteculas de proteiacutena em

soluccedilatildeo mas somente as moleacuteculas proteacuteicas eletricamente neutras Portanto a

concentraccedilatildeo das moleacuteculas de proteiacutena eletricamente neutras em soluccedilatildeo eacute

constante com o pH e pode ser interpretada como a multiplicaccedilatildeo da fraccedilatildeo de

moleacuteculas eletricamente neutras pela concentraccedilatildeo total de proteiacutenas que eacute a

proacutepria solubilidade Assim uma relaccedilatildeo de inversa proporcionalidade eacute definida

quanto maior a fraccedilatildeo de moleacuteculas neutras menor seraacute a solubilidade de uma

proteiacutena em soluccedilatildeo Portanto no ponto isoeleacutetrico no qual haacute o miacutenimo de

solubilidade tem-se o ponto maacuteximo de fraccedilatildeo de moleacuteculas eletricamente neutras

A partir disto eacute possiacutevel escrever a equaccedilatildeo que rege o comportamento da

solubilidade de uma proteiacutena em funccedilatildeo do pH da soluccedilatildeo

휙(푝퐻)푆 (푝퐻) = 휆 = 푐표푛푠푡푎푛푡푒

(41 ndash 6)

18 4 Modelagem Termodinacircmica Proposta

Na equaccedilatildeo (41 ndash 6) o paracircmetro λ pode ser um paracircmetro de ajuste do modelo a

um conjunto de valores experimentais tendo se estabelecido uma funccedilatildeo objetivo ou

ainda dado pelo produto entre a solubilidade no ponto isoeleacutetrico e a fraccedilatildeo de

moleacuteculas eletricamente neutras em soluccedilatildeo tambeacutem no pI neste caso vale a

seguinte equaccedilatildeo

푠 (푝퐻) =휙(푝퐼)푠 (푝퐼)휙(푝퐻)

(41 ndash 7)

Sendo a equaccedilatildeo do modelo ndash equaccedilatildeo (41 ndash 7) ndash extremamente simples a uacutenica

dificuldade reside no caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras

(휙(푝퐻))

42 Caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras

Dentre os aminoaacutecidos que formam atraveacutes de ligaccedilotildees peptiacutedicas as proteiacutenas haacute

aqueles que possuem resiacuteduos com grupos ionizaacuteveis aleacutem dos grupos amina e

aacutecido carboxiacutelico terminais na cadeia Todos estes participam de equiliacutebrios

quiacutemicos com iacuteons H+ presentes na soluccedilatildeo entatildeo ao se alterar o pH da soluccedilatildeo

estes equiliacutebrios satildeo alterados

Assim haacute vaacuterias possibilidades de combinaccedilotildees de estados ionizados destes grupos

ionizaacuteveis que resultam em uma moleacutecula de proteiacutena eletricamente neutra Eacute

importante notar que dada a fraccedilatildeo de uma configuraccedilatildeo de uma moleacutecula neutra

todas as outras fraccedilotildees de configuraccedilotildees possiacuteveis que tambeacutem resultem em

moleacuteculas neutras satildeo proporcionais agrave fraccedilatildeo da configuraccedilatildeo dada pois todas as

configuraccedilotildees participam de equiliacutebrios entre si

19 4 Modelagem Termodinacircmica Proposta

Desta observaccedilatildeo implica-se que basta identificar uma configuraccedilatildeo proteacuteica cuja

soma dos estados ionizados resulte em carga nula para se descrever o equiliacutebrio de

fases em relaccedilatildeo ao pH na regiatildeo do ponto isoeleacutetrico onde esta consideraccedilatildeo eacute

predominante em relaccedilatildeo a outros possiacuteveis fenocircmenos

Contudo eacute necessaacuterio contabilizar a contribuiccedilatildeo de cada grupo ionizaacutevel via

equaccedilatildeo de Henderson-Hasselbach equaccedilatildeo (42 ndash 1)

훼 (푝퐻) =

⎩⎪⎨

⎪⎧ 10

1 + 10 푠푒 휈 = minus1

11 + 10

푠푒 휈 = +1

(42 ndash 1)

Na qual pKAj eacute o co-logaritmo da constante de equiliacutebrio do grupo ionizaacutevel do

resiacuteduo j j eacute estado carregado potencial do resiacuteduo j (-1 para grupos aacutecidos e +1

para grupos baacutesicos) e j eacute a fraccedilatildeo ionizada para o pH dado Para grupos cujo

estado de ionizaccedilatildeo na dada configuraccedilatildeo seja neutro a sua fraccedilatildeo eacute calculada tal

que a soma de sua fraccedilatildeo e da fraccedilatildeo ionizada tenha como resultado o valor

unitaacuterio

Assim a funccedilatildeo Pn pode ser escrita como o produto de cada fraccedilatildeo de cada grupo

ionizaacutevel j naquele estado (-1 0 ou +1) na configuraccedilatildeo neutra k em uma proteiacutena

com n grupos ionizaacuteveis Uma representaccedilatildeo matemaacutetica possiacutevel para esta funccedilatildeo

pode ser escrita como

휙 (푝퐻) = 훼 (푝퐻)

(42 ndash 2)

Na qual a fraccedilatildeo jrsquo(pH) eacute dada por

20 4 Modelagem Termodinacircmica Proposta

훼 (푝퐻) =훼 (푝퐻) 푠푒 휀 = 11 minus 훼 (푝퐻) 푠푒 휀 = 0

(42 ndash 3)

Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (42 ndash 3) e a resultante na equaccedilatildeo

(42 ndash 2) pode-se escrever que

휙 (푝퐻) =1

1 + 10

1 + 휈2 minus 휈 휀 10

minus휈 minus 1

2 minus 휈 휀 푐표푚 휀 = 0

(42 ndash 4)

A equaccedilatildeo (42 ndash 4) junto agrave equaccedilatildeo (41 ndash 7) constituem o modelo termodinacircmico

capaz de predizer a razatildeo entre as fraccedilotildees de moleacuteculas neutras de uma proteiacutena

em funccedilatildeo do pH na regiatildeo do ponto isoeleacutetrico mantendo fixas temperatura e forccedila

iocircnica Substituindo a equaccedilatildeo (42 ndash 4) na equaccedilatildeo (41 ndash 7) obteacutem-se para a

curva de solubilidade

푠 (푝퐻)푠 (푝퐼) =

1 + 101 + 10

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

푐표푚 휀 = 0

(42 ndash 8)

5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

51 Introduccedilatildeo

Segundo Groumlnwall (1941) na fase liacutequida haacute moleacuteculas de proteiacutenas com muitas

configuraccedilotildees k distintas que possuem carga liacutequida i e tambeacutem haacute certas

configuraccedilotildees que tem carga liacutequida nula e satildeo chamadas configuraccedilotildees neutras

Aleacutem disso estas uacuteltimas satildeo aquelas que determinam o equiliacutebrio de fases jaacute que

elas estatildeo em equiliacutebrio com a fase soacutelida na qual soacute haacute moleacuteculas neutras pelo

princiacutepio da eletroneutralidade Eacute tambeacutem afirmado que dado este equiliacutebrio a

atividade das moleacuteculas neutras natildeo se altera com a variaccedilatildeo do pH e eacute

proporcional agraves atividades de qualquer tipo de configuraccedilatildeo neutra

Neste mesmo trabalho eacute atribuiacuteda a Linderstroslashm-Lang o desenvolvimento de uma

teoria de prediccedilatildeo da solubilidade de proteiacutenas com a variaccedilatildeo do pH na regiatildeo do

ponto isoeleacutetrico Este desenvolvimento apresenta um balanccedilo de cargas de um

modo impliacutecito contudo como atestado por Groumlnwall o escasso conhecimento

sobre as estruturas proteacuteicas impediram agravequele tempo uma formulaccedilatildeo mais

pormenorizada do problema

52 Desenvolvimento teoacuterico

A base desta abordagem descrita por Groumlnwall e atribuiacuteda a Linderstroslashm-Lang

reside na hipoacutetese de que a moleacutecula de proteiacutena de configuraccedilatildeo k e carga nula

participa do seguinte equiliacutebrio com os iacuteons H+ e com sua forma de carga i

22 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

푃 + 푖퐻 푃 lowast

(52 ndash 1)

Note-se que o valor de i pode ser negativo A constante do equiliacutebrio quiacutemico

descrita pela equaccedilatildeo (52 ndash 1) pode ser expressa como

퐾 =푎

lowast

푎 푎

(52 ndash 2)

Sabendo que a atividade da moleacutecula de proteiacutena de configuraccedilatildeo k e carga i eacute dada

pelo produto entre sua concentraccedilatildeo e seu coeficiente de atividade tem-se que

푥lowast

= 푎 푎퐾훾

lowast

(52 ndash 3)

Entretanto a solubilidade da proteiacutena eacute soma das concentraccedilotildees de todas as

moleacuteculas de carga i Poreacutem a concentraccedilatildeo das moleacuteculas de carga i eacute a soma das

concentraccedilotildees das moleacuteculas de configuraccedilatildeo k Assim a solubilidade pode ser

escrita como

푠 (푝퐻) = 푎 푎퐾훾

lowast

(52 ndash 4)

Derivando a equaccedilatildeo (52 ndash 4) com respeito agrave atividade do iacuteon H+ considerando

que atividade da moleacutecula neutra eacute constante para qualquer configuraccedilatildeo k e ainda

que o coeficiente de atividade da proteiacutena de carga i independe da atividade do iacuteon

H+ tem-se que

푑푠푑푎 = 푖 ∙ 푎 푎

퐾훾

lowast

(52 ndash 5)

23 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

Sendo

푑 log 푠 (푝퐻)푑(푝퐻) = minus

푎푠 (푝퐻)

푑푠푑푎

(52 ndash 6)

Substituindo as equaccedilotildees (52 ndash 4) e (52 ndash 5) na equaccedilatildeo (52 ndash 6) e

reescrevendo em termos de pH e das concentraccedilotildees das proteiacutenas de carga i tem-

se que

푑 log 푠푑(푝퐻) = minus

sum (푖 ∙ 푥 )sum 푥

(52 ndash 7)

Contudo o termo do lado direito da equaccedilatildeo (52 ndash 7) estaacute associado ao conceito

de valecircncia meacutedia estabelecido por Linderstroslashm-Lang (1924)

횤 =sum (푖 ∙ 푥 )sum 푥

(52 ndash 8)

Os autores natildeo possuiacuteam um modo mais adequado de construir a curva de

solubilidade dada pela equaccedilatildeo (52 ndash 7) do que aproximar por uma funccedilatildeo linear o

perfil de carga liacutequida da proteiacutena obtido experimentalmente e integraacute-lo valendo-se

da analogia entre o conceito de carga liacutequida (Z) e de valecircncia meacutedia ( i ) Entretanto

hoje jaacute se tem uma descriccedilatildeo analiacutetica do perfil de carga liacutequida de proteiacutenas que

pode ser escrita como

푍(푝퐻) = 휈 훼

(52 ndash 9)

Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (52 ndash 9) e a resultante na equaccedilatildeo

(52 ndash 7) tem-se que

24 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

푑 log 푠푑(푝퐻) = minus

12

11 + 10

1 + 휈 + 휈 1 minus 휈 10

(52 ndash 10)

Integrando a equaccedilatildeo (52 ndash 10) de um ponto de referecircncia por exemplo do ponto

isoeleacutetrico (pI) ateacute um pH qualquer tem-se a seguinte relaccedilatildeo

푑 log 푠

( )

( )

= minus12

1

1 + 101 + 휈 + 휈 1 minus 휈 10 푑(푝퐻)

(52 ndash 11)

log푠 (푝퐻)푠 (푝퐼) = minus

12 1 + 휈

11 + 10

푑(푝퐻)

+ 휈 1 minus 휈10

1 + 10푑(푝퐻)

(52 ndash 12)

Fazendo a seguinte substituiccedilatildeo

푢 = 10 푡푎푙 푞푢푒 푑푢푢 = ln 10푑(푝퐻)

(52 ndash 13)

Tem-se que

log푠 (푝퐻)푠 (푝퐼) = minus

12

1 + 휈ln 10

1푢(1 + 푢) 푑푢 +

휈 1 minus 휈ln 10

1(1 + 푢) 푑푢

(52 ndash 14)

log푠 (푝퐻)푠 (푝퐼) = minus

12

1 + 휈ln 10

1푢 푑푢 minus

11 + 푢 푑푢 +

휈 1 minus 휈ln 10

1(1 + 푢) 푑푢

(52 ndash 15)

25 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐼) = minus

12 1 + 휈 log

1010

minus 휈 1 minus 휈 minus 1 + 휈 log1 + 101 + 10

(52 ndash 16)

Sendo

휈 1 minus 휈 minus 1 + 휈 = 휈 minus 휈 minus 1 minus 휈 = minus 1 + 휈 = minus2

(52 ndash 17)

Resultando em

log푠 (푝퐻)푠 (푝퐼) = log

1 + 101 + 10

minus1 + 휈

2 (푝퐻 minus 푝퐼)

(52 ndash 18)

Ainda eacute possiacutevel reescrever a equaccedilatildeo (52 ndash 18) como

log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log

1 + 101 + 10

(52 ndash 19)

Na qual n+ representa o nuacutemero de resiacuteduos ionizaacuteveis que na sua forma carregada

apresentam carga positiva A equaccedilatildeo (52 ndash 19) eacute uma expressatildeo analiacutetica que a

partir de dados da estrutura proteacuteica e de um dado de solubilidade permite predizer

a curva de solubilidade de uma dada proteiacutena em funccedilatildeo do pH na regiatildeo do ponto

isoeleacutetrico mantendo fixas a temperatura e a forccedila iocircnica do sistema

Eacute possiacutevel provar que as equaccedilotildees (42 ndash 8) e (52 ndash 19) satildeo idecircnticas - a prova

disso eacute descrita na seccedilatildeo 6 ndash e assim tem-se que apesar das distintas abordagens

a descriccedilatildeo do fenocircmeno eacute a mesma Note-se que um passo fundamental no

desenvolvimento da Equaccedilatildeo (52 ndash 5) eacute admitir que por hipoacutetese a atividade da

26 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

forma neutra natildeo depende do pH essa hipoacutetese tambeacutem eacute a base da equaccedilatildeo (41

ndash 7) Deve-se registrar o fato de que pelo melhor do nosso conhecimento esta eacute a

primeira vez que uma expressatildeo analiacutetica para o caacutelculo da solubilidade de

proteiacutenas em funccedilatildeo do pH eacute descrita mesmo no limite em que se considera vaacutelida

a lei de Henry

53 Soluccedilatildeo Paraboacutelica da Curva de Solubilidade

Tanto Groumlnwall (1941) quanto Fredericq e Neurath (1950) adotaram a hipoacutetese de

que os perfis de carga liacutequida da -lactoglobulina para um e da insulina para os

outros dois eram lineares na regiatildeo do ponto isoeleacutetrico Esta hipoacutetese eacute bastante

plausiacutevel e simplificadora principalmente a eacutepoca na qual estes trabalhos foram

desenvolvidos em que a estrutura proteacuteica bem como as constantes de ionizaccedilatildeo

dos resiacuteduos com grupos ionizaacuteveis era pouco conhecida De fato ainda hoje a falta

de dados das constantes de ionizaccedilatildeo na cadeia proteacuteica eacute o maior desafio no uso

do modelo rigoroso ndash equaccedilatildeo (52 ndash 18) Por isso o valor desta hipoacutetese de perfil

de carga liacutequida linear eacute notaacutevel

Supondo entatildeo que o perfil de carga seja linear eacute possiacutevel escrevecirc-lo como

푍(푝퐻) = minus퐴(푝퐻 minus 푝퐼) 푐표푚 퐴 gt 0

(53 ndash 1)

Substituindo (53 ndash 1) em (52 ndash 6)

푑 log 푠 (푝퐻)푑(푝퐻) = 퐴(푝퐻 minus 푝퐼)

(53 ndash 2)

Integrando (53 ndash 2) de um pH0 de referecircncia ateacute pH tem-se que

27 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐻 ) = 퐾[푝퐻 minus 2푝퐼(푝퐻 minus 푝퐻 ) minus 푝퐻 ] 푐표푚 퐾 =

퐴2

(53 ndash 3)

Ao se adotar como ponto de referecircncia o ponto isoeleacutetrico a equaccedilatildeo (53 ndash 3)

reduz-se agrave

log푠 (푝퐻)푠 (푝퐼) = 퐾(푝퐻 minus 푝퐼)

(53 ndash 4)

Contudo apesar da soluccedilatildeo quadraacutetica ou paraboacutelica para a equaccedilatildeo estendida de

Linderstroslashm-lang e Groumlnwall expressa na equaccedilatildeo (53 ndash 3) natildeo requerer os dados

das constantes de ionizaccedilatildeo dos resiacuteduos com grupos ionizaacuteveis ela exige a

definiccedilatildeo do paracircmetro A que fisicamente representa a inclinaccedilatildeo da reta de

aproximaccedilatildeo da curva de carga liacutequida e que pode ser calculado por correlaccedilatildeo a

partir de um conjunto de dados experimentais de solubilidade ou de carga liacutequida

6 Identidade entre o Modelo Proposto e a Equaccedilatildeo

Estendida de Linderstroslashm-Lang e Groumlnwall

A equaccedilatildeo final da modelagem termodinacircmica proposta apresentada na seccedilatildeo 4 eacute a

equaccedilatildeo (42 ndash 8) dada por

푠 (푝퐻)푠 (푝퐼) =

1 + 101 + 10

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 1)

Aplicando-se o logaritmo decimal nos dois termos da equaccedilatildeo (6 ndash 1) tem-se que

log푠 (푝퐻)푠 (푝퐼) = log

1 + 101 + 10

+ log

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 2)

Pelo bem da simplificaccedilatildeo desta deduccedilatildeo adotar-se-atildeo as seguintes funccedilotildees

휂 (푝퐻) = log

(6 ndash 3)

휃 (푝퐻) = log

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 4)

Assim pode-se reescrever a equaccedilatildeo (6 ndash 2) por

29 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐼) = 휂 (푝퐻) + 휃 (푝퐻)

(6 ndash 5)

Observando-se a equaccedilatildeo (6 ndash 5) tem-se que a funccedilatildeo j independe do estado de

ionizaccedilatildeo do resiacuteduo j poreacutem a funccedilatildeo jk depende Por isso deve-se analisar esta

funccedilatildeo para cada estado de ionizaccedilatildeo possiacutevel como mostrado na Tabela 61

Tabela 6 1 ndash Anaacutelise da funccedilatildeo jk para cada estado de ionizaccedilatildeo possiacutevel

j jk jk Quantidade de resiacuteduos neste estado

-1 -1 푝퐼 minus 푝퐻 na

0 0 nb

+1 +1 0 nc

0 푝퐼 minus 푝퐻 nd

Pela anaacutelise da Tabela 61 e considerando uma proteiacutena com n resiacuteduos com

grupos ionizaacuteveis infere-se que a equaccedilatildeo (6 ndash 5) pode ser reescrita como

log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)

(6 ndash 6)

Contudo as equaccedilotildees acima descritas satildeo vaacutelidas apenas para configuraccedilotildees

neutras pois apenas as configuraccedilotildees neutras da fase liacutequida estatildeo em equiliacutebrio

com as moleacuteculas de proteiacutena da fase soacutelida Para que uma configuraccedilatildeo seja

neutra vale a seguinte restriccedilatildeo

휀 = 0 hArr 푛 = 푛

(6 ndash 7)

30 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall

Substituindo a restriccedilatildeo dada pela equaccedilatildeo (6 ndash 7) na equaccedilatildeo (6 ndash 6) tem-se que

log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)

(6 ndash 8)

Ora mas a soma de nc e de nd natildeo resulta em outra coisa senatildeo no nuacutemero de

resiacuteduos com grupos ionizaacuteveis da estrutura proteacuteica cujo j seja +1 Assim

substituindo nc mais nd por n+ e substituindo a equaccedilatildeo (6 ndash 3) na equaccedilatildeo (6 ndash 8)

tem-se que

log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log

1 + 101 + 10

(6 ndash 9)

Ao se analisar a equaccedilatildeo (6 ndash 9) observa-se que ela eacute idecircntica a equaccedilatildeo estendida

de Linderstroslashm-Lang e Groumlnwall apresentada pela equaccedilatildeo (52 ndash 19) Com isso

tem-se que apesar das distintas formulaccedilotildees tanto a modelagem termodinacircmica aqui

proposta quanto a extensatildeo a teoria de Linderstroslashm-Lang e Groumlnwall resultam na

mesma descriccedilatildeo do fenocircmeno Aleacutem disso a equaccedilatildeo final dos modelos eacute

extremamente simples e depende apenas de um ponto de referecircncia e dos dados da

estrutura da moleacutecula de proteiacutena cuja solubilidade se deseja estudar

7 Aplicaccedilatildeo dos Modelos Expostos

Para validar o modelo comparando-o com o caacutelculo feito a partir da teoria de Debye-

Huumlckel o criteacuterio que relaciona os pontos calculados pelo modelo com os pontos

experimentais foi estabelecido a partir da seguinte funccedilatildeo objetivo (FO)

퐹푂 =1푁

푠 minus 푠푠

(7 ndash 1)

Contudo a equaccedilatildeo (7 ndash 1) natildeo eacute a melhor definiccedilatildeo de funccedilatildeo objetivo neste caso

pois a derivada da curva de solubilidade eacute razoavelmente grande nos dois lados do

ponto isoeleacutetrico e isso permite que pequenos desvios na direccedilatildeo horizontal

resultem em um grande aumento no valor da funccedilatildeo objetivo Uma soluccedilatildeo possiacutevel

seria substituir essa funccedilatildeo objetivo por uma funccedilatildeo definida pela soma do quadrado

da distacircncia do ponto experimental agrave curva do modelo principalmente se fosse

necessaacuterio calcular algum paracircmetro do modelo via otimizaccedilatildeo da funccedilatildeo objetivo

estipulada Natildeo sendo este o escopo deste trabalho optou-se pelo uso da FO

definida na equaccedilatildeo (7 ndash 1)

71 Solubilidade da Insulina Suiacutena

As Figuras 711 712 e 713 apresentam os graacuteficos da curva de solubilidade

dada pelos pontos experimentais pelo modelo proposto pela abordagem claacutessica e

tambeacutem a curva obtida pela soluccedilatildeo paraboacutelica da Equaccedilatildeo de Linderstroslashm-Lang e

Groumlnwall em trecircs temperaturas distintas

32 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 711 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 25 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

Figura 712 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 15 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

00

40

80

120

160

200

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

00

50

100

150

200

250

300

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

33 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 713 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 5 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

Os desvios da curva obtida pelo modelo proposto para valores de pH distantes do pI

podem ser explicados por ao menos trecircs importantes motivos dois devidos a

hipoacuteteses do modelo e um devido a fenocircmenos intriacutensecos a proteiacutena Sabendo que

no pI a solubilidade eacute miacutenima para valores de pH distantes do pI pode-se ter

solubilidades suficientemente grandes para que a validade da lei de Henry ndash adotada

na formulaccedilatildeo do modelo - seja questionada pois quanto mais distante do pI maior

a solubilidade e menor a validade da lei de Henry jaacute que haacute um aumento da

concentraccedilatildeo do soluto (proteiacutena) na soluccedilatildeo e tambeacutem ao fato do modelo prever

solubilidade infinita quando a fraccedilatildeo de moleacuteculas eletricamente neutras tende a

zero

limrarr푠 = lim

rarr

Φ(푝퐼)푠 (푝퐼)Φ(푝퐻) = +infin

(711 ndash 1)

00

50

100

150

200

250

300

350

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

34 7 Aplicaccedilatildeo dos Modelos Expostos

Todavia ainda haacute um fator de ordem natural que justifica o desvio apresentado para

valores de pH distantes do pI o desnovelamento da cadeia proteacuteica Este fenocircmeno

pode ocorrer de maneira a expor grupos hidroacutefobos resiacuteduos antes natildeo expostos

acrescentando relaccedilotildees de equiliacutebrio quiacutemico natildeo existentes na regiatildeo do pI

alterando o equiliacutebrio de fases e portanto alterando o valor da solubilidade

A Tabela 711 apresenta os valores obtidos para a funccedilatildeo objetivo definida em (7 ndash

1) tanto para o modelo proposto quanto para a abordagem claacutessica para trecircs

diferentes temperaturas

Tabela 711 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada

abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para insulina

suiacutena

T ordmC Abordagem FO

25 P 01857 C 02535

15 P 01981 C 05056

5 P 03595 C 03064

Observando-se a Tabela 711 vecirc-se que o modelo apresentou melhores resultados

do que o caacutelculo efetuado atraveacutes da abordagem claacutessica no que tange a

minimizaccedilatildeo da funccedilatildeo objetivo exceto para os dados a 5 ordmC

Tambeacutem eacute possiacutevel observar que a funccedilatildeo objetivo sofreu aumento com a

diminuiccedilatildeo da temperatura Isto ocorreu principalmente devido agrave dificuldade de

obter dados experimentais de solubilidade a temperaturas baixas o que aumenta o

desvio experimental fazendo com que se tenha um aumento do valor da funccedilatildeo

objetivo como a definida em (5 ndash 1) Um efeito secundaacuterio que tambeacutem pressiona a

35 7 Aplicaccedilatildeo dos Modelos Expostos

funccedilatildeo objetivo eacute o fato dos dados de pKA terem sido obtidos a uma temperatura

especiacutefica o que tende a acrescentar erro no caacutelculo de solubilidades a temperaturas

diferentes ainda que o pKA natildeo varie de forma ab-rupta com a temperatura

Outra observaccedilatildeo que deve ser registrada eacute o fato da funccedilatildeo objetivo para a

abordagem claacutessica na temperatura de 15 ordmC divergir a um valor tatildeo elevado em

relaccedilatildeo aos demais Isto se deve a um ponto experimental especiacutefico a um pH de

45 a solubilidade da insulina suiacutena obtida experimentalmente eacute 230 x 10-5 mol kg-1

enquanto a calculada pelo modelo proposto eacute 230 x 10-5 mol kg-1 e a calculada pela

abordagem claacutessica eacute 520 x 10-5 mol kg-1 Por conta do desvio deste ponto a funccedilatildeo

objetivo para a abordagem claacutessica nesta temperatura tem um aumento significativo

A Tabela 712 apresenta os valores do paracircmetro K da soluccedilatildeo paraboacutelica obtidos

neste trabalho para a insulina suiacutena comparados ao encontrado na literatura

Tabela 712 ndash Valores do paracircmetro K da soluccedilatildeo paraboacutelica para a insulina suiacutena

Referecircncias T ordmC K Fredericq e Neurath (1950) - 081 Neste trabalho 25 104 Neste trabalho 15 101 Neste trabalho 5 145

Pela Tabela 712 pode-se observar que haacute uma diferenccedila pequena entre os

valores do paracircmetro K obtidos neste trabalho e por Fredericq e Neurath (1950) Por

isso natildeo se pode afirmar a que se deve esta diferenccedila se eacute devido a diferenccedilas entre

procedimentos experimentais ou se eacute devido agrave diferenccedila de meacutetodo de caacutelculo do

paracircmetro Apesar de no experimento realizado por Fredericq e Neurath (1950)

haver a presenccedila do acircnion tiocianato e este acircnion interagir com grupos ionizaacuteveis

da cadeia proteacuteica como observado pelos autores do trabalho tambeacutem estes

36 7 Aplicaccedilatildeo dos Modelos Expostos

proacuteprios autores afirmam que a presenccedila deste acircnion natildeo altera a forma da curva

que eacute basicamente determinada pelo paracircmetro K De qualquer modo eacute interessante

observar a proximidade dos valores encontrados neste trabalho com o obtido por

Fredericq e Neurath (1950) pelo menos no que diz respeito agrave ordem de grandeza do

paracircmetro em questatildeo

72 Solubilidade da Lisozima de clara de ovo de galinha

Um modelo para ser validado necessita correlacionar dados experimentais de modo

satisfatoacuterio ou seja um modelo deve buscar fidelidade ao fenocircmeno fiacutesico

observado Assim na procura de dados de solubilidade de proteiacutenas poucos dados

na regiatildeo do pI foram encontrados Este eacute o caso da lisozima de clara de ovo de

galinha que apesar de ter muitos estudos de solubilidade nenhum deles se

encontra na regiatildeo do pI Surgiu assim a necessidade de se obter estes dados

experimentais para poder validar o modelo proposto A escolha da lisozima de clara

de ovo de galinha se deu em parte pela sua importacircncia mas tambeacutem em parte por

ter os valores de pKA conhecidos

A curva de solubilidade da lisozima de clara de ovo de galinha levantada neste

trabalho estaacute apresentada na Figura 721

37 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em

soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e

dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()

Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento

esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH

isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de

soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se

comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto

isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da

soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos

ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente

neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a

solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e

00

10

20

30

40

50

60

70

80

90

100

95 100 105 110 115 120

Solu

bilid

ade

(mg

mL)

pH

38 7 Aplicaccedilatildeo dos Modelos Expostos

alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado

em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo

Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo

a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo

Por conta de falta de dados a este respeito modelou-se apenas a curva de

solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura

722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de

galinha em funccedilatildeo do pH da soluccedilatildeo

Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)

00

10

20

30

40

50

60

70

80

90

96 99 102 105 108 111 114 117 120

Solu

bilid

ade

(mg

mL)

pH

39 7 Aplicaccedilatildeo dos Modelos Expostos

O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721

Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada

abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima

de clara de ovo de galinha

T ordmC Abordagem FO

25 P 4650 C gt7919a

a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado

Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta

aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a

abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca

de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos

anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao

efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de

clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a

variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A

proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de

cargas pontuais de Debye-Huumlckel

8 Conclusotildees

A modelagem termodinacircmica proposta neste trabalho apresentou expressivos

resultados quando comparada a abordagem claacutessica de Debye-Huumlckel

Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o

modelo aproximou melhor os pontos experimentais do que a referida abordagem

comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima

ao ponto isoeleacutetrico

Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica

para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua

construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo

lugar por sua aplicabilidade

Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis

da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva

em regiotildees distantes do ponto isoeleacutetrico

9 Referecircncias Bibliograacuteficas

BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene

Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects

Biophys J 95 1285-1294 2008

FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and

other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72

2684 - 26911950

GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v

93 p 517-542 1931

GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab

Carlsberg v 24 p 185-200 1941

KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native

and mutant insulins pK perturbation of B13-Glu in aggregated species Arch

Biochem Biophys v 283 p 496-502 1990

KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for

the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng

Chem Res v 35 p 4319-4327 1996

42 9 Referecircncias Bibliograacuteficas

KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen

lysozyme J Biochem v 87 p 1215-1219 1980

LADISCH M R Bioseparations Engineering principles practice and

economics John Wiley amp Sons 2001 pp1 116 ndash 117 133

LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab

Carlsberg v 15 p 1-29 1924

PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da

particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas

2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP

PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the

excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte

solutions Fluid Phase Equilib v 269 p 25ndash35 2008

PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-

contribution model involving phase and chemical equilibrium Ind Eng Chem Res

v 33 p 1341-1347 1994

PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277

1973

PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino

acids Fluid Phase Equilib v 152 p 121-132 1998

43 9 Referecircncias Bibliograacuteficas

PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular

Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999

SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of

equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte

solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009

TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J

R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with

carbon dioxide Biotech Bioeng v103 p 909-919 2009

TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer

free energy Biophys J v 95 p 2601-2609 2008

TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in

water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95

2009

Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na

cadeia proteacuteica

Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo

de ionizaccedilatildeo

퐻퐴 퐴 + 퐻

(A ndash 1)

Assim considerando que a constante de equiliacutebrio

퐾 = 푎

(A ndash 2)

Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que

퐾 =[퐴 ][퐻 ]

[퐻퐴]

(A ndash 3)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que

log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]

(A ndash 4)

Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado

por

minus log[휑] = 푝휑

(A ndash 5)

Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que

45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

푝퐾 = log[퐻퐴][퐴 ] + 푝퐻

(A ndash 6)

Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por

훼 =[퐴 ]

[퐻퐴] + [퐴 ]

(A ndash 7)

Reescrevendo (A ndash 7) tem-se que

훼 =[퐴 ] [퐻퐴frasl ]

1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =

훼1 minus 훼

(A ndash 8)

Substituindo (A ndash 8) em (A ndash 6) tem-se que

푝퐾 = log훼

1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10

(A ndash 9)

Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos

훼 =1

1 + 10

(A ndash 10)

Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio

퐴 + 퐻 퐻퐴

(A ndash 11)

Pode se escrever a constante de equiliacutebrio como

퐾 =[퐻퐴 ]

[퐴][퐻 ]

(A ndash 12)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que

46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

log퐾 = minus log[퐴]

[퐻퐴 ] minus log[퐻 ]

(A -13)

Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por

훼 =[퐻퐴 ]

[퐴] + [퐻퐴 ]

(A ndash 14)

Assim a equaccedilatildeo (A ndash 13) fica

훼1 minus 훼 = 10

(A ndash 15)

Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo

훼 =10

1 + 10

(A ndash 16)

Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos

modelos expostos

Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]

48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]

49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)

50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])

51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]

52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])

53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)

54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2

55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO

3 Modelo Estendido de Debye-Huumlckel

31 Introduccedilatildeo

De fato como descrito por Pessocirca Filho (2002) a equaccedilatildeo de Debye-Huumlckel natildeo

deve ser aplicada agrave modelagem de polieletroacutelitos tais como proteiacutenas porque nestas

moleacuteculas as cargas satildeo distribuiacutedas ao longo da cadeia e portanto natildeo satildeo cargas

pontuais como suposto por Debye-Huumlckel

Contudo nesta modelagem considera-se uma regiatildeo de pH em torno do ponto

isoeleacutetrico (pI) na qual satildeo inerentes duas condiccedilotildees favoraacuteveis a aplicaccedilatildeo da

equaccedilatildeo de Debye-Huumlckel carga liacutequida proacutexima a zero pois Z(pI) = 0 e regiatildeo de

miacutenima solubilidade que significa baixas concentraccedilotildees de proteiacutenas em soluccedilatildeo

Isto significa em primeiro lugar que os efeitos da carga tais como ldquodesnovelamentordquo

da cadeia proteacuteica com exposiccedilatildeo de resiacuteduos outrora blindados podem ser

desprezados em uma regiatildeo proacutexima ao ponto isoeleacutetrico e em segundo lugar

baixas concentraccedilotildees de proteiacutena em soluccedilatildeo significam que os termos de curto

alcance podem ser desprezados e portanto haacute prevalecircncia do termo de longo

alcance que no caso de soluccedilotildees eletroliacuteticas pode ser descrito por uma equaccedilatildeo

estendida de Debye-Huumlckel

Assim o modelo de Debye-Huumlckel foi utilizado natildeo para verificar sua aplicabilidade agrave

modelagem de soluccedilotildees proteacuteicas mas sim para confrontar o modelo proposto com

um modelo usual em modelagem de soluccedilotildees eletroliacuteticas e seraacute referido no texto

sempre como abordagem claacutessica

12 3 Modelo Estendido de Debye-Huumlckel

32 Desenvolvimento teoacuterico

Pode-se escrever a atividade da proteiacutena como o produto entre a solubilidade e o

coeficiente de atividade da mesma como mostrado na equaccedilatildeo (32 - 1)

푎 = 훾푠

(32 - 1)

Na qual pode-se calcular o coeficiente de atividade atraveacutes da equaccedilatildeo estendida

de Debye-Huumlckel (Pitzer 1973)

ln 훾 = minus퐴 푍radic퐼

1 + 푏radic퐼+

2푏

ln 1 + 푏radic퐼

(32 - 2)

Sendo que a constante universal empiacuterica b = 12 kg12 mol-12 eacute usada para todos os

eletroacutelitos Jaacute AΦ eacute o paracircmetro de Debye-Huumlckel para o coeficiente osmoacutetico e eacute

dado por

퐴 =13

(2휋푁 휌 ) frasl 푒4휋휀 휀 푘푇

frasl

(32 - 3)

Em que NA eacute a constante de Avogadro ρs eacute a densidade do solvente em g cm-3 e eacute

a carga eletrocircnica (e = 160218 x 10-19 C) ε0 eacute a permissividade do espaccedilo livre (ε0 =

885419 x 10-12 C2 N-1 m-2) εr eacute a constante dieleacutetrica do solvente k aacute constante de

Boltzmann e T eacute a temperatura absoluta Jaacute a carga liacutequida em funccedilatildeo do pH pode

ser calculada como

푍 = 훼 minus 훼

(32 - 4)

Sendo que α+ e α- satildeo dados pelas equaccedilotildees (A - 10) e (A - 16) do Apecircndice A

13 3 Modelo Estendido de Debye-Huumlckel

E a forccedila iocircnica eacute dada pela equaccedilatildeo (32 - 5) descrita abaixo

퐼 = 12

푚 푍

(32 - 5)

Contudo no ponto isoeleacutetrico a carga meacutedia da proteiacutena eacute nula portanto o termo de

Debye-Huumlckel se anula e o coeficiente de atividade se torna unitaacuterio

ln푎 (푝퐼) = ln 푠 (푝퐼)

(32 - 6)

Considerando que a atividade da proteiacutena seja constante com a variaccedilatildeo de pH isto

implica que esta eacute sempre igual agrave solubilidade da proteiacutena no ponto isoeleacutetrico e

portanto vale que

ln푎 (푝퐻) = ln 푠 (푝퐻) + ln 훾(푝퐻) = ln 푠 (푝퐼)

(32 - 7)

Assim

ln 푠 (푝퐻) = ln 푠 (푝퐼) + 퐴휙푍푝퐻2 radic퐼1 + 푏radic퐼

+2푏

ln 1 + 푏radic퐼

(32 - 8)

Esta equaccedilatildeo prevecirc a curva de solubilidade em funccedilatildeo do pH atraveacutes do caacutelculo da

atividade da proteiacutena na fase liacutequida pela equaccedilatildeo estendida de Debye-Huumlckel Para

resolvecirc-la eacute necessaacuterio se utilizar de um meacutetodo numeacuterico pois a forccedila iocircnica

depende da solubilidade naquele pH Optou-se neste trabalho pelo Meacutetodo de

Newton-Raphson para executar o meacutetodo iterativo que eacute exigido pela equaccedilatildeo (32

ndash 8) Para aplicar este meacutetodo arbitrou-se uma funccedilatildeo f(sp) definida aqui como

푓 푠 = minus ln 푠 (푝퐻) + ln 푠 (푝퐼) + 퐴휙푍푝퐻2 radic퐼

1 + 푏radic퐼+

2푏

ln 1 + 푏radic퐼

(32 - 9)

14 3 Modelo Estendido de Debye-Huumlckel

Assim ao calcular o sp que zera esta funccedilatildeo f(sp) saber-se-aacute que eacute a proacutepria

solubilidade que se deseja calcular Para aplicar o Meacutetodo de Newton-Raphson

basta derivar a funccedilatildeo f(sp) e aplicar o seguinte algoritmo de resoluccedilatildeo

푠 = 푠 minus푓(푠 )푓 (푠 )

(32 - 10)

Para calcular frsquo(s) deve-se considerar que a forccedila iocircnica depende da solubilidade

Para isto observando a equaccedilatildeo (32 - 5) vecirc-se que a forccedila iocircnica eacute dada pelo

somatoacuterio das contribuiccedilotildees de todos os iacuteons presentes na soluccedilatildeo por isso aqui

cabe um artifiacutecio de dividir estas contribuiccedilotildees em duas macro-contribuiccedilotildees aquela

devida a todos os iacuteons presentes na soluccedilatildeo exclusive os grupos ionizaacuteveis

presentes nas moleacuteculas da proteiacutena em questatildeo (I0) e que se considera constante

com o pH e aquela que engloba apenas os grupos ionizaacuteveis presentes nas

moleacuteculas da proteiacutena (IP)

퐼 = 퐼 + 퐼 = 퐼 +12푍 푠

(32 - 11)

Considerando a funccedilatildeo w tal que

푤 = radic퐼 = 퐼 +12푍 푠

(32 - 12)

Sendo

푤 =14푍 퐼

(32 - 13)

Entatildeo aplicando-se as devidas regras de derivaccedilatildeo tem-se

15 3 Modelo Estendido de Debye-Huumlckel

푓 (푠 ) = minus1푠 + 퐴 푍

3푤 + 2푤 푏푤(1 + 푏푤)

(32 - 14)

Substituindo as equaccedilotildees (32 - 12) e (32 - 13) na equaccedilatildeo (32 - 14) tem-se que

푓 (푠 ) = minus1푠 + 퐴 푍

15 + 푏radic퐼2radic퐼(1 + 푏radic퐼)

(32 - 15)

Entatildeo o algoritmo deve ser

푠 = 푠 minus

⎜⎛ln 푠 (푝퐼)

푠 + 퐴휙푍푝퐻2 radic퐼

1 + 푏radic퐼+ 2푏 ln 1 + 푏radic퐼

minus 1푠 + 퐴휙푍

15 + 푏radic퐼2radic퐼(1 + 푏radic퐼) ⎠

⎟⎞

(32 - 16)

4 Modelagem Termodinacircmica Proposta

41 Introduccedilatildeo

A condiccedilatildeo de equiliacutebrio entre duas fases (α e β) com m componentes eacute dada por

(Prausnitz et al 1999)

푝 = 푝

(41 ndash 1)

푇 = 푇

(41 ndash 2)

휇 = 휇⋮

휇 = 휇

(41 ndash 3)

Considerando o equiliacutebrio soacutelido-liacutequido (ESL) de sistemas contendo proteiacutenas

sendo que os efeitos da pressatildeo podem ser desprezados que as temperaturas nas

duas fases satildeo iguais e que na fase soacutelida soacute haacute proteiacutena tem-se que para a

proteiacutena a relaccedilatildeo de equiliacutebrio pode ser descrita por

휇 (푇푥) = 휇 (푇)

(41 ndash 4)

Contudo adotando-se a lei de Henry que eacute vaacutelida para baixas concentraccedilotildees de

soluto hipoacutetese que natildeo eacute distante dos valores observados da solubilidade de

proteiacutenas pode se escrever o potencial quiacutemico na fase liacutequida por

휇 (푇푥) = 휇 (푇 푥 ) + 푅푇푙푛푥

(41 ndash 5)

17 4 Modelagem Termodinacircmica Proposta

Entretanto variaccedilotildees de pH natildeo alteram o potencial quiacutemico da fase soacutelida o que

resulta pela relaccedilatildeo (41 ndash 4) que o mesmo natildeo altera tambeacutem o potencial quiacutemico

da fase liacutequida Com isso pela relaccedilatildeo (41 ndash 5) sendo o potencial quiacutemico de

referecircncia constante com o pH uma contradiccedilatildeo emerge a variaccedilatildeo do pH natildeo

poderia alterar o valor da solubilidade poreacutem a observaccedilatildeo experimental mostra o

contraacuterio Assim deve-se lembrar que pelo princiacutepio da eletroneutralidade a fase

soacutelida soacute possui moleacuteculas proteacuteicas eletricamente neutras e portanto o equiliacutebrio

de fases deve se estabelecer apenas entre as moleacuteculas presentes na fase soacutelida e

as moleacuteculas eletricamente neutras em soluccedilatildeo Ou seja como soacute moleacuteculas

eletricamente neutras podem estar na fase soacutelida o equiliacutebrio de fases depende

exclusivamente da fraccedilatildeo de moleacuteculas eletricamente neutras em soluccedilatildeo pois soacute

estas podem precipitar Assim tanto a equaccedilatildeo (41 ndash 4) quanto a equaccedilatildeo (41 ndash

5) devem ser aplicadas natildeo ao conjunto de todas as moleacuteculas de proteiacutena em

soluccedilatildeo mas somente as moleacuteculas proteacuteicas eletricamente neutras Portanto a

concentraccedilatildeo das moleacuteculas de proteiacutena eletricamente neutras em soluccedilatildeo eacute

constante com o pH e pode ser interpretada como a multiplicaccedilatildeo da fraccedilatildeo de

moleacuteculas eletricamente neutras pela concentraccedilatildeo total de proteiacutenas que eacute a

proacutepria solubilidade Assim uma relaccedilatildeo de inversa proporcionalidade eacute definida

quanto maior a fraccedilatildeo de moleacuteculas neutras menor seraacute a solubilidade de uma

proteiacutena em soluccedilatildeo Portanto no ponto isoeleacutetrico no qual haacute o miacutenimo de

solubilidade tem-se o ponto maacuteximo de fraccedilatildeo de moleacuteculas eletricamente neutras

A partir disto eacute possiacutevel escrever a equaccedilatildeo que rege o comportamento da

solubilidade de uma proteiacutena em funccedilatildeo do pH da soluccedilatildeo

휙(푝퐻)푆 (푝퐻) = 휆 = 푐표푛푠푡푎푛푡푒

(41 ndash 6)

18 4 Modelagem Termodinacircmica Proposta

Na equaccedilatildeo (41 ndash 6) o paracircmetro λ pode ser um paracircmetro de ajuste do modelo a

um conjunto de valores experimentais tendo se estabelecido uma funccedilatildeo objetivo ou

ainda dado pelo produto entre a solubilidade no ponto isoeleacutetrico e a fraccedilatildeo de

moleacuteculas eletricamente neutras em soluccedilatildeo tambeacutem no pI neste caso vale a

seguinte equaccedilatildeo

푠 (푝퐻) =휙(푝퐼)푠 (푝퐼)휙(푝퐻)

(41 ndash 7)

Sendo a equaccedilatildeo do modelo ndash equaccedilatildeo (41 ndash 7) ndash extremamente simples a uacutenica

dificuldade reside no caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras

(휙(푝퐻))

42 Caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras

Dentre os aminoaacutecidos que formam atraveacutes de ligaccedilotildees peptiacutedicas as proteiacutenas haacute

aqueles que possuem resiacuteduos com grupos ionizaacuteveis aleacutem dos grupos amina e

aacutecido carboxiacutelico terminais na cadeia Todos estes participam de equiliacutebrios

quiacutemicos com iacuteons H+ presentes na soluccedilatildeo entatildeo ao se alterar o pH da soluccedilatildeo

estes equiliacutebrios satildeo alterados

Assim haacute vaacuterias possibilidades de combinaccedilotildees de estados ionizados destes grupos

ionizaacuteveis que resultam em uma moleacutecula de proteiacutena eletricamente neutra Eacute

importante notar que dada a fraccedilatildeo de uma configuraccedilatildeo de uma moleacutecula neutra

todas as outras fraccedilotildees de configuraccedilotildees possiacuteveis que tambeacutem resultem em

moleacuteculas neutras satildeo proporcionais agrave fraccedilatildeo da configuraccedilatildeo dada pois todas as

configuraccedilotildees participam de equiliacutebrios entre si

19 4 Modelagem Termodinacircmica Proposta

Desta observaccedilatildeo implica-se que basta identificar uma configuraccedilatildeo proteacuteica cuja

soma dos estados ionizados resulte em carga nula para se descrever o equiliacutebrio de

fases em relaccedilatildeo ao pH na regiatildeo do ponto isoeleacutetrico onde esta consideraccedilatildeo eacute

predominante em relaccedilatildeo a outros possiacuteveis fenocircmenos

Contudo eacute necessaacuterio contabilizar a contribuiccedilatildeo de cada grupo ionizaacutevel via

equaccedilatildeo de Henderson-Hasselbach equaccedilatildeo (42 ndash 1)

훼 (푝퐻) =

⎩⎪⎨

⎪⎧ 10

1 + 10 푠푒 휈 = minus1

11 + 10

푠푒 휈 = +1

(42 ndash 1)

Na qual pKAj eacute o co-logaritmo da constante de equiliacutebrio do grupo ionizaacutevel do

resiacuteduo j j eacute estado carregado potencial do resiacuteduo j (-1 para grupos aacutecidos e +1

para grupos baacutesicos) e j eacute a fraccedilatildeo ionizada para o pH dado Para grupos cujo

estado de ionizaccedilatildeo na dada configuraccedilatildeo seja neutro a sua fraccedilatildeo eacute calculada tal

que a soma de sua fraccedilatildeo e da fraccedilatildeo ionizada tenha como resultado o valor

unitaacuterio

Assim a funccedilatildeo Pn pode ser escrita como o produto de cada fraccedilatildeo de cada grupo

ionizaacutevel j naquele estado (-1 0 ou +1) na configuraccedilatildeo neutra k em uma proteiacutena

com n grupos ionizaacuteveis Uma representaccedilatildeo matemaacutetica possiacutevel para esta funccedilatildeo

pode ser escrita como

휙 (푝퐻) = 훼 (푝퐻)

(42 ndash 2)

Na qual a fraccedilatildeo jrsquo(pH) eacute dada por

20 4 Modelagem Termodinacircmica Proposta

훼 (푝퐻) =훼 (푝퐻) 푠푒 휀 = 11 minus 훼 (푝퐻) 푠푒 휀 = 0

(42 ndash 3)

Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (42 ndash 3) e a resultante na equaccedilatildeo

(42 ndash 2) pode-se escrever que

휙 (푝퐻) =1

1 + 10

1 + 휈2 minus 휈 휀 10

minus휈 minus 1

2 minus 휈 휀 푐표푚 휀 = 0

(42 ndash 4)

A equaccedilatildeo (42 ndash 4) junto agrave equaccedilatildeo (41 ndash 7) constituem o modelo termodinacircmico

capaz de predizer a razatildeo entre as fraccedilotildees de moleacuteculas neutras de uma proteiacutena

em funccedilatildeo do pH na regiatildeo do ponto isoeleacutetrico mantendo fixas temperatura e forccedila

iocircnica Substituindo a equaccedilatildeo (42 ndash 4) na equaccedilatildeo (41 ndash 7) obteacutem-se para a

curva de solubilidade

푠 (푝퐻)푠 (푝퐼) =

1 + 101 + 10

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

푐표푚 휀 = 0

(42 ndash 8)

5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

51 Introduccedilatildeo

Segundo Groumlnwall (1941) na fase liacutequida haacute moleacuteculas de proteiacutenas com muitas

configuraccedilotildees k distintas que possuem carga liacutequida i e tambeacutem haacute certas

configuraccedilotildees que tem carga liacutequida nula e satildeo chamadas configuraccedilotildees neutras

Aleacutem disso estas uacuteltimas satildeo aquelas que determinam o equiliacutebrio de fases jaacute que

elas estatildeo em equiliacutebrio com a fase soacutelida na qual soacute haacute moleacuteculas neutras pelo

princiacutepio da eletroneutralidade Eacute tambeacutem afirmado que dado este equiliacutebrio a

atividade das moleacuteculas neutras natildeo se altera com a variaccedilatildeo do pH e eacute

proporcional agraves atividades de qualquer tipo de configuraccedilatildeo neutra

Neste mesmo trabalho eacute atribuiacuteda a Linderstroslashm-Lang o desenvolvimento de uma

teoria de prediccedilatildeo da solubilidade de proteiacutenas com a variaccedilatildeo do pH na regiatildeo do

ponto isoeleacutetrico Este desenvolvimento apresenta um balanccedilo de cargas de um

modo impliacutecito contudo como atestado por Groumlnwall o escasso conhecimento

sobre as estruturas proteacuteicas impediram agravequele tempo uma formulaccedilatildeo mais

pormenorizada do problema

52 Desenvolvimento teoacuterico

A base desta abordagem descrita por Groumlnwall e atribuiacuteda a Linderstroslashm-Lang

reside na hipoacutetese de que a moleacutecula de proteiacutena de configuraccedilatildeo k e carga nula

participa do seguinte equiliacutebrio com os iacuteons H+ e com sua forma de carga i

22 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

푃 + 푖퐻 푃 lowast

(52 ndash 1)

Note-se que o valor de i pode ser negativo A constante do equiliacutebrio quiacutemico

descrita pela equaccedilatildeo (52 ndash 1) pode ser expressa como

퐾 =푎

lowast

푎 푎

(52 ndash 2)

Sabendo que a atividade da moleacutecula de proteiacutena de configuraccedilatildeo k e carga i eacute dada

pelo produto entre sua concentraccedilatildeo e seu coeficiente de atividade tem-se que

푥lowast

= 푎 푎퐾훾

lowast

(52 ndash 3)

Entretanto a solubilidade da proteiacutena eacute soma das concentraccedilotildees de todas as

moleacuteculas de carga i Poreacutem a concentraccedilatildeo das moleacuteculas de carga i eacute a soma das

concentraccedilotildees das moleacuteculas de configuraccedilatildeo k Assim a solubilidade pode ser

escrita como

푠 (푝퐻) = 푎 푎퐾훾

lowast

(52 ndash 4)

Derivando a equaccedilatildeo (52 ndash 4) com respeito agrave atividade do iacuteon H+ considerando

que atividade da moleacutecula neutra eacute constante para qualquer configuraccedilatildeo k e ainda

que o coeficiente de atividade da proteiacutena de carga i independe da atividade do iacuteon

H+ tem-se que

푑푠푑푎 = 푖 ∙ 푎 푎

퐾훾

lowast

(52 ndash 5)

23 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

Sendo

푑 log 푠 (푝퐻)푑(푝퐻) = minus

푎푠 (푝퐻)

푑푠푑푎

(52 ndash 6)

Substituindo as equaccedilotildees (52 ndash 4) e (52 ndash 5) na equaccedilatildeo (52 ndash 6) e

reescrevendo em termos de pH e das concentraccedilotildees das proteiacutenas de carga i tem-

se que

푑 log 푠푑(푝퐻) = minus

sum (푖 ∙ 푥 )sum 푥

(52 ndash 7)

Contudo o termo do lado direito da equaccedilatildeo (52 ndash 7) estaacute associado ao conceito

de valecircncia meacutedia estabelecido por Linderstroslashm-Lang (1924)

횤 =sum (푖 ∙ 푥 )sum 푥

(52 ndash 8)

Os autores natildeo possuiacuteam um modo mais adequado de construir a curva de

solubilidade dada pela equaccedilatildeo (52 ndash 7) do que aproximar por uma funccedilatildeo linear o

perfil de carga liacutequida da proteiacutena obtido experimentalmente e integraacute-lo valendo-se

da analogia entre o conceito de carga liacutequida (Z) e de valecircncia meacutedia ( i ) Entretanto

hoje jaacute se tem uma descriccedilatildeo analiacutetica do perfil de carga liacutequida de proteiacutenas que

pode ser escrita como

푍(푝퐻) = 휈 훼

(52 ndash 9)

Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (52 ndash 9) e a resultante na equaccedilatildeo

(52 ndash 7) tem-se que

24 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

푑 log 푠푑(푝퐻) = minus

12

11 + 10

1 + 휈 + 휈 1 minus 휈 10

(52 ndash 10)

Integrando a equaccedilatildeo (52 ndash 10) de um ponto de referecircncia por exemplo do ponto

isoeleacutetrico (pI) ateacute um pH qualquer tem-se a seguinte relaccedilatildeo

푑 log 푠

( )

( )

= minus12

1

1 + 101 + 휈 + 휈 1 minus 휈 10 푑(푝퐻)

(52 ndash 11)

log푠 (푝퐻)푠 (푝퐼) = minus

12 1 + 휈

11 + 10

푑(푝퐻)

+ 휈 1 minus 휈10

1 + 10푑(푝퐻)

(52 ndash 12)

Fazendo a seguinte substituiccedilatildeo

푢 = 10 푡푎푙 푞푢푒 푑푢푢 = ln 10푑(푝퐻)

(52 ndash 13)

Tem-se que

log푠 (푝퐻)푠 (푝퐼) = minus

12

1 + 휈ln 10

1푢(1 + 푢) 푑푢 +

휈 1 minus 휈ln 10

1(1 + 푢) 푑푢

(52 ndash 14)

log푠 (푝퐻)푠 (푝퐼) = minus

12

1 + 휈ln 10

1푢 푑푢 minus

11 + 푢 푑푢 +

휈 1 minus 휈ln 10

1(1 + 푢) 푑푢

(52 ndash 15)

25 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐼) = minus

12 1 + 휈 log

1010

minus 휈 1 minus 휈 minus 1 + 휈 log1 + 101 + 10

(52 ndash 16)

Sendo

휈 1 minus 휈 minus 1 + 휈 = 휈 minus 휈 minus 1 minus 휈 = minus 1 + 휈 = minus2

(52 ndash 17)

Resultando em

log푠 (푝퐻)푠 (푝퐼) = log

1 + 101 + 10

minus1 + 휈

2 (푝퐻 minus 푝퐼)

(52 ndash 18)

Ainda eacute possiacutevel reescrever a equaccedilatildeo (52 ndash 18) como

log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log

1 + 101 + 10

(52 ndash 19)

Na qual n+ representa o nuacutemero de resiacuteduos ionizaacuteveis que na sua forma carregada

apresentam carga positiva A equaccedilatildeo (52 ndash 19) eacute uma expressatildeo analiacutetica que a

partir de dados da estrutura proteacuteica e de um dado de solubilidade permite predizer

a curva de solubilidade de uma dada proteiacutena em funccedilatildeo do pH na regiatildeo do ponto

isoeleacutetrico mantendo fixas a temperatura e a forccedila iocircnica do sistema

Eacute possiacutevel provar que as equaccedilotildees (42 ndash 8) e (52 ndash 19) satildeo idecircnticas - a prova

disso eacute descrita na seccedilatildeo 6 ndash e assim tem-se que apesar das distintas abordagens

a descriccedilatildeo do fenocircmeno eacute a mesma Note-se que um passo fundamental no

desenvolvimento da Equaccedilatildeo (52 ndash 5) eacute admitir que por hipoacutetese a atividade da

26 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

forma neutra natildeo depende do pH essa hipoacutetese tambeacutem eacute a base da equaccedilatildeo (41

ndash 7) Deve-se registrar o fato de que pelo melhor do nosso conhecimento esta eacute a

primeira vez que uma expressatildeo analiacutetica para o caacutelculo da solubilidade de

proteiacutenas em funccedilatildeo do pH eacute descrita mesmo no limite em que se considera vaacutelida

a lei de Henry

53 Soluccedilatildeo Paraboacutelica da Curva de Solubilidade

Tanto Groumlnwall (1941) quanto Fredericq e Neurath (1950) adotaram a hipoacutetese de

que os perfis de carga liacutequida da -lactoglobulina para um e da insulina para os

outros dois eram lineares na regiatildeo do ponto isoeleacutetrico Esta hipoacutetese eacute bastante

plausiacutevel e simplificadora principalmente a eacutepoca na qual estes trabalhos foram

desenvolvidos em que a estrutura proteacuteica bem como as constantes de ionizaccedilatildeo

dos resiacuteduos com grupos ionizaacuteveis era pouco conhecida De fato ainda hoje a falta

de dados das constantes de ionizaccedilatildeo na cadeia proteacuteica eacute o maior desafio no uso

do modelo rigoroso ndash equaccedilatildeo (52 ndash 18) Por isso o valor desta hipoacutetese de perfil

de carga liacutequida linear eacute notaacutevel

Supondo entatildeo que o perfil de carga seja linear eacute possiacutevel escrevecirc-lo como

푍(푝퐻) = minus퐴(푝퐻 minus 푝퐼) 푐표푚 퐴 gt 0

(53 ndash 1)

Substituindo (53 ndash 1) em (52 ndash 6)

푑 log 푠 (푝퐻)푑(푝퐻) = 퐴(푝퐻 minus 푝퐼)

(53 ndash 2)

Integrando (53 ndash 2) de um pH0 de referecircncia ateacute pH tem-se que

27 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐻 ) = 퐾[푝퐻 minus 2푝퐼(푝퐻 minus 푝퐻 ) minus 푝퐻 ] 푐표푚 퐾 =

퐴2

(53 ndash 3)

Ao se adotar como ponto de referecircncia o ponto isoeleacutetrico a equaccedilatildeo (53 ndash 3)

reduz-se agrave

log푠 (푝퐻)푠 (푝퐼) = 퐾(푝퐻 minus 푝퐼)

(53 ndash 4)

Contudo apesar da soluccedilatildeo quadraacutetica ou paraboacutelica para a equaccedilatildeo estendida de

Linderstroslashm-lang e Groumlnwall expressa na equaccedilatildeo (53 ndash 3) natildeo requerer os dados

das constantes de ionizaccedilatildeo dos resiacuteduos com grupos ionizaacuteveis ela exige a

definiccedilatildeo do paracircmetro A que fisicamente representa a inclinaccedilatildeo da reta de

aproximaccedilatildeo da curva de carga liacutequida e que pode ser calculado por correlaccedilatildeo a

partir de um conjunto de dados experimentais de solubilidade ou de carga liacutequida

6 Identidade entre o Modelo Proposto e a Equaccedilatildeo

Estendida de Linderstroslashm-Lang e Groumlnwall

A equaccedilatildeo final da modelagem termodinacircmica proposta apresentada na seccedilatildeo 4 eacute a

equaccedilatildeo (42 ndash 8) dada por

푠 (푝퐻)푠 (푝퐼) =

1 + 101 + 10

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 1)

Aplicando-se o logaritmo decimal nos dois termos da equaccedilatildeo (6 ndash 1) tem-se que

log푠 (푝퐻)푠 (푝퐼) = log

1 + 101 + 10

+ log

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 2)

Pelo bem da simplificaccedilatildeo desta deduccedilatildeo adotar-se-atildeo as seguintes funccedilotildees

휂 (푝퐻) = log

(6 ndash 3)

휃 (푝퐻) = log

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 4)

Assim pode-se reescrever a equaccedilatildeo (6 ndash 2) por

29 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐼) = 휂 (푝퐻) + 휃 (푝퐻)

(6 ndash 5)

Observando-se a equaccedilatildeo (6 ndash 5) tem-se que a funccedilatildeo j independe do estado de

ionizaccedilatildeo do resiacuteduo j poreacutem a funccedilatildeo jk depende Por isso deve-se analisar esta

funccedilatildeo para cada estado de ionizaccedilatildeo possiacutevel como mostrado na Tabela 61

Tabela 6 1 ndash Anaacutelise da funccedilatildeo jk para cada estado de ionizaccedilatildeo possiacutevel

j jk jk Quantidade de resiacuteduos neste estado

-1 -1 푝퐼 minus 푝퐻 na

0 0 nb

+1 +1 0 nc

0 푝퐼 minus 푝퐻 nd

Pela anaacutelise da Tabela 61 e considerando uma proteiacutena com n resiacuteduos com

grupos ionizaacuteveis infere-se que a equaccedilatildeo (6 ndash 5) pode ser reescrita como

log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)

(6 ndash 6)

Contudo as equaccedilotildees acima descritas satildeo vaacutelidas apenas para configuraccedilotildees

neutras pois apenas as configuraccedilotildees neutras da fase liacutequida estatildeo em equiliacutebrio

com as moleacuteculas de proteiacutena da fase soacutelida Para que uma configuraccedilatildeo seja

neutra vale a seguinte restriccedilatildeo

휀 = 0 hArr 푛 = 푛

(6 ndash 7)

30 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall

Substituindo a restriccedilatildeo dada pela equaccedilatildeo (6 ndash 7) na equaccedilatildeo (6 ndash 6) tem-se que

log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)

(6 ndash 8)

Ora mas a soma de nc e de nd natildeo resulta em outra coisa senatildeo no nuacutemero de

resiacuteduos com grupos ionizaacuteveis da estrutura proteacuteica cujo j seja +1 Assim

substituindo nc mais nd por n+ e substituindo a equaccedilatildeo (6 ndash 3) na equaccedilatildeo (6 ndash 8)

tem-se que

log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log

1 + 101 + 10

(6 ndash 9)

Ao se analisar a equaccedilatildeo (6 ndash 9) observa-se que ela eacute idecircntica a equaccedilatildeo estendida

de Linderstroslashm-Lang e Groumlnwall apresentada pela equaccedilatildeo (52 ndash 19) Com isso

tem-se que apesar das distintas formulaccedilotildees tanto a modelagem termodinacircmica aqui

proposta quanto a extensatildeo a teoria de Linderstroslashm-Lang e Groumlnwall resultam na

mesma descriccedilatildeo do fenocircmeno Aleacutem disso a equaccedilatildeo final dos modelos eacute

extremamente simples e depende apenas de um ponto de referecircncia e dos dados da

estrutura da moleacutecula de proteiacutena cuja solubilidade se deseja estudar

7 Aplicaccedilatildeo dos Modelos Expostos

Para validar o modelo comparando-o com o caacutelculo feito a partir da teoria de Debye-

Huumlckel o criteacuterio que relaciona os pontos calculados pelo modelo com os pontos

experimentais foi estabelecido a partir da seguinte funccedilatildeo objetivo (FO)

퐹푂 =1푁

푠 minus 푠푠

(7 ndash 1)

Contudo a equaccedilatildeo (7 ndash 1) natildeo eacute a melhor definiccedilatildeo de funccedilatildeo objetivo neste caso

pois a derivada da curva de solubilidade eacute razoavelmente grande nos dois lados do

ponto isoeleacutetrico e isso permite que pequenos desvios na direccedilatildeo horizontal

resultem em um grande aumento no valor da funccedilatildeo objetivo Uma soluccedilatildeo possiacutevel

seria substituir essa funccedilatildeo objetivo por uma funccedilatildeo definida pela soma do quadrado

da distacircncia do ponto experimental agrave curva do modelo principalmente se fosse

necessaacuterio calcular algum paracircmetro do modelo via otimizaccedilatildeo da funccedilatildeo objetivo

estipulada Natildeo sendo este o escopo deste trabalho optou-se pelo uso da FO

definida na equaccedilatildeo (7 ndash 1)

71 Solubilidade da Insulina Suiacutena

As Figuras 711 712 e 713 apresentam os graacuteficos da curva de solubilidade

dada pelos pontos experimentais pelo modelo proposto pela abordagem claacutessica e

tambeacutem a curva obtida pela soluccedilatildeo paraboacutelica da Equaccedilatildeo de Linderstroslashm-Lang e

Groumlnwall em trecircs temperaturas distintas

32 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 711 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 25 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

Figura 712 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 15 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

00

40

80

120

160

200

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

00

50

100

150

200

250

300

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

33 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 713 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 5 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

Os desvios da curva obtida pelo modelo proposto para valores de pH distantes do pI

podem ser explicados por ao menos trecircs importantes motivos dois devidos a

hipoacuteteses do modelo e um devido a fenocircmenos intriacutensecos a proteiacutena Sabendo que

no pI a solubilidade eacute miacutenima para valores de pH distantes do pI pode-se ter

solubilidades suficientemente grandes para que a validade da lei de Henry ndash adotada

na formulaccedilatildeo do modelo - seja questionada pois quanto mais distante do pI maior

a solubilidade e menor a validade da lei de Henry jaacute que haacute um aumento da

concentraccedilatildeo do soluto (proteiacutena) na soluccedilatildeo e tambeacutem ao fato do modelo prever

solubilidade infinita quando a fraccedilatildeo de moleacuteculas eletricamente neutras tende a

zero

limrarr푠 = lim

rarr

Φ(푝퐼)푠 (푝퐼)Φ(푝퐻) = +infin

(711 ndash 1)

00

50

100

150

200

250

300

350

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

34 7 Aplicaccedilatildeo dos Modelos Expostos

Todavia ainda haacute um fator de ordem natural que justifica o desvio apresentado para

valores de pH distantes do pI o desnovelamento da cadeia proteacuteica Este fenocircmeno

pode ocorrer de maneira a expor grupos hidroacutefobos resiacuteduos antes natildeo expostos

acrescentando relaccedilotildees de equiliacutebrio quiacutemico natildeo existentes na regiatildeo do pI

alterando o equiliacutebrio de fases e portanto alterando o valor da solubilidade

A Tabela 711 apresenta os valores obtidos para a funccedilatildeo objetivo definida em (7 ndash

1) tanto para o modelo proposto quanto para a abordagem claacutessica para trecircs

diferentes temperaturas

Tabela 711 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada

abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para insulina

suiacutena

T ordmC Abordagem FO

25 P 01857 C 02535

15 P 01981 C 05056

5 P 03595 C 03064

Observando-se a Tabela 711 vecirc-se que o modelo apresentou melhores resultados

do que o caacutelculo efetuado atraveacutes da abordagem claacutessica no que tange a

minimizaccedilatildeo da funccedilatildeo objetivo exceto para os dados a 5 ordmC

Tambeacutem eacute possiacutevel observar que a funccedilatildeo objetivo sofreu aumento com a

diminuiccedilatildeo da temperatura Isto ocorreu principalmente devido agrave dificuldade de

obter dados experimentais de solubilidade a temperaturas baixas o que aumenta o

desvio experimental fazendo com que se tenha um aumento do valor da funccedilatildeo

objetivo como a definida em (5 ndash 1) Um efeito secundaacuterio que tambeacutem pressiona a

35 7 Aplicaccedilatildeo dos Modelos Expostos

funccedilatildeo objetivo eacute o fato dos dados de pKA terem sido obtidos a uma temperatura

especiacutefica o que tende a acrescentar erro no caacutelculo de solubilidades a temperaturas

diferentes ainda que o pKA natildeo varie de forma ab-rupta com a temperatura

Outra observaccedilatildeo que deve ser registrada eacute o fato da funccedilatildeo objetivo para a

abordagem claacutessica na temperatura de 15 ordmC divergir a um valor tatildeo elevado em

relaccedilatildeo aos demais Isto se deve a um ponto experimental especiacutefico a um pH de

45 a solubilidade da insulina suiacutena obtida experimentalmente eacute 230 x 10-5 mol kg-1

enquanto a calculada pelo modelo proposto eacute 230 x 10-5 mol kg-1 e a calculada pela

abordagem claacutessica eacute 520 x 10-5 mol kg-1 Por conta do desvio deste ponto a funccedilatildeo

objetivo para a abordagem claacutessica nesta temperatura tem um aumento significativo

A Tabela 712 apresenta os valores do paracircmetro K da soluccedilatildeo paraboacutelica obtidos

neste trabalho para a insulina suiacutena comparados ao encontrado na literatura

Tabela 712 ndash Valores do paracircmetro K da soluccedilatildeo paraboacutelica para a insulina suiacutena

Referecircncias T ordmC K Fredericq e Neurath (1950) - 081 Neste trabalho 25 104 Neste trabalho 15 101 Neste trabalho 5 145

Pela Tabela 712 pode-se observar que haacute uma diferenccedila pequena entre os

valores do paracircmetro K obtidos neste trabalho e por Fredericq e Neurath (1950) Por

isso natildeo se pode afirmar a que se deve esta diferenccedila se eacute devido a diferenccedilas entre

procedimentos experimentais ou se eacute devido agrave diferenccedila de meacutetodo de caacutelculo do

paracircmetro Apesar de no experimento realizado por Fredericq e Neurath (1950)

haver a presenccedila do acircnion tiocianato e este acircnion interagir com grupos ionizaacuteveis

da cadeia proteacuteica como observado pelos autores do trabalho tambeacutem estes

36 7 Aplicaccedilatildeo dos Modelos Expostos

proacuteprios autores afirmam que a presenccedila deste acircnion natildeo altera a forma da curva

que eacute basicamente determinada pelo paracircmetro K De qualquer modo eacute interessante

observar a proximidade dos valores encontrados neste trabalho com o obtido por

Fredericq e Neurath (1950) pelo menos no que diz respeito agrave ordem de grandeza do

paracircmetro em questatildeo

72 Solubilidade da Lisozima de clara de ovo de galinha

Um modelo para ser validado necessita correlacionar dados experimentais de modo

satisfatoacuterio ou seja um modelo deve buscar fidelidade ao fenocircmeno fiacutesico

observado Assim na procura de dados de solubilidade de proteiacutenas poucos dados

na regiatildeo do pI foram encontrados Este eacute o caso da lisozima de clara de ovo de

galinha que apesar de ter muitos estudos de solubilidade nenhum deles se

encontra na regiatildeo do pI Surgiu assim a necessidade de se obter estes dados

experimentais para poder validar o modelo proposto A escolha da lisozima de clara

de ovo de galinha se deu em parte pela sua importacircncia mas tambeacutem em parte por

ter os valores de pKA conhecidos

A curva de solubilidade da lisozima de clara de ovo de galinha levantada neste

trabalho estaacute apresentada na Figura 721

37 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em

soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e

dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()

Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento

esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH

isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de

soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se

comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto

isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da

soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos

ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente

neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a

solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e

00

10

20

30

40

50

60

70

80

90

100

95 100 105 110 115 120

Solu

bilid

ade

(mg

mL)

pH

38 7 Aplicaccedilatildeo dos Modelos Expostos

alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado

em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo

Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo

a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo

Por conta de falta de dados a este respeito modelou-se apenas a curva de

solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura

722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de

galinha em funccedilatildeo do pH da soluccedilatildeo

Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)

00

10

20

30

40

50

60

70

80

90

96 99 102 105 108 111 114 117 120

Solu

bilid

ade

(mg

mL)

pH

39 7 Aplicaccedilatildeo dos Modelos Expostos

O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721

Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada

abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima

de clara de ovo de galinha

T ordmC Abordagem FO

25 P 4650 C gt7919a

a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado

Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta

aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a

abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca

de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos

anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao

efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de

clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a

variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A

proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de

cargas pontuais de Debye-Huumlckel

8 Conclusotildees

A modelagem termodinacircmica proposta neste trabalho apresentou expressivos

resultados quando comparada a abordagem claacutessica de Debye-Huumlckel

Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o

modelo aproximou melhor os pontos experimentais do que a referida abordagem

comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima

ao ponto isoeleacutetrico

Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica

para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua

construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo

lugar por sua aplicabilidade

Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis

da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva

em regiotildees distantes do ponto isoeleacutetrico

9 Referecircncias Bibliograacuteficas

BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene

Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects

Biophys J 95 1285-1294 2008

FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and

other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72

2684 - 26911950

GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v

93 p 517-542 1931

GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab

Carlsberg v 24 p 185-200 1941

KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native

and mutant insulins pK perturbation of B13-Glu in aggregated species Arch

Biochem Biophys v 283 p 496-502 1990

KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for

the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng

Chem Res v 35 p 4319-4327 1996

42 9 Referecircncias Bibliograacuteficas

KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen

lysozyme J Biochem v 87 p 1215-1219 1980

LADISCH M R Bioseparations Engineering principles practice and

economics John Wiley amp Sons 2001 pp1 116 ndash 117 133

LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab

Carlsberg v 15 p 1-29 1924

PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da

particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas

2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP

PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the

excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte

solutions Fluid Phase Equilib v 269 p 25ndash35 2008

PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-

contribution model involving phase and chemical equilibrium Ind Eng Chem Res

v 33 p 1341-1347 1994

PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277

1973

PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino

acids Fluid Phase Equilib v 152 p 121-132 1998

43 9 Referecircncias Bibliograacuteficas

PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular

Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999

SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of

equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte

solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009

TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J

R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with

carbon dioxide Biotech Bioeng v103 p 909-919 2009

TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer

free energy Biophys J v 95 p 2601-2609 2008

TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in

water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95

2009

Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na

cadeia proteacuteica

Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo

de ionizaccedilatildeo

퐻퐴 퐴 + 퐻

(A ndash 1)

Assim considerando que a constante de equiliacutebrio

퐾 = 푎

(A ndash 2)

Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que

퐾 =[퐴 ][퐻 ]

[퐻퐴]

(A ndash 3)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que

log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]

(A ndash 4)

Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado

por

minus log[휑] = 푝휑

(A ndash 5)

Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que

45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

푝퐾 = log[퐻퐴][퐴 ] + 푝퐻

(A ndash 6)

Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por

훼 =[퐴 ]

[퐻퐴] + [퐴 ]

(A ndash 7)

Reescrevendo (A ndash 7) tem-se que

훼 =[퐴 ] [퐻퐴frasl ]

1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =

훼1 minus 훼

(A ndash 8)

Substituindo (A ndash 8) em (A ndash 6) tem-se que

푝퐾 = log훼

1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10

(A ndash 9)

Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos

훼 =1

1 + 10

(A ndash 10)

Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio

퐴 + 퐻 퐻퐴

(A ndash 11)

Pode se escrever a constante de equiliacutebrio como

퐾 =[퐻퐴 ]

[퐴][퐻 ]

(A ndash 12)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que

46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

log퐾 = minus log[퐴]

[퐻퐴 ] minus log[퐻 ]

(A -13)

Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por

훼 =[퐻퐴 ]

[퐴] + [퐻퐴 ]

(A ndash 14)

Assim a equaccedilatildeo (A ndash 13) fica

훼1 minus 훼 = 10

(A ndash 15)

Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo

훼 =10

1 + 10

(A ndash 16)

Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos

modelos expostos

Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]

48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]

49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)

50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])

51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]

52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])

53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)

54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2

55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO

12 3 Modelo Estendido de Debye-Huumlckel

32 Desenvolvimento teoacuterico

Pode-se escrever a atividade da proteiacutena como o produto entre a solubilidade e o

coeficiente de atividade da mesma como mostrado na equaccedilatildeo (32 - 1)

푎 = 훾푠

(32 - 1)

Na qual pode-se calcular o coeficiente de atividade atraveacutes da equaccedilatildeo estendida

de Debye-Huumlckel (Pitzer 1973)

ln 훾 = minus퐴 푍radic퐼

1 + 푏radic퐼+

2푏

ln 1 + 푏radic퐼

(32 - 2)

Sendo que a constante universal empiacuterica b = 12 kg12 mol-12 eacute usada para todos os

eletroacutelitos Jaacute AΦ eacute o paracircmetro de Debye-Huumlckel para o coeficiente osmoacutetico e eacute

dado por

퐴 =13

(2휋푁 휌 ) frasl 푒4휋휀 휀 푘푇

frasl

(32 - 3)

Em que NA eacute a constante de Avogadro ρs eacute a densidade do solvente em g cm-3 e eacute

a carga eletrocircnica (e = 160218 x 10-19 C) ε0 eacute a permissividade do espaccedilo livre (ε0 =

885419 x 10-12 C2 N-1 m-2) εr eacute a constante dieleacutetrica do solvente k aacute constante de

Boltzmann e T eacute a temperatura absoluta Jaacute a carga liacutequida em funccedilatildeo do pH pode

ser calculada como

푍 = 훼 minus 훼

(32 - 4)

Sendo que α+ e α- satildeo dados pelas equaccedilotildees (A - 10) e (A - 16) do Apecircndice A

13 3 Modelo Estendido de Debye-Huumlckel

E a forccedila iocircnica eacute dada pela equaccedilatildeo (32 - 5) descrita abaixo

퐼 = 12

푚 푍

(32 - 5)

Contudo no ponto isoeleacutetrico a carga meacutedia da proteiacutena eacute nula portanto o termo de

Debye-Huumlckel se anula e o coeficiente de atividade se torna unitaacuterio

ln푎 (푝퐼) = ln 푠 (푝퐼)

(32 - 6)

Considerando que a atividade da proteiacutena seja constante com a variaccedilatildeo de pH isto

implica que esta eacute sempre igual agrave solubilidade da proteiacutena no ponto isoeleacutetrico e

portanto vale que

ln푎 (푝퐻) = ln 푠 (푝퐻) + ln 훾(푝퐻) = ln 푠 (푝퐼)

(32 - 7)

Assim

ln 푠 (푝퐻) = ln 푠 (푝퐼) + 퐴휙푍푝퐻2 radic퐼1 + 푏radic퐼

+2푏

ln 1 + 푏radic퐼

(32 - 8)

Esta equaccedilatildeo prevecirc a curva de solubilidade em funccedilatildeo do pH atraveacutes do caacutelculo da

atividade da proteiacutena na fase liacutequida pela equaccedilatildeo estendida de Debye-Huumlckel Para

resolvecirc-la eacute necessaacuterio se utilizar de um meacutetodo numeacuterico pois a forccedila iocircnica

depende da solubilidade naquele pH Optou-se neste trabalho pelo Meacutetodo de

Newton-Raphson para executar o meacutetodo iterativo que eacute exigido pela equaccedilatildeo (32

ndash 8) Para aplicar este meacutetodo arbitrou-se uma funccedilatildeo f(sp) definida aqui como

푓 푠 = minus ln 푠 (푝퐻) + ln 푠 (푝퐼) + 퐴휙푍푝퐻2 radic퐼

1 + 푏radic퐼+

2푏

ln 1 + 푏radic퐼

(32 - 9)

14 3 Modelo Estendido de Debye-Huumlckel

Assim ao calcular o sp que zera esta funccedilatildeo f(sp) saber-se-aacute que eacute a proacutepria

solubilidade que se deseja calcular Para aplicar o Meacutetodo de Newton-Raphson

basta derivar a funccedilatildeo f(sp) e aplicar o seguinte algoritmo de resoluccedilatildeo

푠 = 푠 minus푓(푠 )푓 (푠 )

(32 - 10)

Para calcular frsquo(s) deve-se considerar que a forccedila iocircnica depende da solubilidade

Para isto observando a equaccedilatildeo (32 - 5) vecirc-se que a forccedila iocircnica eacute dada pelo

somatoacuterio das contribuiccedilotildees de todos os iacuteons presentes na soluccedilatildeo por isso aqui

cabe um artifiacutecio de dividir estas contribuiccedilotildees em duas macro-contribuiccedilotildees aquela

devida a todos os iacuteons presentes na soluccedilatildeo exclusive os grupos ionizaacuteveis

presentes nas moleacuteculas da proteiacutena em questatildeo (I0) e que se considera constante

com o pH e aquela que engloba apenas os grupos ionizaacuteveis presentes nas

moleacuteculas da proteiacutena (IP)

퐼 = 퐼 + 퐼 = 퐼 +12푍 푠

(32 - 11)

Considerando a funccedilatildeo w tal que

푤 = radic퐼 = 퐼 +12푍 푠

(32 - 12)

Sendo

푤 =14푍 퐼

(32 - 13)

Entatildeo aplicando-se as devidas regras de derivaccedilatildeo tem-se

15 3 Modelo Estendido de Debye-Huumlckel

푓 (푠 ) = minus1푠 + 퐴 푍

3푤 + 2푤 푏푤(1 + 푏푤)

(32 - 14)

Substituindo as equaccedilotildees (32 - 12) e (32 - 13) na equaccedilatildeo (32 - 14) tem-se que

푓 (푠 ) = minus1푠 + 퐴 푍

15 + 푏radic퐼2radic퐼(1 + 푏radic퐼)

(32 - 15)

Entatildeo o algoritmo deve ser

푠 = 푠 minus

⎜⎛ln 푠 (푝퐼)

푠 + 퐴휙푍푝퐻2 radic퐼

1 + 푏radic퐼+ 2푏 ln 1 + 푏radic퐼

minus 1푠 + 퐴휙푍

15 + 푏radic퐼2radic퐼(1 + 푏radic퐼) ⎠

⎟⎞

(32 - 16)

4 Modelagem Termodinacircmica Proposta

41 Introduccedilatildeo

A condiccedilatildeo de equiliacutebrio entre duas fases (α e β) com m componentes eacute dada por

(Prausnitz et al 1999)

푝 = 푝

(41 ndash 1)

푇 = 푇

(41 ndash 2)

휇 = 휇⋮

휇 = 휇

(41 ndash 3)

Considerando o equiliacutebrio soacutelido-liacutequido (ESL) de sistemas contendo proteiacutenas

sendo que os efeitos da pressatildeo podem ser desprezados que as temperaturas nas

duas fases satildeo iguais e que na fase soacutelida soacute haacute proteiacutena tem-se que para a

proteiacutena a relaccedilatildeo de equiliacutebrio pode ser descrita por

휇 (푇푥) = 휇 (푇)

(41 ndash 4)

Contudo adotando-se a lei de Henry que eacute vaacutelida para baixas concentraccedilotildees de

soluto hipoacutetese que natildeo eacute distante dos valores observados da solubilidade de

proteiacutenas pode se escrever o potencial quiacutemico na fase liacutequida por

휇 (푇푥) = 휇 (푇 푥 ) + 푅푇푙푛푥

(41 ndash 5)

17 4 Modelagem Termodinacircmica Proposta

Entretanto variaccedilotildees de pH natildeo alteram o potencial quiacutemico da fase soacutelida o que

resulta pela relaccedilatildeo (41 ndash 4) que o mesmo natildeo altera tambeacutem o potencial quiacutemico

da fase liacutequida Com isso pela relaccedilatildeo (41 ndash 5) sendo o potencial quiacutemico de

referecircncia constante com o pH uma contradiccedilatildeo emerge a variaccedilatildeo do pH natildeo

poderia alterar o valor da solubilidade poreacutem a observaccedilatildeo experimental mostra o

contraacuterio Assim deve-se lembrar que pelo princiacutepio da eletroneutralidade a fase

soacutelida soacute possui moleacuteculas proteacuteicas eletricamente neutras e portanto o equiliacutebrio

de fases deve se estabelecer apenas entre as moleacuteculas presentes na fase soacutelida e

as moleacuteculas eletricamente neutras em soluccedilatildeo Ou seja como soacute moleacuteculas

eletricamente neutras podem estar na fase soacutelida o equiliacutebrio de fases depende

exclusivamente da fraccedilatildeo de moleacuteculas eletricamente neutras em soluccedilatildeo pois soacute

estas podem precipitar Assim tanto a equaccedilatildeo (41 ndash 4) quanto a equaccedilatildeo (41 ndash

5) devem ser aplicadas natildeo ao conjunto de todas as moleacuteculas de proteiacutena em

soluccedilatildeo mas somente as moleacuteculas proteacuteicas eletricamente neutras Portanto a

concentraccedilatildeo das moleacuteculas de proteiacutena eletricamente neutras em soluccedilatildeo eacute

constante com o pH e pode ser interpretada como a multiplicaccedilatildeo da fraccedilatildeo de

moleacuteculas eletricamente neutras pela concentraccedilatildeo total de proteiacutenas que eacute a

proacutepria solubilidade Assim uma relaccedilatildeo de inversa proporcionalidade eacute definida

quanto maior a fraccedilatildeo de moleacuteculas neutras menor seraacute a solubilidade de uma

proteiacutena em soluccedilatildeo Portanto no ponto isoeleacutetrico no qual haacute o miacutenimo de

solubilidade tem-se o ponto maacuteximo de fraccedilatildeo de moleacuteculas eletricamente neutras

A partir disto eacute possiacutevel escrever a equaccedilatildeo que rege o comportamento da

solubilidade de uma proteiacutena em funccedilatildeo do pH da soluccedilatildeo

휙(푝퐻)푆 (푝퐻) = 휆 = 푐표푛푠푡푎푛푡푒

(41 ndash 6)

18 4 Modelagem Termodinacircmica Proposta

Na equaccedilatildeo (41 ndash 6) o paracircmetro λ pode ser um paracircmetro de ajuste do modelo a

um conjunto de valores experimentais tendo se estabelecido uma funccedilatildeo objetivo ou

ainda dado pelo produto entre a solubilidade no ponto isoeleacutetrico e a fraccedilatildeo de

moleacuteculas eletricamente neutras em soluccedilatildeo tambeacutem no pI neste caso vale a

seguinte equaccedilatildeo

푠 (푝퐻) =휙(푝퐼)푠 (푝퐼)휙(푝퐻)

(41 ndash 7)

Sendo a equaccedilatildeo do modelo ndash equaccedilatildeo (41 ndash 7) ndash extremamente simples a uacutenica

dificuldade reside no caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras

(휙(푝퐻))

42 Caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras

Dentre os aminoaacutecidos que formam atraveacutes de ligaccedilotildees peptiacutedicas as proteiacutenas haacute

aqueles que possuem resiacuteduos com grupos ionizaacuteveis aleacutem dos grupos amina e

aacutecido carboxiacutelico terminais na cadeia Todos estes participam de equiliacutebrios

quiacutemicos com iacuteons H+ presentes na soluccedilatildeo entatildeo ao se alterar o pH da soluccedilatildeo

estes equiliacutebrios satildeo alterados

Assim haacute vaacuterias possibilidades de combinaccedilotildees de estados ionizados destes grupos

ionizaacuteveis que resultam em uma moleacutecula de proteiacutena eletricamente neutra Eacute

importante notar que dada a fraccedilatildeo de uma configuraccedilatildeo de uma moleacutecula neutra

todas as outras fraccedilotildees de configuraccedilotildees possiacuteveis que tambeacutem resultem em

moleacuteculas neutras satildeo proporcionais agrave fraccedilatildeo da configuraccedilatildeo dada pois todas as

configuraccedilotildees participam de equiliacutebrios entre si

19 4 Modelagem Termodinacircmica Proposta

Desta observaccedilatildeo implica-se que basta identificar uma configuraccedilatildeo proteacuteica cuja

soma dos estados ionizados resulte em carga nula para se descrever o equiliacutebrio de

fases em relaccedilatildeo ao pH na regiatildeo do ponto isoeleacutetrico onde esta consideraccedilatildeo eacute

predominante em relaccedilatildeo a outros possiacuteveis fenocircmenos

Contudo eacute necessaacuterio contabilizar a contribuiccedilatildeo de cada grupo ionizaacutevel via

equaccedilatildeo de Henderson-Hasselbach equaccedilatildeo (42 ndash 1)

훼 (푝퐻) =

⎩⎪⎨

⎪⎧ 10

1 + 10 푠푒 휈 = minus1

11 + 10

푠푒 휈 = +1

(42 ndash 1)

Na qual pKAj eacute o co-logaritmo da constante de equiliacutebrio do grupo ionizaacutevel do

resiacuteduo j j eacute estado carregado potencial do resiacuteduo j (-1 para grupos aacutecidos e +1

para grupos baacutesicos) e j eacute a fraccedilatildeo ionizada para o pH dado Para grupos cujo

estado de ionizaccedilatildeo na dada configuraccedilatildeo seja neutro a sua fraccedilatildeo eacute calculada tal

que a soma de sua fraccedilatildeo e da fraccedilatildeo ionizada tenha como resultado o valor

unitaacuterio

Assim a funccedilatildeo Pn pode ser escrita como o produto de cada fraccedilatildeo de cada grupo

ionizaacutevel j naquele estado (-1 0 ou +1) na configuraccedilatildeo neutra k em uma proteiacutena

com n grupos ionizaacuteveis Uma representaccedilatildeo matemaacutetica possiacutevel para esta funccedilatildeo

pode ser escrita como

휙 (푝퐻) = 훼 (푝퐻)

(42 ndash 2)

Na qual a fraccedilatildeo jrsquo(pH) eacute dada por

20 4 Modelagem Termodinacircmica Proposta

훼 (푝퐻) =훼 (푝퐻) 푠푒 휀 = 11 minus 훼 (푝퐻) 푠푒 휀 = 0

(42 ndash 3)

Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (42 ndash 3) e a resultante na equaccedilatildeo

(42 ndash 2) pode-se escrever que

휙 (푝퐻) =1

1 + 10

1 + 휈2 minus 휈 휀 10

minus휈 minus 1

2 minus 휈 휀 푐표푚 휀 = 0

(42 ndash 4)

A equaccedilatildeo (42 ndash 4) junto agrave equaccedilatildeo (41 ndash 7) constituem o modelo termodinacircmico

capaz de predizer a razatildeo entre as fraccedilotildees de moleacuteculas neutras de uma proteiacutena

em funccedilatildeo do pH na regiatildeo do ponto isoeleacutetrico mantendo fixas temperatura e forccedila

iocircnica Substituindo a equaccedilatildeo (42 ndash 4) na equaccedilatildeo (41 ndash 7) obteacutem-se para a

curva de solubilidade

푠 (푝퐻)푠 (푝퐼) =

1 + 101 + 10

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

푐표푚 휀 = 0

(42 ndash 8)

5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

51 Introduccedilatildeo

Segundo Groumlnwall (1941) na fase liacutequida haacute moleacuteculas de proteiacutenas com muitas

configuraccedilotildees k distintas que possuem carga liacutequida i e tambeacutem haacute certas

configuraccedilotildees que tem carga liacutequida nula e satildeo chamadas configuraccedilotildees neutras

Aleacutem disso estas uacuteltimas satildeo aquelas que determinam o equiliacutebrio de fases jaacute que

elas estatildeo em equiliacutebrio com a fase soacutelida na qual soacute haacute moleacuteculas neutras pelo

princiacutepio da eletroneutralidade Eacute tambeacutem afirmado que dado este equiliacutebrio a

atividade das moleacuteculas neutras natildeo se altera com a variaccedilatildeo do pH e eacute

proporcional agraves atividades de qualquer tipo de configuraccedilatildeo neutra

Neste mesmo trabalho eacute atribuiacuteda a Linderstroslashm-Lang o desenvolvimento de uma

teoria de prediccedilatildeo da solubilidade de proteiacutenas com a variaccedilatildeo do pH na regiatildeo do

ponto isoeleacutetrico Este desenvolvimento apresenta um balanccedilo de cargas de um

modo impliacutecito contudo como atestado por Groumlnwall o escasso conhecimento

sobre as estruturas proteacuteicas impediram agravequele tempo uma formulaccedilatildeo mais

pormenorizada do problema

52 Desenvolvimento teoacuterico

A base desta abordagem descrita por Groumlnwall e atribuiacuteda a Linderstroslashm-Lang

reside na hipoacutetese de que a moleacutecula de proteiacutena de configuraccedilatildeo k e carga nula

participa do seguinte equiliacutebrio com os iacuteons H+ e com sua forma de carga i

22 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

푃 + 푖퐻 푃 lowast

(52 ndash 1)

Note-se que o valor de i pode ser negativo A constante do equiliacutebrio quiacutemico

descrita pela equaccedilatildeo (52 ndash 1) pode ser expressa como

퐾 =푎

lowast

푎 푎

(52 ndash 2)

Sabendo que a atividade da moleacutecula de proteiacutena de configuraccedilatildeo k e carga i eacute dada

pelo produto entre sua concentraccedilatildeo e seu coeficiente de atividade tem-se que

푥lowast

= 푎 푎퐾훾

lowast

(52 ndash 3)

Entretanto a solubilidade da proteiacutena eacute soma das concentraccedilotildees de todas as

moleacuteculas de carga i Poreacutem a concentraccedilatildeo das moleacuteculas de carga i eacute a soma das

concentraccedilotildees das moleacuteculas de configuraccedilatildeo k Assim a solubilidade pode ser

escrita como

푠 (푝퐻) = 푎 푎퐾훾

lowast

(52 ndash 4)

Derivando a equaccedilatildeo (52 ndash 4) com respeito agrave atividade do iacuteon H+ considerando

que atividade da moleacutecula neutra eacute constante para qualquer configuraccedilatildeo k e ainda

que o coeficiente de atividade da proteiacutena de carga i independe da atividade do iacuteon

H+ tem-se que

푑푠푑푎 = 푖 ∙ 푎 푎

퐾훾

lowast

(52 ndash 5)

23 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

Sendo

푑 log 푠 (푝퐻)푑(푝퐻) = minus

푎푠 (푝퐻)

푑푠푑푎

(52 ndash 6)

Substituindo as equaccedilotildees (52 ndash 4) e (52 ndash 5) na equaccedilatildeo (52 ndash 6) e

reescrevendo em termos de pH e das concentraccedilotildees das proteiacutenas de carga i tem-

se que

푑 log 푠푑(푝퐻) = minus

sum (푖 ∙ 푥 )sum 푥

(52 ndash 7)

Contudo o termo do lado direito da equaccedilatildeo (52 ndash 7) estaacute associado ao conceito

de valecircncia meacutedia estabelecido por Linderstroslashm-Lang (1924)

횤 =sum (푖 ∙ 푥 )sum 푥

(52 ndash 8)

Os autores natildeo possuiacuteam um modo mais adequado de construir a curva de

solubilidade dada pela equaccedilatildeo (52 ndash 7) do que aproximar por uma funccedilatildeo linear o

perfil de carga liacutequida da proteiacutena obtido experimentalmente e integraacute-lo valendo-se

da analogia entre o conceito de carga liacutequida (Z) e de valecircncia meacutedia ( i ) Entretanto

hoje jaacute se tem uma descriccedilatildeo analiacutetica do perfil de carga liacutequida de proteiacutenas que

pode ser escrita como

푍(푝퐻) = 휈 훼

(52 ndash 9)

Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (52 ndash 9) e a resultante na equaccedilatildeo

(52 ndash 7) tem-se que

24 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

푑 log 푠푑(푝퐻) = minus

12

11 + 10

1 + 휈 + 휈 1 minus 휈 10

(52 ndash 10)

Integrando a equaccedilatildeo (52 ndash 10) de um ponto de referecircncia por exemplo do ponto

isoeleacutetrico (pI) ateacute um pH qualquer tem-se a seguinte relaccedilatildeo

푑 log 푠

( )

( )

= minus12

1

1 + 101 + 휈 + 휈 1 minus 휈 10 푑(푝퐻)

(52 ndash 11)

log푠 (푝퐻)푠 (푝퐼) = minus

12 1 + 휈

11 + 10

푑(푝퐻)

+ 휈 1 minus 휈10

1 + 10푑(푝퐻)

(52 ndash 12)

Fazendo a seguinte substituiccedilatildeo

푢 = 10 푡푎푙 푞푢푒 푑푢푢 = ln 10푑(푝퐻)

(52 ndash 13)

Tem-se que

log푠 (푝퐻)푠 (푝퐼) = minus

12

1 + 휈ln 10

1푢(1 + 푢) 푑푢 +

휈 1 minus 휈ln 10

1(1 + 푢) 푑푢

(52 ndash 14)

log푠 (푝퐻)푠 (푝퐼) = minus

12

1 + 휈ln 10

1푢 푑푢 minus

11 + 푢 푑푢 +

휈 1 minus 휈ln 10

1(1 + 푢) 푑푢

(52 ndash 15)

25 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐼) = minus

12 1 + 휈 log

1010

minus 휈 1 minus 휈 minus 1 + 휈 log1 + 101 + 10

(52 ndash 16)

Sendo

휈 1 minus 휈 minus 1 + 휈 = 휈 minus 휈 minus 1 minus 휈 = minus 1 + 휈 = minus2

(52 ndash 17)

Resultando em

log푠 (푝퐻)푠 (푝퐼) = log

1 + 101 + 10

minus1 + 휈

2 (푝퐻 minus 푝퐼)

(52 ndash 18)

Ainda eacute possiacutevel reescrever a equaccedilatildeo (52 ndash 18) como

log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log

1 + 101 + 10

(52 ndash 19)

Na qual n+ representa o nuacutemero de resiacuteduos ionizaacuteveis que na sua forma carregada

apresentam carga positiva A equaccedilatildeo (52 ndash 19) eacute uma expressatildeo analiacutetica que a

partir de dados da estrutura proteacuteica e de um dado de solubilidade permite predizer

a curva de solubilidade de uma dada proteiacutena em funccedilatildeo do pH na regiatildeo do ponto

isoeleacutetrico mantendo fixas a temperatura e a forccedila iocircnica do sistema

Eacute possiacutevel provar que as equaccedilotildees (42 ndash 8) e (52 ndash 19) satildeo idecircnticas - a prova

disso eacute descrita na seccedilatildeo 6 ndash e assim tem-se que apesar das distintas abordagens

a descriccedilatildeo do fenocircmeno eacute a mesma Note-se que um passo fundamental no

desenvolvimento da Equaccedilatildeo (52 ndash 5) eacute admitir que por hipoacutetese a atividade da

26 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

forma neutra natildeo depende do pH essa hipoacutetese tambeacutem eacute a base da equaccedilatildeo (41

ndash 7) Deve-se registrar o fato de que pelo melhor do nosso conhecimento esta eacute a

primeira vez que uma expressatildeo analiacutetica para o caacutelculo da solubilidade de

proteiacutenas em funccedilatildeo do pH eacute descrita mesmo no limite em que se considera vaacutelida

a lei de Henry

53 Soluccedilatildeo Paraboacutelica da Curva de Solubilidade

Tanto Groumlnwall (1941) quanto Fredericq e Neurath (1950) adotaram a hipoacutetese de

que os perfis de carga liacutequida da -lactoglobulina para um e da insulina para os

outros dois eram lineares na regiatildeo do ponto isoeleacutetrico Esta hipoacutetese eacute bastante

plausiacutevel e simplificadora principalmente a eacutepoca na qual estes trabalhos foram

desenvolvidos em que a estrutura proteacuteica bem como as constantes de ionizaccedilatildeo

dos resiacuteduos com grupos ionizaacuteveis era pouco conhecida De fato ainda hoje a falta

de dados das constantes de ionizaccedilatildeo na cadeia proteacuteica eacute o maior desafio no uso

do modelo rigoroso ndash equaccedilatildeo (52 ndash 18) Por isso o valor desta hipoacutetese de perfil

de carga liacutequida linear eacute notaacutevel

Supondo entatildeo que o perfil de carga seja linear eacute possiacutevel escrevecirc-lo como

푍(푝퐻) = minus퐴(푝퐻 minus 푝퐼) 푐표푚 퐴 gt 0

(53 ndash 1)

Substituindo (53 ndash 1) em (52 ndash 6)

푑 log 푠 (푝퐻)푑(푝퐻) = 퐴(푝퐻 minus 푝퐼)

(53 ndash 2)

Integrando (53 ndash 2) de um pH0 de referecircncia ateacute pH tem-se que

27 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐻 ) = 퐾[푝퐻 minus 2푝퐼(푝퐻 minus 푝퐻 ) minus 푝퐻 ] 푐표푚 퐾 =

퐴2

(53 ndash 3)

Ao se adotar como ponto de referecircncia o ponto isoeleacutetrico a equaccedilatildeo (53 ndash 3)

reduz-se agrave

log푠 (푝퐻)푠 (푝퐼) = 퐾(푝퐻 minus 푝퐼)

(53 ndash 4)

Contudo apesar da soluccedilatildeo quadraacutetica ou paraboacutelica para a equaccedilatildeo estendida de

Linderstroslashm-lang e Groumlnwall expressa na equaccedilatildeo (53 ndash 3) natildeo requerer os dados

das constantes de ionizaccedilatildeo dos resiacuteduos com grupos ionizaacuteveis ela exige a

definiccedilatildeo do paracircmetro A que fisicamente representa a inclinaccedilatildeo da reta de

aproximaccedilatildeo da curva de carga liacutequida e que pode ser calculado por correlaccedilatildeo a

partir de um conjunto de dados experimentais de solubilidade ou de carga liacutequida

6 Identidade entre o Modelo Proposto e a Equaccedilatildeo

Estendida de Linderstroslashm-Lang e Groumlnwall

A equaccedilatildeo final da modelagem termodinacircmica proposta apresentada na seccedilatildeo 4 eacute a

equaccedilatildeo (42 ndash 8) dada por

푠 (푝퐻)푠 (푝퐼) =

1 + 101 + 10

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 1)

Aplicando-se o logaritmo decimal nos dois termos da equaccedilatildeo (6 ndash 1) tem-se que

log푠 (푝퐻)푠 (푝퐼) = log

1 + 101 + 10

+ log

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 2)

Pelo bem da simplificaccedilatildeo desta deduccedilatildeo adotar-se-atildeo as seguintes funccedilotildees

휂 (푝퐻) = log

(6 ndash 3)

휃 (푝퐻) = log

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 4)

Assim pode-se reescrever a equaccedilatildeo (6 ndash 2) por

29 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐼) = 휂 (푝퐻) + 휃 (푝퐻)

(6 ndash 5)

Observando-se a equaccedilatildeo (6 ndash 5) tem-se que a funccedilatildeo j independe do estado de

ionizaccedilatildeo do resiacuteduo j poreacutem a funccedilatildeo jk depende Por isso deve-se analisar esta

funccedilatildeo para cada estado de ionizaccedilatildeo possiacutevel como mostrado na Tabela 61

Tabela 6 1 ndash Anaacutelise da funccedilatildeo jk para cada estado de ionizaccedilatildeo possiacutevel

j jk jk Quantidade de resiacuteduos neste estado

-1 -1 푝퐼 minus 푝퐻 na

0 0 nb

+1 +1 0 nc

0 푝퐼 minus 푝퐻 nd

Pela anaacutelise da Tabela 61 e considerando uma proteiacutena com n resiacuteduos com

grupos ionizaacuteveis infere-se que a equaccedilatildeo (6 ndash 5) pode ser reescrita como

log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)

(6 ndash 6)

Contudo as equaccedilotildees acima descritas satildeo vaacutelidas apenas para configuraccedilotildees

neutras pois apenas as configuraccedilotildees neutras da fase liacutequida estatildeo em equiliacutebrio

com as moleacuteculas de proteiacutena da fase soacutelida Para que uma configuraccedilatildeo seja

neutra vale a seguinte restriccedilatildeo

휀 = 0 hArr 푛 = 푛

(6 ndash 7)

30 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall

Substituindo a restriccedilatildeo dada pela equaccedilatildeo (6 ndash 7) na equaccedilatildeo (6 ndash 6) tem-se que

log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)

(6 ndash 8)

Ora mas a soma de nc e de nd natildeo resulta em outra coisa senatildeo no nuacutemero de

resiacuteduos com grupos ionizaacuteveis da estrutura proteacuteica cujo j seja +1 Assim

substituindo nc mais nd por n+ e substituindo a equaccedilatildeo (6 ndash 3) na equaccedilatildeo (6 ndash 8)

tem-se que

log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log

1 + 101 + 10

(6 ndash 9)

Ao se analisar a equaccedilatildeo (6 ndash 9) observa-se que ela eacute idecircntica a equaccedilatildeo estendida

de Linderstroslashm-Lang e Groumlnwall apresentada pela equaccedilatildeo (52 ndash 19) Com isso

tem-se que apesar das distintas formulaccedilotildees tanto a modelagem termodinacircmica aqui

proposta quanto a extensatildeo a teoria de Linderstroslashm-Lang e Groumlnwall resultam na

mesma descriccedilatildeo do fenocircmeno Aleacutem disso a equaccedilatildeo final dos modelos eacute

extremamente simples e depende apenas de um ponto de referecircncia e dos dados da

estrutura da moleacutecula de proteiacutena cuja solubilidade se deseja estudar

7 Aplicaccedilatildeo dos Modelos Expostos

Para validar o modelo comparando-o com o caacutelculo feito a partir da teoria de Debye-

Huumlckel o criteacuterio que relaciona os pontos calculados pelo modelo com os pontos

experimentais foi estabelecido a partir da seguinte funccedilatildeo objetivo (FO)

퐹푂 =1푁

푠 minus 푠푠

(7 ndash 1)

Contudo a equaccedilatildeo (7 ndash 1) natildeo eacute a melhor definiccedilatildeo de funccedilatildeo objetivo neste caso

pois a derivada da curva de solubilidade eacute razoavelmente grande nos dois lados do

ponto isoeleacutetrico e isso permite que pequenos desvios na direccedilatildeo horizontal

resultem em um grande aumento no valor da funccedilatildeo objetivo Uma soluccedilatildeo possiacutevel

seria substituir essa funccedilatildeo objetivo por uma funccedilatildeo definida pela soma do quadrado

da distacircncia do ponto experimental agrave curva do modelo principalmente se fosse

necessaacuterio calcular algum paracircmetro do modelo via otimizaccedilatildeo da funccedilatildeo objetivo

estipulada Natildeo sendo este o escopo deste trabalho optou-se pelo uso da FO

definida na equaccedilatildeo (7 ndash 1)

71 Solubilidade da Insulina Suiacutena

As Figuras 711 712 e 713 apresentam os graacuteficos da curva de solubilidade

dada pelos pontos experimentais pelo modelo proposto pela abordagem claacutessica e

tambeacutem a curva obtida pela soluccedilatildeo paraboacutelica da Equaccedilatildeo de Linderstroslashm-Lang e

Groumlnwall em trecircs temperaturas distintas

32 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 711 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 25 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

Figura 712 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 15 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

00

40

80

120

160

200

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

00

50

100

150

200

250

300

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

33 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 713 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 5 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

Os desvios da curva obtida pelo modelo proposto para valores de pH distantes do pI

podem ser explicados por ao menos trecircs importantes motivos dois devidos a

hipoacuteteses do modelo e um devido a fenocircmenos intriacutensecos a proteiacutena Sabendo que

no pI a solubilidade eacute miacutenima para valores de pH distantes do pI pode-se ter

solubilidades suficientemente grandes para que a validade da lei de Henry ndash adotada

na formulaccedilatildeo do modelo - seja questionada pois quanto mais distante do pI maior

a solubilidade e menor a validade da lei de Henry jaacute que haacute um aumento da

concentraccedilatildeo do soluto (proteiacutena) na soluccedilatildeo e tambeacutem ao fato do modelo prever

solubilidade infinita quando a fraccedilatildeo de moleacuteculas eletricamente neutras tende a

zero

limrarr푠 = lim

rarr

Φ(푝퐼)푠 (푝퐼)Φ(푝퐻) = +infin

(711 ndash 1)

00

50

100

150

200

250

300

350

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

34 7 Aplicaccedilatildeo dos Modelos Expostos

Todavia ainda haacute um fator de ordem natural que justifica o desvio apresentado para

valores de pH distantes do pI o desnovelamento da cadeia proteacuteica Este fenocircmeno

pode ocorrer de maneira a expor grupos hidroacutefobos resiacuteduos antes natildeo expostos

acrescentando relaccedilotildees de equiliacutebrio quiacutemico natildeo existentes na regiatildeo do pI

alterando o equiliacutebrio de fases e portanto alterando o valor da solubilidade

A Tabela 711 apresenta os valores obtidos para a funccedilatildeo objetivo definida em (7 ndash

1) tanto para o modelo proposto quanto para a abordagem claacutessica para trecircs

diferentes temperaturas

Tabela 711 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada

abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para insulina

suiacutena

T ordmC Abordagem FO

25 P 01857 C 02535

15 P 01981 C 05056

5 P 03595 C 03064

Observando-se a Tabela 711 vecirc-se que o modelo apresentou melhores resultados

do que o caacutelculo efetuado atraveacutes da abordagem claacutessica no que tange a

minimizaccedilatildeo da funccedilatildeo objetivo exceto para os dados a 5 ordmC

Tambeacutem eacute possiacutevel observar que a funccedilatildeo objetivo sofreu aumento com a

diminuiccedilatildeo da temperatura Isto ocorreu principalmente devido agrave dificuldade de

obter dados experimentais de solubilidade a temperaturas baixas o que aumenta o

desvio experimental fazendo com que se tenha um aumento do valor da funccedilatildeo

objetivo como a definida em (5 ndash 1) Um efeito secundaacuterio que tambeacutem pressiona a

35 7 Aplicaccedilatildeo dos Modelos Expostos

funccedilatildeo objetivo eacute o fato dos dados de pKA terem sido obtidos a uma temperatura

especiacutefica o que tende a acrescentar erro no caacutelculo de solubilidades a temperaturas

diferentes ainda que o pKA natildeo varie de forma ab-rupta com a temperatura

Outra observaccedilatildeo que deve ser registrada eacute o fato da funccedilatildeo objetivo para a

abordagem claacutessica na temperatura de 15 ordmC divergir a um valor tatildeo elevado em

relaccedilatildeo aos demais Isto se deve a um ponto experimental especiacutefico a um pH de

45 a solubilidade da insulina suiacutena obtida experimentalmente eacute 230 x 10-5 mol kg-1

enquanto a calculada pelo modelo proposto eacute 230 x 10-5 mol kg-1 e a calculada pela

abordagem claacutessica eacute 520 x 10-5 mol kg-1 Por conta do desvio deste ponto a funccedilatildeo

objetivo para a abordagem claacutessica nesta temperatura tem um aumento significativo

A Tabela 712 apresenta os valores do paracircmetro K da soluccedilatildeo paraboacutelica obtidos

neste trabalho para a insulina suiacutena comparados ao encontrado na literatura

Tabela 712 ndash Valores do paracircmetro K da soluccedilatildeo paraboacutelica para a insulina suiacutena

Referecircncias T ordmC K Fredericq e Neurath (1950) - 081 Neste trabalho 25 104 Neste trabalho 15 101 Neste trabalho 5 145

Pela Tabela 712 pode-se observar que haacute uma diferenccedila pequena entre os

valores do paracircmetro K obtidos neste trabalho e por Fredericq e Neurath (1950) Por

isso natildeo se pode afirmar a que se deve esta diferenccedila se eacute devido a diferenccedilas entre

procedimentos experimentais ou se eacute devido agrave diferenccedila de meacutetodo de caacutelculo do

paracircmetro Apesar de no experimento realizado por Fredericq e Neurath (1950)

haver a presenccedila do acircnion tiocianato e este acircnion interagir com grupos ionizaacuteveis

da cadeia proteacuteica como observado pelos autores do trabalho tambeacutem estes

36 7 Aplicaccedilatildeo dos Modelos Expostos

proacuteprios autores afirmam que a presenccedila deste acircnion natildeo altera a forma da curva

que eacute basicamente determinada pelo paracircmetro K De qualquer modo eacute interessante

observar a proximidade dos valores encontrados neste trabalho com o obtido por

Fredericq e Neurath (1950) pelo menos no que diz respeito agrave ordem de grandeza do

paracircmetro em questatildeo

72 Solubilidade da Lisozima de clara de ovo de galinha

Um modelo para ser validado necessita correlacionar dados experimentais de modo

satisfatoacuterio ou seja um modelo deve buscar fidelidade ao fenocircmeno fiacutesico

observado Assim na procura de dados de solubilidade de proteiacutenas poucos dados

na regiatildeo do pI foram encontrados Este eacute o caso da lisozima de clara de ovo de

galinha que apesar de ter muitos estudos de solubilidade nenhum deles se

encontra na regiatildeo do pI Surgiu assim a necessidade de se obter estes dados

experimentais para poder validar o modelo proposto A escolha da lisozima de clara

de ovo de galinha se deu em parte pela sua importacircncia mas tambeacutem em parte por

ter os valores de pKA conhecidos

A curva de solubilidade da lisozima de clara de ovo de galinha levantada neste

trabalho estaacute apresentada na Figura 721

37 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em

soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e

dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()

Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento

esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH

isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de

soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se

comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto

isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da

soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos

ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente

neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a

solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e

00

10

20

30

40

50

60

70

80

90

100

95 100 105 110 115 120

Solu

bilid

ade

(mg

mL)

pH

38 7 Aplicaccedilatildeo dos Modelos Expostos

alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado

em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo

Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo

a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo

Por conta de falta de dados a este respeito modelou-se apenas a curva de

solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura

722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de

galinha em funccedilatildeo do pH da soluccedilatildeo

Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)

00

10

20

30

40

50

60

70

80

90

96 99 102 105 108 111 114 117 120

Solu

bilid

ade

(mg

mL)

pH

39 7 Aplicaccedilatildeo dos Modelos Expostos

O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721

Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada

abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima

de clara de ovo de galinha

T ordmC Abordagem FO

25 P 4650 C gt7919a

a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado

Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta

aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a

abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca

de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos

anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao

efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de

clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a

variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A

proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de

cargas pontuais de Debye-Huumlckel

8 Conclusotildees

A modelagem termodinacircmica proposta neste trabalho apresentou expressivos

resultados quando comparada a abordagem claacutessica de Debye-Huumlckel

Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o

modelo aproximou melhor os pontos experimentais do que a referida abordagem

comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima

ao ponto isoeleacutetrico

Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica

para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua

construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo

lugar por sua aplicabilidade

Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis

da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva

em regiotildees distantes do ponto isoeleacutetrico

9 Referecircncias Bibliograacuteficas

BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene

Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects

Biophys J 95 1285-1294 2008

FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and

other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72

2684 - 26911950

GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v

93 p 517-542 1931

GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab

Carlsberg v 24 p 185-200 1941

KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native

and mutant insulins pK perturbation of B13-Glu in aggregated species Arch

Biochem Biophys v 283 p 496-502 1990

KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for

the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng

Chem Res v 35 p 4319-4327 1996

42 9 Referecircncias Bibliograacuteficas

KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen

lysozyme J Biochem v 87 p 1215-1219 1980

LADISCH M R Bioseparations Engineering principles practice and

economics John Wiley amp Sons 2001 pp1 116 ndash 117 133

LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab

Carlsberg v 15 p 1-29 1924

PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da

particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas

2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP

PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the

excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte

solutions Fluid Phase Equilib v 269 p 25ndash35 2008

PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-

contribution model involving phase and chemical equilibrium Ind Eng Chem Res

v 33 p 1341-1347 1994

PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277

1973

PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino

acids Fluid Phase Equilib v 152 p 121-132 1998

43 9 Referecircncias Bibliograacuteficas

PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular

Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999

SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of

equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte

solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009

TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J

R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with

carbon dioxide Biotech Bioeng v103 p 909-919 2009

TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer

free energy Biophys J v 95 p 2601-2609 2008

TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in

water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95

2009

Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na

cadeia proteacuteica

Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo

de ionizaccedilatildeo

퐻퐴 퐴 + 퐻

(A ndash 1)

Assim considerando que a constante de equiliacutebrio

퐾 = 푎

(A ndash 2)

Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que

퐾 =[퐴 ][퐻 ]

[퐻퐴]

(A ndash 3)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que

log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]

(A ndash 4)

Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado

por

minus log[휑] = 푝휑

(A ndash 5)

Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que

45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

푝퐾 = log[퐻퐴][퐴 ] + 푝퐻

(A ndash 6)

Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por

훼 =[퐴 ]

[퐻퐴] + [퐴 ]

(A ndash 7)

Reescrevendo (A ndash 7) tem-se que

훼 =[퐴 ] [퐻퐴frasl ]

1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =

훼1 minus 훼

(A ndash 8)

Substituindo (A ndash 8) em (A ndash 6) tem-se que

푝퐾 = log훼

1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10

(A ndash 9)

Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos

훼 =1

1 + 10

(A ndash 10)

Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio

퐴 + 퐻 퐻퐴

(A ndash 11)

Pode se escrever a constante de equiliacutebrio como

퐾 =[퐻퐴 ]

[퐴][퐻 ]

(A ndash 12)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que

46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

log퐾 = minus log[퐴]

[퐻퐴 ] minus log[퐻 ]

(A -13)

Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por

훼 =[퐻퐴 ]

[퐴] + [퐻퐴 ]

(A ndash 14)

Assim a equaccedilatildeo (A ndash 13) fica

훼1 minus 훼 = 10

(A ndash 15)

Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo

훼 =10

1 + 10

(A ndash 16)

Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos

modelos expostos

Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]

48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]

49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)

50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])

51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]

52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])

53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)

54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2

55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO

13 3 Modelo Estendido de Debye-Huumlckel

E a forccedila iocircnica eacute dada pela equaccedilatildeo (32 - 5) descrita abaixo

퐼 = 12

푚 푍

(32 - 5)

Contudo no ponto isoeleacutetrico a carga meacutedia da proteiacutena eacute nula portanto o termo de

Debye-Huumlckel se anula e o coeficiente de atividade se torna unitaacuterio

ln푎 (푝퐼) = ln 푠 (푝퐼)

(32 - 6)

Considerando que a atividade da proteiacutena seja constante com a variaccedilatildeo de pH isto

implica que esta eacute sempre igual agrave solubilidade da proteiacutena no ponto isoeleacutetrico e

portanto vale que

ln푎 (푝퐻) = ln 푠 (푝퐻) + ln 훾(푝퐻) = ln 푠 (푝퐼)

(32 - 7)

Assim

ln 푠 (푝퐻) = ln 푠 (푝퐼) + 퐴휙푍푝퐻2 radic퐼1 + 푏radic퐼

+2푏

ln 1 + 푏radic퐼

(32 - 8)

Esta equaccedilatildeo prevecirc a curva de solubilidade em funccedilatildeo do pH atraveacutes do caacutelculo da

atividade da proteiacutena na fase liacutequida pela equaccedilatildeo estendida de Debye-Huumlckel Para

resolvecirc-la eacute necessaacuterio se utilizar de um meacutetodo numeacuterico pois a forccedila iocircnica

depende da solubilidade naquele pH Optou-se neste trabalho pelo Meacutetodo de

Newton-Raphson para executar o meacutetodo iterativo que eacute exigido pela equaccedilatildeo (32

ndash 8) Para aplicar este meacutetodo arbitrou-se uma funccedilatildeo f(sp) definida aqui como

푓 푠 = minus ln 푠 (푝퐻) + ln 푠 (푝퐼) + 퐴휙푍푝퐻2 radic퐼

1 + 푏radic퐼+

2푏

ln 1 + 푏radic퐼

(32 - 9)

14 3 Modelo Estendido de Debye-Huumlckel

Assim ao calcular o sp que zera esta funccedilatildeo f(sp) saber-se-aacute que eacute a proacutepria

solubilidade que se deseja calcular Para aplicar o Meacutetodo de Newton-Raphson

basta derivar a funccedilatildeo f(sp) e aplicar o seguinte algoritmo de resoluccedilatildeo

푠 = 푠 minus푓(푠 )푓 (푠 )

(32 - 10)

Para calcular frsquo(s) deve-se considerar que a forccedila iocircnica depende da solubilidade

Para isto observando a equaccedilatildeo (32 - 5) vecirc-se que a forccedila iocircnica eacute dada pelo

somatoacuterio das contribuiccedilotildees de todos os iacuteons presentes na soluccedilatildeo por isso aqui

cabe um artifiacutecio de dividir estas contribuiccedilotildees em duas macro-contribuiccedilotildees aquela

devida a todos os iacuteons presentes na soluccedilatildeo exclusive os grupos ionizaacuteveis

presentes nas moleacuteculas da proteiacutena em questatildeo (I0) e que se considera constante

com o pH e aquela que engloba apenas os grupos ionizaacuteveis presentes nas

moleacuteculas da proteiacutena (IP)

퐼 = 퐼 + 퐼 = 퐼 +12푍 푠

(32 - 11)

Considerando a funccedilatildeo w tal que

푤 = radic퐼 = 퐼 +12푍 푠

(32 - 12)

Sendo

푤 =14푍 퐼

(32 - 13)

Entatildeo aplicando-se as devidas regras de derivaccedilatildeo tem-se

15 3 Modelo Estendido de Debye-Huumlckel

푓 (푠 ) = minus1푠 + 퐴 푍

3푤 + 2푤 푏푤(1 + 푏푤)

(32 - 14)

Substituindo as equaccedilotildees (32 - 12) e (32 - 13) na equaccedilatildeo (32 - 14) tem-se que

푓 (푠 ) = minus1푠 + 퐴 푍

15 + 푏radic퐼2radic퐼(1 + 푏radic퐼)

(32 - 15)

Entatildeo o algoritmo deve ser

푠 = 푠 minus

⎜⎛ln 푠 (푝퐼)

푠 + 퐴휙푍푝퐻2 radic퐼

1 + 푏radic퐼+ 2푏 ln 1 + 푏radic퐼

minus 1푠 + 퐴휙푍

15 + 푏radic퐼2radic퐼(1 + 푏radic퐼) ⎠

⎟⎞

(32 - 16)

4 Modelagem Termodinacircmica Proposta

41 Introduccedilatildeo

A condiccedilatildeo de equiliacutebrio entre duas fases (α e β) com m componentes eacute dada por

(Prausnitz et al 1999)

푝 = 푝

(41 ndash 1)

푇 = 푇

(41 ndash 2)

휇 = 휇⋮

휇 = 휇

(41 ndash 3)

Considerando o equiliacutebrio soacutelido-liacutequido (ESL) de sistemas contendo proteiacutenas

sendo que os efeitos da pressatildeo podem ser desprezados que as temperaturas nas

duas fases satildeo iguais e que na fase soacutelida soacute haacute proteiacutena tem-se que para a

proteiacutena a relaccedilatildeo de equiliacutebrio pode ser descrita por

휇 (푇푥) = 휇 (푇)

(41 ndash 4)

Contudo adotando-se a lei de Henry que eacute vaacutelida para baixas concentraccedilotildees de

soluto hipoacutetese que natildeo eacute distante dos valores observados da solubilidade de

proteiacutenas pode se escrever o potencial quiacutemico na fase liacutequida por

휇 (푇푥) = 휇 (푇 푥 ) + 푅푇푙푛푥

(41 ndash 5)

17 4 Modelagem Termodinacircmica Proposta

Entretanto variaccedilotildees de pH natildeo alteram o potencial quiacutemico da fase soacutelida o que

resulta pela relaccedilatildeo (41 ndash 4) que o mesmo natildeo altera tambeacutem o potencial quiacutemico

da fase liacutequida Com isso pela relaccedilatildeo (41 ndash 5) sendo o potencial quiacutemico de

referecircncia constante com o pH uma contradiccedilatildeo emerge a variaccedilatildeo do pH natildeo

poderia alterar o valor da solubilidade poreacutem a observaccedilatildeo experimental mostra o

contraacuterio Assim deve-se lembrar que pelo princiacutepio da eletroneutralidade a fase

soacutelida soacute possui moleacuteculas proteacuteicas eletricamente neutras e portanto o equiliacutebrio

de fases deve se estabelecer apenas entre as moleacuteculas presentes na fase soacutelida e

as moleacuteculas eletricamente neutras em soluccedilatildeo Ou seja como soacute moleacuteculas

eletricamente neutras podem estar na fase soacutelida o equiliacutebrio de fases depende

exclusivamente da fraccedilatildeo de moleacuteculas eletricamente neutras em soluccedilatildeo pois soacute

estas podem precipitar Assim tanto a equaccedilatildeo (41 ndash 4) quanto a equaccedilatildeo (41 ndash

5) devem ser aplicadas natildeo ao conjunto de todas as moleacuteculas de proteiacutena em

soluccedilatildeo mas somente as moleacuteculas proteacuteicas eletricamente neutras Portanto a

concentraccedilatildeo das moleacuteculas de proteiacutena eletricamente neutras em soluccedilatildeo eacute

constante com o pH e pode ser interpretada como a multiplicaccedilatildeo da fraccedilatildeo de

moleacuteculas eletricamente neutras pela concentraccedilatildeo total de proteiacutenas que eacute a

proacutepria solubilidade Assim uma relaccedilatildeo de inversa proporcionalidade eacute definida

quanto maior a fraccedilatildeo de moleacuteculas neutras menor seraacute a solubilidade de uma

proteiacutena em soluccedilatildeo Portanto no ponto isoeleacutetrico no qual haacute o miacutenimo de

solubilidade tem-se o ponto maacuteximo de fraccedilatildeo de moleacuteculas eletricamente neutras

A partir disto eacute possiacutevel escrever a equaccedilatildeo que rege o comportamento da

solubilidade de uma proteiacutena em funccedilatildeo do pH da soluccedilatildeo

휙(푝퐻)푆 (푝퐻) = 휆 = 푐표푛푠푡푎푛푡푒

(41 ndash 6)

18 4 Modelagem Termodinacircmica Proposta

Na equaccedilatildeo (41 ndash 6) o paracircmetro λ pode ser um paracircmetro de ajuste do modelo a

um conjunto de valores experimentais tendo se estabelecido uma funccedilatildeo objetivo ou

ainda dado pelo produto entre a solubilidade no ponto isoeleacutetrico e a fraccedilatildeo de

moleacuteculas eletricamente neutras em soluccedilatildeo tambeacutem no pI neste caso vale a

seguinte equaccedilatildeo

푠 (푝퐻) =휙(푝퐼)푠 (푝퐼)휙(푝퐻)

(41 ndash 7)

Sendo a equaccedilatildeo do modelo ndash equaccedilatildeo (41 ndash 7) ndash extremamente simples a uacutenica

dificuldade reside no caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras

(휙(푝퐻))

42 Caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras

Dentre os aminoaacutecidos que formam atraveacutes de ligaccedilotildees peptiacutedicas as proteiacutenas haacute

aqueles que possuem resiacuteduos com grupos ionizaacuteveis aleacutem dos grupos amina e

aacutecido carboxiacutelico terminais na cadeia Todos estes participam de equiliacutebrios

quiacutemicos com iacuteons H+ presentes na soluccedilatildeo entatildeo ao se alterar o pH da soluccedilatildeo

estes equiliacutebrios satildeo alterados

Assim haacute vaacuterias possibilidades de combinaccedilotildees de estados ionizados destes grupos

ionizaacuteveis que resultam em uma moleacutecula de proteiacutena eletricamente neutra Eacute

importante notar que dada a fraccedilatildeo de uma configuraccedilatildeo de uma moleacutecula neutra

todas as outras fraccedilotildees de configuraccedilotildees possiacuteveis que tambeacutem resultem em

moleacuteculas neutras satildeo proporcionais agrave fraccedilatildeo da configuraccedilatildeo dada pois todas as

configuraccedilotildees participam de equiliacutebrios entre si

19 4 Modelagem Termodinacircmica Proposta

Desta observaccedilatildeo implica-se que basta identificar uma configuraccedilatildeo proteacuteica cuja

soma dos estados ionizados resulte em carga nula para se descrever o equiliacutebrio de

fases em relaccedilatildeo ao pH na regiatildeo do ponto isoeleacutetrico onde esta consideraccedilatildeo eacute

predominante em relaccedilatildeo a outros possiacuteveis fenocircmenos

Contudo eacute necessaacuterio contabilizar a contribuiccedilatildeo de cada grupo ionizaacutevel via

equaccedilatildeo de Henderson-Hasselbach equaccedilatildeo (42 ndash 1)

훼 (푝퐻) =

⎩⎪⎨

⎪⎧ 10

1 + 10 푠푒 휈 = minus1

11 + 10

푠푒 휈 = +1

(42 ndash 1)

Na qual pKAj eacute o co-logaritmo da constante de equiliacutebrio do grupo ionizaacutevel do

resiacuteduo j j eacute estado carregado potencial do resiacuteduo j (-1 para grupos aacutecidos e +1

para grupos baacutesicos) e j eacute a fraccedilatildeo ionizada para o pH dado Para grupos cujo

estado de ionizaccedilatildeo na dada configuraccedilatildeo seja neutro a sua fraccedilatildeo eacute calculada tal

que a soma de sua fraccedilatildeo e da fraccedilatildeo ionizada tenha como resultado o valor

unitaacuterio

Assim a funccedilatildeo Pn pode ser escrita como o produto de cada fraccedilatildeo de cada grupo

ionizaacutevel j naquele estado (-1 0 ou +1) na configuraccedilatildeo neutra k em uma proteiacutena

com n grupos ionizaacuteveis Uma representaccedilatildeo matemaacutetica possiacutevel para esta funccedilatildeo

pode ser escrita como

휙 (푝퐻) = 훼 (푝퐻)

(42 ndash 2)

Na qual a fraccedilatildeo jrsquo(pH) eacute dada por

20 4 Modelagem Termodinacircmica Proposta

훼 (푝퐻) =훼 (푝퐻) 푠푒 휀 = 11 minus 훼 (푝퐻) 푠푒 휀 = 0

(42 ndash 3)

Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (42 ndash 3) e a resultante na equaccedilatildeo

(42 ndash 2) pode-se escrever que

휙 (푝퐻) =1

1 + 10

1 + 휈2 minus 휈 휀 10

minus휈 minus 1

2 minus 휈 휀 푐표푚 휀 = 0

(42 ndash 4)

A equaccedilatildeo (42 ndash 4) junto agrave equaccedilatildeo (41 ndash 7) constituem o modelo termodinacircmico

capaz de predizer a razatildeo entre as fraccedilotildees de moleacuteculas neutras de uma proteiacutena

em funccedilatildeo do pH na regiatildeo do ponto isoeleacutetrico mantendo fixas temperatura e forccedila

iocircnica Substituindo a equaccedilatildeo (42 ndash 4) na equaccedilatildeo (41 ndash 7) obteacutem-se para a

curva de solubilidade

푠 (푝퐻)푠 (푝퐼) =

1 + 101 + 10

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

푐표푚 휀 = 0

(42 ndash 8)

5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

51 Introduccedilatildeo

Segundo Groumlnwall (1941) na fase liacutequida haacute moleacuteculas de proteiacutenas com muitas

configuraccedilotildees k distintas que possuem carga liacutequida i e tambeacutem haacute certas

configuraccedilotildees que tem carga liacutequida nula e satildeo chamadas configuraccedilotildees neutras

Aleacutem disso estas uacuteltimas satildeo aquelas que determinam o equiliacutebrio de fases jaacute que

elas estatildeo em equiliacutebrio com a fase soacutelida na qual soacute haacute moleacuteculas neutras pelo

princiacutepio da eletroneutralidade Eacute tambeacutem afirmado que dado este equiliacutebrio a

atividade das moleacuteculas neutras natildeo se altera com a variaccedilatildeo do pH e eacute

proporcional agraves atividades de qualquer tipo de configuraccedilatildeo neutra

Neste mesmo trabalho eacute atribuiacuteda a Linderstroslashm-Lang o desenvolvimento de uma

teoria de prediccedilatildeo da solubilidade de proteiacutenas com a variaccedilatildeo do pH na regiatildeo do

ponto isoeleacutetrico Este desenvolvimento apresenta um balanccedilo de cargas de um

modo impliacutecito contudo como atestado por Groumlnwall o escasso conhecimento

sobre as estruturas proteacuteicas impediram agravequele tempo uma formulaccedilatildeo mais

pormenorizada do problema

52 Desenvolvimento teoacuterico

A base desta abordagem descrita por Groumlnwall e atribuiacuteda a Linderstroslashm-Lang

reside na hipoacutetese de que a moleacutecula de proteiacutena de configuraccedilatildeo k e carga nula

participa do seguinte equiliacutebrio com os iacuteons H+ e com sua forma de carga i

22 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

푃 + 푖퐻 푃 lowast

(52 ndash 1)

Note-se que o valor de i pode ser negativo A constante do equiliacutebrio quiacutemico

descrita pela equaccedilatildeo (52 ndash 1) pode ser expressa como

퐾 =푎

lowast

푎 푎

(52 ndash 2)

Sabendo que a atividade da moleacutecula de proteiacutena de configuraccedilatildeo k e carga i eacute dada

pelo produto entre sua concentraccedilatildeo e seu coeficiente de atividade tem-se que

푥lowast

= 푎 푎퐾훾

lowast

(52 ndash 3)

Entretanto a solubilidade da proteiacutena eacute soma das concentraccedilotildees de todas as

moleacuteculas de carga i Poreacutem a concentraccedilatildeo das moleacuteculas de carga i eacute a soma das

concentraccedilotildees das moleacuteculas de configuraccedilatildeo k Assim a solubilidade pode ser

escrita como

푠 (푝퐻) = 푎 푎퐾훾

lowast

(52 ndash 4)

Derivando a equaccedilatildeo (52 ndash 4) com respeito agrave atividade do iacuteon H+ considerando

que atividade da moleacutecula neutra eacute constante para qualquer configuraccedilatildeo k e ainda

que o coeficiente de atividade da proteiacutena de carga i independe da atividade do iacuteon

H+ tem-se que

푑푠푑푎 = 푖 ∙ 푎 푎

퐾훾

lowast

(52 ndash 5)

23 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

Sendo

푑 log 푠 (푝퐻)푑(푝퐻) = minus

푎푠 (푝퐻)

푑푠푑푎

(52 ndash 6)

Substituindo as equaccedilotildees (52 ndash 4) e (52 ndash 5) na equaccedilatildeo (52 ndash 6) e

reescrevendo em termos de pH e das concentraccedilotildees das proteiacutenas de carga i tem-

se que

푑 log 푠푑(푝퐻) = minus

sum (푖 ∙ 푥 )sum 푥

(52 ndash 7)

Contudo o termo do lado direito da equaccedilatildeo (52 ndash 7) estaacute associado ao conceito

de valecircncia meacutedia estabelecido por Linderstroslashm-Lang (1924)

횤 =sum (푖 ∙ 푥 )sum 푥

(52 ndash 8)

Os autores natildeo possuiacuteam um modo mais adequado de construir a curva de

solubilidade dada pela equaccedilatildeo (52 ndash 7) do que aproximar por uma funccedilatildeo linear o

perfil de carga liacutequida da proteiacutena obtido experimentalmente e integraacute-lo valendo-se

da analogia entre o conceito de carga liacutequida (Z) e de valecircncia meacutedia ( i ) Entretanto

hoje jaacute se tem uma descriccedilatildeo analiacutetica do perfil de carga liacutequida de proteiacutenas que

pode ser escrita como

푍(푝퐻) = 휈 훼

(52 ndash 9)

Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (52 ndash 9) e a resultante na equaccedilatildeo

(52 ndash 7) tem-se que

24 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

푑 log 푠푑(푝퐻) = minus

12

11 + 10

1 + 휈 + 휈 1 minus 휈 10

(52 ndash 10)

Integrando a equaccedilatildeo (52 ndash 10) de um ponto de referecircncia por exemplo do ponto

isoeleacutetrico (pI) ateacute um pH qualquer tem-se a seguinte relaccedilatildeo

푑 log 푠

( )

( )

= minus12

1

1 + 101 + 휈 + 휈 1 minus 휈 10 푑(푝퐻)

(52 ndash 11)

log푠 (푝퐻)푠 (푝퐼) = minus

12 1 + 휈

11 + 10

푑(푝퐻)

+ 휈 1 minus 휈10

1 + 10푑(푝퐻)

(52 ndash 12)

Fazendo a seguinte substituiccedilatildeo

푢 = 10 푡푎푙 푞푢푒 푑푢푢 = ln 10푑(푝퐻)

(52 ndash 13)

Tem-se que

log푠 (푝퐻)푠 (푝퐼) = minus

12

1 + 휈ln 10

1푢(1 + 푢) 푑푢 +

휈 1 minus 휈ln 10

1(1 + 푢) 푑푢

(52 ndash 14)

log푠 (푝퐻)푠 (푝퐼) = minus

12

1 + 휈ln 10

1푢 푑푢 minus

11 + 푢 푑푢 +

휈 1 minus 휈ln 10

1(1 + 푢) 푑푢

(52 ndash 15)

25 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐼) = minus

12 1 + 휈 log

1010

minus 휈 1 minus 휈 minus 1 + 휈 log1 + 101 + 10

(52 ndash 16)

Sendo

휈 1 minus 휈 minus 1 + 휈 = 휈 minus 휈 minus 1 minus 휈 = minus 1 + 휈 = minus2

(52 ndash 17)

Resultando em

log푠 (푝퐻)푠 (푝퐼) = log

1 + 101 + 10

minus1 + 휈

2 (푝퐻 minus 푝퐼)

(52 ndash 18)

Ainda eacute possiacutevel reescrever a equaccedilatildeo (52 ndash 18) como

log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log

1 + 101 + 10

(52 ndash 19)

Na qual n+ representa o nuacutemero de resiacuteduos ionizaacuteveis que na sua forma carregada

apresentam carga positiva A equaccedilatildeo (52 ndash 19) eacute uma expressatildeo analiacutetica que a

partir de dados da estrutura proteacuteica e de um dado de solubilidade permite predizer

a curva de solubilidade de uma dada proteiacutena em funccedilatildeo do pH na regiatildeo do ponto

isoeleacutetrico mantendo fixas a temperatura e a forccedila iocircnica do sistema

Eacute possiacutevel provar que as equaccedilotildees (42 ndash 8) e (52 ndash 19) satildeo idecircnticas - a prova

disso eacute descrita na seccedilatildeo 6 ndash e assim tem-se que apesar das distintas abordagens

a descriccedilatildeo do fenocircmeno eacute a mesma Note-se que um passo fundamental no

desenvolvimento da Equaccedilatildeo (52 ndash 5) eacute admitir que por hipoacutetese a atividade da

26 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

forma neutra natildeo depende do pH essa hipoacutetese tambeacutem eacute a base da equaccedilatildeo (41

ndash 7) Deve-se registrar o fato de que pelo melhor do nosso conhecimento esta eacute a

primeira vez que uma expressatildeo analiacutetica para o caacutelculo da solubilidade de

proteiacutenas em funccedilatildeo do pH eacute descrita mesmo no limite em que se considera vaacutelida

a lei de Henry

53 Soluccedilatildeo Paraboacutelica da Curva de Solubilidade

Tanto Groumlnwall (1941) quanto Fredericq e Neurath (1950) adotaram a hipoacutetese de

que os perfis de carga liacutequida da -lactoglobulina para um e da insulina para os

outros dois eram lineares na regiatildeo do ponto isoeleacutetrico Esta hipoacutetese eacute bastante

plausiacutevel e simplificadora principalmente a eacutepoca na qual estes trabalhos foram

desenvolvidos em que a estrutura proteacuteica bem como as constantes de ionizaccedilatildeo

dos resiacuteduos com grupos ionizaacuteveis era pouco conhecida De fato ainda hoje a falta

de dados das constantes de ionizaccedilatildeo na cadeia proteacuteica eacute o maior desafio no uso

do modelo rigoroso ndash equaccedilatildeo (52 ndash 18) Por isso o valor desta hipoacutetese de perfil

de carga liacutequida linear eacute notaacutevel

Supondo entatildeo que o perfil de carga seja linear eacute possiacutevel escrevecirc-lo como

푍(푝퐻) = minus퐴(푝퐻 minus 푝퐼) 푐표푚 퐴 gt 0

(53 ndash 1)

Substituindo (53 ndash 1) em (52 ndash 6)

푑 log 푠 (푝퐻)푑(푝퐻) = 퐴(푝퐻 minus 푝퐼)

(53 ndash 2)

Integrando (53 ndash 2) de um pH0 de referecircncia ateacute pH tem-se que

27 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐻 ) = 퐾[푝퐻 minus 2푝퐼(푝퐻 minus 푝퐻 ) minus 푝퐻 ] 푐표푚 퐾 =

퐴2

(53 ndash 3)

Ao se adotar como ponto de referecircncia o ponto isoeleacutetrico a equaccedilatildeo (53 ndash 3)

reduz-se agrave

log푠 (푝퐻)푠 (푝퐼) = 퐾(푝퐻 minus 푝퐼)

(53 ndash 4)

Contudo apesar da soluccedilatildeo quadraacutetica ou paraboacutelica para a equaccedilatildeo estendida de

Linderstroslashm-lang e Groumlnwall expressa na equaccedilatildeo (53 ndash 3) natildeo requerer os dados

das constantes de ionizaccedilatildeo dos resiacuteduos com grupos ionizaacuteveis ela exige a

definiccedilatildeo do paracircmetro A que fisicamente representa a inclinaccedilatildeo da reta de

aproximaccedilatildeo da curva de carga liacutequida e que pode ser calculado por correlaccedilatildeo a

partir de um conjunto de dados experimentais de solubilidade ou de carga liacutequida

6 Identidade entre o Modelo Proposto e a Equaccedilatildeo

Estendida de Linderstroslashm-Lang e Groumlnwall

A equaccedilatildeo final da modelagem termodinacircmica proposta apresentada na seccedilatildeo 4 eacute a

equaccedilatildeo (42 ndash 8) dada por

푠 (푝퐻)푠 (푝퐼) =

1 + 101 + 10

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 1)

Aplicando-se o logaritmo decimal nos dois termos da equaccedilatildeo (6 ndash 1) tem-se que

log푠 (푝퐻)푠 (푝퐼) = log

1 + 101 + 10

+ log

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 2)

Pelo bem da simplificaccedilatildeo desta deduccedilatildeo adotar-se-atildeo as seguintes funccedilotildees

휂 (푝퐻) = log

(6 ndash 3)

휃 (푝퐻) = log

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 4)

Assim pode-se reescrever a equaccedilatildeo (6 ndash 2) por

29 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐼) = 휂 (푝퐻) + 휃 (푝퐻)

(6 ndash 5)

Observando-se a equaccedilatildeo (6 ndash 5) tem-se que a funccedilatildeo j independe do estado de

ionizaccedilatildeo do resiacuteduo j poreacutem a funccedilatildeo jk depende Por isso deve-se analisar esta

funccedilatildeo para cada estado de ionizaccedilatildeo possiacutevel como mostrado na Tabela 61

Tabela 6 1 ndash Anaacutelise da funccedilatildeo jk para cada estado de ionizaccedilatildeo possiacutevel

j jk jk Quantidade de resiacuteduos neste estado

-1 -1 푝퐼 minus 푝퐻 na

0 0 nb

+1 +1 0 nc

0 푝퐼 minus 푝퐻 nd

Pela anaacutelise da Tabela 61 e considerando uma proteiacutena com n resiacuteduos com

grupos ionizaacuteveis infere-se que a equaccedilatildeo (6 ndash 5) pode ser reescrita como

log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)

(6 ndash 6)

Contudo as equaccedilotildees acima descritas satildeo vaacutelidas apenas para configuraccedilotildees

neutras pois apenas as configuraccedilotildees neutras da fase liacutequida estatildeo em equiliacutebrio

com as moleacuteculas de proteiacutena da fase soacutelida Para que uma configuraccedilatildeo seja

neutra vale a seguinte restriccedilatildeo

휀 = 0 hArr 푛 = 푛

(6 ndash 7)

30 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall

Substituindo a restriccedilatildeo dada pela equaccedilatildeo (6 ndash 7) na equaccedilatildeo (6 ndash 6) tem-se que

log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)

(6 ndash 8)

Ora mas a soma de nc e de nd natildeo resulta em outra coisa senatildeo no nuacutemero de

resiacuteduos com grupos ionizaacuteveis da estrutura proteacuteica cujo j seja +1 Assim

substituindo nc mais nd por n+ e substituindo a equaccedilatildeo (6 ndash 3) na equaccedilatildeo (6 ndash 8)

tem-se que

log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log

1 + 101 + 10

(6 ndash 9)

Ao se analisar a equaccedilatildeo (6 ndash 9) observa-se que ela eacute idecircntica a equaccedilatildeo estendida

de Linderstroslashm-Lang e Groumlnwall apresentada pela equaccedilatildeo (52 ndash 19) Com isso

tem-se que apesar das distintas formulaccedilotildees tanto a modelagem termodinacircmica aqui

proposta quanto a extensatildeo a teoria de Linderstroslashm-Lang e Groumlnwall resultam na

mesma descriccedilatildeo do fenocircmeno Aleacutem disso a equaccedilatildeo final dos modelos eacute

extremamente simples e depende apenas de um ponto de referecircncia e dos dados da

estrutura da moleacutecula de proteiacutena cuja solubilidade se deseja estudar

7 Aplicaccedilatildeo dos Modelos Expostos

Para validar o modelo comparando-o com o caacutelculo feito a partir da teoria de Debye-

Huumlckel o criteacuterio que relaciona os pontos calculados pelo modelo com os pontos

experimentais foi estabelecido a partir da seguinte funccedilatildeo objetivo (FO)

퐹푂 =1푁

푠 minus 푠푠

(7 ndash 1)

Contudo a equaccedilatildeo (7 ndash 1) natildeo eacute a melhor definiccedilatildeo de funccedilatildeo objetivo neste caso

pois a derivada da curva de solubilidade eacute razoavelmente grande nos dois lados do

ponto isoeleacutetrico e isso permite que pequenos desvios na direccedilatildeo horizontal

resultem em um grande aumento no valor da funccedilatildeo objetivo Uma soluccedilatildeo possiacutevel

seria substituir essa funccedilatildeo objetivo por uma funccedilatildeo definida pela soma do quadrado

da distacircncia do ponto experimental agrave curva do modelo principalmente se fosse

necessaacuterio calcular algum paracircmetro do modelo via otimizaccedilatildeo da funccedilatildeo objetivo

estipulada Natildeo sendo este o escopo deste trabalho optou-se pelo uso da FO

definida na equaccedilatildeo (7 ndash 1)

71 Solubilidade da Insulina Suiacutena

As Figuras 711 712 e 713 apresentam os graacuteficos da curva de solubilidade

dada pelos pontos experimentais pelo modelo proposto pela abordagem claacutessica e

tambeacutem a curva obtida pela soluccedilatildeo paraboacutelica da Equaccedilatildeo de Linderstroslashm-Lang e

Groumlnwall em trecircs temperaturas distintas

32 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 711 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 25 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

Figura 712 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 15 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

00

40

80

120

160

200

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

00

50

100

150

200

250

300

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

33 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 713 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 5 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

Os desvios da curva obtida pelo modelo proposto para valores de pH distantes do pI

podem ser explicados por ao menos trecircs importantes motivos dois devidos a

hipoacuteteses do modelo e um devido a fenocircmenos intriacutensecos a proteiacutena Sabendo que

no pI a solubilidade eacute miacutenima para valores de pH distantes do pI pode-se ter

solubilidades suficientemente grandes para que a validade da lei de Henry ndash adotada

na formulaccedilatildeo do modelo - seja questionada pois quanto mais distante do pI maior

a solubilidade e menor a validade da lei de Henry jaacute que haacute um aumento da

concentraccedilatildeo do soluto (proteiacutena) na soluccedilatildeo e tambeacutem ao fato do modelo prever

solubilidade infinita quando a fraccedilatildeo de moleacuteculas eletricamente neutras tende a

zero

limrarr푠 = lim

rarr

Φ(푝퐼)푠 (푝퐼)Φ(푝퐻) = +infin

(711 ndash 1)

00

50

100

150

200

250

300

350

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

34 7 Aplicaccedilatildeo dos Modelos Expostos

Todavia ainda haacute um fator de ordem natural que justifica o desvio apresentado para

valores de pH distantes do pI o desnovelamento da cadeia proteacuteica Este fenocircmeno

pode ocorrer de maneira a expor grupos hidroacutefobos resiacuteduos antes natildeo expostos

acrescentando relaccedilotildees de equiliacutebrio quiacutemico natildeo existentes na regiatildeo do pI

alterando o equiliacutebrio de fases e portanto alterando o valor da solubilidade

A Tabela 711 apresenta os valores obtidos para a funccedilatildeo objetivo definida em (7 ndash

1) tanto para o modelo proposto quanto para a abordagem claacutessica para trecircs

diferentes temperaturas

Tabela 711 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada

abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para insulina

suiacutena

T ordmC Abordagem FO

25 P 01857 C 02535

15 P 01981 C 05056

5 P 03595 C 03064

Observando-se a Tabela 711 vecirc-se que o modelo apresentou melhores resultados

do que o caacutelculo efetuado atraveacutes da abordagem claacutessica no que tange a

minimizaccedilatildeo da funccedilatildeo objetivo exceto para os dados a 5 ordmC

Tambeacutem eacute possiacutevel observar que a funccedilatildeo objetivo sofreu aumento com a

diminuiccedilatildeo da temperatura Isto ocorreu principalmente devido agrave dificuldade de

obter dados experimentais de solubilidade a temperaturas baixas o que aumenta o

desvio experimental fazendo com que se tenha um aumento do valor da funccedilatildeo

objetivo como a definida em (5 ndash 1) Um efeito secundaacuterio que tambeacutem pressiona a

35 7 Aplicaccedilatildeo dos Modelos Expostos

funccedilatildeo objetivo eacute o fato dos dados de pKA terem sido obtidos a uma temperatura

especiacutefica o que tende a acrescentar erro no caacutelculo de solubilidades a temperaturas

diferentes ainda que o pKA natildeo varie de forma ab-rupta com a temperatura

Outra observaccedilatildeo que deve ser registrada eacute o fato da funccedilatildeo objetivo para a

abordagem claacutessica na temperatura de 15 ordmC divergir a um valor tatildeo elevado em

relaccedilatildeo aos demais Isto se deve a um ponto experimental especiacutefico a um pH de

45 a solubilidade da insulina suiacutena obtida experimentalmente eacute 230 x 10-5 mol kg-1

enquanto a calculada pelo modelo proposto eacute 230 x 10-5 mol kg-1 e a calculada pela

abordagem claacutessica eacute 520 x 10-5 mol kg-1 Por conta do desvio deste ponto a funccedilatildeo

objetivo para a abordagem claacutessica nesta temperatura tem um aumento significativo

A Tabela 712 apresenta os valores do paracircmetro K da soluccedilatildeo paraboacutelica obtidos

neste trabalho para a insulina suiacutena comparados ao encontrado na literatura

Tabela 712 ndash Valores do paracircmetro K da soluccedilatildeo paraboacutelica para a insulina suiacutena

Referecircncias T ordmC K Fredericq e Neurath (1950) - 081 Neste trabalho 25 104 Neste trabalho 15 101 Neste trabalho 5 145

Pela Tabela 712 pode-se observar que haacute uma diferenccedila pequena entre os

valores do paracircmetro K obtidos neste trabalho e por Fredericq e Neurath (1950) Por

isso natildeo se pode afirmar a que se deve esta diferenccedila se eacute devido a diferenccedilas entre

procedimentos experimentais ou se eacute devido agrave diferenccedila de meacutetodo de caacutelculo do

paracircmetro Apesar de no experimento realizado por Fredericq e Neurath (1950)

haver a presenccedila do acircnion tiocianato e este acircnion interagir com grupos ionizaacuteveis

da cadeia proteacuteica como observado pelos autores do trabalho tambeacutem estes

36 7 Aplicaccedilatildeo dos Modelos Expostos

proacuteprios autores afirmam que a presenccedila deste acircnion natildeo altera a forma da curva

que eacute basicamente determinada pelo paracircmetro K De qualquer modo eacute interessante

observar a proximidade dos valores encontrados neste trabalho com o obtido por

Fredericq e Neurath (1950) pelo menos no que diz respeito agrave ordem de grandeza do

paracircmetro em questatildeo

72 Solubilidade da Lisozima de clara de ovo de galinha

Um modelo para ser validado necessita correlacionar dados experimentais de modo

satisfatoacuterio ou seja um modelo deve buscar fidelidade ao fenocircmeno fiacutesico

observado Assim na procura de dados de solubilidade de proteiacutenas poucos dados

na regiatildeo do pI foram encontrados Este eacute o caso da lisozima de clara de ovo de

galinha que apesar de ter muitos estudos de solubilidade nenhum deles se

encontra na regiatildeo do pI Surgiu assim a necessidade de se obter estes dados

experimentais para poder validar o modelo proposto A escolha da lisozima de clara

de ovo de galinha se deu em parte pela sua importacircncia mas tambeacutem em parte por

ter os valores de pKA conhecidos

A curva de solubilidade da lisozima de clara de ovo de galinha levantada neste

trabalho estaacute apresentada na Figura 721

37 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em

soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e

dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()

Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento

esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH

isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de

soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se

comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto

isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da

soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos

ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente

neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a

solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e

00

10

20

30

40

50

60

70

80

90

100

95 100 105 110 115 120

Solu

bilid

ade

(mg

mL)

pH

38 7 Aplicaccedilatildeo dos Modelos Expostos

alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado

em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo

Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo

a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo

Por conta de falta de dados a este respeito modelou-se apenas a curva de

solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura

722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de

galinha em funccedilatildeo do pH da soluccedilatildeo

Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)

00

10

20

30

40

50

60

70

80

90

96 99 102 105 108 111 114 117 120

Solu

bilid

ade

(mg

mL)

pH

39 7 Aplicaccedilatildeo dos Modelos Expostos

O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721

Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada

abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima

de clara de ovo de galinha

T ordmC Abordagem FO

25 P 4650 C gt7919a

a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado

Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta

aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a

abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca

de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos

anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao

efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de

clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a

variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A

proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de

cargas pontuais de Debye-Huumlckel

8 Conclusotildees

A modelagem termodinacircmica proposta neste trabalho apresentou expressivos

resultados quando comparada a abordagem claacutessica de Debye-Huumlckel

Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o

modelo aproximou melhor os pontos experimentais do que a referida abordagem

comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima

ao ponto isoeleacutetrico

Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica

para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua

construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo

lugar por sua aplicabilidade

Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis

da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva

em regiotildees distantes do ponto isoeleacutetrico

9 Referecircncias Bibliograacuteficas

BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene

Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects

Biophys J 95 1285-1294 2008

FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and

other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72

2684 - 26911950

GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v

93 p 517-542 1931

GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab

Carlsberg v 24 p 185-200 1941

KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native

and mutant insulins pK perturbation of B13-Glu in aggregated species Arch

Biochem Biophys v 283 p 496-502 1990

KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for

the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng

Chem Res v 35 p 4319-4327 1996

42 9 Referecircncias Bibliograacuteficas

KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen

lysozyme J Biochem v 87 p 1215-1219 1980

LADISCH M R Bioseparations Engineering principles practice and

economics John Wiley amp Sons 2001 pp1 116 ndash 117 133

LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab

Carlsberg v 15 p 1-29 1924

PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da

particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas

2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP

PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the

excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte

solutions Fluid Phase Equilib v 269 p 25ndash35 2008

PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-

contribution model involving phase and chemical equilibrium Ind Eng Chem Res

v 33 p 1341-1347 1994

PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277

1973

PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino

acids Fluid Phase Equilib v 152 p 121-132 1998

43 9 Referecircncias Bibliograacuteficas

PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular

Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999

SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of

equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte

solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009

TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J

R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with

carbon dioxide Biotech Bioeng v103 p 909-919 2009

TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer

free energy Biophys J v 95 p 2601-2609 2008

TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in

water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95

2009

Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na

cadeia proteacuteica

Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo

de ionizaccedilatildeo

퐻퐴 퐴 + 퐻

(A ndash 1)

Assim considerando que a constante de equiliacutebrio

퐾 = 푎

(A ndash 2)

Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que

퐾 =[퐴 ][퐻 ]

[퐻퐴]

(A ndash 3)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que

log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]

(A ndash 4)

Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado

por

minus log[휑] = 푝휑

(A ndash 5)

Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que

45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

푝퐾 = log[퐻퐴][퐴 ] + 푝퐻

(A ndash 6)

Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por

훼 =[퐴 ]

[퐻퐴] + [퐴 ]

(A ndash 7)

Reescrevendo (A ndash 7) tem-se que

훼 =[퐴 ] [퐻퐴frasl ]

1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =

훼1 minus 훼

(A ndash 8)

Substituindo (A ndash 8) em (A ndash 6) tem-se que

푝퐾 = log훼

1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10

(A ndash 9)

Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos

훼 =1

1 + 10

(A ndash 10)

Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio

퐴 + 퐻 퐻퐴

(A ndash 11)

Pode se escrever a constante de equiliacutebrio como

퐾 =[퐻퐴 ]

[퐴][퐻 ]

(A ndash 12)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que

46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

log퐾 = minus log[퐴]

[퐻퐴 ] minus log[퐻 ]

(A -13)

Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por

훼 =[퐻퐴 ]

[퐴] + [퐻퐴 ]

(A ndash 14)

Assim a equaccedilatildeo (A ndash 13) fica

훼1 minus 훼 = 10

(A ndash 15)

Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo

훼 =10

1 + 10

(A ndash 16)

Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos

modelos expostos

Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]

48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]

49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)

50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])

51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]

52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])

53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)

54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2

55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO

14 3 Modelo Estendido de Debye-Huumlckel

Assim ao calcular o sp que zera esta funccedilatildeo f(sp) saber-se-aacute que eacute a proacutepria

solubilidade que se deseja calcular Para aplicar o Meacutetodo de Newton-Raphson

basta derivar a funccedilatildeo f(sp) e aplicar o seguinte algoritmo de resoluccedilatildeo

푠 = 푠 minus푓(푠 )푓 (푠 )

(32 - 10)

Para calcular frsquo(s) deve-se considerar que a forccedila iocircnica depende da solubilidade

Para isto observando a equaccedilatildeo (32 - 5) vecirc-se que a forccedila iocircnica eacute dada pelo

somatoacuterio das contribuiccedilotildees de todos os iacuteons presentes na soluccedilatildeo por isso aqui

cabe um artifiacutecio de dividir estas contribuiccedilotildees em duas macro-contribuiccedilotildees aquela

devida a todos os iacuteons presentes na soluccedilatildeo exclusive os grupos ionizaacuteveis

presentes nas moleacuteculas da proteiacutena em questatildeo (I0) e que se considera constante

com o pH e aquela que engloba apenas os grupos ionizaacuteveis presentes nas

moleacuteculas da proteiacutena (IP)

퐼 = 퐼 + 퐼 = 퐼 +12푍 푠

(32 - 11)

Considerando a funccedilatildeo w tal que

푤 = radic퐼 = 퐼 +12푍 푠

(32 - 12)

Sendo

푤 =14푍 퐼

(32 - 13)

Entatildeo aplicando-se as devidas regras de derivaccedilatildeo tem-se

15 3 Modelo Estendido de Debye-Huumlckel

푓 (푠 ) = minus1푠 + 퐴 푍

3푤 + 2푤 푏푤(1 + 푏푤)

(32 - 14)

Substituindo as equaccedilotildees (32 - 12) e (32 - 13) na equaccedilatildeo (32 - 14) tem-se que

푓 (푠 ) = minus1푠 + 퐴 푍

15 + 푏radic퐼2radic퐼(1 + 푏radic퐼)

(32 - 15)

Entatildeo o algoritmo deve ser

푠 = 푠 minus

⎜⎛ln 푠 (푝퐼)

푠 + 퐴휙푍푝퐻2 radic퐼

1 + 푏radic퐼+ 2푏 ln 1 + 푏radic퐼

minus 1푠 + 퐴휙푍

15 + 푏radic퐼2radic퐼(1 + 푏radic퐼) ⎠

⎟⎞

(32 - 16)

4 Modelagem Termodinacircmica Proposta

41 Introduccedilatildeo

A condiccedilatildeo de equiliacutebrio entre duas fases (α e β) com m componentes eacute dada por

(Prausnitz et al 1999)

푝 = 푝

(41 ndash 1)

푇 = 푇

(41 ndash 2)

휇 = 휇⋮

휇 = 휇

(41 ndash 3)

Considerando o equiliacutebrio soacutelido-liacutequido (ESL) de sistemas contendo proteiacutenas

sendo que os efeitos da pressatildeo podem ser desprezados que as temperaturas nas

duas fases satildeo iguais e que na fase soacutelida soacute haacute proteiacutena tem-se que para a

proteiacutena a relaccedilatildeo de equiliacutebrio pode ser descrita por

휇 (푇푥) = 휇 (푇)

(41 ndash 4)

Contudo adotando-se a lei de Henry que eacute vaacutelida para baixas concentraccedilotildees de

soluto hipoacutetese que natildeo eacute distante dos valores observados da solubilidade de

proteiacutenas pode se escrever o potencial quiacutemico na fase liacutequida por

휇 (푇푥) = 휇 (푇 푥 ) + 푅푇푙푛푥

(41 ndash 5)

17 4 Modelagem Termodinacircmica Proposta

Entretanto variaccedilotildees de pH natildeo alteram o potencial quiacutemico da fase soacutelida o que

resulta pela relaccedilatildeo (41 ndash 4) que o mesmo natildeo altera tambeacutem o potencial quiacutemico

da fase liacutequida Com isso pela relaccedilatildeo (41 ndash 5) sendo o potencial quiacutemico de

referecircncia constante com o pH uma contradiccedilatildeo emerge a variaccedilatildeo do pH natildeo

poderia alterar o valor da solubilidade poreacutem a observaccedilatildeo experimental mostra o

contraacuterio Assim deve-se lembrar que pelo princiacutepio da eletroneutralidade a fase

soacutelida soacute possui moleacuteculas proteacuteicas eletricamente neutras e portanto o equiliacutebrio

de fases deve se estabelecer apenas entre as moleacuteculas presentes na fase soacutelida e

as moleacuteculas eletricamente neutras em soluccedilatildeo Ou seja como soacute moleacuteculas

eletricamente neutras podem estar na fase soacutelida o equiliacutebrio de fases depende

exclusivamente da fraccedilatildeo de moleacuteculas eletricamente neutras em soluccedilatildeo pois soacute

estas podem precipitar Assim tanto a equaccedilatildeo (41 ndash 4) quanto a equaccedilatildeo (41 ndash

5) devem ser aplicadas natildeo ao conjunto de todas as moleacuteculas de proteiacutena em

soluccedilatildeo mas somente as moleacuteculas proteacuteicas eletricamente neutras Portanto a

concentraccedilatildeo das moleacuteculas de proteiacutena eletricamente neutras em soluccedilatildeo eacute

constante com o pH e pode ser interpretada como a multiplicaccedilatildeo da fraccedilatildeo de

moleacuteculas eletricamente neutras pela concentraccedilatildeo total de proteiacutenas que eacute a

proacutepria solubilidade Assim uma relaccedilatildeo de inversa proporcionalidade eacute definida

quanto maior a fraccedilatildeo de moleacuteculas neutras menor seraacute a solubilidade de uma

proteiacutena em soluccedilatildeo Portanto no ponto isoeleacutetrico no qual haacute o miacutenimo de

solubilidade tem-se o ponto maacuteximo de fraccedilatildeo de moleacuteculas eletricamente neutras

A partir disto eacute possiacutevel escrever a equaccedilatildeo que rege o comportamento da

solubilidade de uma proteiacutena em funccedilatildeo do pH da soluccedilatildeo

휙(푝퐻)푆 (푝퐻) = 휆 = 푐표푛푠푡푎푛푡푒

(41 ndash 6)

18 4 Modelagem Termodinacircmica Proposta

Na equaccedilatildeo (41 ndash 6) o paracircmetro λ pode ser um paracircmetro de ajuste do modelo a

um conjunto de valores experimentais tendo se estabelecido uma funccedilatildeo objetivo ou

ainda dado pelo produto entre a solubilidade no ponto isoeleacutetrico e a fraccedilatildeo de

moleacuteculas eletricamente neutras em soluccedilatildeo tambeacutem no pI neste caso vale a

seguinte equaccedilatildeo

푠 (푝퐻) =휙(푝퐼)푠 (푝퐼)휙(푝퐻)

(41 ndash 7)

Sendo a equaccedilatildeo do modelo ndash equaccedilatildeo (41 ndash 7) ndash extremamente simples a uacutenica

dificuldade reside no caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras

(휙(푝퐻))

42 Caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras

Dentre os aminoaacutecidos que formam atraveacutes de ligaccedilotildees peptiacutedicas as proteiacutenas haacute

aqueles que possuem resiacuteduos com grupos ionizaacuteveis aleacutem dos grupos amina e

aacutecido carboxiacutelico terminais na cadeia Todos estes participam de equiliacutebrios

quiacutemicos com iacuteons H+ presentes na soluccedilatildeo entatildeo ao se alterar o pH da soluccedilatildeo

estes equiliacutebrios satildeo alterados

Assim haacute vaacuterias possibilidades de combinaccedilotildees de estados ionizados destes grupos

ionizaacuteveis que resultam em uma moleacutecula de proteiacutena eletricamente neutra Eacute

importante notar que dada a fraccedilatildeo de uma configuraccedilatildeo de uma moleacutecula neutra

todas as outras fraccedilotildees de configuraccedilotildees possiacuteveis que tambeacutem resultem em

moleacuteculas neutras satildeo proporcionais agrave fraccedilatildeo da configuraccedilatildeo dada pois todas as

configuraccedilotildees participam de equiliacutebrios entre si

19 4 Modelagem Termodinacircmica Proposta

Desta observaccedilatildeo implica-se que basta identificar uma configuraccedilatildeo proteacuteica cuja

soma dos estados ionizados resulte em carga nula para se descrever o equiliacutebrio de

fases em relaccedilatildeo ao pH na regiatildeo do ponto isoeleacutetrico onde esta consideraccedilatildeo eacute

predominante em relaccedilatildeo a outros possiacuteveis fenocircmenos

Contudo eacute necessaacuterio contabilizar a contribuiccedilatildeo de cada grupo ionizaacutevel via

equaccedilatildeo de Henderson-Hasselbach equaccedilatildeo (42 ndash 1)

훼 (푝퐻) =

⎩⎪⎨

⎪⎧ 10

1 + 10 푠푒 휈 = minus1

11 + 10

푠푒 휈 = +1

(42 ndash 1)

Na qual pKAj eacute o co-logaritmo da constante de equiliacutebrio do grupo ionizaacutevel do

resiacuteduo j j eacute estado carregado potencial do resiacuteduo j (-1 para grupos aacutecidos e +1

para grupos baacutesicos) e j eacute a fraccedilatildeo ionizada para o pH dado Para grupos cujo

estado de ionizaccedilatildeo na dada configuraccedilatildeo seja neutro a sua fraccedilatildeo eacute calculada tal

que a soma de sua fraccedilatildeo e da fraccedilatildeo ionizada tenha como resultado o valor

unitaacuterio

Assim a funccedilatildeo Pn pode ser escrita como o produto de cada fraccedilatildeo de cada grupo

ionizaacutevel j naquele estado (-1 0 ou +1) na configuraccedilatildeo neutra k em uma proteiacutena

com n grupos ionizaacuteveis Uma representaccedilatildeo matemaacutetica possiacutevel para esta funccedilatildeo

pode ser escrita como

휙 (푝퐻) = 훼 (푝퐻)

(42 ndash 2)

Na qual a fraccedilatildeo jrsquo(pH) eacute dada por

20 4 Modelagem Termodinacircmica Proposta

훼 (푝퐻) =훼 (푝퐻) 푠푒 휀 = 11 minus 훼 (푝퐻) 푠푒 휀 = 0

(42 ndash 3)

Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (42 ndash 3) e a resultante na equaccedilatildeo

(42 ndash 2) pode-se escrever que

휙 (푝퐻) =1

1 + 10

1 + 휈2 minus 휈 휀 10

minus휈 minus 1

2 minus 휈 휀 푐표푚 휀 = 0

(42 ndash 4)

A equaccedilatildeo (42 ndash 4) junto agrave equaccedilatildeo (41 ndash 7) constituem o modelo termodinacircmico

capaz de predizer a razatildeo entre as fraccedilotildees de moleacuteculas neutras de uma proteiacutena

em funccedilatildeo do pH na regiatildeo do ponto isoeleacutetrico mantendo fixas temperatura e forccedila

iocircnica Substituindo a equaccedilatildeo (42 ndash 4) na equaccedilatildeo (41 ndash 7) obteacutem-se para a

curva de solubilidade

푠 (푝퐻)푠 (푝퐼) =

1 + 101 + 10

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

푐표푚 휀 = 0

(42 ndash 8)

5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

51 Introduccedilatildeo

Segundo Groumlnwall (1941) na fase liacutequida haacute moleacuteculas de proteiacutenas com muitas

configuraccedilotildees k distintas que possuem carga liacutequida i e tambeacutem haacute certas

configuraccedilotildees que tem carga liacutequida nula e satildeo chamadas configuraccedilotildees neutras

Aleacutem disso estas uacuteltimas satildeo aquelas que determinam o equiliacutebrio de fases jaacute que

elas estatildeo em equiliacutebrio com a fase soacutelida na qual soacute haacute moleacuteculas neutras pelo

princiacutepio da eletroneutralidade Eacute tambeacutem afirmado que dado este equiliacutebrio a

atividade das moleacuteculas neutras natildeo se altera com a variaccedilatildeo do pH e eacute

proporcional agraves atividades de qualquer tipo de configuraccedilatildeo neutra

Neste mesmo trabalho eacute atribuiacuteda a Linderstroslashm-Lang o desenvolvimento de uma

teoria de prediccedilatildeo da solubilidade de proteiacutenas com a variaccedilatildeo do pH na regiatildeo do

ponto isoeleacutetrico Este desenvolvimento apresenta um balanccedilo de cargas de um

modo impliacutecito contudo como atestado por Groumlnwall o escasso conhecimento

sobre as estruturas proteacuteicas impediram agravequele tempo uma formulaccedilatildeo mais

pormenorizada do problema

52 Desenvolvimento teoacuterico

A base desta abordagem descrita por Groumlnwall e atribuiacuteda a Linderstroslashm-Lang

reside na hipoacutetese de que a moleacutecula de proteiacutena de configuraccedilatildeo k e carga nula

participa do seguinte equiliacutebrio com os iacuteons H+ e com sua forma de carga i

22 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

푃 + 푖퐻 푃 lowast

(52 ndash 1)

Note-se que o valor de i pode ser negativo A constante do equiliacutebrio quiacutemico

descrita pela equaccedilatildeo (52 ndash 1) pode ser expressa como

퐾 =푎

lowast

푎 푎

(52 ndash 2)

Sabendo que a atividade da moleacutecula de proteiacutena de configuraccedilatildeo k e carga i eacute dada

pelo produto entre sua concentraccedilatildeo e seu coeficiente de atividade tem-se que

푥lowast

= 푎 푎퐾훾

lowast

(52 ndash 3)

Entretanto a solubilidade da proteiacutena eacute soma das concentraccedilotildees de todas as

moleacuteculas de carga i Poreacutem a concentraccedilatildeo das moleacuteculas de carga i eacute a soma das

concentraccedilotildees das moleacuteculas de configuraccedilatildeo k Assim a solubilidade pode ser

escrita como

푠 (푝퐻) = 푎 푎퐾훾

lowast

(52 ndash 4)

Derivando a equaccedilatildeo (52 ndash 4) com respeito agrave atividade do iacuteon H+ considerando

que atividade da moleacutecula neutra eacute constante para qualquer configuraccedilatildeo k e ainda

que o coeficiente de atividade da proteiacutena de carga i independe da atividade do iacuteon

H+ tem-se que

푑푠푑푎 = 푖 ∙ 푎 푎

퐾훾

lowast

(52 ndash 5)

23 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

Sendo

푑 log 푠 (푝퐻)푑(푝퐻) = minus

푎푠 (푝퐻)

푑푠푑푎

(52 ndash 6)

Substituindo as equaccedilotildees (52 ndash 4) e (52 ndash 5) na equaccedilatildeo (52 ndash 6) e

reescrevendo em termos de pH e das concentraccedilotildees das proteiacutenas de carga i tem-

se que

푑 log 푠푑(푝퐻) = minus

sum (푖 ∙ 푥 )sum 푥

(52 ndash 7)

Contudo o termo do lado direito da equaccedilatildeo (52 ndash 7) estaacute associado ao conceito

de valecircncia meacutedia estabelecido por Linderstroslashm-Lang (1924)

횤 =sum (푖 ∙ 푥 )sum 푥

(52 ndash 8)

Os autores natildeo possuiacuteam um modo mais adequado de construir a curva de

solubilidade dada pela equaccedilatildeo (52 ndash 7) do que aproximar por uma funccedilatildeo linear o

perfil de carga liacutequida da proteiacutena obtido experimentalmente e integraacute-lo valendo-se

da analogia entre o conceito de carga liacutequida (Z) e de valecircncia meacutedia ( i ) Entretanto

hoje jaacute se tem uma descriccedilatildeo analiacutetica do perfil de carga liacutequida de proteiacutenas que

pode ser escrita como

푍(푝퐻) = 휈 훼

(52 ndash 9)

Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (52 ndash 9) e a resultante na equaccedilatildeo

(52 ndash 7) tem-se que

24 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

푑 log 푠푑(푝퐻) = minus

12

11 + 10

1 + 휈 + 휈 1 minus 휈 10

(52 ndash 10)

Integrando a equaccedilatildeo (52 ndash 10) de um ponto de referecircncia por exemplo do ponto

isoeleacutetrico (pI) ateacute um pH qualquer tem-se a seguinte relaccedilatildeo

푑 log 푠

( )

( )

= minus12

1

1 + 101 + 휈 + 휈 1 minus 휈 10 푑(푝퐻)

(52 ndash 11)

log푠 (푝퐻)푠 (푝퐼) = minus

12 1 + 휈

11 + 10

푑(푝퐻)

+ 휈 1 minus 휈10

1 + 10푑(푝퐻)

(52 ndash 12)

Fazendo a seguinte substituiccedilatildeo

푢 = 10 푡푎푙 푞푢푒 푑푢푢 = ln 10푑(푝퐻)

(52 ndash 13)

Tem-se que

log푠 (푝퐻)푠 (푝퐼) = minus

12

1 + 휈ln 10

1푢(1 + 푢) 푑푢 +

휈 1 minus 휈ln 10

1(1 + 푢) 푑푢

(52 ndash 14)

log푠 (푝퐻)푠 (푝퐼) = minus

12

1 + 휈ln 10

1푢 푑푢 minus

11 + 푢 푑푢 +

휈 1 minus 휈ln 10

1(1 + 푢) 푑푢

(52 ndash 15)

25 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐼) = minus

12 1 + 휈 log

1010

minus 휈 1 minus 휈 minus 1 + 휈 log1 + 101 + 10

(52 ndash 16)

Sendo

휈 1 minus 휈 minus 1 + 휈 = 휈 minus 휈 minus 1 minus 휈 = minus 1 + 휈 = minus2

(52 ndash 17)

Resultando em

log푠 (푝퐻)푠 (푝퐼) = log

1 + 101 + 10

minus1 + 휈

2 (푝퐻 minus 푝퐼)

(52 ndash 18)

Ainda eacute possiacutevel reescrever a equaccedilatildeo (52 ndash 18) como

log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log

1 + 101 + 10

(52 ndash 19)

Na qual n+ representa o nuacutemero de resiacuteduos ionizaacuteveis que na sua forma carregada

apresentam carga positiva A equaccedilatildeo (52 ndash 19) eacute uma expressatildeo analiacutetica que a

partir de dados da estrutura proteacuteica e de um dado de solubilidade permite predizer

a curva de solubilidade de uma dada proteiacutena em funccedilatildeo do pH na regiatildeo do ponto

isoeleacutetrico mantendo fixas a temperatura e a forccedila iocircnica do sistema

Eacute possiacutevel provar que as equaccedilotildees (42 ndash 8) e (52 ndash 19) satildeo idecircnticas - a prova

disso eacute descrita na seccedilatildeo 6 ndash e assim tem-se que apesar das distintas abordagens

a descriccedilatildeo do fenocircmeno eacute a mesma Note-se que um passo fundamental no

desenvolvimento da Equaccedilatildeo (52 ndash 5) eacute admitir que por hipoacutetese a atividade da

26 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

forma neutra natildeo depende do pH essa hipoacutetese tambeacutem eacute a base da equaccedilatildeo (41

ndash 7) Deve-se registrar o fato de que pelo melhor do nosso conhecimento esta eacute a

primeira vez que uma expressatildeo analiacutetica para o caacutelculo da solubilidade de

proteiacutenas em funccedilatildeo do pH eacute descrita mesmo no limite em que se considera vaacutelida

a lei de Henry

53 Soluccedilatildeo Paraboacutelica da Curva de Solubilidade

Tanto Groumlnwall (1941) quanto Fredericq e Neurath (1950) adotaram a hipoacutetese de

que os perfis de carga liacutequida da -lactoglobulina para um e da insulina para os

outros dois eram lineares na regiatildeo do ponto isoeleacutetrico Esta hipoacutetese eacute bastante

plausiacutevel e simplificadora principalmente a eacutepoca na qual estes trabalhos foram

desenvolvidos em que a estrutura proteacuteica bem como as constantes de ionizaccedilatildeo

dos resiacuteduos com grupos ionizaacuteveis era pouco conhecida De fato ainda hoje a falta

de dados das constantes de ionizaccedilatildeo na cadeia proteacuteica eacute o maior desafio no uso

do modelo rigoroso ndash equaccedilatildeo (52 ndash 18) Por isso o valor desta hipoacutetese de perfil

de carga liacutequida linear eacute notaacutevel

Supondo entatildeo que o perfil de carga seja linear eacute possiacutevel escrevecirc-lo como

푍(푝퐻) = minus퐴(푝퐻 minus 푝퐼) 푐표푚 퐴 gt 0

(53 ndash 1)

Substituindo (53 ndash 1) em (52 ndash 6)

푑 log 푠 (푝퐻)푑(푝퐻) = 퐴(푝퐻 minus 푝퐼)

(53 ndash 2)

Integrando (53 ndash 2) de um pH0 de referecircncia ateacute pH tem-se que

27 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐻 ) = 퐾[푝퐻 minus 2푝퐼(푝퐻 minus 푝퐻 ) minus 푝퐻 ] 푐표푚 퐾 =

퐴2

(53 ndash 3)

Ao se adotar como ponto de referecircncia o ponto isoeleacutetrico a equaccedilatildeo (53 ndash 3)

reduz-se agrave

log푠 (푝퐻)푠 (푝퐼) = 퐾(푝퐻 minus 푝퐼)

(53 ndash 4)

Contudo apesar da soluccedilatildeo quadraacutetica ou paraboacutelica para a equaccedilatildeo estendida de

Linderstroslashm-lang e Groumlnwall expressa na equaccedilatildeo (53 ndash 3) natildeo requerer os dados

das constantes de ionizaccedilatildeo dos resiacuteduos com grupos ionizaacuteveis ela exige a

definiccedilatildeo do paracircmetro A que fisicamente representa a inclinaccedilatildeo da reta de

aproximaccedilatildeo da curva de carga liacutequida e que pode ser calculado por correlaccedilatildeo a

partir de um conjunto de dados experimentais de solubilidade ou de carga liacutequida

6 Identidade entre o Modelo Proposto e a Equaccedilatildeo

Estendida de Linderstroslashm-Lang e Groumlnwall

A equaccedilatildeo final da modelagem termodinacircmica proposta apresentada na seccedilatildeo 4 eacute a

equaccedilatildeo (42 ndash 8) dada por

푠 (푝퐻)푠 (푝퐼) =

1 + 101 + 10

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 1)

Aplicando-se o logaritmo decimal nos dois termos da equaccedilatildeo (6 ndash 1) tem-se que

log푠 (푝퐻)푠 (푝퐼) = log

1 + 101 + 10

+ log

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 2)

Pelo bem da simplificaccedilatildeo desta deduccedilatildeo adotar-se-atildeo as seguintes funccedilotildees

휂 (푝퐻) = log

(6 ndash 3)

휃 (푝퐻) = log

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 4)

Assim pode-se reescrever a equaccedilatildeo (6 ndash 2) por

29 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐼) = 휂 (푝퐻) + 휃 (푝퐻)

(6 ndash 5)

Observando-se a equaccedilatildeo (6 ndash 5) tem-se que a funccedilatildeo j independe do estado de

ionizaccedilatildeo do resiacuteduo j poreacutem a funccedilatildeo jk depende Por isso deve-se analisar esta

funccedilatildeo para cada estado de ionizaccedilatildeo possiacutevel como mostrado na Tabela 61

Tabela 6 1 ndash Anaacutelise da funccedilatildeo jk para cada estado de ionizaccedilatildeo possiacutevel

j jk jk Quantidade de resiacuteduos neste estado

-1 -1 푝퐼 minus 푝퐻 na

0 0 nb

+1 +1 0 nc

0 푝퐼 minus 푝퐻 nd

Pela anaacutelise da Tabela 61 e considerando uma proteiacutena com n resiacuteduos com

grupos ionizaacuteveis infere-se que a equaccedilatildeo (6 ndash 5) pode ser reescrita como

log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)

(6 ndash 6)

Contudo as equaccedilotildees acima descritas satildeo vaacutelidas apenas para configuraccedilotildees

neutras pois apenas as configuraccedilotildees neutras da fase liacutequida estatildeo em equiliacutebrio

com as moleacuteculas de proteiacutena da fase soacutelida Para que uma configuraccedilatildeo seja

neutra vale a seguinte restriccedilatildeo

휀 = 0 hArr 푛 = 푛

(6 ndash 7)

30 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall

Substituindo a restriccedilatildeo dada pela equaccedilatildeo (6 ndash 7) na equaccedilatildeo (6 ndash 6) tem-se que

log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)

(6 ndash 8)

Ora mas a soma de nc e de nd natildeo resulta em outra coisa senatildeo no nuacutemero de

resiacuteduos com grupos ionizaacuteveis da estrutura proteacuteica cujo j seja +1 Assim

substituindo nc mais nd por n+ e substituindo a equaccedilatildeo (6 ndash 3) na equaccedilatildeo (6 ndash 8)

tem-se que

log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log

1 + 101 + 10

(6 ndash 9)

Ao se analisar a equaccedilatildeo (6 ndash 9) observa-se que ela eacute idecircntica a equaccedilatildeo estendida

de Linderstroslashm-Lang e Groumlnwall apresentada pela equaccedilatildeo (52 ndash 19) Com isso

tem-se que apesar das distintas formulaccedilotildees tanto a modelagem termodinacircmica aqui

proposta quanto a extensatildeo a teoria de Linderstroslashm-Lang e Groumlnwall resultam na

mesma descriccedilatildeo do fenocircmeno Aleacutem disso a equaccedilatildeo final dos modelos eacute

extremamente simples e depende apenas de um ponto de referecircncia e dos dados da

estrutura da moleacutecula de proteiacutena cuja solubilidade se deseja estudar

7 Aplicaccedilatildeo dos Modelos Expostos

Para validar o modelo comparando-o com o caacutelculo feito a partir da teoria de Debye-

Huumlckel o criteacuterio que relaciona os pontos calculados pelo modelo com os pontos

experimentais foi estabelecido a partir da seguinte funccedilatildeo objetivo (FO)

퐹푂 =1푁

푠 minus 푠푠

(7 ndash 1)

Contudo a equaccedilatildeo (7 ndash 1) natildeo eacute a melhor definiccedilatildeo de funccedilatildeo objetivo neste caso

pois a derivada da curva de solubilidade eacute razoavelmente grande nos dois lados do

ponto isoeleacutetrico e isso permite que pequenos desvios na direccedilatildeo horizontal

resultem em um grande aumento no valor da funccedilatildeo objetivo Uma soluccedilatildeo possiacutevel

seria substituir essa funccedilatildeo objetivo por uma funccedilatildeo definida pela soma do quadrado

da distacircncia do ponto experimental agrave curva do modelo principalmente se fosse

necessaacuterio calcular algum paracircmetro do modelo via otimizaccedilatildeo da funccedilatildeo objetivo

estipulada Natildeo sendo este o escopo deste trabalho optou-se pelo uso da FO

definida na equaccedilatildeo (7 ndash 1)

71 Solubilidade da Insulina Suiacutena

As Figuras 711 712 e 713 apresentam os graacuteficos da curva de solubilidade

dada pelos pontos experimentais pelo modelo proposto pela abordagem claacutessica e

tambeacutem a curva obtida pela soluccedilatildeo paraboacutelica da Equaccedilatildeo de Linderstroslashm-Lang e

Groumlnwall em trecircs temperaturas distintas

32 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 711 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 25 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

Figura 712 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 15 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

00

40

80

120

160

200

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

00

50

100

150

200

250

300

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

33 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 713 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 5 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

Os desvios da curva obtida pelo modelo proposto para valores de pH distantes do pI

podem ser explicados por ao menos trecircs importantes motivos dois devidos a

hipoacuteteses do modelo e um devido a fenocircmenos intriacutensecos a proteiacutena Sabendo que

no pI a solubilidade eacute miacutenima para valores de pH distantes do pI pode-se ter

solubilidades suficientemente grandes para que a validade da lei de Henry ndash adotada

na formulaccedilatildeo do modelo - seja questionada pois quanto mais distante do pI maior

a solubilidade e menor a validade da lei de Henry jaacute que haacute um aumento da

concentraccedilatildeo do soluto (proteiacutena) na soluccedilatildeo e tambeacutem ao fato do modelo prever

solubilidade infinita quando a fraccedilatildeo de moleacuteculas eletricamente neutras tende a

zero

limrarr푠 = lim

rarr

Φ(푝퐼)푠 (푝퐼)Φ(푝퐻) = +infin

(711 ndash 1)

00

50

100

150

200

250

300

350

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

34 7 Aplicaccedilatildeo dos Modelos Expostos

Todavia ainda haacute um fator de ordem natural que justifica o desvio apresentado para

valores de pH distantes do pI o desnovelamento da cadeia proteacuteica Este fenocircmeno

pode ocorrer de maneira a expor grupos hidroacutefobos resiacuteduos antes natildeo expostos

acrescentando relaccedilotildees de equiliacutebrio quiacutemico natildeo existentes na regiatildeo do pI

alterando o equiliacutebrio de fases e portanto alterando o valor da solubilidade

A Tabela 711 apresenta os valores obtidos para a funccedilatildeo objetivo definida em (7 ndash

1) tanto para o modelo proposto quanto para a abordagem claacutessica para trecircs

diferentes temperaturas

Tabela 711 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada

abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para insulina

suiacutena

T ordmC Abordagem FO

25 P 01857 C 02535

15 P 01981 C 05056

5 P 03595 C 03064

Observando-se a Tabela 711 vecirc-se que o modelo apresentou melhores resultados

do que o caacutelculo efetuado atraveacutes da abordagem claacutessica no que tange a

minimizaccedilatildeo da funccedilatildeo objetivo exceto para os dados a 5 ordmC

Tambeacutem eacute possiacutevel observar que a funccedilatildeo objetivo sofreu aumento com a

diminuiccedilatildeo da temperatura Isto ocorreu principalmente devido agrave dificuldade de

obter dados experimentais de solubilidade a temperaturas baixas o que aumenta o

desvio experimental fazendo com que se tenha um aumento do valor da funccedilatildeo

objetivo como a definida em (5 ndash 1) Um efeito secundaacuterio que tambeacutem pressiona a

35 7 Aplicaccedilatildeo dos Modelos Expostos

funccedilatildeo objetivo eacute o fato dos dados de pKA terem sido obtidos a uma temperatura

especiacutefica o que tende a acrescentar erro no caacutelculo de solubilidades a temperaturas

diferentes ainda que o pKA natildeo varie de forma ab-rupta com a temperatura

Outra observaccedilatildeo que deve ser registrada eacute o fato da funccedilatildeo objetivo para a

abordagem claacutessica na temperatura de 15 ordmC divergir a um valor tatildeo elevado em

relaccedilatildeo aos demais Isto se deve a um ponto experimental especiacutefico a um pH de

45 a solubilidade da insulina suiacutena obtida experimentalmente eacute 230 x 10-5 mol kg-1

enquanto a calculada pelo modelo proposto eacute 230 x 10-5 mol kg-1 e a calculada pela

abordagem claacutessica eacute 520 x 10-5 mol kg-1 Por conta do desvio deste ponto a funccedilatildeo

objetivo para a abordagem claacutessica nesta temperatura tem um aumento significativo

A Tabela 712 apresenta os valores do paracircmetro K da soluccedilatildeo paraboacutelica obtidos

neste trabalho para a insulina suiacutena comparados ao encontrado na literatura

Tabela 712 ndash Valores do paracircmetro K da soluccedilatildeo paraboacutelica para a insulina suiacutena

Referecircncias T ordmC K Fredericq e Neurath (1950) - 081 Neste trabalho 25 104 Neste trabalho 15 101 Neste trabalho 5 145

Pela Tabela 712 pode-se observar que haacute uma diferenccedila pequena entre os

valores do paracircmetro K obtidos neste trabalho e por Fredericq e Neurath (1950) Por

isso natildeo se pode afirmar a que se deve esta diferenccedila se eacute devido a diferenccedilas entre

procedimentos experimentais ou se eacute devido agrave diferenccedila de meacutetodo de caacutelculo do

paracircmetro Apesar de no experimento realizado por Fredericq e Neurath (1950)

haver a presenccedila do acircnion tiocianato e este acircnion interagir com grupos ionizaacuteveis

da cadeia proteacuteica como observado pelos autores do trabalho tambeacutem estes

36 7 Aplicaccedilatildeo dos Modelos Expostos

proacuteprios autores afirmam que a presenccedila deste acircnion natildeo altera a forma da curva

que eacute basicamente determinada pelo paracircmetro K De qualquer modo eacute interessante

observar a proximidade dos valores encontrados neste trabalho com o obtido por

Fredericq e Neurath (1950) pelo menos no que diz respeito agrave ordem de grandeza do

paracircmetro em questatildeo

72 Solubilidade da Lisozima de clara de ovo de galinha

Um modelo para ser validado necessita correlacionar dados experimentais de modo

satisfatoacuterio ou seja um modelo deve buscar fidelidade ao fenocircmeno fiacutesico

observado Assim na procura de dados de solubilidade de proteiacutenas poucos dados

na regiatildeo do pI foram encontrados Este eacute o caso da lisozima de clara de ovo de

galinha que apesar de ter muitos estudos de solubilidade nenhum deles se

encontra na regiatildeo do pI Surgiu assim a necessidade de se obter estes dados

experimentais para poder validar o modelo proposto A escolha da lisozima de clara

de ovo de galinha se deu em parte pela sua importacircncia mas tambeacutem em parte por

ter os valores de pKA conhecidos

A curva de solubilidade da lisozima de clara de ovo de galinha levantada neste

trabalho estaacute apresentada na Figura 721

37 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em

soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e

dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()

Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento

esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH

isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de

soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se

comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto

isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da

soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos

ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente

neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a

solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e

00

10

20

30

40

50

60

70

80

90

100

95 100 105 110 115 120

Solu

bilid

ade

(mg

mL)

pH

38 7 Aplicaccedilatildeo dos Modelos Expostos

alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado

em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo

Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo

a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo

Por conta de falta de dados a este respeito modelou-se apenas a curva de

solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura

722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de

galinha em funccedilatildeo do pH da soluccedilatildeo

Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)

00

10

20

30

40

50

60

70

80

90

96 99 102 105 108 111 114 117 120

Solu

bilid

ade

(mg

mL)

pH

39 7 Aplicaccedilatildeo dos Modelos Expostos

O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721

Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada

abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima

de clara de ovo de galinha

T ordmC Abordagem FO

25 P 4650 C gt7919a

a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado

Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta

aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a

abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca

de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos

anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao

efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de

clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a

variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A

proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de

cargas pontuais de Debye-Huumlckel

8 Conclusotildees

A modelagem termodinacircmica proposta neste trabalho apresentou expressivos

resultados quando comparada a abordagem claacutessica de Debye-Huumlckel

Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o

modelo aproximou melhor os pontos experimentais do que a referida abordagem

comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima

ao ponto isoeleacutetrico

Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica

para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua

construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo

lugar por sua aplicabilidade

Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis

da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva

em regiotildees distantes do ponto isoeleacutetrico

9 Referecircncias Bibliograacuteficas

BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene

Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects

Biophys J 95 1285-1294 2008

FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and

other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72

2684 - 26911950

GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v

93 p 517-542 1931

GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab

Carlsberg v 24 p 185-200 1941

KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native

and mutant insulins pK perturbation of B13-Glu in aggregated species Arch

Biochem Biophys v 283 p 496-502 1990

KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for

the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng

Chem Res v 35 p 4319-4327 1996

42 9 Referecircncias Bibliograacuteficas

KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen

lysozyme J Biochem v 87 p 1215-1219 1980

LADISCH M R Bioseparations Engineering principles practice and

economics John Wiley amp Sons 2001 pp1 116 ndash 117 133

LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab

Carlsberg v 15 p 1-29 1924

PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da

particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas

2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP

PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the

excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte

solutions Fluid Phase Equilib v 269 p 25ndash35 2008

PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-

contribution model involving phase and chemical equilibrium Ind Eng Chem Res

v 33 p 1341-1347 1994

PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277

1973

PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino

acids Fluid Phase Equilib v 152 p 121-132 1998

43 9 Referecircncias Bibliograacuteficas

PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular

Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999

SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of

equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte

solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009

TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J

R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with

carbon dioxide Biotech Bioeng v103 p 909-919 2009

TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer

free energy Biophys J v 95 p 2601-2609 2008

TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in

water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95

2009

Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na

cadeia proteacuteica

Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo

de ionizaccedilatildeo

퐻퐴 퐴 + 퐻

(A ndash 1)

Assim considerando que a constante de equiliacutebrio

퐾 = 푎

(A ndash 2)

Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que

퐾 =[퐴 ][퐻 ]

[퐻퐴]

(A ndash 3)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que

log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]

(A ndash 4)

Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado

por

minus log[휑] = 푝휑

(A ndash 5)

Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que

45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

푝퐾 = log[퐻퐴][퐴 ] + 푝퐻

(A ndash 6)

Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por

훼 =[퐴 ]

[퐻퐴] + [퐴 ]

(A ndash 7)

Reescrevendo (A ndash 7) tem-se que

훼 =[퐴 ] [퐻퐴frasl ]

1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =

훼1 minus 훼

(A ndash 8)

Substituindo (A ndash 8) em (A ndash 6) tem-se que

푝퐾 = log훼

1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10

(A ndash 9)

Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos

훼 =1

1 + 10

(A ndash 10)

Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio

퐴 + 퐻 퐻퐴

(A ndash 11)

Pode se escrever a constante de equiliacutebrio como

퐾 =[퐻퐴 ]

[퐴][퐻 ]

(A ndash 12)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que

46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

log퐾 = minus log[퐴]

[퐻퐴 ] minus log[퐻 ]

(A -13)

Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por

훼 =[퐻퐴 ]

[퐴] + [퐻퐴 ]

(A ndash 14)

Assim a equaccedilatildeo (A ndash 13) fica

훼1 minus 훼 = 10

(A ndash 15)

Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo

훼 =10

1 + 10

(A ndash 16)

Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos

modelos expostos

Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]

48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]

49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)

50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])

51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]

52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])

53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)

54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2

55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO

15 3 Modelo Estendido de Debye-Huumlckel

푓 (푠 ) = minus1푠 + 퐴 푍

3푤 + 2푤 푏푤(1 + 푏푤)

(32 - 14)

Substituindo as equaccedilotildees (32 - 12) e (32 - 13) na equaccedilatildeo (32 - 14) tem-se que

푓 (푠 ) = minus1푠 + 퐴 푍

15 + 푏radic퐼2radic퐼(1 + 푏radic퐼)

(32 - 15)

Entatildeo o algoritmo deve ser

푠 = 푠 minus

⎜⎛ln 푠 (푝퐼)

푠 + 퐴휙푍푝퐻2 radic퐼

1 + 푏radic퐼+ 2푏 ln 1 + 푏radic퐼

minus 1푠 + 퐴휙푍

15 + 푏radic퐼2radic퐼(1 + 푏radic퐼) ⎠

⎟⎞

(32 - 16)

4 Modelagem Termodinacircmica Proposta

41 Introduccedilatildeo

A condiccedilatildeo de equiliacutebrio entre duas fases (α e β) com m componentes eacute dada por

(Prausnitz et al 1999)

푝 = 푝

(41 ndash 1)

푇 = 푇

(41 ndash 2)

휇 = 휇⋮

휇 = 휇

(41 ndash 3)

Considerando o equiliacutebrio soacutelido-liacutequido (ESL) de sistemas contendo proteiacutenas

sendo que os efeitos da pressatildeo podem ser desprezados que as temperaturas nas

duas fases satildeo iguais e que na fase soacutelida soacute haacute proteiacutena tem-se que para a

proteiacutena a relaccedilatildeo de equiliacutebrio pode ser descrita por

휇 (푇푥) = 휇 (푇)

(41 ndash 4)

Contudo adotando-se a lei de Henry que eacute vaacutelida para baixas concentraccedilotildees de

soluto hipoacutetese que natildeo eacute distante dos valores observados da solubilidade de

proteiacutenas pode se escrever o potencial quiacutemico na fase liacutequida por

휇 (푇푥) = 휇 (푇 푥 ) + 푅푇푙푛푥

(41 ndash 5)

17 4 Modelagem Termodinacircmica Proposta

Entretanto variaccedilotildees de pH natildeo alteram o potencial quiacutemico da fase soacutelida o que

resulta pela relaccedilatildeo (41 ndash 4) que o mesmo natildeo altera tambeacutem o potencial quiacutemico

da fase liacutequida Com isso pela relaccedilatildeo (41 ndash 5) sendo o potencial quiacutemico de

referecircncia constante com o pH uma contradiccedilatildeo emerge a variaccedilatildeo do pH natildeo

poderia alterar o valor da solubilidade poreacutem a observaccedilatildeo experimental mostra o

contraacuterio Assim deve-se lembrar que pelo princiacutepio da eletroneutralidade a fase

soacutelida soacute possui moleacuteculas proteacuteicas eletricamente neutras e portanto o equiliacutebrio

de fases deve se estabelecer apenas entre as moleacuteculas presentes na fase soacutelida e

as moleacuteculas eletricamente neutras em soluccedilatildeo Ou seja como soacute moleacuteculas

eletricamente neutras podem estar na fase soacutelida o equiliacutebrio de fases depende

exclusivamente da fraccedilatildeo de moleacuteculas eletricamente neutras em soluccedilatildeo pois soacute

estas podem precipitar Assim tanto a equaccedilatildeo (41 ndash 4) quanto a equaccedilatildeo (41 ndash

5) devem ser aplicadas natildeo ao conjunto de todas as moleacuteculas de proteiacutena em

soluccedilatildeo mas somente as moleacuteculas proteacuteicas eletricamente neutras Portanto a

concentraccedilatildeo das moleacuteculas de proteiacutena eletricamente neutras em soluccedilatildeo eacute

constante com o pH e pode ser interpretada como a multiplicaccedilatildeo da fraccedilatildeo de

moleacuteculas eletricamente neutras pela concentraccedilatildeo total de proteiacutenas que eacute a

proacutepria solubilidade Assim uma relaccedilatildeo de inversa proporcionalidade eacute definida

quanto maior a fraccedilatildeo de moleacuteculas neutras menor seraacute a solubilidade de uma

proteiacutena em soluccedilatildeo Portanto no ponto isoeleacutetrico no qual haacute o miacutenimo de

solubilidade tem-se o ponto maacuteximo de fraccedilatildeo de moleacuteculas eletricamente neutras

A partir disto eacute possiacutevel escrever a equaccedilatildeo que rege o comportamento da

solubilidade de uma proteiacutena em funccedilatildeo do pH da soluccedilatildeo

휙(푝퐻)푆 (푝퐻) = 휆 = 푐표푛푠푡푎푛푡푒

(41 ndash 6)

18 4 Modelagem Termodinacircmica Proposta

Na equaccedilatildeo (41 ndash 6) o paracircmetro λ pode ser um paracircmetro de ajuste do modelo a

um conjunto de valores experimentais tendo se estabelecido uma funccedilatildeo objetivo ou

ainda dado pelo produto entre a solubilidade no ponto isoeleacutetrico e a fraccedilatildeo de

moleacuteculas eletricamente neutras em soluccedilatildeo tambeacutem no pI neste caso vale a

seguinte equaccedilatildeo

푠 (푝퐻) =휙(푝퐼)푠 (푝퐼)휙(푝퐻)

(41 ndash 7)

Sendo a equaccedilatildeo do modelo ndash equaccedilatildeo (41 ndash 7) ndash extremamente simples a uacutenica

dificuldade reside no caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras

(휙(푝퐻))

42 Caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras

Dentre os aminoaacutecidos que formam atraveacutes de ligaccedilotildees peptiacutedicas as proteiacutenas haacute

aqueles que possuem resiacuteduos com grupos ionizaacuteveis aleacutem dos grupos amina e

aacutecido carboxiacutelico terminais na cadeia Todos estes participam de equiliacutebrios

quiacutemicos com iacuteons H+ presentes na soluccedilatildeo entatildeo ao se alterar o pH da soluccedilatildeo

estes equiliacutebrios satildeo alterados

Assim haacute vaacuterias possibilidades de combinaccedilotildees de estados ionizados destes grupos

ionizaacuteveis que resultam em uma moleacutecula de proteiacutena eletricamente neutra Eacute

importante notar que dada a fraccedilatildeo de uma configuraccedilatildeo de uma moleacutecula neutra

todas as outras fraccedilotildees de configuraccedilotildees possiacuteveis que tambeacutem resultem em

moleacuteculas neutras satildeo proporcionais agrave fraccedilatildeo da configuraccedilatildeo dada pois todas as

configuraccedilotildees participam de equiliacutebrios entre si

19 4 Modelagem Termodinacircmica Proposta

Desta observaccedilatildeo implica-se que basta identificar uma configuraccedilatildeo proteacuteica cuja

soma dos estados ionizados resulte em carga nula para se descrever o equiliacutebrio de

fases em relaccedilatildeo ao pH na regiatildeo do ponto isoeleacutetrico onde esta consideraccedilatildeo eacute

predominante em relaccedilatildeo a outros possiacuteveis fenocircmenos

Contudo eacute necessaacuterio contabilizar a contribuiccedilatildeo de cada grupo ionizaacutevel via

equaccedilatildeo de Henderson-Hasselbach equaccedilatildeo (42 ndash 1)

훼 (푝퐻) =

⎩⎪⎨

⎪⎧ 10

1 + 10 푠푒 휈 = minus1

11 + 10

푠푒 휈 = +1

(42 ndash 1)

Na qual pKAj eacute o co-logaritmo da constante de equiliacutebrio do grupo ionizaacutevel do

resiacuteduo j j eacute estado carregado potencial do resiacuteduo j (-1 para grupos aacutecidos e +1

para grupos baacutesicos) e j eacute a fraccedilatildeo ionizada para o pH dado Para grupos cujo

estado de ionizaccedilatildeo na dada configuraccedilatildeo seja neutro a sua fraccedilatildeo eacute calculada tal

que a soma de sua fraccedilatildeo e da fraccedilatildeo ionizada tenha como resultado o valor

unitaacuterio

Assim a funccedilatildeo Pn pode ser escrita como o produto de cada fraccedilatildeo de cada grupo

ionizaacutevel j naquele estado (-1 0 ou +1) na configuraccedilatildeo neutra k em uma proteiacutena

com n grupos ionizaacuteveis Uma representaccedilatildeo matemaacutetica possiacutevel para esta funccedilatildeo

pode ser escrita como

휙 (푝퐻) = 훼 (푝퐻)

(42 ndash 2)

Na qual a fraccedilatildeo jrsquo(pH) eacute dada por

20 4 Modelagem Termodinacircmica Proposta

훼 (푝퐻) =훼 (푝퐻) 푠푒 휀 = 11 minus 훼 (푝퐻) 푠푒 휀 = 0

(42 ndash 3)

Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (42 ndash 3) e a resultante na equaccedilatildeo

(42 ndash 2) pode-se escrever que

휙 (푝퐻) =1

1 + 10

1 + 휈2 minus 휈 휀 10

minus휈 minus 1

2 minus 휈 휀 푐표푚 휀 = 0

(42 ndash 4)

A equaccedilatildeo (42 ndash 4) junto agrave equaccedilatildeo (41 ndash 7) constituem o modelo termodinacircmico

capaz de predizer a razatildeo entre as fraccedilotildees de moleacuteculas neutras de uma proteiacutena

em funccedilatildeo do pH na regiatildeo do ponto isoeleacutetrico mantendo fixas temperatura e forccedila

iocircnica Substituindo a equaccedilatildeo (42 ndash 4) na equaccedilatildeo (41 ndash 7) obteacutem-se para a

curva de solubilidade

푠 (푝퐻)푠 (푝퐼) =

1 + 101 + 10

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

푐표푚 휀 = 0

(42 ndash 8)

5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

51 Introduccedilatildeo

Segundo Groumlnwall (1941) na fase liacutequida haacute moleacuteculas de proteiacutenas com muitas

configuraccedilotildees k distintas que possuem carga liacutequida i e tambeacutem haacute certas

configuraccedilotildees que tem carga liacutequida nula e satildeo chamadas configuraccedilotildees neutras

Aleacutem disso estas uacuteltimas satildeo aquelas que determinam o equiliacutebrio de fases jaacute que

elas estatildeo em equiliacutebrio com a fase soacutelida na qual soacute haacute moleacuteculas neutras pelo

princiacutepio da eletroneutralidade Eacute tambeacutem afirmado que dado este equiliacutebrio a

atividade das moleacuteculas neutras natildeo se altera com a variaccedilatildeo do pH e eacute

proporcional agraves atividades de qualquer tipo de configuraccedilatildeo neutra

Neste mesmo trabalho eacute atribuiacuteda a Linderstroslashm-Lang o desenvolvimento de uma

teoria de prediccedilatildeo da solubilidade de proteiacutenas com a variaccedilatildeo do pH na regiatildeo do

ponto isoeleacutetrico Este desenvolvimento apresenta um balanccedilo de cargas de um

modo impliacutecito contudo como atestado por Groumlnwall o escasso conhecimento

sobre as estruturas proteacuteicas impediram agravequele tempo uma formulaccedilatildeo mais

pormenorizada do problema

52 Desenvolvimento teoacuterico

A base desta abordagem descrita por Groumlnwall e atribuiacuteda a Linderstroslashm-Lang

reside na hipoacutetese de que a moleacutecula de proteiacutena de configuraccedilatildeo k e carga nula

participa do seguinte equiliacutebrio com os iacuteons H+ e com sua forma de carga i

22 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

푃 + 푖퐻 푃 lowast

(52 ndash 1)

Note-se que o valor de i pode ser negativo A constante do equiliacutebrio quiacutemico

descrita pela equaccedilatildeo (52 ndash 1) pode ser expressa como

퐾 =푎

lowast

푎 푎

(52 ndash 2)

Sabendo que a atividade da moleacutecula de proteiacutena de configuraccedilatildeo k e carga i eacute dada

pelo produto entre sua concentraccedilatildeo e seu coeficiente de atividade tem-se que

푥lowast

= 푎 푎퐾훾

lowast

(52 ndash 3)

Entretanto a solubilidade da proteiacutena eacute soma das concentraccedilotildees de todas as

moleacuteculas de carga i Poreacutem a concentraccedilatildeo das moleacuteculas de carga i eacute a soma das

concentraccedilotildees das moleacuteculas de configuraccedilatildeo k Assim a solubilidade pode ser

escrita como

푠 (푝퐻) = 푎 푎퐾훾

lowast

(52 ndash 4)

Derivando a equaccedilatildeo (52 ndash 4) com respeito agrave atividade do iacuteon H+ considerando

que atividade da moleacutecula neutra eacute constante para qualquer configuraccedilatildeo k e ainda

que o coeficiente de atividade da proteiacutena de carga i independe da atividade do iacuteon

H+ tem-se que

푑푠푑푎 = 푖 ∙ 푎 푎

퐾훾

lowast

(52 ndash 5)

23 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

Sendo

푑 log 푠 (푝퐻)푑(푝퐻) = minus

푎푠 (푝퐻)

푑푠푑푎

(52 ndash 6)

Substituindo as equaccedilotildees (52 ndash 4) e (52 ndash 5) na equaccedilatildeo (52 ndash 6) e

reescrevendo em termos de pH e das concentraccedilotildees das proteiacutenas de carga i tem-

se que

푑 log 푠푑(푝퐻) = minus

sum (푖 ∙ 푥 )sum 푥

(52 ndash 7)

Contudo o termo do lado direito da equaccedilatildeo (52 ndash 7) estaacute associado ao conceito

de valecircncia meacutedia estabelecido por Linderstroslashm-Lang (1924)

횤 =sum (푖 ∙ 푥 )sum 푥

(52 ndash 8)

Os autores natildeo possuiacuteam um modo mais adequado de construir a curva de

solubilidade dada pela equaccedilatildeo (52 ndash 7) do que aproximar por uma funccedilatildeo linear o

perfil de carga liacutequida da proteiacutena obtido experimentalmente e integraacute-lo valendo-se

da analogia entre o conceito de carga liacutequida (Z) e de valecircncia meacutedia ( i ) Entretanto

hoje jaacute se tem uma descriccedilatildeo analiacutetica do perfil de carga liacutequida de proteiacutenas que

pode ser escrita como

푍(푝퐻) = 휈 훼

(52 ndash 9)

Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (52 ndash 9) e a resultante na equaccedilatildeo

(52 ndash 7) tem-se que

24 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

푑 log 푠푑(푝퐻) = minus

12

11 + 10

1 + 휈 + 휈 1 minus 휈 10

(52 ndash 10)

Integrando a equaccedilatildeo (52 ndash 10) de um ponto de referecircncia por exemplo do ponto

isoeleacutetrico (pI) ateacute um pH qualquer tem-se a seguinte relaccedilatildeo

푑 log 푠

( )

( )

= minus12

1

1 + 101 + 휈 + 휈 1 minus 휈 10 푑(푝퐻)

(52 ndash 11)

log푠 (푝퐻)푠 (푝퐼) = minus

12 1 + 휈

11 + 10

푑(푝퐻)

+ 휈 1 minus 휈10

1 + 10푑(푝퐻)

(52 ndash 12)

Fazendo a seguinte substituiccedilatildeo

푢 = 10 푡푎푙 푞푢푒 푑푢푢 = ln 10푑(푝퐻)

(52 ndash 13)

Tem-se que

log푠 (푝퐻)푠 (푝퐼) = minus

12

1 + 휈ln 10

1푢(1 + 푢) 푑푢 +

휈 1 minus 휈ln 10

1(1 + 푢) 푑푢

(52 ndash 14)

log푠 (푝퐻)푠 (푝퐼) = minus

12

1 + 휈ln 10

1푢 푑푢 minus

11 + 푢 푑푢 +

휈 1 minus 휈ln 10

1(1 + 푢) 푑푢

(52 ndash 15)

25 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐼) = minus

12 1 + 휈 log

1010

minus 휈 1 minus 휈 minus 1 + 휈 log1 + 101 + 10

(52 ndash 16)

Sendo

휈 1 minus 휈 minus 1 + 휈 = 휈 minus 휈 minus 1 minus 휈 = minus 1 + 휈 = minus2

(52 ndash 17)

Resultando em

log푠 (푝퐻)푠 (푝퐼) = log

1 + 101 + 10

minus1 + 휈

2 (푝퐻 minus 푝퐼)

(52 ndash 18)

Ainda eacute possiacutevel reescrever a equaccedilatildeo (52 ndash 18) como

log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log

1 + 101 + 10

(52 ndash 19)

Na qual n+ representa o nuacutemero de resiacuteduos ionizaacuteveis que na sua forma carregada

apresentam carga positiva A equaccedilatildeo (52 ndash 19) eacute uma expressatildeo analiacutetica que a

partir de dados da estrutura proteacuteica e de um dado de solubilidade permite predizer

a curva de solubilidade de uma dada proteiacutena em funccedilatildeo do pH na regiatildeo do ponto

isoeleacutetrico mantendo fixas a temperatura e a forccedila iocircnica do sistema

Eacute possiacutevel provar que as equaccedilotildees (42 ndash 8) e (52 ndash 19) satildeo idecircnticas - a prova

disso eacute descrita na seccedilatildeo 6 ndash e assim tem-se que apesar das distintas abordagens

a descriccedilatildeo do fenocircmeno eacute a mesma Note-se que um passo fundamental no

desenvolvimento da Equaccedilatildeo (52 ndash 5) eacute admitir que por hipoacutetese a atividade da

26 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

forma neutra natildeo depende do pH essa hipoacutetese tambeacutem eacute a base da equaccedilatildeo (41

ndash 7) Deve-se registrar o fato de que pelo melhor do nosso conhecimento esta eacute a

primeira vez que uma expressatildeo analiacutetica para o caacutelculo da solubilidade de

proteiacutenas em funccedilatildeo do pH eacute descrita mesmo no limite em que se considera vaacutelida

a lei de Henry

53 Soluccedilatildeo Paraboacutelica da Curva de Solubilidade

Tanto Groumlnwall (1941) quanto Fredericq e Neurath (1950) adotaram a hipoacutetese de

que os perfis de carga liacutequida da -lactoglobulina para um e da insulina para os

outros dois eram lineares na regiatildeo do ponto isoeleacutetrico Esta hipoacutetese eacute bastante

plausiacutevel e simplificadora principalmente a eacutepoca na qual estes trabalhos foram

desenvolvidos em que a estrutura proteacuteica bem como as constantes de ionizaccedilatildeo

dos resiacuteduos com grupos ionizaacuteveis era pouco conhecida De fato ainda hoje a falta

de dados das constantes de ionizaccedilatildeo na cadeia proteacuteica eacute o maior desafio no uso

do modelo rigoroso ndash equaccedilatildeo (52 ndash 18) Por isso o valor desta hipoacutetese de perfil

de carga liacutequida linear eacute notaacutevel

Supondo entatildeo que o perfil de carga seja linear eacute possiacutevel escrevecirc-lo como

푍(푝퐻) = minus퐴(푝퐻 minus 푝퐼) 푐표푚 퐴 gt 0

(53 ndash 1)

Substituindo (53 ndash 1) em (52 ndash 6)

푑 log 푠 (푝퐻)푑(푝퐻) = 퐴(푝퐻 minus 푝퐼)

(53 ndash 2)

Integrando (53 ndash 2) de um pH0 de referecircncia ateacute pH tem-se que

27 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐻 ) = 퐾[푝퐻 minus 2푝퐼(푝퐻 minus 푝퐻 ) minus 푝퐻 ] 푐표푚 퐾 =

퐴2

(53 ndash 3)

Ao se adotar como ponto de referecircncia o ponto isoeleacutetrico a equaccedilatildeo (53 ndash 3)

reduz-se agrave

log푠 (푝퐻)푠 (푝퐼) = 퐾(푝퐻 minus 푝퐼)

(53 ndash 4)

Contudo apesar da soluccedilatildeo quadraacutetica ou paraboacutelica para a equaccedilatildeo estendida de

Linderstroslashm-lang e Groumlnwall expressa na equaccedilatildeo (53 ndash 3) natildeo requerer os dados

das constantes de ionizaccedilatildeo dos resiacuteduos com grupos ionizaacuteveis ela exige a

definiccedilatildeo do paracircmetro A que fisicamente representa a inclinaccedilatildeo da reta de

aproximaccedilatildeo da curva de carga liacutequida e que pode ser calculado por correlaccedilatildeo a

partir de um conjunto de dados experimentais de solubilidade ou de carga liacutequida

6 Identidade entre o Modelo Proposto e a Equaccedilatildeo

Estendida de Linderstroslashm-Lang e Groumlnwall

A equaccedilatildeo final da modelagem termodinacircmica proposta apresentada na seccedilatildeo 4 eacute a

equaccedilatildeo (42 ndash 8) dada por

푠 (푝퐻)푠 (푝퐼) =

1 + 101 + 10

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 1)

Aplicando-se o logaritmo decimal nos dois termos da equaccedilatildeo (6 ndash 1) tem-se que

log푠 (푝퐻)푠 (푝퐼) = log

1 + 101 + 10

+ log

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 2)

Pelo bem da simplificaccedilatildeo desta deduccedilatildeo adotar-se-atildeo as seguintes funccedilotildees

휂 (푝퐻) = log

(6 ndash 3)

휃 (푝퐻) = log

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 4)

Assim pode-se reescrever a equaccedilatildeo (6 ndash 2) por

29 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐼) = 휂 (푝퐻) + 휃 (푝퐻)

(6 ndash 5)

Observando-se a equaccedilatildeo (6 ndash 5) tem-se que a funccedilatildeo j independe do estado de

ionizaccedilatildeo do resiacuteduo j poreacutem a funccedilatildeo jk depende Por isso deve-se analisar esta

funccedilatildeo para cada estado de ionizaccedilatildeo possiacutevel como mostrado na Tabela 61

Tabela 6 1 ndash Anaacutelise da funccedilatildeo jk para cada estado de ionizaccedilatildeo possiacutevel

j jk jk Quantidade de resiacuteduos neste estado

-1 -1 푝퐼 minus 푝퐻 na

0 0 nb

+1 +1 0 nc

0 푝퐼 minus 푝퐻 nd

Pela anaacutelise da Tabela 61 e considerando uma proteiacutena com n resiacuteduos com

grupos ionizaacuteveis infere-se que a equaccedilatildeo (6 ndash 5) pode ser reescrita como

log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)

(6 ndash 6)

Contudo as equaccedilotildees acima descritas satildeo vaacutelidas apenas para configuraccedilotildees

neutras pois apenas as configuraccedilotildees neutras da fase liacutequida estatildeo em equiliacutebrio

com as moleacuteculas de proteiacutena da fase soacutelida Para que uma configuraccedilatildeo seja

neutra vale a seguinte restriccedilatildeo

휀 = 0 hArr 푛 = 푛

(6 ndash 7)

30 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall

Substituindo a restriccedilatildeo dada pela equaccedilatildeo (6 ndash 7) na equaccedilatildeo (6 ndash 6) tem-se que

log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)

(6 ndash 8)

Ora mas a soma de nc e de nd natildeo resulta em outra coisa senatildeo no nuacutemero de

resiacuteduos com grupos ionizaacuteveis da estrutura proteacuteica cujo j seja +1 Assim

substituindo nc mais nd por n+ e substituindo a equaccedilatildeo (6 ndash 3) na equaccedilatildeo (6 ndash 8)

tem-se que

log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log

1 + 101 + 10

(6 ndash 9)

Ao se analisar a equaccedilatildeo (6 ndash 9) observa-se que ela eacute idecircntica a equaccedilatildeo estendida

de Linderstroslashm-Lang e Groumlnwall apresentada pela equaccedilatildeo (52 ndash 19) Com isso

tem-se que apesar das distintas formulaccedilotildees tanto a modelagem termodinacircmica aqui

proposta quanto a extensatildeo a teoria de Linderstroslashm-Lang e Groumlnwall resultam na

mesma descriccedilatildeo do fenocircmeno Aleacutem disso a equaccedilatildeo final dos modelos eacute

extremamente simples e depende apenas de um ponto de referecircncia e dos dados da

estrutura da moleacutecula de proteiacutena cuja solubilidade se deseja estudar

7 Aplicaccedilatildeo dos Modelos Expostos

Para validar o modelo comparando-o com o caacutelculo feito a partir da teoria de Debye-

Huumlckel o criteacuterio que relaciona os pontos calculados pelo modelo com os pontos

experimentais foi estabelecido a partir da seguinte funccedilatildeo objetivo (FO)

퐹푂 =1푁

푠 minus 푠푠

(7 ndash 1)

Contudo a equaccedilatildeo (7 ndash 1) natildeo eacute a melhor definiccedilatildeo de funccedilatildeo objetivo neste caso

pois a derivada da curva de solubilidade eacute razoavelmente grande nos dois lados do

ponto isoeleacutetrico e isso permite que pequenos desvios na direccedilatildeo horizontal

resultem em um grande aumento no valor da funccedilatildeo objetivo Uma soluccedilatildeo possiacutevel

seria substituir essa funccedilatildeo objetivo por uma funccedilatildeo definida pela soma do quadrado

da distacircncia do ponto experimental agrave curva do modelo principalmente se fosse

necessaacuterio calcular algum paracircmetro do modelo via otimizaccedilatildeo da funccedilatildeo objetivo

estipulada Natildeo sendo este o escopo deste trabalho optou-se pelo uso da FO

definida na equaccedilatildeo (7 ndash 1)

71 Solubilidade da Insulina Suiacutena

As Figuras 711 712 e 713 apresentam os graacuteficos da curva de solubilidade

dada pelos pontos experimentais pelo modelo proposto pela abordagem claacutessica e

tambeacutem a curva obtida pela soluccedilatildeo paraboacutelica da Equaccedilatildeo de Linderstroslashm-Lang e

Groumlnwall em trecircs temperaturas distintas

32 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 711 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 25 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

Figura 712 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 15 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

00

40

80

120

160

200

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

00

50

100

150

200

250

300

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

33 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 713 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 5 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

Os desvios da curva obtida pelo modelo proposto para valores de pH distantes do pI

podem ser explicados por ao menos trecircs importantes motivos dois devidos a

hipoacuteteses do modelo e um devido a fenocircmenos intriacutensecos a proteiacutena Sabendo que

no pI a solubilidade eacute miacutenima para valores de pH distantes do pI pode-se ter

solubilidades suficientemente grandes para que a validade da lei de Henry ndash adotada

na formulaccedilatildeo do modelo - seja questionada pois quanto mais distante do pI maior

a solubilidade e menor a validade da lei de Henry jaacute que haacute um aumento da

concentraccedilatildeo do soluto (proteiacutena) na soluccedilatildeo e tambeacutem ao fato do modelo prever

solubilidade infinita quando a fraccedilatildeo de moleacuteculas eletricamente neutras tende a

zero

limrarr푠 = lim

rarr

Φ(푝퐼)푠 (푝퐼)Φ(푝퐻) = +infin

(711 ndash 1)

00

50

100

150

200

250

300

350

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

34 7 Aplicaccedilatildeo dos Modelos Expostos

Todavia ainda haacute um fator de ordem natural que justifica o desvio apresentado para

valores de pH distantes do pI o desnovelamento da cadeia proteacuteica Este fenocircmeno

pode ocorrer de maneira a expor grupos hidroacutefobos resiacuteduos antes natildeo expostos

acrescentando relaccedilotildees de equiliacutebrio quiacutemico natildeo existentes na regiatildeo do pI

alterando o equiliacutebrio de fases e portanto alterando o valor da solubilidade

A Tabela 711 apresenta os valores obtidos para a funccedilatildeo objetivo definida em (7 ndash

1) tanto para o modelo proposto quanto para a abordagem claacutessica para trecircs

diferentes temperaturas

Tabela 711 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada

abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para insulina

suiacutena

T ordmC Abordagem FO

25 P 01857 C 02535

15 P 01981 C 05056

5 P 03595 C 03064

Observando-se a Tabela 711 vecirc-se que o modelo apresentou melhores resultados

do que o caacutelculo efetuado atraveacutes da abordagem claacutessica no que tange a

minimizaccedilatildeo da funccedilatildeo objetivo exceto para os dados a 5 ordmC

Tambeacutem eacute possiacutevel observar que a funccedilatildeo objetivo sofreu aumento com a

diminuiccedilatildeo da temperatura Isto ocorreu principalmente devido agrave dificuldade de

obter dados experimentais de solubilidade a temperaturas baixas o que aumenta o

desvio experimental fazendo com que se tenha um aumento do valor da funccedilatildeo

objetivo como a definida em (5 ndash 1) Um efeito secundaacuterio que tambeacutem pressiona a

35 7 Aplicaccedilatildeo dos Modelos Expostos

funccedilatildeo objetivo eacute o fato dos dados de pKA terem sido obtidos a uma temperatura

especiacutefica o que tende a acrescentar erro no caacutelculo de solubilidades a temperaturas

diferentes ainda que o pKA natildeo varie de forma ab-rupta com a temperatura

Outra observaccedilatildeo que deve ser registrada eacute o fato da funccedilatildeo objetivo para a

abordagem claacutessica na temperatura de 15 ordmC divergir a um valor tatildeo elevado em

relaccedilatildeo aos demais Isto se deve a um ponto experimental especiacutefico a um pH de

45 a solubilidade da insulina suiacutena obtida experimentalmente eacute 230 x 10-5 mol kg-1

enquanto a calculada pelo modelo proposto eacute 230 x 10-5 mol kg-1 e a calculada pela

abordagem claacutessica eacute 520 x 10-5 mol kg-1 Por conta do desvio deste ponto a funccedilatildeo

objetivo para a abordagem claacutessica nesta temperatura tem um aumento significativo

A Tabela 712 apresenta os valores do paracircmetro K da soluccedilatildeo paraboacutelica obtidos

neste trabalho para a insulina suiacutena comparados ao encontrado na literatura

Tabela 712 ndash Valores do paracircmetro K da soluccedilatildeo paraboacutelica para a insulina suiacutena

Referecircncias T ordmC K Fredericq e Neurath (1950) - 081 Neste trabalho 25 104 Neste trabalho 15 101 Neste trabalho 5 145

Pela Tabela 712 pode-se observar que haacute uma diferenccedila pequena entre os

valores do paracircmetro K obtidos neste trabalho e por Fredericq e Neurath (1950) Por

isso natildeo se pode afirmar a que se deve esta diferenccedila se eacute devido a diferenccedilas entre

procedimentos experimentais ou se eacute devido agrave diferenccedila de meacutetodo de caacutelculo do

paracircmetro Apesar de no experimento realizado por Fredericq e Neurath (1950)

haver a presenccedila do acircnion tiocianato e este acircnion interagir com grupos ionizaacuteveis

da cadeia proteacuteica como observado pelos autores do trabalho tambeacutem estes

36 7 Aplicaccedilatildeo dos Modelos Expostos

proacuteprios autores afirmam que a presenccedila deste acircnion natildeo altera a forma da curva

que eacute basicamente determinada pelo paracircmetro K De qualquer modo eacute interessante

observar a proximidade dos valores encontrados neste trabalho com o obtido por

Fredericq e Neurath (1950) pelo menos no que diz respeito agrave ordem de grandeza do

paracircmetro em questatildeo

72 Solubilidade da Lisozima de clara de ovo de galinha

Um modelo para ser validado necessita correlacionar dados experimentais de modo

satisfatoacuterio ou seja um modelo deve buscar fidelidade ao fenocircmeno fiacutesico

observado Assim na procura de dados de solubilidade de proteiacutenas poucos dados

na regiatildeo do pI foram encontrados Este eacute o caso da lisozima de clara de ovo de

galinha que apesar de ter muitos estudos de solubilidade nenhum deles se

encontra na regiatildeo do pI Surgiu assim a necessidade de se obter estes dados

experimentais para poder validar o modelo proposto A escolha da lisozima de clara

de ovo de galinha se deu em parte pela sua importacircncia mas tambeacutem em parte por

ter os valores de pKA conhecidos

A curva de solubilidade da lisozima de clara de ovo de galinha levantada neste

trabalho estaacute apresentada na Figura 721

37 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em

soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e

dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()

Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento

esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH

isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de

soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se

comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto

isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da

soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos

ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente

neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a

solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e

00

10

20

30

40

50

60

70

80

90

100

95 100 105 110 115 120

Solu

bilid

ade

(mg

mL)

pH

38 7 Aplicaccedilatildeo dos Modelos Expostos

alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado

em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo

Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo

a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo

Por conta de falta de dados a este respeito modelou-se apenas a curva de

solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura

722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de

galinha em funccedilatildeo do pH da soluccedilatildeo

Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)

00

10

20

30

40

50

60

70

80

90

96 99 102 105 108 111 114 117 120

Solu

bilid

ade

(mg

mL)

pH

39 7 Aplicaccedilatildeo dos Modelos Expostos

O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721

Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada

abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima

de clara de ovo de galinha

T ordmC Abordagem FO

25 P 4650 C gt7919a

a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado

Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta

aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a

abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca

de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos

anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao

efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de

clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a

variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A

proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de

cargas pontuais de Debye-Huumlckel

8 Conclusotildees

A modelagem termodinacircmica proposta neste trabalho apresentou expressivos

resultados quando comparada a abordagem claacutessica de Debye-Huumlckel

Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o

modelo aproximou melhor os pontos experimentais do que a referida abordagem

comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima

ao ponto isoeleacutetrico

Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica

para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua

construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo

lugar por sua aplicabilidade

Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis

da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva

em regiotildees distantes do ponto isoeleacutetrico

9 Referecircncias Bibliograacuteficas

BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene

Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects

Biophys J 95 1285-1294 2008

FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and

other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72

2684 - 26911950

GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v

93 p 517-542 1931

GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab

Carlsberg v 24 p 185-200 1941

KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native

and mutant insulins pK perturbation of B13-Glu in aggregated species Arch

Biochem Biophys v 283 p 496-502 1990

KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for

the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng

Chem Res v 35 p 4319-4327 1996

42 9 Referecircncias Bibliograacuteficas

KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen

lysozyme J Biochem v 87 p 1215-1219 1980

LADISCH M R Bioseparations Engineering principles practice and

economics John Wiley amp Sons 2001 pp1 116 ndash 117 133

LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab

Carlsberg v 15 p 1-29 1924

PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da

particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas

2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP

PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the

excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte

solutions Fluid Phase Equilib v 269 p 25ndash35 2008

PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-

contribution model involving phase and chemical equilibrium Ind Eng Chem Res

v 33 p 1341-1347 1994

PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277

1973

PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino

acids Fluid Phase Equilib v 152 p 121-132 1998

43 9 Referecircncias Bibliograacuteficas

PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular

Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999

SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of

equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte

solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009

TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J

R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with

carbon dioxide Biotech Bioeng v103 p 909-919 2009

TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer

free energy Biophys J v 95 p 2601-2609 2008

TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in

water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95

2009

Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na

cadeia proteacuteica

Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo

de ionizaccedilatildeo

퐻퐴 퐴 + 퐻

(A ndash 1)

Assim considerando que a constante de equiliacutebrio

퐾 = 푎

(A ndash 2)

Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que

퐾 =[퐴 ][퐻 ]

[퐻퐴]

(A ndash 3)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que

log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]

(A ndash 4)

Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado

por

minus log[휑] = 푝휑

(A ndash 5)

Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que

45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

푝퐾 = log[퐻퐴][퐴 ] + 푝퐻

(A ndash 6)

Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por

훼 =[퐴 ]

[퐻퐴] + [퐴 ]

(A ndash 7)

Reescrevendo (A ndash 7) tem-se que

훼 =[퐴 ] [퐻퐴frasl ]

1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =

훼1 minus 훼

(A ndash 8)

Substituindo (A ndash 8) em (A ndash 6) tem-se que

푝퐾 = log훼

1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10

(A ndash 9)

Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos

훼 =1

1 + 10

(A ndash 10)

Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio

퐴 + 퐻 퐻퐴

(A ndash 11)

Pode se escrever a constante de equiliacutebrio como

퐾 =[퐻퐴 ]

[퐴][퐻 ]

(A ndash 12)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que

46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

log퐾 = minus log[퐴]

[퐻퐴 ] minus log[퐻 ]

(A -13)

Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por

훼 =[퐻퐴 ]

[퐴] + [퐻퐴 ]

(A ndash 14)

Assim a equaccedilatildeo (A ndash 13) fica

훼1 minus 훼 = 10

(A ndash 15)

Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo

훼 =10

1 + 10

(A ndash 16)

Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos

modelos expostos

Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]

48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]

49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)

50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])

51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]

52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])

53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)

54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2

55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO

4 Modelagem Termodinacircmica Proposta

41 Introduccedilatildeo

A condiccedilatildeo de equiliacutebrio entre duas fases (α e β) com m componentes eacute dada por

(Prausnitz et al 1999)

푝 = 푝

(41 ndash 1)

푇 = 푇

(41 ndash 2)

휇 = 휇⋮

휇 = 휇

(41 ndash 3)

Considerando o equiliacutebrio soacutelido-liacutequido (ESL) de sistemas contendo proteiacutenas

sendo que os efeitos da pressatildeo podem ser desprezados que as temperaturas nas

duas fases satildeo iguais e que na fase soacutelida soacute haacute proteiacutena tem-se que para a

proteiacutena a relaccedilatildeo de equiliacutebrio pode ser descrita por

휇 (푇푥) = 휇 (푇)

(41 ndash 4)

Contudo adotando-se a lei de Henry que eacute vaacutelida para baixas concentraccedilotildees de

soluto hipoacutetese que natildeo eacute distante dos valores observados da solubilidade de

proteiacutenas pode se escrever o potencial quiacutemico na fase liacutequida por

휇 (푇푥) = 휇 (푇 푥 ) + 푅푇푙푛푥

(41 ndash 5)

17 4 Modelagem Termodinacircmica Proposta

Entretanto variaccedilotildees de pH natildeo alteram o potencial quiacutemico da fase soacutelida o que

resulta pela relaccedilatildeo (41 ndash 4) que o mesmo natildeo altera tambeacutem o potencial quiacutemico

da fase liacutequida Com isso pela relaccedilatildeo (41 ndash 5) sendo o potencial quiacutemico de

referecircncia constante com o pH uma contradiccedilatildeo emerge a variaccedilatildeo do pH natildeo

poderia alterar o valor da solubilidade poreacutem a observaccedilatildeo experimental mostra o

contraacuterio Assim deve-se lembrar que pelo princiacutepio da eletroneutralidade a fase

soacutelida soacute possui moleacuteculas proteacuteicas eletricamente neutras e portanto o equiliacutebrio

de fases deve se estabelecer apenas entre as moleacuteculas presentes na fase soacutelida e

as moleacuteculas eletricamente neutras em soluccedilatildeo Ou seja como soacute moleacuteculas

eletricamente neutras podem estar na fase soacutelida o equiliacutebrio de fases depende

exclusivamente da fraccedilatildeo de moleacuteculas eletricamente neutras em soluccedilatildeo pois soacute

estas podem precipitar Assim tanto a equaccedilatildeo (41 ndash 4) quanto a equaccedilatildeo (41 ndash

5) devem ser aplicadas natildeo ao conjunto de todas as moleacuteculas de proteiacutena em

soluccedilatildeo mas somente as moleacuteculas proteacuteicas eletricamente neutras Portanto a

concentraccedilatildeo das moleacuteculas de proteiacutena eletricamente neutras em soluccedilatildeo eacute

constante com o pH e pode ser interpretada como a multiplicaccedilatildeo da fraccedilatildeo de

moleacuteculas eletricamente neutras pela concentraccedilatildeo total de proteiacutenas que eacute a

proacutepria solubilidade Assim uma relaccedilatildeo de inversa proporcionalidade eacute definida

quanto maior a fraccedilatildeo de moleacuteculas neutras menor seraacute a solubilidade de uma

proteiacutena em soluccedilatildeo Portanto no ponto isoeleacutetrico no qual haacute o miacutenimo de

solubilidade tem-se o ponto maacuteximo de fraccedilatildeo de moleacuteculas eletricamente neutras

A partir disto eacute possiacutevel escrever a equaccedilatildeo que rege o comportamento da

solubilidade de uma proteiacutena em funccedilatildeo do pH da soluccedilatildeo

휙(푝퐻)푆 (푝퐻) = 휆 = 푐표푛푠푡푎푛푡푒

(41 ndash 6)

18 4 Modelagem Termodinacircmica Proposta

Na equaccedilatildeo (41 ndash 6) o paracircmetro λ pode ser um paracircmetro de ajuste do modelo a

um conjunto de valores experimentais tendo se estabelecido uma funccedilatildeo objetivo ou

ainda dado pelo produto entre a solubilidade no ponto isoeleacutetrico e a fraccedilatildeo de

moleacuteculas eletricamente neutras em soluccedilatildeo tambeacutem no pI neste caso vale a

seguinte equaccedilatildeo

푠 (푝퐻) =휙(푝퐼)푠 (푝퐼)휙(푝퐻)

(41 ndash 7)

Sendo a equaccedilatildeo do modelo ndash equaccedilatildeo (41 ndash 7) ndash extremamente simples a uacutenica

dificuldade reside no caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras

(휙(푝퐻))

42 Caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras

Dentre os aminoaacutecidos que formam atraveacutes de ligaccedilotildees peptiacutedicas as proteiacutenas haacute

aqueles que possuem resiacuteduos com grupos ionizaacuteveis aleacutem dos grupos amina e

aacutecido carboxiacutelico terminais na cadeia Todos estes participam de equiliacutebrios

quiacutemicos com iacuteons H+ presentes na soluccedilatildeo entatildeo ao se alterar o pH da soluccedilatildeo

estes equiliacutebrios satildeo alterados

Assim haacute vaacuterias possibilidades de combinaccedilotildees de estados ionizados destes grupos

ionizaacuteveis que resultam em uma moleacutecula de proteiacutena eletricamente neutra Eacute

importante notar que dada a fraccedilatildeo de uma configuraccedilatildeo de uma moleacutecula neutra

todas as outras fraccedilotildees de configuraccedilotildees possiacuteveis que tambeacutem resultem em

moleacuteculas neutras satildeo proporcionais agrave fraccedilatildeo da configuraccedilatildeo dada pois todas as

configuraccedilotildees participam de equiliacutebrios entre si

19 4 Modelagem Termodinacircmica Proposta

Desta observaccedilatildeo implica-se que basta identificar uma configuraccedilatildeo proteacuteica cuja

soma dos estados ionizados resulte em carga nula para se descrever o equiliacutebrio de

fases em relaccedilatildeo ao pH na regiatildeo do ponto isoeleacutetrico onde esta consideraccedilatildeo eacute

predominante em relaccedilatildeo a outros possiacuteveis fenocircmenos

Contudo eacute necessaacuterio contabilizar a contribuiccedilatildeo de cada grupo ionizaacutevel via

equaccedilatildeo de Henderson-Hasselbach equaccedilatildeo (42 ndash 1)

훼 (푝퐻) =

⎩⎪⎨

⎪⎧ 10

1 + 10 푠푒 휈 = minus1

11 + 10

푠푒 휈 = +1

(42 ndash 1)

Na qual pKAj eacute o co-logaritmo da constante de equiliacutebrio do grupo ionizaacutevel do

resiacuteduo j j eacute estado carregado potencial do resiacuteduo j (-1 para grupos aacutecidos e +1

para grupos baacutesicos) e j eacute a fraccedilatildeo ionizada para o pH dado Para grupos cujo

estado de ionizaccedilatildeo na dada configuraccedilatildeo seja neutro a sua fraccedilatildeo eacute calculada tal

que a soma de sua fraccedilatildeo e da fraccedilatildeo ionizada tenha como resultado o valor

unitaacuterio

Assim a funccedilatildeo Pn pode ser escrita como o produto de cada fraccedilatildeo de cada grupo

ionizaacutevel j naquele estado (-1 0 ou +1) na configuraccedilatildeo neutra k em uma proteiacutena

com n grupos ionizaacuteveis Uma representaccedilatildeo matemaacutetica possiacutevel para esta funccedilatildeo

pode ser escrita como

휙 (푝퐻) = 훼 (푝퐻)

(42 ndash 2)

Na qual a fraccedilatildeo jrsquo(pH) eacute dada por

20 4 Modelagem Termodinacircmica Proposta

훼 (푝퐻) =훼 (푝퐻) 푠푒 휀 = 11 minus 훼 (푝퐻) 푠푒 휀 = 0

(42 ndash 3)

Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (42 ndash 3) e a resultante na equaccedilatildeo

(42 ndash 2) pode-se escrever que

휙 (푝퐻) =1

1 + 10

1 + 휈2 minus 휈 휀 10

minus휈 minus 1

2 minus 휈 휀 푐표푚 휀 = 0

(42 ndash 4)

A equaccedilatildeo (42 ndash 4) junto agrave equaccedilatildeo (41 ndash 7) constituem o modelo termodinacircmico

capaz de predizer a razatildeo entre as fraccedilotildees de moleacuteculas neutras de uma proteiacutena

em funccedilatildeo do pH na regiatildeo do ponto isoeleacutetrico mantendo fixas temperatura e forccedila

iocircnica Substituindo a equaccedilatildeo (42 ndash 4) na equaccedilatildeo (41 ndash 7) obteacutem-se para a

curva de solubilidade

푠 (푝퐻)푠 (푝퐼) =

1 + 101 + 10

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

푐표푚 휀 = 0

(42 ndash 8)

5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

51 Introduccedilatildeo

Segundo Groumlnwall (1941) na fase liacutequida haacute moleacuteculas de proteiacutenas com muitas

configuraccedilotildees k distintas que possuem carga liacutequida i e tambeacutem haacute certas

configuraccedilotildees que tem carga liacutequida nula e satildeo chamadas configuraccedilotildees neutras

Aleacutem disso estas uacuteltimas satildeo aquelas que determinam o equiliacutebrio de fases jaacute que

elas estatildeo em equiliacutebrio com a fase soacutelida na qual soacute haacute moleacuteculas neutras pelo

princiacutepio da eletroneutralidade Eacute tambeacutem afirmado que dado este equiliacutebrio a

atividade das moleacuteculas neutras natildeo se altera com a variaccedilatildeo do pH e eacute

proporcional agraves atividades de qualquer tipo de configuraccedilatildeo neutra

Neste mesmo trabalho eacute atribuiacuteda a Linderstroslashm-Lang o desenvolvimento de uma

teoria de prediccedilatildeo da solubilidade de proteiacutenas com a variaccedilatildeo do pH na regiatildeo do

ponto isoeleacutetrico Este desenvolvimento apresenta um balanccedilo de cargas de um

modo impliacutecito contudo como atestado por Groumlnwall o escasso conhecimento

sobre as estruturas proteacuteicas impediram agravequele tempo uma formulaccedilatildeo mais

pormenorizada do problema

52 Desenvolvimento teoacuterico

A base desta abordagem descrita por Groumlnwall e atribuiacuteda a Linderstroslashm-Lang

reside na hipoacutetese de que a moleacutecula de proteiacutena de configuraccedilatildeo k e carga nula

participa do seguinte equiliacutebrio com os iacuteons H+ e com sua forma de carga i

22 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

푃 + 푖퐻 푃 lowast

(52 ndash 1)

Note-se que o valor de i pode ser negativo A constante do equiliacutebrio quiacutemico

descrita pela equaccedilatildeo (52 ndash 1) pode ser expressa como

퐾 =푎

lowast

푎 푎

(52 ndash 2)

Sabendo que a atividade da moleacutecula de proteiacutena de configuraccedilatildeo k e carga i eacute dada

pelo produto entre sua concentraccedilatildeo e seu coeficiente de atividade tem-se que

푥lowast

= 푎 푎퐾훾

lowast

(52 ndash 3)

Entretanto a solubilidade da proteiacutena eacute soma das concentraccedilotildees de todas as

moleacuteculas de carga i Poreacutem a concentraccedilatildeo das moleacuteculas de carga i eacute a soma das

concentraccedilotildees das moleacuteculas de configuraccedilatildeo k Assim a solubilidade pode ser

escrita como

푠 (푝퐻) = 푎 푎퐾훾

lowast

(52 ndash 4)

Derivando a equaccedilatildeo (52 ndash 4) com respeito agrave atividade do iacuteon H+ considerando

que atividade da moleacutecula neutra eacute constante para qualquer configuraccedilatildeo k e ainda

que o coeficiente de atividade da proteiacutena de carga i independe da atividade do iacuteon

H+ tem-se que

푑푠푑푎 = 푖 ∙ 푎 푎

퐾훾

lowast

(52 ndash 5)

23 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

Sendo

푑 log 푠 (푝퐻)푑(푝퐻) = minus

푎푠 (푝퐻)

푑푠푑푎

(52 ndash 6)

Substituindo as equaccedilotildees (52 ndash 4) e (52 ndash 5) na equaccedilatildeo (52 ndash 6) e

reescrevendo em termos de pH e das concentraccedilotildees das proteiacutenas de carga i tem-

se que

푑 log 푠푑(푝퐻) = minus

sum (푖 ∙ 푥 )sum 푥

(52 ndash 7)

Contudo o termo do lado direito da equaccedilatildeo (52 ndash 7) estaacute associado ao conceito

de valecircncia meacutedia estabelecido por Linderstroslashm-Lang (1924)

횤 =sum (푖 ∙ 푥 )sum 푥

(52 ndash 8)

Os autores natildeo possuiacuteam um modo mais adequado de construir a curva de

solubilidade dada pela equaccedilatildeo (52 ndash 7) do que aproximar por uma funccedilatildeo linear o

perfil de carga liacutequida da proteiacutena obtido experimentalmente e integraacute-lo valendo-se

da analogia entre o conceito de carga liacutequida (Z) e de valecircncia meacutedia ( i ) Entretanto

hoje jaacute se tem uma descriccedilatildeo analiacutetica do perfil de carga liacutequida de proteiacutenas que

pode ser escrita como

푍(푝퐻) = 휈 훼

(52 ndash 9)

Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (52 ndash 9) e a resultante na equaccedilatildeo

(52 ndash 7) tem-se que

24 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

푑 log 푠푑(푝퐻) = minus

12

11 + 10

1 + 휈 + 휈 1 minus 휈 10

(52 ndash 10)

Integrando a equaccedilatildeo (52 ndash 10) de um ponto de referecircncia por exemplo do ponto

isoeleacutetrico (pI) ateacute um pH qualquer tem-se a seguinte relaccedilatildeo

푑 log 푠

( )

( )

= minus12

1

1 + 101 + 휈 + 휈 1 minus 휈 10 푑(푝퐻)

(52 ndash 11)

log푠 (푝퐻)푠 (푝퐼) = minus

12 1 + 휈

11 + 10

푑(푝퐻)

+ 휈 1 minus 휈10

1 + 10푑(푝퐻)

(52 ndash 12)

Fazendo a seguinte substituiccedilatildeo

푢 = 10 푡푎푙 푞푢푒 푑푢푢 = ln 10푑(푝퐻)

(52 ndash 13)

Tem-se que

log푠 (푝퐻)푠 (푝퐼) = minus

12

1 + 휈ln 10

1푢(1 + 푢) 푑푢 +

휈 1 minus 휈ln 10

1(1 + 푢) 푑푢

(52 ndash 14)

log푠 (푝퐻)푠 (푝퐼) = minus

12

1 + 휈ln 10

1푢 푑푢 minus

11 + 푢 푑푢 +

휈 1 minus 휈ln 10

1(1 + 푢) 푑푢

(52 ndash 15)

25 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐼) = minus

12 1 + 휈 log

1010

minus 휈 1 minus 휈 minus 1 + 휈 log1 + 101 + 10

(52 ndash 16)

Sendo

휈 1 minus 휈 minus 1 + 휈 = 휈 minus 휈 minus 1 minus 휈 = minus 1 + 휈 = minus2

(52 ndash 17)

Resultando em

log푠 (푝퐻)푠 (푝퐼) = log

1 + 101 + 10

minus1 + 휈

2 (푝퐻 minus 푝퐼)

(52 ndash 18)

Ainda eacute possiacutevel reescrever a equaccedilatildeo (52 ndash 18) como

log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log

1 + 101 + 10

(52 ndash 19)

Na qual n+ representa o nuacutemero de resiacuteduos ionizaacuteveis que na sua forma carregada

apresentam carga positiva A equaccedilatildeo (52 ndash 19) eacute uma expressatildeo analiacutetica que a

partir de dados da estrutura proteacuteica e de um dado de solubilidade permite predizer

a curva de solubilidade de uma dada proteiacutena em funccedilatildeo do pH na regiatildeo do ponto

isoeleacutetrico mantendo fixas a temperatura e a forccedila iocircnica do sistema

Eacute possiacutevel provar que as equaccedilotildees (42 ndash 8) e (52 ndash 19) satildeo idecircnticas - a prova

disso eacute descrita na seccedilatildeo 6 ndash e assim tem-se que apesar das distintas abordagens

a descriccedilatildeo do fenocircmeno eacute a mesma Note-se que um passo fundamental no

desenvolvimento da Equaccedilatildeo (52 ndash 5) eacute admitir que por hipoacutetese a atividade da

26 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

forma neutra natildeo depende do pH essa hipoacutetese tambeacutem eacute a base da equaccedilatildeo (41

ndash 7) Deve-se registrar o fato de que pelo melhor do nosso conhecimento esta eacute a

primeira vez que uma expressatildeo analiacutetica para o caacutelculo da solubilidade de

proteiacutenas em funccedilatildeo do pH eacute descrita mesmo no limite em que se considera vaacutelida

a lei de Henry

53 Soluccedilatildeo Paraboacutelica da Curva de Solubilidade

Tanto Groumlnwall (1941) quanto Fredericq e Neurath (1950) adotaram a hipoacutetese de

que os perfis de carga liacutequida da -lactoglobulina para um e da insulina para os

outros dois eram lineares na regiatildeo do ponto isoeleacutetrico Esta hipoacutetese eacute bastante

plausiacutevel e simplificadora principalmente a eacutepoca na qual estes trabalhos foram

desenvolvidos em que a estrutura proteacuteica bem como as constantes de ionizaccedilatildeo

dos resiacuteduos com grupos ionizaacuteveis era pouco conhecida De fato ainda hoje a falta

de dados das constantes de ionizaccedilatildeo na cadeia proteacuteica eacute o maior desafio no uso

do modelo rigoroso ndash equaccedilatildeo (52 ndash 18) Por isso o valor desta hipoacutetese de perfil

de carga liacutequida linear eacute notaacutevel

Supondo entatildeo que o perfil de carga seja linear eacute possiacutevel escrevecirc-lo como

푍(푝퐻) = minus퐴(푝퐻 minus 푝퐼) 푐표푚 퐴 gt 0

(53 ndash 1)

Substituindo (53 ndash 1) em (52 ndash 6)

푑 log 푠 (푝퐻)푑(푝퐻) = 퐴(푝퐻 minus 푝퐼)

(53 ndash 2)

Integrando (53 ndash 2) de um pH0 de referecircncia ateacute pH tem-se que

27 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐻 ) = 퐾[푝퐻 minus 2푝퐼(푝퐻 minus 푝퐻 ) minus 푝퐻 ] 푐표푚 퐾 =

퐴2

(53 ndash 3)

Ao se adotar como ponto de referecircncia o ponto isoeleacutetrico a equaccedilatildeo (53 ndash 3)

reduz-se agrave

log푠 (푝퐻)푠 (푝퐼) = 퐾(푝퐻 minus 푝퐼)

(53 ndash 4)

Contudo apesar da soluccedilatildeo quadraacutetica ou paraboacutelica para a equaccedilatildeo estendida de

Linderstroslashm-lang e Groumlnwall expressa na equaccedilatildeo (53 ndash 3) natildeo requerer os dados

das constantes de ionizaccedilatildeo dos resiacuteduos com grupos ionizaacuteveis ela exige a

definiccedilatildeo do paracircmetro A que fisicamente representa a inclinaccedilatildeo da reta de

aproximaccedilatildeo da curva de carga liacutequida e que pode ser calculado por correlaccedilatildeo a

partir de um conjunto de dados experimentais de solubilidade ou de carga liacutequida

6 Identidade entre o Modelo Proposto e a Equaccedilatildeo

Estendida de Linderstroslashm-Lang e Groumlnwall

A equaccedilatildeo final da modelagem termodinacircmica proposta apresentada na seccedilatildeo 4 eacute a

equaccedilatildeo (42 ndash 8) dada por

푠 (푝퐻)푠 (푝퐼) =

1 + 101 + 10

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 1)

Aplicando-se o logaritmo decimal nos dois termos da equaccedilatildeo (6 ndash 1) tem-se que

log푠 (푝퐻)푠 (푝퐼) = log

1 + 101 + 10

+ log

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 2)

Pelo bem da simplificaccedilatildeo desta deduccedilatildeo adotar-se-atildeo as seguintes funccedilotildees

휂 (푝퐻) = log

(6 ndash 3)

휃 (푝퐻) = log

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 4)

Assim pode-se reescrever a equaccedilatildeo (6 ndash 2) por

29 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐼) = 휂 (푝퐻) + 휃 (푝퐻)

(6 ndash 5)

Observando-se a equaccedilatildeo (6 ndash 5) tem-se que a funccedilatildeo j independe do estado de

ionizaccedilatildeo do resiacuteduo j poreacutem a funccedilatildeo jk depende Por isso deve-se analisar esta

funccedilatildeo para cada estado de ionizaccedilatildeo possiacutevel como mostrado na Tabela 61

Tabela 6 1 ndash Anaacutelise da funccedilatildeo jk para cada estado de ionizaccedilatildeo possiacutevel

j jk jk Quantidade de resiacuteduos neste estado

-1 -1 푝퐼 minus 푝퐻 na

0 0 nb

+1 +1 0 nc

0 푝퐼 minus 푝퐻 nd

Pela anaacutelise da Tabela 61 e considerando uma proteiacutena com n resiacuteduos com

grupos ionizaacuteveis infere-se que a equaccedilatildeo (6 ndash 5) pode ser reescrita como

log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)

(6 ndash 6)

Contudo as equaccedilotildees acima descritas satildeo vaacutelidas apenas para configuraccedilotildees

neutras pois apenas as configuraccedilotildees neutras da fase liacutequida estatildeo em equiliacutebrio

com as moleacuteculas de proteiacutena da fase soacutelida Para que uma configuraccedilatildeo seja

neutra vale a seguinte restriccedilatildeo

휀 = 0 hArr 푛 = 푛

(6 ndash 7)

30 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall

Substituindo a restriccedilatildeo dada pela equaccedilatildeo (6 ndash 7) na equaccedilatildeo (6 ndash 6) tem-se que

log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)

(6 ndash 8)

Ora mas a soma de nc e de nd natildeo resulta em outra coisa senatildeo no nuacutemero de

resiacuteduos com grupos ionizaacuteveis da estrutura proteacuteica cujo j seja +1 Assim

substituindo nc mais nd por n+ e substituindo a equaccedilatildeo (6 ndash 3) na equaccedilatildeo (6 ndash 8)

tem-se que

log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log

1 + 101 + 10

(6 ndash 9)

Ao se analisar a equaccedilatildeo (6 ndash 9) observa-se que ela eacute idecircntica a equaccedilatildeo estendida

de Linderstroslashm-Lang e Groumlnwall apresentada pela equaccedilatildeo (52 ndash 19) Com isso

tem-se que apesar das distintas formulaccedilotildees tanto a modelagem termodinacircmica aqui

proposta quanto a extensatildeo a teoria de Linderstroslashm-Lang e Groumlnwall resultam na

mesma descriccedilatildeo do fenocircmeno Aleacutem disso a equaccedilatildeo final dos modelos eacute

extremamente simples e depende apenas de um ponto de referecircncia e dos dados da

estrutura da moleacutecula de proteiacutena cuja solubilidade se deseja estudar

7 Aplicaccedilatildeo dos Modelos Expostos

Para validar o modelo comparando-o com o caacutelculo feito a partir da teoria de Debye-

Huumlckel o criteacuterio que relaciona os pontos calculados pelo modelo com os pontos

experimentais foi estabelecido a partir da seguinte funccedilatildeo objetivo (FO)

퐹푂 =1푁

푠 minus 푠푠

(7 ndash 1)

Contudo a equaccedilatildeo (7 ndash 1) natildeo eacute a melhor definiccedilatildeo de funccedilatildeo objetivo neste caso

pois a derivada da curva de solubilidade eacute razoavelmente grande nos dois lados do

ponto isoeleacutetrico e isso permite que pequenos desvios na direccedilatildeo horizontal

resultem em um grande aumento no valor da funccedilatildeo objetivo Uma soluccedilatildeo possiacutevel

seria substituir essa funccedilatildeo objetivo por uma funccedilatildeo definida pela soma do quadrado

da distacircncia do ponto experimental agrave curva do modelo principalmente se fosse

necessaacuterio calcular algum paracircmetro do modelo via otimizaccedilatildeo da funccedilatildeo objetivo

estipulada Natildeo sendo este o escopo deste trabalho optou-se pelo uso da FO

definida na equaccedilatildeo (7 ndash 1)

71 Solubilidade da Insulina Suiacutena

As Figuras 711 712 e 713 apresentam os graacuteficos da curva de solubilidade

dada pelos pontos experimentais pelo modelo proposto pela abordagem claacutessica e

tambeacutem a curva obtida pela soluccedilatildeo paraboacutelica da Equaccedilatildeo de Linderstroslashm-Lang e

Groumlnwall em trecircs temperaturas distintas

32 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 711 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 25 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

Figura 712 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 15 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

00

40

80

120

160

200

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

00

50

100

150

200

250

300

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

33 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 713 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 5 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

Os desvios da curva obtida pelo modelo proposto para valores de pH distantes do pI

podem ser explicados por ao menos trecircs importantes motivos dois devidos a

hipoacuteteses do modelo e um devido a fenocircmenos intriacutensecos a proteiacutena Sabendo que

no pI a solubilidade eacute miacutenima para valores de pH distantes do pI pode-se ter

solubilidades suficientemente grandes para que a validade da lei de Henry ndash adotada

na formulaccedilatildeo do modelo - seja questionada pois quanto mais distante do pI maior

a solubilidade e menor a validade da lei de Henry jaacute que haacute um aumento da

concentraccedilatildeo do soluto (proteiacutena) na soluccedilatildeo e tambeacutem ao fato do modelo prever

solubilidade infinita quando a fraccedilatildeo de moleacuteculas eletricamente neutras tende a

zero

limrarr푠 = lim

rarr

Φ(푝퐼)푠 (푝퐼)Φ(푝퐻) = +infin

(711 ndash 1)

00

50

100

150

200

250

300

350

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

34 7 Aplicaccedilatildeo dos Modelos Expostos

Todavia ainda haacute um fator de ordem natural que justifica o desvio apresentado para

valores de pH distantes do pI o desnovelamento da cadeia proteacuteica Este fenocircmeno

pode ocorrer de maneira a expor grupos hidroacutefobos resiacuteduos antes natildeo expostos

acrescentando relaccedilotildees de equiliacutebrio quiacutemico natildeo existentes na regiatildeo do pI

alterando o equiliacutebrio de fases e portanto alterando o valor da solubilidade

A Tabela 711 apresenta os valores obtidos para a funccedilatildeo objetivo definida em (7 ndash

1) tanto para o modelo proposto quanto para a abordagem claacutessica para trecircs

diferentes temperaturas

Tabela 711 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada

abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para insulina

suiacutena

T ordmC Abordagem FO

25 P 01857 C 02535

15 P 01981 C 05056

5 P 03595 C 03064

Observando-se a Tabela 711 vecirc-se que o modelo apresentou melhores resultados

do que o caacutelculo efetuado atraveacutes da abordagem claacutessica no que tange a

minimizaccedilatildeo da funccedilatildeo objetivo exceto para os dados a 5 ordmC

Tambeacutem eacute possiacutevel observar que a funccedilatildeo objetivo sofreu aumento com a

diminuiccedilatildeo da temperatura Isto ocorreu principalmente devido agrave dificuldade de

obter dados experimentais de solubilidade a temperaturas baixas o que aumenta o

desvio experimental fazendo com que se tenha um aumento do valor da funccedilatildeo

objetivo como a definida em (5 ndash 1) Um efeito secundaacuterio que tambeacutem pressiona a

35 7 Aplicaccedilatildeo dos Modelos Expostos

funccedilatildeo objetivo eacute o fato dos dados de pKA terem sido obtidos a uma temperatura

especiacutefica o que tende a acrescentar erro no caacutelculo de solubilidades a temperaturas

diferentes ainda que o pKA natildeo varie de forma ab-rupta com a temperatura

Outra observaccedilatildeo que deve ser registrada eacute o fato da funccedilatildeo objetivo para a

abordagem claacutessica na temperatura de 15 ordmC divergir a um valor tatildeo elevado em

relaccedilatildeo aos demais Isto se deve a um ponto experimental especiacutefico a um pH de

45 a solubilidade da insulina suiacutena obtida experimentalmente eacute 230 x 10-5 mol kg-1

enquanto a calculada pelo modelo proposto eacute 230 x 10-5 mol kg-1 e a calculada pela

abordagem claacutessica eacute 520 x 10-5 mol kg-1 Por conta do desvio deste ponto a funccedilatildeo

objetivo para a abordagem claacutessica nesta temperatura tem um aumento significativo

A Tabela 712 apresenta os valores do paracircmetro K da soluccedilatildeo paraboacutelica obtidos

neste trabalho para a insulina suiacutena comparados ao encontrado na literatura

Tabela 712 ndash Valores do paracircmetro K da soluccedilatildeo paraboacutelica para a insulina suiacutena

Referecircncias T ordmC K Fredericq e Neurath (1950) - 081 Neste trabalho 25 104 Neste trabalho 15 101 Neste trabalho 5 145

Pela Tabela 712 pode-se observar que haacute uma diferenccedila pequena entre os

valores do paracircmetro K obtidos neste trabalho e por Fredericq e Neurath (1950) Por

isso natildeo se pode afirmar a que se deve esta diferenccedila se eacute devido a diferenccedilas entre

procedimentos experimentais ou se eacute devido agrave diferenccedila de meacutetodo de caacutelculo do

paracircmetro Apesar de no experimento realizado por Fredericq e Neurath (1950)

haver a presenccedila do acircnion tiocianato e este acircnion interagir com grupos ionizaacuteveis

da cadeia proteacuteica como observado pelos autores do trabalho tambeacutem estes

36 7 Aplicaccedilatildeo dos Modelos Expostos

proacuteprios autores afirmam que a presenccedila deste acircnion natildeo altera a forma da curva

que eacute basicamente determinada pelo paracircmetro K De qualquer modo eacute interessante

observar a proximidade dos valores encontrados neste trabalho com o obtido por

Fredericq e Neurath (1950) pelo menos no que diz respeito agrave ordem de grandeza do

paracircmetro em questatildeo

72 Solubilidade da Lisozima de clara de ovo de galinha

Um modelo para ser validado necessita correlacionar dados experimentais de modo

satisfatoacuterio ou seja um modelo deve buscar fidelidade ao fenocircmeno fiacutesico

observado Assim na procura de dados de solubilidade de proteiacutenas poucos dados

na regiatildeo do pI foram encontrados Este eacute o caso da lisozima de clara de ovo de

galinha que apesar de ter muitos estudos de solubilidade nenhum deles se

encontra na regiatildeo do pI Surgiu assim a necessidade de se obter estes dados

experimentais para poder validar o modelo proposto A escolha da lisozima de clara

de ovo de galinha se deu em parte pela sua importacircncia mas tambeacutem em parte por

ter os valores de pKA conhecidos

A curva de solubilidade da lisozima de clara de ovo de galinha levantada neste

trabalho estaacute apresentada na Figura 721

37 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em

soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e

dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()

Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento

esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH

isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de

soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se

comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto

isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da

soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos

ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente

neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a

solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e

00

10

20

30

40

50

60

70

80

90

100

95 100 105 110 115 120

Solu

bilid

ade

(mg

mL)

pH

38 7 Aplicaccedilatildeo dos Modelos Expostos

alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado

em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo

Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo

a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo

Por conta de falta de dados a este respeito modelou-se apenas a curva de

solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura

722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de

galinha em funccedilatildeo do pH da soluccedilatildeo

Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)

00

10

20

30

40

50

60

70

80

90

96 99 102 105 108 111 114 117 120

Solu

bilid

ade

(mg

mL)

pH

39 7 Aplicaccedilatildeo dos Modelos Expostos

O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721

Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada

abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima

de clara de ovo de galinha

T ordmC Abordagem FO

25 P 4650 C gt7919a

a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado

Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta

aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a

abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca

de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos

anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao

efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de

clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a

variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A

proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de

cargas pontuais de Debye-Huumlckel

8 Conclusotildees

A modelagem termodinacircmica proposta neste trabalho apresentou expressivos

resultados quando comparada a abordagem claacutessica de Debye-Huumlckel

Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o

modelo aproximou melhor os pontos experimentais do que a referida abordagem

comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima

ao ponto isoeleacutetrico

Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica

para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua

construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo

lugar por sua aplicabilidade

Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis

da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva

em regiotildees distantes do ponto isoeleacutetrico

9 Referecircncias Bibliograacuteficas

BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene

Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects

Biophys J 95 1285-1294 2008

FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and

other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72

2684 - 26911950

GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v

93 p 517-542 1931

GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab

Carlsberg v 24 p 185-200 1941

KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native

and mutant insulins pK perturbation of B13-Glu in aggregated species Arch

Biochem Biophys v 283 p 496-502 1990

KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for

the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng

Chem Res v 35 p 4319-4327 1996

42 9 Referecircncias Bibliograacuteficas

KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen

lysozyme J Biochem v 87 p 1215-1219 1980

LADISCH M R Bioseparations Engineering principles practice and

economics John Wiley amp Sons 2001 pp1 116 ndash 117 133

LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab

Carlsberg v 15 p 1-29 1924

PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da

particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas

2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP

PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the

excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte

solutions Fluid Phase Equilib v 269 p 25ndash35 2008

PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-

contribution model involving phase and chemical equilibrium Ind Eng Chem Res

v 33 p 1341-1347 1994

PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277

1973

PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino

acids Fluid Phase Equilib v 152 p 121-132 1998

43 9 Referecircncias Bibliograacuteficas

PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular

Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999

SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of

equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte

solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009

TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J

R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with

carbon dioxide Biotech Bioeng v103 p 909-919 2009

TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer

free energy Biophys J v 95 p 2601-2609 2008

TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in

water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95

2009

Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na

cadeia proteacuteica

Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo

de ionizaccedilatildeo

퐻퐴 퐴 + 퐻

(A ndash 1)

Assim considerando que a constante de equiliacutebrio

퐾 = 푎

(A ndash 2)

Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que

퐾 =[퐴 ][퐻 ]

[퐻퐴]

(A ndash 3)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que

log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]

(A ndash 4)

Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado

por

minus log[휑] = 푝휑

(A ndash 5)

Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que

45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

푝퐾 = log[퐻퐴][퐴 ] + 푝퐻

(A ndash 6)

Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por

훼 =[퐴 ]

[퐻퐴] + [퐴 ]

(A ndash 7)

Reescrevendo (A ndash 7) tem-se que

훼 =[퐴 ] [퐻퐴frasl ]

1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =

훼1 minus 훼

(A ndash 8)

Substituindo (A ndash 8) em (A ndash 6) tem-se que

푝퐾 = log훼

1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10

(A ndash 9)

Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos

훼 =1

1 + 10

(A ndash 10)

Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio

퐴 + 퐻 퐻퐴

(A ndash 11)

Pode se escrever a constante de equiliacutebrio como

퐾 =[퐻퐴 ]

[퐴][퐻 ]

(A ndash 12)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que

46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

log퐾 = minus log[퐴]

[퐻퐴 ] minus log[퐻 ]

(A -13)

Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por

훼 =[퐻퐴 ]

[퐴] + [퐻퐴 ]

(A ndash 14)

Assim a equaccedilatildeo (A ndash 13) fica

훼1 minus 훼 = 10

(A ndash 15)

Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo

훼 =10

1 + 10

(A ndash 16)

Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos

modelos expostos

Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]

48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]

49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)

50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])

51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]

52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])

53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)

54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2

55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO

17 4 Modelagem Termodinacircmica Proposta

Entretanto variaccedilotildees de pH natildeo alteram o potencial quiacutemico da fase soacutelida o que

resulta pela relaccedilatildeo (41 ndash 4) que o mesmo natildeo altera tambeacutem o potencial quiacutemico

da fase liacutequida Com isso pela relaccedilatildeo (41 ndash 5) sendo o potencial quiacutemico de

referecircncia constante com o pH uma contradiccedilatildeo emerge a variaccedilatildeo do pH natildeo

poderia alterar o valor da solubilidade poreacutem a observaccedilatildeo experimental mostra o

contraacuterio Assim deve-se lembrar que pelo princiacutepio da eletroneutralidade a fase

soacutelida soacute possui moleacuteculas proteacuteicas eletricamente neutras e portanto o equiliacutebrio

de fases deve se estabelecer apenas entre as moleacuteculas presentes na fase soacutelida e

as moleacuteculas eletricamente neutras em soluccedilatildeo Ou seja como soacute moleacuteculas

eletricamente neutras podem estar na fase soacutelida o equiliacutebrio de fases depende

exclusivamente da fraccedilatildeo de moleacuteculas eletricamente neutras em soluccedilatildeo pois soacute

estas podem precipitar Assim tanto a equaccedilatildeo (41 ndash 4) quanto a equaccedilatildeo (41 ndash

5) devem ser aplicadas natildeo ao conjunto de todas as moleacuteculas de proteiacutena em

soluccedilatildeo mas somente as moleacuteculas proteacuteicas eletricamente neutras Portanto a

concentraccedilatildeo das moleacuteculas de proteiacutena eletricamente neutras em soluccedilatildeo eacute

constante com o pH e pode ser interpretada como a multiplicaccedilatildeo da fraccedilatildeo de

moleacuteculas eletricamente neutras pela concentraccedilatildeo total de proteiacutenas que eacute a

proacutepria solubilidade Assim uma relaccedilatildeo de inversa proporcionalidade eacute definida

quanto maior a fraccedilatildeo de moleacuteculas neutras menor seraacute a solubilidade de uma

proteiacutena em soluccedilatildeo Portanto no ponto isoeleacutetrico no qual haacute o miacutenimo de

solubilidade tem-se o ponto maacuteximo de fraccedilatildeo de moleacuteculas eletricamente neutras

A partir disto eacute possiacutevel escrever a equaccedilatildeo que rege o comportamento da

solubilidade de uma proteiacutena em funccedilatildeo do pH da soluccedilatildeo

휙(푝퐻)푆 (푝퐻) = 휆 = 푐표푛푠푡푎푛푡푒

(41 ndash 6)

18 4 Modelagem Termodinacircmica Proposta

Na equaccedilatildeo (41 ndash 6) o paracircmetro λ pode ser um paracircmetro de ajuste do modelo a

um conjunto de valores experimentais tendo se estabelecido uma funccedilatildeo objetivo ou

ainda dado pelo produto entre a solubilidade no ponto isoeleacutetrico e a fraccedilatildeo de

moleacuteculas eletricamente neutras em soluccedilatildeo tambeacutem no pI neste caso vale a

seguinte equaccedilatildeo

푠 (푝퐻) =휙(푝퐼)푠 (푝퐼)휙(푝퐻)

(41 ndash 7)

Sendo a equaccedilatildeo do modelo ndash equaccedilatildeo (41 ndash 7) ndash extremamente simples a uacutenica

dificuldade reside no caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras

(휙(푝퐻))

42 Caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras

Dentre os aminoaacutecidos que formam atraveacutes de ligaccedilotildees peptiacutedicas as proteiacutenas haacute

aqueles que possuem resiacuteduos com grupos ionizaacuteveis aleacutem dos grupos amina e

aacutecido carboxiacutelico terminais na cadeia Todos estes participam de equiliacutebrios

quiacutemicos com iacuteons H+ presentes na soluccedilatildeo entatildeo ao se alterar o pH da soluccedilatildeo

estes equiliacutebrios satildeo alterados

Assim haacute vaacuterias possibilidades de combinaccedilotildees de estados ionizados destes grupos

ionizaacuteveis que resultam em uma moleacutecula de proteiacutena eletricamente neutra Eacute

importante notar que dada a fraccedilatildeo de uma configuraccedilatildeo de uma moleacutecula neutra

todas as outras fraccedilotildees de configuraccedilotildees possiacuteveis que tambeacutem resultem em

moleacuteculas neutras satildeo proporcionais agrave fraccedilatildeo da configuraccedilatildeo dada pois todas as

configuraccedilotildees participam de equiliacutebrios entre si

19 4 Modelagem Termodinacircmica Proposta

Desta observaccedilatildeo implica-se que basta identificar uma configuraccedilatildeo proteacuteica cuja

soma dos estados ionizados resulte em carga nula para se descrever o equiliacutebrio de

fases em relaccedilatildeo ao pH na regiatildeo do ponto isoeleacutetrico onde esta consideraccedilatildeo eacute

predominante em relaccedilatildeo a outros possiacuteveis fenocircmenos

Contudo eacute necessaacuterio contabilizar a contribuiccedilatildeo de cada grupo ionizaacutevel via

equaccedilatildeo de Henderson-Hasselbach equaccedilatildeo (42 ndash 1)

훼 (푝퐻) =

⎩⎪⎨

⎪⎧ 10

1 + 10 푠푒 휈 = minus1

11 + 10

푠푒 휈 = +1

(42 ndash 1)

Na qual pKAj eacute o co-logaritmo da constante de equiliacutebrio do grupo ionizaacutevel do

resiacuteduo j j eacute estado carregado potencial do resiacuteduo j (-1 para grupos aacutecidos e +1

para grupos baacutesicos) e j eacute a fraccedilatildeo ionizada para o pH dado Para grupos cujo

estado de ionizaccedilatildeo na dada configuraccedilatildeo seja neutro a sua fraccedilatildeo eacute calculada tal

que a soma de sua fraccedilatildeo e da fraccedilatildeo ionizada tenha como resultado o valor

unitaacuterio

Assim a funccedilatildeo Pn pode ser escrita como o produto de cada fraccedilatildeo de cada grupo

ionizaacutevel j naquele estado (-1 0 ou +1) na configuraccedilatildeo neutra k em uma proteiacutena

com n grupos ionizaacuteveis Uma representaccedilatildeo matemaacutetica possiacutevel para esta funccedilatildeo

pode ser escrita como

휙 (푝퐻) = 훼 (푝퐻)

(42 ndash 2)

Na qual a fraccedilatildeo jrsquo(pH) eacute dada por

20 4 Modelagem Termodinacircmica Proposta

훼 (푝퐻) =훼 (푝퐻) 푠푒 휀 = 11 minus 훼 (푝퐻) 푠푒 휀 = 0

(42 ndash 3)

Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (42 ndash 3) e a resultante na equaccedilatildeo

(42 ndash 2) pode-se escrever que

휙 (푝퐻) =1

1 + 10

1 + 휈2 minus 휈 휀 10

minus휈 minus 1

2 minus 휈 휀 푐표푚 휀 = 0

(42 ndash 4)

A equaccedilatildeo (42 ndash 4) junto agrave equaccedilatildeo (41 ndash 7) constituem o modelo termodinacircmico

capaz de predizer a razatildeo entre as fraccedilotildees de moleacuteculas neutras de uma proteiacutena

em funccedilatildeo do pH na regiatildeo do ponto isoeleacutetrico mantendo fixas temperatura e forccedila

iocircnica Substituindo a equaccedilatildeo (42 ndash 4) na equaccedilatildeo (41 ndash 7) obteacutem-se para a

curva de solubilidade

푠 (푝퐻)푠 (푝퐼) =

1 + 101 + 10

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

푐표푚 휀 = 0

(42 ndash 8)

5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

51 Introduccedilatildeo

Segundo Groumlnwall (1941) na fase liacutequida haacute moleacuteculas de proteiacutenas com muitas

configuraccedilotildees k distintas que possuem carga liacutequida i e tambeacutem haacute certas

configuraccedilotildees que tem carga liacutequida nula e satildeo chamadas configuraccedilotildees neutras

Aleacutem disso estas uacuteltimas satildeo aquelas que determinam o equiliacutebrio de fases jaacute que

elas estatildeo em equiliacutebrio com a fase soacutelida na qual soacute haacute moleacuteculas neutras pelo

princiacutepio da eletroneutralidade Eacute tambeacutem afirmado que dado este equiliacutebrio a

atividade das moleacuteculas neutras natildeo se altera com a variaccedilatildeo do pH e eacute

proporcional agraves atividades de qualquer tipo de configuraccedilatildeo neutra

Neste mesmo trabalho eacute atribuiacuteda a Linderstroslashm-Lang o desenvolvimento de uma

teoria de prediccedilatildeo da solubilidade de proteiacutenas com a variaccedilatildeo do pH na regiatildeo do

ponto isoeleacutetrico Este desenvolvimento apresenta um balanccedilo de cargas de um

modo impliacutecito contudo como atestado por Groumlnwall o escasso conhecimento

sobre as estruturas proteacuteicas impediram agravequele tempo uma formulaccedilatildeo mais

pormenorizada do problema

52 Desenvolvimento teoacuterico

A base desta abordagem descrita por Groumlnwall e atribuiacuteda a Linderstroslashm-Lang

reside na hipoacutetese de que a moleacutecula de proteiacutena de configuraccedilatildeo k e carga nula

participa do seguinte equiliacutebrio com os iacuteons H+ e com sua forma de carga i

22 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

푃 + 푖퐻 푃 lowast

(52 ndash 1)

Note-se que o valor de i pode ser negativo A constante do equiliacutebrio quiacutemico

descrita pela equaccedilatildeo (52 ndash 1) pode ser expressa como

퐾 =푎

lowast

푎 푎

(52 ndash 2)

Sabendo que a atividade da moleacutecula de proteiacutena de configuraccedilatildeo k e carga i eacute dada

pelo produto entre sua concentraccedilatildeo e seu coeficiente de atividade tem-se que

푥lowast

= 푎 푎퐾훾

lowast

(52 ndash 3)

Entretanto a solubilidade da proteiacutena eacute soma das concentraccedilotildees de todas as

moleacuteculas de carga i Poreacutem a concentraccedilatildeo das moleacuteculas de carga i eacute a soma das

concentraccedilotildees das moleacuteculas de configuraccedilatildeo k Assim a solubilidade pode ser

escrita como

푠 (푝퐻) = 푎 푎퐾훾

lowast

(52 ndash 4)

Derivando a equaccedilatildeo (52 ndash 4) com respeito agrave atividade do iacuteon H+ considerando

que atividade da moleacutecula neutra eacute constante para qualquer configuraccedilatildeo k e ainda

que o coeficiente de atividade da proteiacutena de carga i independe da atividade do iacuteon

H+ tem-se que

푑푠푑푎 = 푖 ∙ 푎 푎

퐾훾

lowast

(52 ndash 5)

23 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

Sendo

푑 log 푠 (푝퐻)푑(푝퐻) = minus

푎푠 (푝퐻)

푑푠푑푎

(52 ndash 6)

Substituindo as equaccedilotildees (52 ndash 4) e (52 ndash 5) na equaccedilatildeo (52 ndash 6) e

reescrevendo em termos de pH e das concentraccedilotildees das proteiacutenas de carga i tem-

se que

푑 log 푠푑(푝퐻) = minus

sum (푖 ∙ 푥 )sum 푥

(52 ndash 7)

Contudo o termo do lado direito da equaccedilatildeo (52 ndash 7) estaacute associado ao conceito

de valecircncia meacutedia estabelecido por Linderstroslashm-Lang (1924)

횤 =sum (푖 ∙ 푥 )sum 푥

(52 ndash 8)

Os autores natildeo possuiacuteam um modo mais adequado de construir a curva de

solubilidade dada pela equaccedilatildeo (52 ndash 7) do que aproximar por uma funccedilatildeo linear o

perfil de carga liacutequida da proteiacutena obtido experimentalmente e integraacute-lo valendo-se

da analogia entre o conceito de carga liacutequida (Z) e de valecircncia meacutedia ( i ) Entretanto

hoje jaacute se tem uma descriccedilatildeo analiacutetica do perfil de carga liacutequida de proteiacutenas que

pode ser escrita como

푍(푝퐻) = 휈 훼

(52 ndash 9)

Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (52 ndash 9) e a resultante na equaccedilatildeo

(52 ndash 7) tem-se que

24 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

푑 log 푠푑(푝퐻) = minus

12

11 + 10

1 + 휈 + 휈 1 minus 휈 10

(52 ndash 10)

Integrando a equaccedilatildeo (52 ndash 10) de um ponto de referecircncia por exemplo do ponto

isoeleacutetrico (pI) ateacute um pH qualquer tem-se a seguinte relaccedilatildeo

푑 log 푠

( )

( )

= minus12

1

1 + 101 + 휈 + 휈 1 minus 휈 10 푑(푝퐻)

(52 ndash 11)

log푠 (푝퐻)푠 (푝퐼) = minus

12 1 + 휈

11 + 10

푑(푝퐻)

+ 휈 1 minus 휈10

1 + 10푑(푝퐻)

(52 ndash 12)

Fazendo a seguinte substituiccedilatildeo

푢 = 10 푡푎푙 푞푢푒 푑푢푢 = ln 10푑(푝퐻)

(52 ndash 13)

Tem-se que

log푠 (푝퐻)푠 (푝퐼) = minus

12

1 + 휈ln 10

1푢(1 + 푢) 푑푢 +

휈 1 minus 휈ln 10

1(1 + 푢) 푑푢

(52 ndash 14)

log푠 (푝퐻)푠 (푝퐼) = minus

12

1 + 휈ln 10

1푢 푑푢 minus

11 + 푢 푑푢 +

휈 1 minus 휈ln 10

1(1 + 푢) 푑푢

(52 ndash 15)

25 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐼) = minus

12 1 + 휈 log

1010

minus 휈 1 minus 휈 minus 1 + 휈 log1 + 101 + 10

(52 ndash 16)

Sendo

휈 1 minus 휈 minus 1 + 휈 = 휈 minus 휈 minus 1 minus 휈 = minus 1 + 휈 = minus2

(52 ndash 17)

Resultando em

log푠 (푝퐻)푠 (푝퐼) = log

1 + 101 + 10

minus1 + 휈

2 (푝퐻 minus 푝퐼)

(52 ndash 18)

Ainda eacute possiacutevel reescrever a equaccedilatildeo (52 ndash 18) como

log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log

1 + 101 + 10

(52 ndash 19)

Na qual n+ representa o nuacutemero de resiacuteduos ionizaacuteveis que na sua forma carregada

apresentam carga positiva A equaccedilatildeo (52 ndash 19) eacute uma expressatildeo analiacutetica que a

partir de dados da estrutura proteacuteica e de um dado de solubilidade permite predizer

a curva de solubilidade de uma dada proteiacutena em funccedilatildeo do pH na regiatildeo do ponto

isoeleacutetrico mantendo fixas a temperatura e a forccedila iocircnica do sistema

Eacute possiacutevel provar que as equaccedilotildees (42 ndash 8) e (52 ndash 19) satildeo idecircnticas - a prova

disso eacute descrita na seccedilatildeo 6 ndash e assim tem-se que apesar das distintas abordagens

a descriccedilatildeo do fenocircmeno eacute a mesma Note-se que um passo fundamental no

desenvolvimento da Equaccedilatildeo (52 ndash 5) eacute admitir que por hipoacutetese a atividade da

26 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

forma neutra natildeo depende do pH essa hipoacutetese tambeacutem eacute a base da equaccedilatildeo (41

ndash 7) Deve-se registrar o fato de que pelo melhor do nosso conhecimento esta eacute a

primeira vez que uma expressatildeo analiacutetica para o caacutelculo da solubilidade de

proteiacutenas em funccedilatildeo do pH eacute descrita mesmo no limite em que se considera vaacutelida

a lei de Henry

53 Soluccedilatildeo Paraboacutelica da Curva de Solubilidade

Tanto Groumlnwall (1941) quanto Fredericq e Neurath (1950) adotaram a hipoacutetese de

que os perfis de carga liacutequida da -lactoglobulina para um e da insulina para os

outros dois eram lineares na regiatildeo do ponto isoeleacutetrico Esta hipoacutetese eacute bastante

plausiacutevel e simplificadora principalmente a eacutepoca na qual estes trabalhos foram

desenvolvidos em que a estrutura proteacuteica bem como as constantes de ionizaccedilatildeo

dos resiacuteduos com grupos ionizaacuteveis era pouco conhecida De fato ainda hoje a falta

de dados das constantes de ionizaccedilatildeo na cadeia proteacuteica eacute o maior desafio no uso

do modelo rigoroso ndash equaccedilatildeo (52 ndash 18) Por isso o valor desta hipoacutetese de perfil

de carga liacutequida linear eacute notaacutevel

Supondo entatildeo que o perfil de carga seja linear eacute possiacutevel escrevecirc-lo como

푍(푝퐻) = minus퐴(푝퐻 minus 푝퐼) 푐표푚 퐴 gt 0

(53 ndash 1)

Substituindo (53 ndash 1) em (52 ndash 6)

푑 log 푠 (푝퐻)푑(푝퐻) = 퐴(푝퐻 minus 푝퐼)

(53 ndash 2)

Integrando (53 ndash 2) de um pH0 de referecircncia ateacute pH tem-se que

27 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐻 ) = 퐾[푝퐻 minus 2푝퐼(푝퐻 minus 푝퐻 ) minus 푝퐻 ] 푐표푚 퐾 =

퐴2

(53 ndash 3)

Ao se adotar como ponto de referecircncia o ponto isoeleacutetrico a equaccedilatildeo (53 ndash 3)

reduz-se agrave

log푠 (푝퐻)푠 (푝퐼) = 퐾(푝퐻 minus 푝퐼)

(53 ndash 4)

Contudo apesar da soluccedilatildeo quadraacutetica ou paraboacutelica para a equaccedilatildeo estendida de

Linderstroslashm-lang e Groumlnwall expressa na equaccedilatildeo (53 ndash 3) natildeo requerer os dados

das constantes de ionizaccedilatildeo dos resiacuteduos com grupos ionizaacuteveis ela exige a

definiccedilatildeo do paracircmetro A que fisicamente representa a inclinaccedilatildeo da reta de

aproximaccedilatildeo da curva de carga liacutequida e que pode ser calculado por correlaccedilatildeo a

partir de um conjunto de dados experimentais de solubilidade ou de carga liacutequida

6 Identidade entre o Modelo Proposto e a Equaccedilatildeo

Estendida de Linderstroslashm-Lang e Groumlnwall

A equaccedilatildeo final da modelagem termodinacircmica proposta apresentada na seccedilatildeo 4 eacute a

equaccedilatildeo (42 ndash 8) dada por

푠 (푝퐻)푠 (푝퐼) =

1 + 101 + 10

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 1)

Aplicando-se o logaritmo decimal nos dois termos da equaccedilatildeo (6 ndash 1) tem-se que

log푠 (푝퐻)푠 (푝퐼) = log

1 + 101 + 10

+ log

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 2)

Pelo bem da simplificaccedilatildeo desta deduccedilatildeo adotar-se-atildeo as seguintes funccedilotildees

휂 (푝퐻) = log

(6 ndash 3)

휃 (푝퐻) = log

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 4)

Assim pode-se reescrever a equaccedilatildeo (6 ndash 2) por

29 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐼) = 휂 (푝퐻) + 휃 (푝퐻)

(6 ndash 5)

Observando-se a equaccedilatildeo (6 ndash 5) tem-se que a funccedilatildeo j independe do estado de

ionizaccedilatildeo do resiacuteduo j poreacutem a funccedilatildeo jk depende Por isso deve-se analisar esta

funccedilatildeo para cada estado de ionizaccedilatildeo possiacutevel como mostrado na Tabela 61

Tabela 6 1 ndash Anaacutelise da funccedilatildeo jk para cada estado de ionizaccedilatildeo possiacutevel

j jk jk Quantidade de resiacuteduos neste estado

-1 -1 푝퐼 minus 푝퐻 na

0 0 nb

+1 +1 0 nc

0 푝퐼 minus 푝퐻 nd

Pela anaacutelise da Tabela 61 e considerando uma proteiacutena com n resiacuteduos com

grupos ionizaacuteveis infere-se que a equaccedilatildeo (6 ndash 5) pode ser reescrita como

log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)

(6 ndash 6)

Contudo as equaccedilotildees acima descritas satildeo vaacutelidas apenas para configuraccedilotildees

neutras pois apenas as configuraccedilotildees neutras da fase liacutequida estatildeo em equiliacutebrio

com as moleacuteculas de proteiacutena da fase soacutelida Para que uma configuraccedilatildeo seja

neutra vale a seguinte restriccedilatildeo

휀 = 0 hArr 푛 = 푛

(6 ndash 7)

30 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall

Substituindo a restriccedilatildeo dada pela equaccedilatildeo (6 ndash 7) na equaccedilatildeo (6 ndash 6) tem-se que

log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)

(6 ndash 8)

Ora mas a soma de nc e de nd natildeo resulta em outra coisa senatildeo no nuacutemero de

resiacuteduos com grupos ionizaacuteveis da estrutura proteacuteica cujo j seja +1 Assim

substituindo nc mais nd por n+ e substituindo a equaccedilatildeo (6 ndash 3) na equaccedilatildeo (6 ndash 8)

tem-se que

log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log

1 + 101 + 10

(6 ndash 9)

Ao se analisar a equaccedilatildeo (6 ndash 9) observa-se que ela eacute idecircntica a equaccedilatildeo estendida

de Linderstroslashm-Lang e Groumlnwall apresentada pela equaccedilatildeo (52 ndash 19) Com isso

tem-se que apesar das distintas formulaccedilotildees tanto a modelagem termodinacircmica aqui

proposta quanto a extensatildeo a teoria de Linderstroslashm-Lang e Groumlnwall resultam na

mesma descriccedilatildeo do fenocircmeno Aleacutem disso a equaccedilatildeo final dos modelos eacute

extremamente simples e depende apenas de um ponto de referecircncia e dos dados da

estrutura da moleacutecula de proteiacutena cuja solubilidade se deseja estudar

7 Aplicaccedilatildeo dos Modelos Expostos

Para validar o modelo comparando-o com o caacutelculo feito a partir da teoria de Debye-

Huumlckel o criteacuterio que relaciona os pontos calculados pelo modelo com os pontos

experimentais foi estabelecido a partir da seguinte funccedilatildeo objetivo (FO)

퐹푂 =1푁

푠 minus 푠푠

(7 ndash 1)

Contudo a equaccedilatildeo (7 ndash 1) natildeo eacute a melhor definiccedilatildeo de funccedilatildeo objetivo neste caso

pois a derivada da curva de solubilidade eacute razoavelmente grande nos dois lados do

ponto isoeleacutetrico e isso permite que pequenos desvios na direccedilatildeo horizontal

resultem em um grande aumento no valor da funccedilatildeo objetivo Uma soluccedilatildeo possiacutevel

seria substituir essa funccedilatildeo objetivo por uma funccedilatildeo definida pela soma do quadrado

da distacircncia do ponto experimental agrave curva do modelo principalmente se fosse

necessaacuterio calcular algum paracircmetro do modelo via otimizaccedilatildeo da funccedilatildeo objetivo

estipulada Natildeo sendo este o escopo deste trabalho optou-se pelo uso da FO

definida na equaccedilatildeo (7 ndash 1)

71 Solubilidade da Insulina Suiacutena

As Figuras 711 712 e 713 apresentam os graacuteficos da curva de solubilidade

dada pelos pontos experimentais pelo modelo proposto pela abordagem claacutessica e

tambeacutem a curva obtida pela soluccedilatildeo paraboacutelica da Equaccedilatildeo de Linderstroslashm-Lang e

Groumlnwall em trecircs temperaturas distintas

32 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 711 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 25 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

Figura 712 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 15 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

00

40

80

120

160

200

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

00

50

100

150

200

250

300

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

33 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 713 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 5 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

Os desvios da curva obtida pelo modelo proposto para valores de pH distantes do pI

podem ser explicados por ao menos trecircs importantes motivos dois devidos a

hipoacuteteses do modelo e um devido a fenocircmenos intriacutensecos a proteiacutena Sabendo que

no pI a solubilidade eacute miacutenima para valores de pH distantes do pI pode-se ter

solubilidades suficientemente grandes para que a validade da lei de Henry ndash adotada

na formulaccedilatildeo do modelo - seja questionada pois quanto mais distante do pI maior

a solubilidade e menor a validade da lei de Henry jaacute que haacute um aumento da

concentraccedilatildeo do soluto (proteiacutena) na soluccedilatildeo e tambeacutem ao fato do modelo prever

solubilidade infinita quando a fraccedilatildeo de moleacuteculas eletricamente neutras tende a

zero

limrarr푠 = lim

rarr

Φ(푝퐼)푠 (푝퐼)Φ(푝퐻) = +infin

(711 ndash 1)

00

50

100

150

200

250

300

350

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

34 7 Aplicaccedilatildeo dos Modelos Expostos

Todavia ainda haacute um fator de ordem natural que justifica o desvio apresentado para

valores de pH distantes do pI o desnovelamento da cadeia proteacuteica Este fenocircmeno

pode ocorrer de maneira a expor grupos hidroacutefobos resiacuteduos antes natildeo expostos

acrescentando relaccedilotildees de equiliacutebrio quiacutemico natildeo existentes na regiatildeo do pI

alterando o equiliacutebrio de fases e portanto alterando o valor da solubilidade

A Tabela 711 apresenta os valores obtidos para a funccedilatildeo objetivo definida em (7 ndash

1) tanto para o modelo proposto quanto para a abordagem claacutessica para trecircs

diferentes temperaturas

Tabela 711 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada

abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para insulina

suiacutena

T ordmC Abordagem FO

25 P 01857 C 02535

15 P 01981 C 05056

5 P 03595 C 03064

Observando-se a Tabela 711 vecirc-se que o modelo apresentou melhores resultados

do que o caacutelculo efetuado atraveacutes da abordagem claacutessica no que tange a

minimizaccedilatildeo da funccedilatildeo objetivo exceto para os dados a 5 ordmC

Tambeacutem eacute possiacutevel observar que a funccedilatildeo objetivo sofreu aumento com a

diminuiccedilatildeo da temperatura Isto ocorreu principalmente devido agrave dificuldade de

obter dados experimentais de solubilidade a temperaturas baixas o que aumenta o

desvio experimental fazendo com que se tenha um aumento do valor da funccedilatildeo

objetivo como a definida em (5 ndash 1) Um efeito secundaacuterio que tambeacutem pressiona a

35 7 Aplicaccedilatildeo dos Modelos Expostos

funccedilatildeo objetivo eacute o fato dos dados de pKA terem sido obtidos a uma temperatura

especiacutefica o que tende a acrescentar erro no caacutelculo de solubilidades a temperaturas

diferentes ainda que o pKA natildeo varie de forma ab-rupta com a temperatura

Outra observaccedilatildeo que deve ser registrada eacute o fato da funccedilatildeo objetivo para a

abordagem claacutessica na temperatura de 15 ordmC divergir a um valor tatildeo elevado em

relaccedilatildeo aos demais Isto se deve a um ponto experimental especiacutefico a um pH de

45 a solubilidade da insulina suiacutena obtida experimentalmente eacute 230 x 10-5 mol kg-1

enquanto a calculada pelo modelo proposto eacute 230 x 10-5 mol kg-1 e a calculada pela

abordagem claacutessica eacute 520 x 10-5 mol kg-1 Por conta do desvio deste ponto a funccedilatildeo

objetivo para a abordagem claacutessica nesta temperatura tem um aumento significativo

A Tabela 712 apresenta os valores do paracircmetro K da soluccedilatildeo paraboacutelica obtidos

neste trabalho para a insulina suiacutena comparados ao encontrado na literatura

Tabela 712 ndash Valores do paracircmetro K da soluccedilatildeo paraboacutelica para a insulina suiacutena

Referecircncias T ordmC K Fredericq e Neurath (1950) - 081 Neste trabalho 25 104 Neste trabalho 15 101 Neste trabalho 5 145

Pela Tabela 712 pode-se observar que haacute uma diferenccedila pequena entre os

valores do paracircmetro K obtidos neste trabalho e por Fredericq e Neurath (1950) Por

isso natildeo se pode afirmar a que se deve esta diferenccedila se eacute devido a diferenccedilas entre

procedimentos experimentais ou se eacute devido agrave diferenccedila de meacutetodo de caacutelculo do

paracircmetro Apesar de no experimento realizado por Fredericq e Neurath (1950)

haver a presenccedila do acircnion tiocianato e este acircnion interagir com grupos ionizaacuteveis

da cadeia proteacuteica como observado pelos autores do trabalho tambeacutem estes

36 7 Aplicaccedilatildeo dos Modelos Expostos

proacuteprios autores afirmam que a presenccedila deste acircnion natildeo altera a forma da curva

que eacute basicamente determinada pelo paracircmetro K De qualquer modo eacute interessante

observar a proximidade dos valores encontrados neste trabalho com o obtido por

Fredericq e Neurath (1950) pelo menos no que diz respeito agrave ordem de grandeza do

paracircmetro em questatildeo

72 Solubilidade da Lisozima de clara de ovo de galinha

Um modelo para ser validado necessita correlacionar dados experimentais de modo

satisfatoacuterio ou seja um modelo deve buscar fidelidade ao fenocircmeno fiacutesico

observado Assim na procura de dados de solubilidade de proteiacutenas poucos dados

na regiatildeo do pI foram encontrados Este eacute o caso da lisozima de clara de ovo de

galinha que apesar de ter muitos estudos de solubilidade nenhum deles se

encontra na regiatildeo do pI Surgiu assim a necessidade de se obter estes dados

experimentais para poder validar o modelo proposto A escolha da lisozima de clara

de ovo de galinha se deu em parte pela sua importacircncia mas tambeacutem em parte por

ter os valores de pKA conhecidos

A curva de solubilidade da lisozima de clara de ovo de galinha levantada neste

trabalho estaacute apresentada na Figura 721

37 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em

soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e

dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()

Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento

esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH

isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de

soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se

comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto

isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da

soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos

ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente

neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a

solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e

00

10

20

30

40

50

60

70

80

90

100

95 100 105 110 115 120

Solu

bilid

ade

(mg

mL)

pH

38 7 Aplicaccedilatildeo dos Modelos Expostos

alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado

em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo

Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo

a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo

Por conta de falta de dados a este respeito modelou-se apenas a curva de

solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura

722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de

galinha em funccedilatildeo do pH da soluccedilatildeo

Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)

00

10

20

30

40

50

60

70

80

90

96 99 102 105 108 111 114 117 120

Solu

bilid

ade

(mg

mL)

pH

39 7 Aplicaccedilatildeo dos Modelos Expostos

O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721

Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada

abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima

de clara de ovo de galinha

T ordmC Abordagem FO

25 P 4650 C gt7919a

a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado

Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta

aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a

abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca

de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos

anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao

efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de

clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a

variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A

proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de

cargas pontuais de Debye-Huumlckel

8 Conclusotildees

A modelagem termodinacircmica proposta neste trabalho apresentou expressivos

resultados quando comparada a abordagem claacutessica de Debye-Huumlckel

Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o

modelo aproximou melhor os pontos experimentais do que a referida abordagem

comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima

ao ponto isoeleacutetrico

Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica

para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua

construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo

lugar por sua aplicabilidade

Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis

da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva

em regiotildees distantes do ponto isoeleacutetrico

9 Referecircncias Bibliograacuteficas

BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene

Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects

Biophys J 95 1285-1294 2008

FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and

other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72

2684 - 26911950

GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v

93 p 517-542 1931

GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab

Carlsberg v 24 p 185-200 1941

KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native

and mutant insulins pK perturbation of B13-Glu in aggregated species Arch

Biochem Biophys v 283 p 496-502 1990

KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for

the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng

Chem Res v 35 p 4319-4327 1996

42 9 Referecircncias Bibliograacuteficas

KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen

lysozyme J Biochem v 87 p 1215-1219 1980

LADISCH M R Bioseparations Engineering principles practice and

economics John Wiley amp Sons 2001 pp1 116 ndash 117 133

LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab

Carlsberg v 15 p 1-29 1924

PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da

particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas

2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP

PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the

excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte

solutions Fluid Phase Equilib v 269 p 25ndash35 2008

PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-

contribution model involving phase and chemical equilibrium Ind Eng Chem Res

v 33 p 1341-1347 1994

PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277

1973

PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino

acids Fluid Phase Equilib v 152 p 121-132 1998

43 9 Referecircncias Bibliograacuteficas

PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular

Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999

SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of

equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte

solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009

TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J

R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with

carbon dioxide Biotech Bioeng v103 p 909-919 2009

TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer

free energy Biophys J v 95 p 2601-2609 2008

TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in

water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95

2009

Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na

cadeia proteacuteica

Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo

de ionizaccedilatildeo

퐻퐴 퐴 + 퐻

(A ndash 1)

Assim considerando que a constante de equiliacutebrio

퐾 = 푎

(A ndash 2)

Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que

퐾 =[퐴 ][퐻 ]

[퐻퐴]

(A ndash 3)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que

log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]

(A ndash 4)

Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado

por

minus log[휑] = 푝휑

(A ndash 5)

Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que

45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

푝퐾 = log[퐻퐴][퐴 ] + 푝퐻

(A ndash 6)

Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por

훼 =[퐴 ]

[퐻퐴] + [퐴 ]

(A ndash 7)

Reescrevendo (A ndash 7) tem-se que

훼 =[퐴 ] [퐻퐴frasl ]

1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =

훼1 minus 훼

(A ndash 8)

Substituindo (A ndash 8) em (A ndash 6) tem-se que

푝퐾 = log훼

1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10

(A ndash 9)

Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos

훼 =1

1 + 10

(A ndash 10)

Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio

퐴 + 퐻 퐻퐴

(A ndash 11)

Pode se escrever a constante de equiliacutebrio como

퐾 =[퐻퐴 ]

[퐴][퐻 ]

(A ndash 12)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que

46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

log퐾 = minus log[퐴]

[퐻퐴 ] minus log[퐻 ]

(A -13)

Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por

훼 =[퐻퐴 ]

[퐴] + [퐻퐴 ]

(A ndash 14)

Assim a equaccedilatildeo (A ndash 13) fica

훼1 minus 훼 = 10

(A ndash 15)

Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo

훼 =10

1 + 10

(A ndash 16)

Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos

modelos expostos

Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]

48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]

49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)

50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])

51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]

52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])

53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)

54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2

55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO

18 4 Modelagem Termodinacircmica Proposta

Na equaccedilatildeo (41 ndash 6) o paracircmetro λ pode ser um paracircmetro de ajuste do modelo a

um conjunto de valores experimentais tendo se estabelecido uma funccedilatildeo objetivo ou

ainda dado pelo produto entre a solubilidade no ponto isoeleacutetrico e a fraccedilatildeo de

moleacuteculas eletricamente neutras em soluccedilatildeo tambeacutem no pI neste caso vale a

seguinte equaccedilatildeo

푠 (푝퐻) =휙(푝퐼)푠 (푝퐼)휙(푝퐻)

(41 ndash 7)

Sendo a equaccedilatildeo do modelo ndash equaccedilatildeo (41 ndash 7) ndash extremamente simples a uacutenica

dificuldade reside no caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras

(휙(푝퐻))

42 Caacutelculo das fraccedilotildees de moleacuteculas eletricamente neutras

Dentre os aminoaacutecidos que formam atraveacutes de ligaccedilotildees peptiacutedicas as proteiacutenas haacute

aqueles que possuem resiacuteduos com grupos ionizaacuteveis aleacutem dos grupos amina e

aacutecido carboxiacutelico terminais na cadeia Todos estes participam de equiliacutebrios

quiacutemicos com iacuteons H+ presentes na soluccedilatildeo entatildeo ao se alterar o pH da soluccedilatildeo

estes equiliacutebrios satildeo alterados

Assim haacute vaacuterias possibilidades de combinaccedilotildees de estados ionizados destes grupos

ionizaacuteveis que resultam em uma moleacutecula de proteiacutena eletricamente neutra Eacute

importante notar que dada a fraccedilatildeo de uma configuraccedilatildeo de uma moleacutecula neutra

todas as outras fraccedilotildees de configuraccedilotildees possiacuteveis que tambeacutem resultem em

moleacuteculas neutras satildeo proporcionais agrave fraccedilatildeo da configuraccedilatildeo dada pois todas as

configuraccedilotildees participam de equiliacutebrios entre si

19 4 Modelagem Termodinacircmica Proposta

Desta observaccedilatildeo implica-se que basta identificar uma configuraccedilatildeo proteacuteica cuja

soma dos estados ionizados resulte em carga nula para se descrever o equiliacutebrio de

fases em relaccedilatildeo ao pH na regiatildeo do ponto isoeleacutetrico onde esta consideraccedilatildeo eacute

predominante em relaccedilatildeo a outros possiacuteveis fenocircmenos

Contudo eacute necessaacuterio contabilizar a contribuiccedilatildeo de cada grupo ionizaacutevel via

equaccedilatildeo de Henderson-Hasselbach equaccedilatildeo (42 ndash 1)

훼 (푝퐻) =

⎩⎪⎨

⎪⎧ 10

1 + 10 푠푒 휈 = minus1

11 + 10

푠푒 휈 = +1

(42 ndash 1)

Na qual pKAj eacute o co-logaritmo da constante de equiliacutebrio do grupo ionizaacutevel do

resiacuteduo j j eacute estado carregado potencial do resiacuteduo j (-1 para grupos aacutecidos e +1

para grupos baacutesicos) e j eacute a fraccedilatildeo ionizada para o pH dado Para grupos cujo

estado de ionizaccedilatildeo na dada configuraccedilatildeo seja neutro a sua fraccedilatildeo eacute calculada tal

que a soma de sua fraccedilatildeo e da fraccedilatildeo ionizada tenha como resultado o valor

unitaacuterio

Assim a funccedilatildeo Pn pode ser escrita como o produto de cada fraccedilatildeo de cada grupo

ionizaacutevel j naquele estado (-1 0 ou +1) na configuraccedilatildeo neutra k em uma proteiacutena

com n grupos ionizaacuteveis Uma representaccedilatildeo matemaacutetica possiacutevel para esta funccedilatildeo

pode ser escrita como

휙 (푝퐻) = 훼 (푝퐻)

(42 ndash 2)

Na qual a fraccedilatildeo jrsquo(pH) eacute dada por

20 4 Modelagem Termodinacircmica Proposta

훼 (푝퐻) =훼 (푝퐻) 푠푒 휀 = 11 minus 훼 (푝퐻) 푠푒 휀 = 0

(42 ndash 3)

Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (42 ndash 3) e a resultante na equaccedilatildeo

(42 ndash 2) pode-se escrever que

휙 (푝퐻) =1

1 + 10

1 + 휈2 minus 휈 휀 10

minus휈 minus 1

2 minus 휈 휀 푐표푚 휀 = 0

(42 ndash 4)

A equaccedilatildeo (42 ndash 4) junto agrave equaccedilatildeo (41 ndash 7) constituem o modelo termodinacircmico

capaz de predizer a razatildeo entre as fraccedilotildees de moleacuteculas neutras de uma proteiacutena

em funccedilatildeo do pH na regiatildeo do ponto isoeleacutetrico mantendo fixas temperatura e forccedila

iocircnica Substituindo a equaccedilatildeo (42 ndash 4) na equaccedilatildeo (41 ndash 7) obteacutem-se para a

curva de solubilidade

푠 (푝퐻)푠 (푝퐼) =

1 + 101 + 10

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

푐표푚 휀 = 0

(42 ndash 8)

5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

51 Introduccedilatildeo

Segundo Groumlnwall (1941) na fase liacutequida haacute moleacuteculas de proteiacutenas com muitas

configuraccedilotildees k distintas que possuem carga liacutequida i e tambeacutem haacute certas

configuraccedilotildees que tem carga liacutequida nula e satildeo chamadas configuraccedilotildees neutras

Aleacutem disso estas uacuteltimas satildeo aquelas que determinam o equiliacutebrio de fases jaacute que

elas estatildeo em equiliacutebrio com a fase soacutelida na qual soacute haacute moleacuteculas neutras pelo

princiacutepio da eletroneutralidade Eacute tambeacutem afirmado que dado este equiliacutebrio a

atividade das moleacuteculas neutras natildeo se altera com a variaccedilatildeo do pH e eacute

proporcional agraves atividades de qualquer tipo de configuraccedilatildeo neutra

Neste mesmo trabalho eacute atribuiacuteda a Linderstroslashm-Lang o desenvolvimento de uma

teoria de prediccedilatildeo da solubilidade de proteiacutenas com a variaccedilatildeo do pH na regiatildeo do

ponto isoeleacutetrico Este desenvolvimento apresenta um balanccedilo de cargas de um

modo impliacutecito contudo como atestado por Groumlnwall o escasso conhecimento

sobre as estruturas proteacuteicas impediram agravequele tempo uma formulaccedilatildeo mais

pormenorizada do problema

52 Desenvolvimento teoacuterico

A base desta abordagem descrita por Groumlnwall e atribuiacuteda a Linderstroslashm-Lang

reside na hipoacutetese de que a moleacutecula de proteiacutena de configuraccedilatildeo k e carga nula

participa do seguinte equiliacutebrio com os iacuteons H+ e com sua forma de carga i

22 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

푃 + 푖퐻 푃 lowast

(52 ndash 1)

Note-se que o valor de i pode ser negativo A constante do equiliacutebrio quiacutemico

descrita pela equaccedilatildeo (52 ndash 1) pode ser expressa como

퐾 =푎

lowast

푎 푎

(52 ndash 2)

Sabendo que a atividade da moleacutecula de proteiacutena de configuraccedilatildeo k e carga i eacute dada

pelo produto entre sua concentraccedilatildeo e seu coeficiente de atividade tem-se que

푥lowast

= 푎 푎퐾훾

lowast

(52 ndash 3)

Entretanto a solubilidade da proteiacutena eacute soma das concentraccedilotildees de todas as

moleacuteculas de carga i Poreacutem a concentraccedilatildeo das moleacuteculas de carga i eacute a soma das

concentraccedilotildees das moleacuteculas de configuraccedilatildeo k Assim a solubilidade pode ser

escrita como

푠 (푝퐻) = 푎 푎퐾훾

lowast

(52 ndash 4)

Derivando a equaccedilatildeo (52 ndash 4) com respeito agrave atividade do iacuteon H+ considerando

que atividade da moleacutecula neutra eacute constante para qualquer configuraccedilatildeo k e ainda

que o coeficiente de atividade da proteiacutena de carga i independe da atividade do iacuteon

H+ tem-se que

푑푠푑푎 = 푖 ∙ 푎 푎

퐾훾

lowast

(52 ndash 5)

23 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

Sendo

푑 log 푠 (푝퐻)푑(푝퐻) = minus

푎푠 (푝퐻)

푑푠푑푎

(52 ndash 6)

Substituindo as equaccedilotildees (52 ndash 4) e (52 ndash 5) na equaccedilatildeo (52 ndash 6) e

reescrevendo em termos de pH e das concentraccedilotildees das proteiacutenas de carga i tem-

se que

푑 log 푠푑(푝퐻) = minus

sum (푖 ∙ 푥 )sum 푥

(52 ndash 7)

Contudo o termo do lado direito da equaccedilatildeo (52 ndash 7) estaacute associado ao conceito

de valecircncia meacutedia estabelecido por Linderstroslashm-Lang (1924)

횤 =sum (푖 ∙ 푥 )sum 푥

(52 ndash 8)

Os autores natildeo possuiacuteam um modo mais adequado de construir a curva de

solubilidade dada pela equaccedilatildeo (52 ndash 7) do que aproximar por uma funccedilatildeo linear o

perfil de carga liacutequida da proteiacutena obtido experimentalmente e integraacute-lo valendo-se

da analogia entre o conceito de carga liacutequida (Z) e de valecircncia meacutedia ( i ) Entretanto

hoje jaacute se tem uma descriccedilatildeo analiacutetica do perfil de carga liacutequida de proteiacutenas que

pode ser escrita como

푍(푝퐻) = 휈 훼

(52 ndash 9)

Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (52 ndash 9) e a resultante na equaccedilatildeo

(52 ndash 7) tem-se que

24 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

푑 log 푠푑(푝퐻) = minus

12

11 + 10

1 + 휈 + 휈 1 minus 휈 10

(52 ndash 10)

Integrando a equaccedilatildeo (52 ndash 10) de um ponto de referecircncia por exemplo do ponto

isoeleacutetrico (pI) ateacute um pH qualquer tem-se a seguinte relaccedilatildeo

푑 log 푠

( )

( )

= minus12

1

1 + 101 + 휈 + 휈 1 minus 휈 10 푑(푝퐻)

(52 ndash 11)

log푠 (푝퐻)푠 (푝퐼) = minus

12 1 + 휈

11 + 10

푑(푝퐻)

+ 휈 1 minus 휈10

1 + 10푑(푝퐻)

(52 ndash 12)

Fazendo a seguinte substituiccedilatildeo

푢 = 10 푡푎푙 푞푢푒 푑푢푢 = ln 10푑(푝퐻)

(52 ndash 13)

Tem-se que

log푠 (푝퐻)푠 (푝퐼) = minus

12

1 + 휈ln 10

1푢(1 + 푢) 푑푢 +

휈 1 minus 휈ln 10

1(1 + 푢) 푑푢

(52 ndash 14)

log푠 (푝퐻)푠 (푝퐼) = minus

12

1 + 휈ln 10

1푢 푑푢 minus

11 + 푢 푑푢 +

휈 1 minus 휈ln 10

1(1 + 푢) 푑푢

(52 ndash 15)

25 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐼) = minus

12 1 + 휈 log

1010

minus 휈 1 minus 휈 minus 1 + 휈 log1 + 101 + 10

(52 ndash 16)

Sendo

휈 1 minus 휈 minus 1 + 휈 = 휈 minus 휈 minus 1 minus 휈 = minus 1 + 휈 = minus2

(52 ndash 17)

Resultando em

log푠 (푝퐻)푠 (푝퐼) = log

1 + 101 + 10

minus1 + 휈

2 (푝퐻 minus 푝퐼)

(52 ndash 18)

Ainda eacute possiacutevel reescrever a equaccedilatildeo (52 ndash 18) como

log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log

1 + 101 + 10

(52 ndash 19)

Na qual n+ representa o nuacutemero de resiacuteduos ionizaacuteveis que na sua forma carregada

apresentam carga positiva A equaccedilatildeo (52 ndash 19) eacute uma expressatildeo analiacutetica que a

partir de dados da estrutura proteacuteica e de um dado de solubilidade permite predizer

a curva de solubilidade de uma dada proteiacutena em funccedilatildeo do pH na regiatildeo do ponto

isoeleacutetrico mantendo fixas a temperatura e a forccedila iocircnica do sistema

Eacute possiacutevel provar que as equaccedilotildees (42 ndash 8) e (52 ndash 19) satildeo idecircnticas - a prova

disso eacute descrita na seccedilatildeo 6 ndash e assim tem-se que apesar das distintas abordagens

a descriccedilatildeo do fenocircmeno eacute a mesma Note-se que um passo fundamental no

desenvolvimento da Equaccedilatildeo (52 ndash 5) eacute admitir que por hipoacutetese a atividade da

26 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

forma neutra natildeo depende do pH essa hipoacutetese tambeacutem eacute a base da equaccedilatildeo (41

ndash 7) Deve-se registrar o fato de que pelo melhor do nosso conhecimento esta eacute a

primeira vez que uma expressatildeo analiacutetica para o caacutelculo da solubilidade de

proteiacutenas em funccedilatildeo do pH eacute descrita mesmo no limite em que se considera vaacutelida

a lei de Henry

53 Soluccedilatildeo Paraboacutelica da Curva de Solubilidade

Tanto Groumlnwall (1941) quanto Fredericq e Neurath (1950) adotaram a hipoacutetese de

que os perfis de carga liacutequida da -lactoglobulina para um e da insulina para os

outros dois eram lineares na regiatildeo do ponto isoeleacutetrico Esta hipoacutetese eacute bastante

plausiacutevel e simplificadora principalmente a eacutepoca na qual estes trabalhos foram

desenvolvidos em que a estrutura proteacuteica bem como as constantes de ionizaccedilatildeo

dos resiacuteduos com grupos ionizaacuteveis era pouco conhecida De fato ainda hoje a falta

de dados das constantes de ionizaccedilatildeo na cadeia proteacuteica eacute o maior desafio no uso

do modelo rigoroso ndash equaccedilatildeo (52 ndash 18) Por isso o valor desta hipoacutetese de perfil

de carga liacutequida linear eacute notaacutevel

Supondo entatildeo que o perfil de carga seja linear eacute possiacutevel escrevecirc-lo como

푍(푝퐻) = minus퐴(푝퐻 minus 푝퐼) 푐표푚 퐴 gt 0

(53 ndash 1)

Substituindo (53 ndash 1) em (52 ndash 6)

푑 log 푠 (푝퐻)푑(푝퐻) = 퐴(푝퐻 minus 푝퐼)

(53 ndash 2)

Integrando (53 ndash 2) de um pH0 de referecircncia ateacute pH tem-se que

27 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐻 ) = 퐾[푝퐻 minus 2푝퐼(푝퐻 minus 푝퐻 ) minus 푝퐻 ] 푐표푚 퐾 =

퐴2

(53 ndash 3)

Ao se adotar como ponto de referecircncia o ponto isoeleacutetrico a equaccedilatildeo (53 ndash 3)

reduz-se agrave

log푠 (푝퐻)푠 (푝퐼) = 퐾(푝퐻 minus 푝퐼)

(53 ndash 4)

Contudo apesar da soluccedilatildeo quadraacutetica ou paraboacutelica para a equaccedilatildeo estendida de

Linderstroslashm-lang e Groumlnwall expressa na equaccedilatildeo (53 ndash 3) natildeo requerer os dados

das constantes de ionizaccedilatildeo dos resiacuteduos com grupos ionizaacuteveis ela exige a

definiccedilatildeo do paracircmetro A que fisicamente representa a inclinaccedilatildeo da reta de

aproximaccedilatildeo da curva de carga liacutequida e que pode ser calculado por correlaccedilatildeo a

partir de um conjunto de dados experimentais de solubilidade ou de carga liacutequida

6 Identidade entre o Modelo Proposto e a Equaccedilatildeo

Estendida de Linderstroslashm-Lang e Groumlnwall

A equaccedilatildeo final da modelagem termodinacircmica proposta apresentada na seccedilatildeo 4 eacute a

equaccedilatildeo (42 ndash 8) dada por

푠 (푝퐻)푠 (푝퐼) =

1 + 101 + 10

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 1)

Aplicando-se o logaritmo decimal nos dois termos da equaccedilatildeo (6 ndash 1) tem-se que

log푠 (푝퐻)푠 (푝퐼) = log

1 + 101 + 10

+ log

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 2)

Pelo bem da simplificaccedilatildeo desta deduccedilatildeo adotar-se-atildeo as seguintes funccedilotildees

휂 (푝퐻) = log

(6 ndash 3)

휃 (푝퐻) = log

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 4)

Assim pode-se reescrever a equaccedilatildeo (6 ndash 2) por

29 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐼) = 휂 (푝퐻) + 휃 (푝퐻)

(6 ndash 5)

Observando-se a equaccedilatildeo (6 ndash 5) tem-se que a funccedilatildeo j independe do estado de

ionizaccedilatildeo do resiacuteduo j poreacutem a funccedilatildeo jk depende Por isso deve-se analisar esta

funccedilatildeo para cada estado de ionizaccedilatildeo possiacutevel como mostrado na Tabela 61

Tabela 6 1 ndash Anaacutelise da funccedilatildeo jk para cada estado de ionizaccedilatildeo possiacutevel

j jk jk Quantidade de resiacuteduos neste estado

-1 -1 푝퐼 minus 푝퐻 na

0 0 nb

+1 +1 0 nc

0 푝퐼 minus 푝퐻 nd

Pela anaacutelise da Tabela 61 e considerando uma proteiacutena com n resiacuteduos com

grupos ionizaacuteveis infere-se que a equaccedilatildeo (6 ndash 5) pode ser reescrita como

log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)

(6 ndash 6)

Contudo as equaccedilotildees acima descritas satildeo vaacutelidas apenas para configuraccedilotildees

neutras pois apenas as configuraccedilotildees neutras da fase liacutequida estatildeo em equiliacutebrio

com as moleacuteculas de proteiacutena da fase soacutelida Para que uma configuraccedilatildeo seja

neutra vale a seguinte restriccedilatildeo

휀 = 0 hArr 푛 = 푛

(6 ndash 7)

30 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall

Substituindo a restriccedilatildeo dada pela equaccedilatildeo (6 ndash 7) na equaccedilatildeo (6 ndash 6) tem-se que

log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)

(6 ndash 8)

Ora mas a soma de nc e de nd natildeo resulta em outra coisa senatildeo no nuacutemero de

resiacuteduos com grupos ionizaacuteveis da estrutura proteacuteica cujo j seja +1 Assim

substituindo nc mais nd por n+ e substituindo a equaccedilatildeo (6 ndash 3) na equaccedilatildeo (6 ndash 8)

tem-se que

log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log

1 + 101 + 10

(6 ndash 9)

Ao se analisar a equaccedilatildeo (6 ndash 9) observa-se que ela eacute idecircntica a equaccedilatildeo estendida

de Linderstroslashm-Lang e Groumlnwall apresentada pela equaccedilatildeo (52 ndash 19) Com isso

tem-se que apesar das distintas formulaccedilotildees tanto a modelagem termodinacircmica aqui

proposta quanto a extensatildeo a teoria de Linderstroslashm-Lang e Groumlnwall resultam na

mesma descriccedilatildeo do fenocircmeno Aleacutem disso a equaccedilatildeo final dos modelos eacute

extremamente simples e depende apenas de um ponto de referecircncia e dos dados da

estrutura da moleacutecula de proteiacutena cuja solubilidade se deseja estudar

7 Aplicaccedilatildeo dos Modelos Expostos

Para validar o modelo comparando-o com o caacutelculo feito a partir da teoria de Debye-

Huumlckel o criteacuterio que relaciona os pontos calculados pelo modelo com os pontos

experimentais foi estabelecido a partir da seguinte funccedilatildeo objetivo (FO)

퐹푂 =1푁

푠 minus 푠푠

(7 ndash 1)

Contudo a equaccedilatildeo (7 ndash 1) natildeo eacute a melhor definiccedilatildeo de funccedilatildeo objetivo neste caso

pois a derivada da curva de solubilidade eacute razoavelmente grande nos dois lados do

ponto isoeleacutetrico e isso permite que pequenos desvios na direccedilatildeo horizontal

resultem em um grande aumento no valor da funccedilatildeo objetivo Uma soluccedilatildeo possiacutevel

seria substituir essa funccedilatildeo objetivo por uma funccedilatildeo definida pela soma do quadrado

da distacircncia do ponto experimental agrave curva do modelo principalmente se fosse

necessaacuterio calcular algum paracircmetro do modelo via otimizaccedilatildeo da funccedilatildeo objetivo

estipulada Natildeo sendo este o escopo deste trabalho optou-se pelo uso da FO

definida na equaccedilatildeo (7 ndash 1)

71 Solubilidade da Insulina Suiacutena

As Figuras 711 712 e 713 apresentam os graacuteficos da curva de solubilidade

dada pelos pontos experimentais pelo modelo proposto pela abordagem claacutessica e

tambeacutem a curva obtida pela soluccedilatildeo paraboacutelica da Equaccedilatildeo de Linderstroslashm-Lang e

Groumlnwall em trecircs temperaturas distintas

32 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 711 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 25 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

Figura 712 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 15 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

00

40

80

120

160

200

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

00

50

100

150

200

250

300

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

33 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 713 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 5 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

Os desvios da curva obtida pelo modelo proposto para valores de pH distantes do pI

podem ser explicados por ao menos trecircs importantes motivos dois devidos a

hipoacuteteses do modelo e um devido a fenocircmenos intriacutensecos a proteiacutena Sabendo que

no pI a solubilidade eacute miacutenima para valores de pH distantes do pI pode-se ter

solubilidades suficientemente grandes para que a validade da lei de Henry ndash adotada

na formulaccedilatildeo do modelo - seja questionada pois quanto mais distante do pI maior

a solubilidade e menor a validade da lei de Henry jaacute que haacute um aumento da

concentraccedilatildeo do soluto (proteiacutena) na soluccedilatildeo e tambeacutem ao fato do modelo prever

solubilidade infinita quando a fraccedilatildeo de moleacuteculas eletricamente neutras tende a

zero

limrarr푠 = lim

rarr

Φ(푝퐼)푠 (푝퐼)Φ(푝퐻) = +infin

(711 ndash 1)

00

50

100

150

200

250

300

350

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

34 7 Aplicaccedilatildeo dos Modelos Expostos

Todavia ainda haacute um fator de ordem natural que justifica o desvio apresentado para

valores de pH distantes do pI o desnovelamento da cadeia proteacuteica Este fenocircmeno

pode ocorrer de maneira a expor grupos hidroacutefobos resiacuteduos antes natildeo expostos

acrescentando relaccedilotildees de equiliacutebrio quiacutemico natildeo existentes na regiatildeo do pI

alterando o equiliacutebrio de fases e portanto alterando o valor da solubilidade

A Tabela 711 apresenta os valores obtidos para a funccedilatildeo objetivo definida em (7 ndash

1) tanto para o modelo proposto quanto para a abordagem claacutessica para trecircs

diferentes temperaturas

Tabela 711 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada

abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para insulina

suiacutena

T ordmC Abordagem FO

25 P 01857 C 02535

15 P 01981 C 05056

5 P 03595 C 03064

Observando-se a Tabela 711 vecirc-se que o modelo apresentou melhores resultados

do que o caacutelculo efetuado atraveacutes da abordagem claacutessica no que tange a

minimizaccedilatildeo da funccedilatildeo objetivo exceto para os dados a 5 ordmC

Tambeacutem eacute possiacutevel observar que a funccedilatildeo objetivo sofreu aumento com a

diminuiccedilatildeo da temperatura Isto ocorreu principalmente devido agrave dificuldade de

obter dados experimentais de solubilidade a temperaturas baixas o que aumenta o

desvio experimental fazendo com que se tenha um aumento do valor da funccedilatildeo

objetivo como a definida em (5 ndash 1) Um efeito secundaacuterio que tambeacutem pressiona a

35 7 Aplicaccedilatildeo dos Modelos Expostos

funccedilatildeo objetivo eacute o fato dos dados de pKA terem sido obtidos a uma temperatura

especiacutefica o que tende a acrescentar erro no caacutelculo de solubilidades a temperaturas

diferentes ainda que o pKA natildeo varie de forma ab-rupta com a temperatura

Outra observaccedilatildeo que deve ser registrada eacute o fato da funccedilatildeo objetivo para a

abordagem claacutessica na temperatura de 15 ordmC divergir a um valor tatildeo elevado em

relaccedilatildeo aos demais Isto se deve a um ponto experimental especiacutefico a um pH de

45 a solubilidade da insulina suiacutena obtida experimentalmente eacute 230 x 10-5 mol kg-1

enquanto a calculada pelo modelo proposto eacute 230 x 10-5 mol kg-1 e a calculada pela

abordagem claacutessica eacute 520 x 10-5 mol kg-1 Por conta do desvio deste ponto a funccedilatildeo

objetivo para a abordagem claacutessica nesta temperatura tem um aumento significativo

A Tabela 712 apresenta os valores do paracircmetro K da soluccedilatildeo paraboacutelica obtidos

neste trabalho para a insulina suiacutena comparados ao encontrado na literatura

Tabela 712 ndash Valores do paracircmetro K da soluccedilatildeo paraboacutelica para a insulina suiacutena

Referecircncias T ordmC K Fredericq e Neurath (1950) - 081 Neste trabalho 25 104 Neste trabalho 15 101 Neste trabalho 5 145

Pela Tabela 712 pode-se observar que haacute uma diferenccedila pequena entre os

valores do paracircmetro K obtidos neste trabalho e por Fredericq e Neurath (1950) Por

isso natildeo se pode afirmar a que se deve esta diferenccedila se eacute devido a diferenccedilas entre

procedimentos experimentais ou se eacute devido agrave diferenccedila de meacutetodo de caacutelculo do

paracircmetro Apesar de no experimento realizado por Fredericq e Neurath (1950)

haver a presenccedila do acircnion tiocianato e este acircnion interagir com grupos ionizaacuteveis

da cadeia proteacuteica como observado pelos autores do trabalho tambeacutem estes

36 7 Aplicaccedilatildeo dos Modelos Expostos

proacuteprios autores afirmam que a presenccedila deste acircnion natildeo altera a forma da curva

que eacute basicamente determinada pelo paracircmetro K De qualquer modo eacute interessante

observar a proximidade dos valores encontrados neste trabalho com o obtido por

Fredericq e Neurath (1950) pelo menos no que diz respeito agrave ordem de grandeza do

paracircmetro em questatildeo

72 Solubilidade da Lisozima de clara de ovo de galinha

Um modelo para ser validado necessita correlacionar dados experimentais de modo

satisfatoacuterio ou seja um modelo deve buscar fidelidade ao fenocircmeno fiacutesico

observado Assim na procura de dados de solubilidade de proteiacutenas poucos dados

na regiatildeo do pI foram encontrados Este eacute o caso da lisozima de clara de ovo de

galinha que apesar de ter muitos estudos de solubilidade nenhum deles se

encontra na regiatildeo do pI Surgiu assim a necessidade de se obter estes dados

experimentais para poder validar o modelo proposto A escolha da lisozima de clara

de ovo de galinha se deu em parte pela sua importacircncia mas tambeacutem em parte por

ter os valores de pKA conhecidos

A curva de solubilidade da lisozima de clara de ovo de galinha levantada neste

trabalho estaacute apresentada na Figura 721

37 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em

soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e

dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()

Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento

esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH

isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de

soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se

comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto

isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da

soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos

ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente

neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a

solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e

00

10

20

30

40

50

60

70

80

90

100

95 100 105 110 115 120

Solu

bilid

ade

(mg

mL)

pH

38 7 Aplicaccedilatildeo dos Modelos Expostos

alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado

em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo

Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo

a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo

Por conta de falta de dados a este respeito modelou-se apenas a curva de

solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura

722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de

galinha em funccedilatildeo do pH da soluccedilatildeo

Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)

00

10

20

30

40

50

60

70

80

90

96 99 102 105 108 111 114 117 120

Solu

bilid

ade

(mg

mL)

pH

39 7 Aplicaccedilatildeo dos Modelos Expostos

O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721

Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada

abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima

de clara de ovo de galinha

T ordmC Abordagem FO

25 P 4650 C gt7919a

a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado

Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta

aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a

abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca

de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos

anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao

efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de

clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a

variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A

proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de

cargas pontuais de Debye-Huumlckel

8 Conclusotildees

A modelagem termodinacircmica proposta neste trabalho apresentou expressivos

resultados quando comparada a abordagem claacutessica de Debye-Huumlckel

Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o

modelo aproximou melhor os pontos experimentais do que a referida abordagem

comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima

ao ponto isoeleacutetrico

Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica

para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua

construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo

lugar por sua aplicabilidade

Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis

da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva

em regiotildees distantes do ponto isoeleacutetrico

9 Referecircncias Bibliograacuteficas

BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene

Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects

Biophys J 95 1285-1294 2008

FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and

other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72

2684 - 26911950

GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v

93 p 517-542 1931

GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab

Carlsberg v 24 p 185-200 1941

KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native

and mutant insulins pK perturbation of B13-Glu in aggregated species Arch

Biochem Biophys v 283 p 496-502 1990

KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for

the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng

Chem Res v 35 p 4319-4327 1996

42 9 Referecircncias Bibliograacuteficas

KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen

lysozyme J Biochem v 87 p 1215-1219 1980

LADISCH M R Bioseparations Engineering principles practice and

economics John Wiley amp Sons 2001 pp1 116 ndash 117 133

LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab

Carlsberg v 15 p 1-29 1924

PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da

particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas

2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP

PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the

excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte

solutions Fluid Phase Equilib v 269 p 25ndash35 2008

PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-

contribution model involving phase and chemical equilibrium Ind Eng Chem Res

v 33 p 1341-1347 1994

PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277

1973

PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino

acids Fluid Phase Equilib v 152 p 121-132 1998

43 9 Referecircncias Bibliograacuteficas

PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular

Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999

SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of

equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte

solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009

TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J

R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with

carbon dioxide Biotech Bioeng v103 p 909-919 2009

TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer

free energy Biophys J v 95 p 2601-2609 2008

TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in

water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95

2009

Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na

cadeia proteacuteica

Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo

de ionizaccedilatildeo

퐻퐴 퐴 + 퐻

(A ndash 1)

Assim considerando que a constante de equiliacutebrio

퐾 = 푎

(A ndash 2)

Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que

퐾 =[퐴 ][퐻 ]

[퐻퐴]

(A ndash 3)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que

log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]

(A ndash 4)

Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado

por

minus log[휑] = 푝휑

(A ndash 5)

Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que

45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

푝퐾 = log[퐻퐴][퐴 ] + 푝퐻

(A ndash 6)

Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por

훼 =[퐴 ]

[퐻퐴] + [퐴 ]

(A ndash 7)

Reescrevendo (A ndash 7) tem-se que

훼 =[퐴 ] [퐻퐴frasl ]

1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =

훼1 minus 훼

(A ndash 8)

Substituindo (A ndash 8) em (A ndash 6) tem-se que

푝퐾 = log훼

1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10

(A ndash 9)

Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos

훼 =1

1 + 10

(A ndash 10)

Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio

퐴 + 퐻 퐻퐴

(A ndash 11)

Pode se escrever a constante de equiliacutebrio como

퐾 =[퐻퐴 ]

[퐴][퐻 ]

(A ndash 12)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que

46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

log퐾 = minus log[퐴]

[퐻퐴 ] minus log[퐻 ]

(A -13)

Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por

훼 =[퐻퐴 ]

[퐴] + [퐻퐴 ]

(A ndash 14)

Assim a equaccedilatildeo (A ndash 13) fica

훼1 minus 훼 = 10

(A ndash 15)

Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo

훼 =10

1 + 10

(A ndash 16)

Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos

modelos expostos

Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]

48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]

49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)

50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])

51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]

52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])

53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)

54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2

55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO

19 4 Modelagem Termodinacircmica Proposta

Desta observaccedilatildeo implica-se que basta identificar uma configuraccedilatildeo proteacuteica cuja

soma dos estados ionizados resulte em carga nula para se descrever o equiliacutebrio de

fases em relaccedilatildeo ao pH na regiatildeo do ponto isoeleacutetrico onde esta consideraccedilatildeo eacute

predominante em relaccedilatildeo a outros possiacuteveis fenocircmenos

Contudo eacute necessaacuterio contabilizar a contribuiccedilatildeo de cada grupo ionizaacutevel via

equaccedilatildeo de Henderson-Hasselbach equaccedilatildeo (42 ndash 1)

훼 (푝퐻) =

⎩⎪⎨

⎪⎧ 10

1 + 10 푠푒 휈 = minus1

11 + 10

푠푒 휈 = +1

(42 ndash 1)

Na qual pKAj eacute o co-logaritmo da constante de equiliacutebrio do grupo ionizaacutevel do

resiacuteduo j j eacute estado carregado potencial do resiacuteduo j (-1 para grupos aacutecidos e +1

para grupos baacutesicos) e j eacute a fraccedilatildeo ionizada para o pH dado Para grupos cujo

estado de ionizaccedilatildeo na dada configuraccedilatildeo seja neutro a sua fraccedilatildeo eacute calculada tal

que a soma de sua fraccedilatildeo e da fraccedilatildeo ionizada tenha como resultado o valor

unitaacuterio

Assim a funccedilatildeo Pn pode ser escrita como o produto de cada fraccedilatildeo de cada grupo

ionizaacutevel j naquele estado (-1 0 ou +1) na configuraccedilatildeo neutra k em uma proteiacutena

com n grupos ionizaacuteveis Uma representaccedilatildeo matemaacutetica possiacutevel para esta funccedilatildeo

pode ser escrita como

휙 (푝퐻) = 훼 (푝퐻)

(42 ndash 2)

Na qual a fraccedilatildeo jrsquo(pH) eacute dada por

20 4 Modelagem Termodinacircmica Proposta

훼 (푝퐻) =훼 (푝퐻) 푠푒 휀 = 11 minus 훼 (푝퐻) 푠푒 휀 = 0

(42 ndash 3)

Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (42 ndash 3) e a resultante na equaccedilatildeo

(42 ndash 2) pode-se escrever que

휙 (푝퐻) =1

1 + 10

1 + 휈2 minus 휈 휀 10

minus휈 minus 1

2 minus 휈 휀 푐표푚 휀 = 0

(42 ndash 4)

A equaccedilatildeo (42 ndash 4) junto agrave equaccedilatildeo (41 ndash 7) constituem o modelo termodinacircmico

capaz de predizer a razatildeo entre as fraccedilotildees de moleacuteculas neutras de uma proteiacutena

em funccedilatildeo do pH na regiatildeo do ponto isoeleacutetrico mantendo fixas temperatura e forccedila

iocircnica Substituindo a equaccedilatildeo (42 ndash 4) na equaccedilatildeo (41 ndash 7) obteacutem-se para a

curva de solubilidade

푠 (푝퐻)푠 (푝퐼) =

1 + 101 + 10

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

푐표푚 휀 = 0

(42 ndash 8)

5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

51 Introduccedilatildeo

Segundo Groumlnwall (1941) na fase liacutequida haacute moleacuteculas de proteiacutenas com muitas

configuraccedilotildees k distintas que possuem carga liacutequida i e tambeacutem haacute certas

configuraccedilotildees que tem carga liacutequida nula e satildeo chamadas configuraccedilotildees neutras

Aleacutem disso estas uacuteltimas satildeo aquelas que determinam o equiliacutebrio de fases jaacute que

elas estatildeo em equiliacutebrio com a fase soacutelida na qual soacute haacute moleacuteculas neutras pelo

princiacutepio da eletroneutralidade Eacute tambeacutem afirmado que dado este equiliacutebrio a

atividade das moleacuteculas neutras natildeo se altera com a variaccedilatildeo do pH e eacute

proporcional agraves atividades de qualquer tipo de configuraccedilatildeo neutra

Neste mesmo trabalho eacute atribuiacuteda a Linderstroslashm-Lang o desenvolvimento de uma

teoria de prediccedilatildeo da solubilidade de proteiacutenas com a variaccedilatildeo do pH na regiatildeo do

ponto isoeleacutetrico Este desenvolvimento apresenta um balanccedilo de cargas de um

modo impliacutecito contudo como atestado por Groumlnwall o escasso conhecimento

sobre as estruturas proteacuteicas impediram agravequele tempo uma formulaccedilatildeo mais

pormenorizada do problema

52 Desenvolvimento teoacuterico

A base desta abordagem descrita por Groumlnwall e atribuiacuteda a Linderstroslashm-Lang

reside na hipoacutetese de que a moleacutecula de proteiacutena de configuraccedilatildeo k e carga nula

participa do seguinte equiliacutebrio com os iacuteons H+ e com sua forma de carga i

22 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

푃 + 푖퐻 푃 lowast

(52 ndash 1)

Note-se que o valor de i pode ser negativo A constante do equiliacutebrio quiacutemico

descrita pela equaccedilatildeo (52 ndash 1) pode ser expressa como

퐾 =푎

lowast

푎 푎

(52 ndash 2)

Sabendo que a atividade da moleacutecula de proteiacutena de configuraccedilatildeo k e carga i eacute dada

pelo produto entre sua concentraccedilatildeo e seu coeficiente de atividade tem-se que

푥lowast

= 푎 푎퐾훾

lowast

(52 ndash 3)

Entretanto a solubilidade da proteiacutena eacute soma das concentraccedilotildees de todas as

moleacuteculas de carga i Poreacutem a concentraccedilatildeo das moleacuteculas de carga i eacute a soma das

concentraccedilotildees das moleacuteculas de configuraccedilatildeo k Assim a solubilidade pode ser

escrita como

푠 (푝퐻) = 푎 푎퐾훾

lowast

(52 ndash 4)

Derivando a equaccedilatildeo (52 ndash 4) com respeito agrave atividade do iacuteon H+ considerando

que atividade da moleacutecula neutra eacute constante para qualquer configuraccedilatildeo k e ainda

que o coeficiente de atividade da proteiacutena de carga i independe da atividade do iacuteon

H+ tem-se que

푑푠푑푎 = 푖 ∙ 푎 푎

퐾훾

lowast

(52 ndash 5)

23 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

Sendo

푑 log 푠 (푝퐻)푑(푝퐻) = minus

푎푠 (푝퐻)

푑푠푑푎

(52 ndash 6)

Substituindo as equaccedilotildees (52 ndash 4) e (52 ndash 5) na equaccedilatildeo (52 ndash 6) e

reescrevendo em termos de pH e das concentraccedilotildees das proteiacutenas de carga i tem-

se que

푑 log 푠푑(푝퐻) = minus

sum (푖 ∙ 푥 )sum 푥

(52 ndash 7)

Contudo o termo do lado direito da equaccedilatildeo (52 ndash 7) estaacute associado ao conceito

de valecircncia meacutedia estabelecido por Linderstroslashm-Lang (1924)

횤 =sum (푖 ∙ 푥 )sum 푥

(52 ndash 8)

Os autores natildeo possuiacuteam um modo mais adequado de construir a curva de

solubilidade dada pela equaccedilatildeo (52 ndash 7) do que aproximar por uma funccedilatildeo linear o

perfil de carga liacutequida da proteiacutena obtido experimentalmente e integraacute-lo valendo-se

da analogia entre o conceito de carga liacutequida (Z) e de valecircncia meacutedia ( i ) Entretanto

hoje jaacute se tem uma descriccedilatildeo analiacutetica do perfil de carga liacutequida de proteiacutenas que

pode ser escrita como

푍(푝퐻) = 휈 훼

(52 ndash 9)

Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (52 ndash 9) e a resultante na equaccedilatildeo

(52 ndash 7) tem-se que

24 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

푑 log 푠푑(푝퐻) = minus

12

11 + 10

1 + 휈 + 휈 1 minus 휈 10

(52 ndash 10)

Integrando a equaccedilatildeo (52 ndash 10) de um ponto de referecircncia por exemplo do ponto

isoeleacutetrico (pI) ateacute um pH qualquer tem-se a seguinte relaccedilatildeo

푑 log 푠

( )

( )

= minus12

1

1 + 101 + 휈 + 휈 1 minus 휈 10 푑(푝퐻)

(52 ndash 11)

log푠 (푝퐻)푠 (푝퐼) = minus

12 1 + 휈

11 + 10

푑(푝퐻)

+ 휈 1 minus 휈10

1 + 10푑(푝퐻)

(52 ndash 12)

Fazendo a seguinte substituiccedilatildeo

푢 = 10 푡푎푙 푞푢푒 푑푢푢 = ln 10푑(푝퐻)

(52 ndash 13)

Tem-se que

log푠 (푝퐻)푠 (푝퐼) = minus

12

1 + 휈ln 10

1푢(1 + 푢) 푑푢 +

휈 1 minus 휈ln 10

1(1 + 푢) 푑푢

(52 ndash 14)

log푠 (푝퐻)푠 (푝퐼) = minus

12

1 + 휈ln 10

1푢 푑푢 minus

11 + 푢 푑푢 +

휈 1 minus 휈ln 10

1(1 + 푢) 푑푢

(52 ndash 15)

25 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐼) = minus

12 1 + 휈 log

1010

minus 휈 1 minus 휈 minus 1 + 휈 log1 + 101 + 10

(52 ndash 16)

Sendo

휈 1 minus 휈 minus 1 + 휈 = 휈 minus 휈 minus 1 minus 휈 = minus 1 + 휈 = minus2

(52 ndash 17)

Resultando em

log푠 (푝퐻)푠 (푝퐼) = log

1 + 101 + 10

minus1 + 휈

2 (푝퐻 minus 푝퐼)

(52 ndash 18)

Ainda eacute possiacutevel reescrever a equaccedilatildeo (52 ndash 18) como

log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log

1 + 101 + 10

(52 ndash 19)

Na qual n+ representa o nuacutemero de resiacuteduos ionizaacuteveis que na sua forma carregada

apresentam carga positiva A equaccedilatildeo (52 ndash 19) eacute uma expressatildeo analiacutetica que a

partir de dados da estrutura proteacuteica e de um dado de solubilidade permite predizer

a curva de solubilidade de uma dada proteiacutena em funccedilatildeo do pH na regiatildeo do ponto

isoeleacutetrico mantendo fixas a temperatura e a forccedila iocircnica do sistema

Eacute possiacutevel provar que as equaccedilotildees (42 ndash 8) e (52 ndash 19) satildeo idecircnticas - a prova

disso eacute descrita na seccedilatildeo 6 ndash e assim tem-se que apesar das distintas abordagens

a descriccedilatildeo do fenocircmeno eacute a mesma Note-se que um passo fundamental no

desenvolvimento da Equaccedilatildeo (52 ndash 5) eacute admitir que por hipoacutetese a atividade da

26 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

forma neutra natildeo depende do pH essa hipoacutetese tambeacutem eacute a base da equaccedilatildeo (41

ndash 7) Deve-se registrar o fato de que pelo melhor do nosso conhecimento esta eacute a

primeira vez que uma expressatildeo analiacutetica para o caacutelculo da solubilidade de

proteiacutenas em funccedilatildeo do pH eacute descrita mesmo no limite em que se considera vaacutelida

a lei de Henry

53 Soluccedilatildeo Paraboacutelica da Curva de Solubilidade

Tanto Groumlnwall (1941) quanto Fredericq e Neurath (1950) adotaram a hipoacutetese de

que os perfis de carga liacutequida da -lactoglobulina para um e da insulina para os

outros dois eram lineares na regiatildeo do ponto isoeleacutetrico Esta hipoacutetese eacute bastante

plausiacutevel e simplificadora principalmente a eacutepoca na qual estes trabalhos foram

desenvolvidos em que a estrutura proteacuteica bem como as constantes de ionizaccedilatildeo

dos resiacuteduos com grupos ionizaacuteveis era pouco conhecida De fato ainda hoje a falta

de dados das constantes de ionizaccedilatildeo na cadeia proteacuteica eacute o maior desafio no uso

do modelo rigoroso ndash equaccedilatildeo (52 ndash 18) Por isso o valor desta hipoacutetese de perfil

de carga liacutequida linear eacute notaacutevel

Supondo entatildeo que o perfil de carga seja linear eacute possiacutevel escrevecirc-lo como

푍(푝퐻) = minus퐴(푝퐻 minus 푝퐼) 푐표푚 퐴 gt 0

(53 ndash 1)

Substituindo (53 ndash 1) em (52 ndash 6)

푑 log 푠 (푝퐻)푑(푝퐻) = 퐴(푝퐻 minus 푝퐼)

(53 ndash 2)

Integrando (53 ndash 2) de um pH0 de referecircncia ateacute pH tem-se que

27 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐻 ) = 퐾[푝퐻 minus 2푝퐼(푝퐻 minus 푝퐻 ) minus 푝퐻 ] 푐표푚 퐾 =

퐴2

(53 ndash 3)

Ao se adotar como ponto de referecircncia o ponto isoeleacutetrico a equaccedilatildeo (53 ndash 3)

reduz-se agrave

log푠 (푝퐻)푠 (푝퐼) = 퐾(푝퐻 minus 푝퐼)

(53 ndash 4)

Contudo apesar da soluccedilatildeo quadraacutetica ou paraboacutelica para a equaccedilatildeo estendida de

Linderstroslashm-lang e Groumlnwall expressa na equaccedilatildeo (53 ndash 3) natildeo requerer os dados

das constantes de ionizaccedilatildeo dos resiacuteduos com grupos ionizaacuteveis ela exige a

definiccedilatildeo do paracircmetro A que fisicamente representa a inclinaccedilatildeo da reta de

aproximaccedilatildeo da curva de carga liacutequida e que pode ser calculado por correlaccedilatildeo a

partir de um conjunto de dados experimentais de solubilidade ou de carga liacutequida

6 Identidade entre o Modelo Proposto e a Equaccedilatildeo

Estendida de Linderstroslashm-Lang e Groumlnwall

A equaccedilatildeo final da modelagem termodinacircmica proposta apresentada na seccedilatildeo 4 eacute a

equaccedilatildeo (42 ndash 8) dada por

푠 (푝퐻)푠 (푝퐼) =

1 + 101 + 10

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 1)

Aplicando-se o logaritmo decimal nos dois termos da equaccedilatildeo (6 ndash 1) tem-se que

log푠 (푝퐻)푠 (푝퐼) = log

1 + 101 + 10

+ log

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 2)

Pelo bem da simplificaccedilatildeo desta deduccedilatildeo adotar-se-atildeo as seguintes funccedilotildees

휂 (푝퐻) = log

(6 ndash 3)

휃 (푝퐻) = log

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 4)

Assim pode-se reescrever a equaccedilatildeo (6 ndash 2) por

29 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐼) = 휂 (푝퐻) + 휃 (푝퐻)

(6 ndash 5)

Observando-se a equaccedilatildeo (6 ndash 5) tem-se que a funccedilatildeo j independe do estado de

ionizaccedilatildeo do resiacuteduo j poreacutem a funccedilatildeo jk depende Por isso deve-se analisar esta

funccedilatildeo para cada estado de ionizaccedilatildeo possiacutevel como mostrado na Tabela 61

Tabela 6 1 ndash Anaacutelise da funccedilatildeo jk para cada estado de ionizaccedilatildeo possiacutevel

j jk jk Quantidade de resiacuteduos neste estado

-1 -1 푝퐼 minus 푝퐻 na

0 0 nb

+1 +1 0 nc

0 푝퐼 minus 푝퐻 nd

Pela anaacutelise da Tabela 61 e considerando uma proteiacutena com n resiacuteduos com

grupos ionizaacuteveis infere-se que a equaccedilatildeo (6 ndash 5) pode ser reescrita como

log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)

(6 ndash 6)

Contudo as equaccedilotildees acima descritas satildeo vaacutelidas apenas para configuraccedilotildees

neutras pois apenas as configuraccedilotildees neutras da fase liacutequida estatildeo em equiliacutebrio

com as moleacuteculas de proteiacutena da fase soacutelida Para que uma configuraccedilatildeo seja

neutra vale a seguinte restriccedilatildeo

휀 = 0 hArr 푛 = 푛

(6 ndash 7)

30 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall

Substituindo a restriccedilatildeo dada pela equaccedilatildeo (6 ndash 7) na equaccedilatildeo (6 ndash 6) tem-se que

log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)

(6 ndash 8)

Ora mas a soma de nc e de nd natildeo resulta em outra coisa senatildeo no nuacutemero de

resiacuteduos com grupos ionizaacuteveis da estrutura proteacuteica cujo j seja +1 Assim

substituindo nc mais nd por n+ e substituindo a equaccedilatildeo (6 ndash 3) na equaccedilatildeo (6 ndash 8)

tem-se que

log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log

1 + 101 + 10

(6 ndash 9)

Ao se analisar a equaccedilatildeo (6 ndash 9) observa-se que ela eacute idecircntica a equaccedilatildeo estendida

de Linderstroslashm-Lang e Groumlnwall apresentada pela equaccedilatildeo (52 ndash 19) Com isso

tem-se que apesar das distintas formulaccedilotildees tanto a modelagem termodinacircmica aqui

proposta quanto a extensatildeo a teoria de Linderstroslashm-Lang e Groumlnwall resultam na

mesma descriccedilatildeo do fenocircmeno Aleacutem disso a equaccedilatildeo final dos modelos eacute

extremamente simples e depende apenas de um ponto de referecircncia e dos dados da

estrutura da moleacutecula de proteiacutena cuja solubilidade se deseja estudar

7 Aplicaccedilatildeo dos Modelos Expostos

Para validar o modelo comparando-o com o caacutelculo feito a partir da teoria de Debye-

Huumlckel o criteacuterio que relaciona os pontos calculados pelo modelo com os pontos

experimentais foi estabelecido a partir da seguinte funccedilatildeo objetivo (FO)

퐹푂 =1푁

푠 minus 푠푠

(7 ndash 1)

Contudo a equaccedilatildeo (7 ndash 1) natildeo eacute a melhor definiccedilatildeo de funccedilatildeo objetivo neste caso

pois a derivada da curva de solubilidade eacute razoavelmente grande nos dois lados do

ponto isoeleacutetrico e isso permite que pequenos desvios na direccedilatildeo horizontal

resultem em um grande aumento no valor da funccedilatildeo objetivo Uma soluccedilatildeo possiacutevel

seria substituir essa funccedilatildeo objetivo por uma funccedilatildeo definida pela soma do quadrado

da distacircncia do ponto experimental agrave curva do modelo principalmente se fosse

necessaacuterio calcular algum paracircmetro do modelo via otimizaccedilatildeo da funccedilatildeo objetivo

estipulada Natildeo sendo este o escopo deste trabalho optou-se pelo uso da FO

definida na equaccedilatildeo (7 ndash 1)

71 Solubilidade da Insulina Suiacutena

As Figuras 711 712 e 713 apresentam os graacuteficos da curva de solubilidade

dada pelos pontos experimentais pelo modelo proposto pela abordagem claacutessica e

tambeacutem a curva obtida pela soluccedilatildeo paraboacutelica da Equaccedilatildeo de Linderstroslashm-Lang e

Groumlnwall em trecircs temperaturas distintas

32 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 711 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 25 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

Figura 712 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 15 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

00

40

80

120

160

200

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

00

50

100

150

200

250

300

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

33 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 713 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 5 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

Os desvios da curva obtida pelo modelo proposto para valores de pH distantes do pI

podem ser explicados por ao menos trecircs importantes motivos dois devidos a

hipoacuteteses do modelo e um devido a fenocircmenos intriacutensecos a proteiacutena Sabendo que

no pI a solubilidade eacute miacutenima para valores de pH distantes do pI pode-se ter

solubilidades suficientemente grandes para que a validade da lei de Henry ndash adotada

na formulaccedilatildeo do modelo - seja questionada pois quanto mais distante do pI maior

a solubilidade e menor a validade da lei de Henry jaacute que haacute um aumento da

concentraccedilatildeo do soluto (proteiacutena) na soluccedilatildeo e tambeacutem ao fato do modelo prever

solubilidade infinita quando a fraccedilatildeo de moleacuteculas eletricamente neutras tende a

zero

limrarr푠 = lim

rarr

Φ(푝퐼)푠 (푝퐼)Φ(푝퐻) = +infin

(711 ndash 1)

00

50

100

150

200

250

300

350

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

34 7 Aplicaccedilatildeo dos Modelos Expostos

Todavia ainda haacute um fator de ordem natural que justifica o desvio apresentado para

valores de pH distantes do pI o desnovelamento da cadeia proteacuteica Este fenocircmeno

pode ocorrer de maneira a expor grupos hidroacutefobos resiacuteduos antes natildeo expostos

acrescentando relaccedilotildees de equiliacutebrio quiacutemico natildeo existentes na regiatildeo do pI

alterando o equiliacutebrio de fases e portanto alterando o valor da solubilidade

A Tabela 711 apresenta os valores obtidos para a funccedilatildeo objetivo definida em (7 ndash

1) tanto para o modelo proposto quanto para a abordagem claacutessica para trecircs

diferentes temperaturas

Tabela 711 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada

abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para insulina

suiacutena

T ordmC Abordagem FO

25 P 01857 C 02535

15 P 01981 C 05056

5 P 03595 C 03064

Observando-se a Tabela 711 vecirc-se que o modelo apresentou melhores resultados

do que o caacutelculo efetuado atraveacutes da abordagem claacutessica no que tange a

minimizaccedilatildeo da funccedilatildeo objetivo exceto para os dados a 5 ordmC

Tambeacutem eacute possiacutevel observar que a funccedilatildeo objetivo sofreu aumento com a

diminuiccedilatildeo da temperatura Isto ocorreu principalmente devido agrave dificuldade de

obter dados experimentais de solubilidade a temperaturas baixas o que aumenta o

desvio experimental fazendo com que se tenha um aumento do valor da funccedilatildeo

objetivo como a definida em (5 ndash 1) Um efeito secundaacuterio que tambeacutem pressiona a

35 7 Aplicaccedilatildeo dos Modelos Expostos

funccedilatildeo objetivo eacute o fato dos dados de pKA terem sido obtidos a uma temperatura

especiacutefica o que tende a acrescentar erro no caacutelculo de solubilidades a temperaturas

diferentes ainda que o pKA natildeo varie de forma ab-rupta com a temperatura

Outra observaccedilatildeo que deve ser registrada eacute o fato da funccedilatildeo objetivo para a

abordagem claacutessica na temperatura de 15 ordmC divergir a um valor tatildeo elevado em

relaccedilatildeo aos demais Isto se deve a um ponto experimental especiacutefico a um pH de

45 a solubilidade da insulina suiacutena obtida experimentalmente eacute 230 x 10-5 mol kg-1

enquanto a calculada pelo modelo proposto eacute 230 x 10-5 mol kg-1 e a calculada pela

abordagem claacutessica eacute 520 x 10-5 mol kg-1 Por conta do desvio deste ponto a funccedilatildeo

objetivo para a abordagem claacutessica nesta temperatura tem um aumento significativo

A Tabela 712 apresenta os valores do paracircmetro K da soluccedilatildeo paraboacutelica obtidos

neste trabalho para a insulina suiacutena comparados ao encontrado na literatura

Tabela 712 ndash Valores do paracircmetro K da soluccedilatildeo paraboacutelica para a insulina suiacutena

Referecircncias T ordmC K Fredericq e Neurath (1950) - 081 Neste trabalho 25 104 Neste trabalho 15 101 Neste trabalho 5 145

Pela Tabela 712 pode-se observar que haacute uma diferenccedila pequena entre os

valores do paracircmetro K obtidos neste trabalho e por Fredericq e Neurath (1950) Por

isso natildeo se pode afirmar a que se deve esta diferenccedila se eacute devido a diferenccedilas entre

procedimentos experimentais ou se eacute devido agrave diferenccedila de meacutetodo de caacutelculo do

paracircmetro Apesar de no experimento realizado por Fredericq e Neurath (1950)

haver a presenccedila do acircnion tiocianato e este acircnion interagir com grupos ionizaacuteveis

da cadeia proteacuteica como observado pelos autores do trabalho tambeacutem estes

36 7 Aplicaccedilatildeo dos Modelos Expostos

proacuteprios autores afirmam que a presenccedila deste acircnion natildeo altera a forma da curva

que eacute basicamente determinada pelo paracircmetro K De qualquer modo eacute interessante

observar a proximidade dos valores encontrados neste trabalho com o obtido por

Fredericq e Neurath (1950) pelo menos no que diz respeito agrave ordem de grandeza do

paracircmetro em questatildeo

72 Solubilidade da Lisozima de clara de ovo de galinha

Um modelo para ser validado necessita correlacionar dados experimentais de modo

satisfatoacuterio ou seja um modelo deve buscar fidelidade ao fenocircmeno fiacutesico

observado Assim na procura de dados de solubilidade de proteiacutenas poucos dados

na regiatildeo do pI foram encontrados Este eacute o caso da lisozima de clara de ovo de

galinha que apesar de ter muitos estudos de solubilidade nenhum deles se

encontra na regiatildeo do pI Surgiu assim a necessidade de se obter estes dados

experimentais para poder validar o modelo proposto A escolha da lisozima de clara

de ovo de galinha se deu em parte pela sua importacircncia mas tambeacutem em parte por

ter os valores de pKA conhecidos

A curva de solubilidade da lisozima de clara de ovo de galinha levantada neste

trabalho estaacute apresentada na Figura 721

37 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em

soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e

dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()

Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento

esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH

isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de

soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se

comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto

isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da

soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos

ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente

neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a

solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e

00

10

20

30

40

50

60

70

80

90

100

95 100 105 110 115 120

Solu

bilid

ade

(mg

mL)

pH

38 7 Aplicaccedilatildeo dos Modelos Expostos

alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado

em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo

Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo

a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo

Por conta de falta de dados a este respeito modelou-se apenas a curva de

solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura

722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de

galinha em funccedilatildeo do pH da soluccedilatildeo

Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)

00

10

20

30

40

50

60

70

80

90

96 99 102 105 108 111 114 117 120

Solu

bilid

ade

(mg

mL)

pH

39 7 Aplicaccedilatildeo dos Modelos Expostos

O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721

Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada

abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima

de clara de ovo de galinha

T ordmC Abordagem FO

25 P 4650 C gt7919a

a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado

Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta

aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a

abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca

de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos

anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao

efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de

clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a

variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A

proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de

cargas pontuais de Debye-Huumlckel

8 Conclusotildees

A modelagem termodinacircmica proposta neste trabalho apresentou expressivos

resultados quando comparada a abordagem claacutessica de Debye-Huumlckel

Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o

modelo aproximou melhor os pontos experimentais do que a referida abordagem

comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima

ao ponto isoeleacutetrico

Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica

para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua

construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo

lugar por sua aplicabilidade

Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis

da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva

em regiotildees distantes do ponto isoeleacutetrico

9 Referecircncias Bibliograacuteficas

BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene

Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects

Biophys J 95 1285-1294 2008

FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and

other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72

2684 - 26911950

GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v

93 p 517-542 1931

GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab

Carlsberg v 24 p 185-200 1941

KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native

and mutant insulins pK perturbation of B13-Glu in aggregated species Arch

Biochem Biophys v 283 p 496-502 1990

KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for

the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng

Chem Res v 35 p 4319-4327 1996

42 9 Referecircncias Bibliograacuteficas

KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen

lysozyme J Biochem v 87 p 1215-1219 1980

LADISCH M R Bioseparations Engineering principles practice and

economics John Wiley amp Sons 2001 pp1 116 ndash 117 133

LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab

Carlsberg v 15 p 1-29 1924

PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da

particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas

2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP

PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the

excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte

solutions Fluid Phase Equilib v 269 p 25ndash35 2008

PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-

contribution model involving phase and chemical equilibrium Ind Eng Chem Res

v 33 p 1341-1347 1994

PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277

1973

PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino

acids Fluid Phase Equilib v 152 p 121-132 1998

43 9 Referecircncias Bibliograacuteficas

PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular

Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999

SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of

equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte

solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009

TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J

R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with

carbon dioxide Biotech Bioeng v103 p 909-919 2009

TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer

free energy Biophys J v 95 p 2601-2609 2008

TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in

water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95

2009

Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na

cadeia proteacuteica

Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo

de ionizaccedilatildeo

퐻퐴 퐴 + 퐻

(A ndash 1)

Assim considerando que a constante de equiliacutebrio

퐾 = 푎

(A ndash 2)

Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que

퐾 =[퐴 ][퐻 ]

[퐻퐴]

(A ndash 3)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que

log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]

(A ndash 4)

Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado

por

minus log[휑] = 푝휑

(A ndash 5)

Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que

45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

푝퐾 = log[퐻퐴][퐴 ] + 푝퐻

(A ndash 6)

Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por

훼 =[퐴 ]

[퐻퐴] + [퐴 ]

(A ndash 7)

Reescrevendo (A ndash 7) tem-se que

훼 =[퐴 ] [퐻퐴frasl ]

1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =

훼1 minus 훼

(A ndash 8)

Substituindo (A ndash 8) em (A ndash 6) tem-se que

푝퐾 = log훼

1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10

(A ndash 9)

Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos

훼 =1

1 + 10

(A ndash 10)

Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio

퐴 + 퐻 퐻퐴

(A ndash 11)

Pode se escrever a constante de equiliacutebrio como

퐾 =[퐻퐴 ]

[퐴][퐻 ]

(A ndash 12)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que

46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

log퐾 = minus log[퐴]

[퐻퐴 ] minus log[퐻 ]

(A -13)

Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por

훼 =[퐻퐴 ]

[퐴] + [퐻퐴 ]

(A ndash 14)

Assim a equaccedilatildeo (A ndash 13) fica

훼1 minus 훼 = 10

(A ndash 15)

Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo

훼 =10

1 + 10

(A ndash 16)

Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos

modelos expostos

Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]

48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]

49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)

50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])

51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]

52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])

53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)

54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2

55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO

20 4 Modelagem Termodinacircmica Proposta

훼 (푝퐻) =훼 (푝퐻) 푠푒 휀 = 11 minus 훼 (푝퐻) 푠푒 휀 = 0

(42 ndash 3)

Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (42 ndash 3) e a resultante na equaccedilatildeo

(42 ndash 2) pode-se escrever que

휙 (푝퐻) =1

1 + 10

1 + 휈2 minus 휈 휀 10

minus휈 minus 1

2 minus 휈 휀 푐표푚 휀 = 0

(42 ndash 4)

A equaccedilatildeo (42 ndash 4) junto agrave equaccedilatildeo (41 ndash 7) constituem o modelo termodinacircmico

capaz de predizer a razatildeo entre as fraccedilotildees de moleacuteculas neutras de uma proteiacutena

em funccedilatildeo do pH na regiatildeo do ponto isoeleacutetrico mantendo fixas temperatura e forccedila

iocircnica Substituindo a equaccedilatildeo (42 ndash 4) na equaccedilatildeo (41 ndash 7) obteacutem-se para a

curva de solubilidade

푠 (푝퐻)푠 (푝퐼) =

1 + 101 + 10

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

푐표푚 휀 = 0

(42 ndash 8)

5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

51 Introduccedilatildeo

Segundo Groumlnwall (1941) na fase liacutequida haacute moleacuteculas de proteiacutenas com muitas

configuraccedilotildees k distintas que possuem carga liacutequida i e tambeacutem haacute certas

configuraccedilotildees que tem carga liacutequida nula e satildeo chamadas configuraccedilotildees neutras

Aleacutem disso estas uacuteltimas satildeo aquelas que determinam o equiliacutebrio de fases jaacute que

elas estatildeo em equiliacutebrio com a fase soacutelida na qual soacute haacute moleacuteculas neutras pelo

princiacutepio da eletroneutralidade Eacute tambeacutem afirmado que dado este equiliacutebrio a

atividade das moleacuteculas neutras natildeo se altera com a variaccedilatildeo do pH e eacute

proporcional agraves atividades de qualquer tipo de configuraccedilatildeo neutra

Neste mesmo trabalho eacute atribuiacuteda a Linderstroslashm-Lang o desenvolvimento de uma

teoria de prediccedilatildeo da solubilidade de proteiacutenas com a variaccedilatildeo do pH na regiatildeo do

ponto isoeleacutetrico Este desenvolvimento apresenta um balanccedilo de cargas de um

modo impliacutecito contudo como atestado por Groumlnwall o escasso conhecimento

sobre as estruturas proteacuteicas impediram agravequele tempo uma formulaccedilatildeo mais

pormenorizada do problema

52 Desenvolvimento teoacuterico

A base desta abordagem descrita por Groumlnwall e atribuiacuteda a Linderstroslashm-Lang

reside na hipoacutetese de que a moleacutecula de proteiacutena de configuraccedilatildeo k e carga nula

participa do seguinte equiliacutebrio com os iacuteons H+ e com sua forma de carga i

22 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

푃 + 푖퐻 푃 lowast

(52 ndash 1)

Note-se que o valor de i pode ser negativo A constante do equiliacutebrio quiacutemico

descrita pela equaccedilatildeo (52 ndash 1) pode ser expressa como

퐾 =푎

lowast

푎 푎

(52 ndash 2)

Sabendo que a atividade da moleacutecula de proteiacutena de configuraccedilatildeo k e carga i eacute dada

pelo produto entre sua concentraccedilatildeo e seu coeficiente de atividade tem-se que

푥lowast

= 푎 푎퐾훾

lowast

(52 ndash 3)

Entretanto a solubilidade da proteiacutena eacute soma das concentraccedilotildees de todas as

moleacuteculas de carga i Poreacutem a concentraccedilatildeo das moleacuteculas de carga i eacute a soma das

concentraccedilotildees das moleacuteculas de configuraccedilatildeo k Assim a solubilidade pode ser

escrita como

푠 (푝퐻) = 푎 푎퐾훾

lowast

(52 ndash 4)

Derivando a equaccedilatildeo (52 ndash 4) com respeito agrave atividade do iacuteon H+ considerando

que atividade da moleacutecula neutra eacute constante para qualquer configuraccedilatildeo k e ainda

que o coeficiente de atividade da proteiacutena de carga i independe da atividade do iacuteon

H+ tem-se que

푑푠푑푎 = 푖 ∙ 푎 푎

퐾훾

lowast

(52 ndash 5)

23 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

Sendo

푑 log 푠 (푝퐻)푑(푝퐻) = minus

푎푠 (푝퐻)

푑푠푑푎

(52 ndash 6)

Substituindo as equaccedilotildees (52 ndash 4) e (52 ndash 5) na equaccedilatildeo (52 ndash 6) e

reescrevendo em termos de pH e das concentraccedilotildees das proteiacutenas de carga i tem-

se que

푑 log 푠푑(푝퐻) = minus

sum (푖 ∙ 푥 )sum 푥

(52 ndash 7)

Contudo o termo do lado direito da equaccedilatildeo (52 ndash 7) estaacute associado ao conceito

de valecircncia meacutedia estabelecido por Linderstroslashm-Lang (1924)

횤 =sum (푖 ∙ 푥 )sum 푥

(52 ndash 8)

Os autores natildeo possuiacuteam um modo mais adequado de construir a curva de

solubilidade dada pela equaccedilatildeo (52 ndash 7) do que aproximar por uma funccedilatildeo linear o

perfil de carga liacutequida da proteiacutena obtido experimentalmente e integraacute-lo valendo-se

da analogia entre o conceito de carga liacutequida (Z) e de valecircncia meacutedia ( i ) Entretanto

hoje jaacute se tem uma descriccedilatildeo analiacutetica do perfil de carga liacutequida de proteiacutenas que

pode ser escrita como

푍(푝퐻) = 휈 훼

(52 ndash 9)

Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (52 ndash 9) e a resultante na equaccedilatildeo

(52 ndash 7) tem-se que

24 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

푑 log 푠푑(푝퐻) = minus

12

11 + 10

1 + 휈 + 휈 1 minus 휈 10

(52 ndash 10)

Integrando a equaccedilatildeo (52 ndash 10) de um ponto de referecircncia por exemplo do ponto

isoeleacutetrico (pI) ateacute um pH qualquer tem-se a seguinte relaccedilatildeo

푑 log 푠

( )

( )

= minus12

1

1 + 101 + 휈 + 휈 1 minus 휈 10 푑(푝퐻)

(52 ndash 11)

log푠 (푝퐻)푠 (푝퐼) = minus

12 1 + 휈

11 + 10

푑(푝퐻)

+ 휈 1 minus 휈10

1 + 10푑(푝퐻)

(52 ndash 12)

Fazendo a seguinte substituiccedilatildeo

푢 = 10 푡푎푙 푞푢푒 푑푢푢 = ln 10푑(푝퐻)

(52 ndash 13)

Tem-se que

log푠 (푝퐻)푠 (푝퐼) = minus

12

1 + 휈ln 10

1푢(1 + 푢) 푑푢 +

휈 1 minus 휈ln 10

1(1 + 푢) 푑푢

(52 ndash 14)

log푠 (푝퐻)푠 (푝퐼) = minus

12

1 + 휈ln 10

1푢 푑푢 minus

11 + 푢 푑푢 +

휈 1 minus 휈ln 10

1(1 + 푢) 푑푢

(52 ndash 15)

25 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐼) = minus

12 1 + 휈 log

1010

minus 휈 1 minus 휈 minus 1 + 휈 log1 + 101 + 10

(52 ndash 16)

Sendo

휈 1 minus 휈 minus 1 + 휈 = 휈 minus 휈 minus 1 minus 휈 = minus 1 + 휈 = minus2

(52 ndash 17)

Resultando em

log푠 (푝퐻)푠 (푝퐼) = log

1 + 101 + 10

minus1 + 휈

2 (푝퐻 minus 푝퐼)

(52 ndash 18)

Ainda eacute possiacutevel reescrever a equaccedilatildeo (52 ndash 18) como

log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log

1 + 101 + 10

(52 ndash 19)

Na qual n+ representa o nuacutemero de resiacuteduos ionizaacuteveis que na sua forma carregada

apresentam carga positiva A equaccedilatildeo (52 ndash 19) eacute uma expressatildeo analiacutetica que a

partir de dados da estrutura proteacuteica e de um dado de solubilidade permite predizer

a curva de solubilidade de uma dada proteiacutena em funccedilatildeo do pH na regiatildeo do ponto

isoeleacutetrico mantendo fixas a temperatura e a forccedila iocircnica do sistema

Eacute possiacutevel provar que as equaccedilotildees (42 ndash 8) e (52 ndash 19) satildeo idecircnticas - a prova

disso eacute descrita na seccedilatildeo 6 ndash e assim tem-se que apesar das distintas abordagens

a descriccedilatildeo do fenocircmeno eacute a mesma Note-se que um passo fundamental no

desenvolvimento da Equaccedilatildeo (52 ndash 5) eacute admitir que por hipoacutetese a atividade da

26 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

forma neutra natildeo depende do pH essa hipoacutetese tambeacutem eacute a base da equaccedilatildeo (41

ndash 7) Deve-se registrar o fato de que pelo melhor do nosso conhecimento esta eacute a

primeira vez que uma expressatildeo analiacutetica para o caacutelculo da solubilidade de

proteiacutenas em funccedilatildeo do pH eacute descrita mesmo no limite em que se considera vaacutelida

a lei de Henry

53 Soluccedilatildeo Paraboacutelica da Curva de Solubilidade

Tanto Groumlnwall (1941) quanto Fredericq e Neurath (1950) adotaram a hipoacutetese de

que os perfis de carga liacutequida da -lactoglobulina para um e da insulina para os

outros dois eram lineares na regiatildeo do ponto isoeleacutetrico Esta hipoacutetese eacute bastante

plausiacutevel e simplificadora principalmente a eacutepoca na qual estes trabalhos foram

desenvolvidos em que a estrutura proteacuteica bem como as constantes de ionizaccedilatildeo

dos resiacuteduos com grupos ionizaacuteveis era pouco conhecida De fato ainda hoje a falta

de dados das constantes de ionizaccedilatildeo na cadeia proteacuteica eacute o maior desafio no uso

do modelo rigoroso ndash equaccedilatildeo (52 ndash 18) Por isso o valor desta hipoacutetese de perfil

de carga liacutequida linear eacute notaacutevel

Supondo entatildeo que o perfil de carga seja linear eacute possiacutevel escrevecirc-lo como

푍(푝퐻) = minus퐴(푝퐻 minus 푝퐼) 푐표푚 퐴 gt 0

(53 ndash 1)

Substituindo (53 ndash 1) em (52 ndash 6)

푑 log 푠 (푝퐻)푑(푝퐻) = 퐴(푝퐻 minus 푝퐼)

(53 ndash 2)

Integrando (53 ndash 2) de um pH0 de referecircncia ateacute pH tem-se que

27 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐻 ) = 퐾[푝퐻 minus 2푝퐼(푝퐻 minus 푝퐻 ) minus 푝퐻 ] 푐표푚 퐾 =

퐴2

(53 ndash 3)

Ao se adotar como ponto de referecircncia o ponto isoeleacutetrico a equaccedilatildeo (53 ndash 3)

reduz-se agrave

log푠 (푝퐻)푠 (푝퐼) = 퐾(푝퐻 minus 푝퐼)

(53 ndash 4)

Contudo apesar da soluccedilatildeo quadraacutetica ou paraboacutelica para a equaccedilatildeo estendida de

Linderstroslashm-lang e Groumlnwall expressa na equaccedilatildeo (53 ndash 3) natildeo requerer os dados

das constantes de ionizaccedilatildeo dos resiacuteduos com grupos ionizaacuteveis ela exige a

definiccedilatildeo do paracircmetro A que fisicamente representa a inclinaccedilatildeo da reta de

aproximaccedilatildeo da curva de carga liacutequida e que pode ser calculado por correlaccedilatildeo a

partir de um conjunto de dados experimentais de solubilidade ou de carga liacutequida

6 Identidade entre o Modelo Proposto e a Equaccedilatildeo

Estendida de Linderstroslashm-Lang e Groumlnwall

A equaccedilatildeo final da modelagem termodinacircmica proposta apresentada na seccedilatildeo 4 eacute a

equaccedilatildeo (42 ndash 8) dada por

푠 (푝퐻)푠 (푝퐼) =

1 + 101 + 10

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 1)

Aplicando-se o logaritmo decimal nos dois termos da equaccedilatildeo (6 ndash 1) tem-se que

log푠 (푝퐻)푠 (푝퐼) = log

1 + 101 + 10

+ log

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 2)

Pelo bem da simplificaccedilatildeo desta deduccedilatildeo adotar-se-atildeo as seguintes funccedilotildees

휂 (푝퐻) = log

(6 ndash 3)

휃 (푝퐻) = log

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 4)

Assim pode-se reescrever a equaccedilatildeo (6 ndash 2) por

29 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐼) = 휂 (푝퐻) + 휃 (푝퐻)

(6 ndash 5)

Observando-se a equaccedilatildeo (6 ndash 5) tem-se que a funccedilatildeo j independe do estado de

ionizaccedilatildeo do resiacuteduo j poreacutem a funccedilatildeo jk depende Por isso deve-se analisar esta

funccedilatildeo para cada estado de ionizaccedilatildeo possiacutevel como mostrado na Tabela 61

Tabela 6 1 ndash Anaacutelise da funccedilatildeo jk para cada estado de ionizaccedilatildeo possiacutevel

j jk jk Quantidade de resiacuteduos neste estado

-1 -1 푝퐼 minus 푝퐻 na

0 0 nb

+1 +1 0 nc

0 푝퐼 minus 푝퐻 nd

Pela anaacutelise da Tabela 61 e considerando uma proteiacutena com n resiacuteduos com

grupos ionizaacuteveis infere-se que a equaccedilatildeo (6 ndash 5) pode ser reescrita como

log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)

(6 ndash 6)

Contudo as equaccedilotildees acima descritas satildeo vaacutelidas apenas para configuraccedilotildees

neutras pois apenas as configuraccedilotildees neutras da fase liacutequida estatildeo em equiliacutebrio

com as moleacuteculas de proteiacutena da fase soacutelida Para que uma configuraccedilatildeo seja

neutra vale a seguinte restriccedilatildeo

휀 = 0 hArr 푛 = 푛

(6 ndash 7)

30 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall

Substituindo a restriccedilatildeo dada pela equaccedilatildeo (6 ndash 7) na equaccedilatildeo (6 ndash 6) tem-se que

log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)

(6 ndash 8)

Ora mas a soma de nc e de nd natildeo resulta em outra coisa senatildeo no nuacutemero de

resiacuteduos com grupos ionizaacuteveis da estrutura proteacuteica cujo j seja +1 Assim

substituindo nc mais nd por n+ e substituindo a equaccedilatildeo (6 ndash 3) na equaccedilatildeo (6 ndash 8)

tem-se que

log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log

1 + 101 + 10

(6 ndash 9)

Ao se analisar a equaccedilatildeo (6 ndash 9) observa-se que ela eacute idecircntica a equaccedilatildeo estendida

de Linderstroslashm-Lang e Groumlnwall apresentada pela equaccedilatildeo (52 ndash 19) Com isso

tem-se que apesar das distintas formulaccedilotildees tanto a modelagem termodinacircmica aqui

proposta quanto a extensatildeo a teoria de Linderstroslashm-Lang e Groumlnwall resultam na

mesma descriccedilatildeo do fenocircmeno Aleacutem disso a equaccedilatildeo final dos modelos eacute

extremamente simples e depende apenas de um ponto de referecircncia e dos dados da

estrutura da moleacutecula de proteiacutena cuja solubilidade se deseja estudar

7 Aplicaccedilatildeo dos Modelos Expostos

Para validar o modelo comparando-o com o caacutelculo feito a partir da teoria de Debye-

Huumlckel o criteacuterio que relaciona os pontos calculados pelo modelo com os pontos

experimentais foi estabelecido a partir da seguinte funccedilatildeo objetivo (FO)

퐹푂 =1푁

푠 minus 푠푠

(7 ndash 1)

Contudo a equaccedilatildeo (7 ndash 1) natildeo eacute a melhor definiccedilatildeo de funccedilatildeo objetivo neste caso

pois a derivada da curva de solubilidade eacute razoavelmente grande nos dois lados do

ponto isoeleacutetrico e isso permite que pequenos desvios na direccedilatildeo horizontal

resultem em um grande aumento no valor da funccedilatildeo objetivo Uma soluccedilatildeo possiacutevel

seria substituir essa funccedilatildeo objetivo por uma funccedilatildeo definida pela soma do quadrado

da distacircncia do ponto experimental agrave curva do modelo principalmente se fosse

necessaacuterio calcular algum paracircmetro do modelo via otimizaccedilatildeo da funccedilatildeo objetivo

estipulada Natildeo sendo este o escopo deste trabalho optou-se pelo uso da FO

definida na equaccedilatildeo (7 ndash 1)

71 Solubilidade da Insulina Suiacutena

As Figuras 711 712 e 713 apresentam os graacuteficos da curva de solubilidade

dada pelos pontos experimentais pelo modelo proposto pela abordagem claacutessica e

tambeacutem a curva obtida pela soluccedilatildeo paraboacutelica da Equaccedilatildeo de Linderstroslashm-Lang e

Groumlnwall em trecircs temperaturas distintas

32 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 711 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 25 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

Figura 712 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 15 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

00

40

80

120

160

200

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

00

50

100

150

200

250

300

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

33 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 713 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 5 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

Os desvios da curva obtida pelo modelo proposto para valores de pH distantes do pI

podem ser explicados por ao menos trecircs importantes motivos dois devidos a

hipoacuteteses do modelo e um devido a fenocircmenos intriacutensecos a proteiacutena Sabendo que

no pI a solubilidade eacute miacutenima para valores de pH distantes do pI pode-se ter

solubilidades suficientemente grandes para que a validade da lei de Henry ndash adotada

na formulaccedilatildeo do modelo - seja questionada pois quanto mais distante do pI maior

a solubilidade e menor a validade da lei de Henry jaacute que haacute um aumento da

concentraccedilatildeo do soluto (proteiacutena) na soluccedilatildeo e tambeacutem ao fato do modelo prever

solubilidade infinita quando a fraccedilatildeo de moleacuteculas eletricamente neutras tende a

zero

limrarr푠 = lim

rarr

Φ(푝퐼)푠 (푝퐼)Φ(푝퐻) = +infin

(711 ndash 1)

00

50

100

150

200

250

300

350

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

34 7 Aplicaccedilatildeo dos Modelos Expostos

Todavia ainda haacute um fator de ordem natural que justifica o desvio apresentado para

valores de pH distantes do pI o desnovelamento da cadeia proteacuteica Este fenocircmeno

pode ocorrer de maneira a expor grupos hidroacutefobos resiacuteduos antes natildeo expostos

acrescentando relaccedilotildees de equiliacutebrio quiacutemico natildeo existentes na regiatildeo do pI

alterando o equiliacutebrio de fases e portanto alterando o valor da solubilidade

A Tabela 711 apresenta os valores obtidos para a funccedilatildeo objetivo definida em (7 ndash

1) tanto para o modelo proposto quanto para a abordagem claacutessica para trecircs

diferentes temperaturas

Tabela 711 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada

abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para insulina

suiacutena

T ordmC Abordagem FO

25 P 01857 C 02535

15 P 01981 C 05056

5 P 03595 C 03064

Observando-se a Tabela 711 vecirc-se que o modelo apresentou melhores resultados

do que o caacutelculo efetuado atraveacutes da abordagem claacutessica no que tange a

minimizaccedilatildeo da funccedilatildeo objetivo exceto para os dados a 5 ordmC

Tambeacutem eacute possiacutevel observar que a funccedilatildeo objetivo sofreu aumento com a

diminuiccedilatildeo da temperatura Isto ocorreu principalmente devido agrave dificuldade de

obter dados experimentais de solubilidade a temperaturas baixas o que aumenta o

desvio experimental fazendo com que se tenha um aumento do valor da funccedilatildeo

objetivo como a definida em (5 ndash 1) Um efeito secundaacuterio que tambeacutem pressiona a

35 7 Aplicaccedilatildeo dos Modelos Expostos

funccedilatildeo objetivo eacute o fato dos dados de pKA terem sido obtidos a uma temperatura

especiacutefica o que tende a acrescentar erro no caacutelculo de solubilidades a temperaturas

diferentes ainda que o pKA natildeo varie de forma ab-rupta com a temperatura

Outra observaccedilatildeo que deve ser registrada eacute o fato da funccedilatildeo objetivo para a

abordagem claacutessica na temperatura de 15 ordmC divergir a um valor tatildeo elevado em

relaccedilatildeo aos demais Isto se deve a um ponto experimental especiacutefico a um pH de

45 a solubilidade da insulina suiacutena obtida experimentalmente eacute 230 x 10-5 mol kg-1

enquanto a calculada pelo modelo proposto eacute 230 x 10-5 mol kg-1 e a calculada pela

abordagem claacutessica eacute 520 x 10-5 mol kg-1 Por conta do desvio deste ponto a funccedilatildeo

objetivo para a abordagem claacutessica nesta temperatura tem um aumento significativo

A Tabela 712 apresenta os valores do paracircmetro K da soluccedilatildeo paraboacutelica obtidos

neste trabalho para a insulina suiacutena comparados ao encontrado na literatura

Tabela 712 ndash Valores do paracircmetro K da soluccedilatildeo paraboacutelica para a insulina suiacutena

Referecircncias T ordmC K Fredericq e Neurath (1950) - 081 Neste trabalho 25 104 Neste trabalho 15 101 Neste trabalho 5 145

Pela Tabela 712 pode-se observar que haacute uma diferenccedila pequena entre os

valores do paracircmetro K obtidos neste trabalho e por Fredericq e Neurath (1950) Por

isso natildeo se pode afirmar a que se deve esta diferenccedila se eacute devido a diferenccedilas entre

procedimentos experimentais ou se eacute devido agrave diferenccedila de meacutetodo de caacutelculo do

paracircmetro Apesar de no experimento realizado por Fredericq e Neurath (1950)

haver a presenccedila do acircnion tiocianato e este acircnion interagir com grupos ionizaacuteveis

da cadeia proteacuteica como observado pelos autores do trabalho tambeacutem estes

36 7 Aplicaccedilatildeo dos Modelos Expostos

proacuteprios autores afirmam que a presenccedila deste acircnion natildeo altera a forma da curva

que eacute basicamente determinada pelo paracircmetro K De qualquer modo eacute interessante

observar a proximidade dos valores encontrados neste trabalho com o obtido por

Fredericq e Neurath (1950) pelo menos no que diz respeito agrave ordem de grandeza do

paracircmetro em questatildeo

72 Solubilidade da Lisozima de clara de ovo de galinha

Um modelo para ser validado necessita correlacionar dados experimentais de modo

satisfatoacuterio ou seja um modelo deve buscar fidelidade ao fenocircmeno fiacutesico

observado Assim na procura de dados de solubilidade de proteiacutenas poucos dados

na regiatildeo do pI foram encontrados Este eacute o caso da lisozima de clara de ovo de

galinha que apesar de ter muitos estudos de solubilidade nenhum deles se

encontra na regiatildeo do pI Surgiu assim a necessidade de se obter estes dados

experimentais para poder validar o modelo proposto A escolha da lisozima de clara

de ovo de galinha se deu em parte pela sua importacircncia mas tambeacutem em parte por

ter os valores de pKA conhecidos

A curva de solubilidade da lisozima de clara de ovo de galinha levantada neste

trabalho estaacute apresentada na Figura 721

37 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em

soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e

dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()

Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento

esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH

isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de

soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se

comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto

isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da

soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos

ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente

neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a

solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e

00

10

20

30

40

50

60

70

80

90

100

95 100 105 110 115 120

Solu

bilid

ade

(mg

mL)

pH

38 7 Aplicaccedilatildeo dos Modelos Expostos

alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado

em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo

Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo

a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo

Por conta de falta de dados a este respeito modelou-se apenas a curva de

solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura

722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de

galinha em funccedilatildeo do pH da soluccedilatildeo

Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)

00

10

20

30

40

50

60

70

80

90

96 99 102 105 108 111 114 117 120

Solu

bilid

ade

(mg

mL)

pH

39 7 Aplicaccedilatildeo dos Modelos Expostos

O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721

Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada

abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima

de clara de ovo de galinha

T ordmC Abordagem FO

25 P 4650 C gt7919a

a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado

Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta

aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a

abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca

de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos

anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao

efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de

clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a

variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A

proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de

cargas pontuais de Debye-Huumlckel

8 Conclusotildees

A modelagem termodinacircmica proposta neste trabalho apresentou expressivos

resultados quando comparada a abordagem claacutessica de Debye-Huumlckel

Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o

modelo aproximou melhor os pontos experimentais do que a referida abordagem

comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima

ao ponto isoeleacutetrico

Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica

para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua

construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo

lugar por sua aplicabilidade

Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis

da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva

em regiotildees distantes do ponto isoeleacutetrico

9 Referecircncias Bibliograacuteficas

BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene

Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects

Biophys J 95 1285-1294 2008

FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and

other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72

2684 - 26911950

GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v

93 p 517-542 1931

GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab

Carlsberg v 24 p 185-200 1941

KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native

and mutant insulins pK perturbation of B13-Glu in aggregated species Arch

Biochem Biophys v 283 p 496-502 1990

KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for

the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng

Chem Res v 35 p 4319-4327 1996

42 9 Referecircncias Bibliograacuteficas

KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen

lysozyme J Biochem v 87 p 1215-1219 1980

LADISCH M R Bioseparations Engineering principles practice and

economics John Wiley amp Sons 2001 pp1 116 ndash 117 133

LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab

Carlsberg v 15 p 1-29 1924

PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da

particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas

2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP

PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the

excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte

solutions Fluid Phase Equilib v 269 p 25ndash35 2008

PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-

contribution model involving phase and chemical equilibrium Ind Eng Chem Res

v 33 p 1341-1347 1994

PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277

1973

PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino

acids Fluid Phase Equilib v 152 p 121-132 1998

43 9 Referecircncias Bibliograacuteficas

PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular

Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999

SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of

equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte

solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009

TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J

R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with

carbon dioxide Biotech Bioeng v103 p 909-919 2009

TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer

free energy Biophys J v 95 p 2601-2609 2008

TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in

water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95

2009

Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na

cadeia proteacuteica

Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo

de ionizaccedilatildeo

퐻퐴 퐴 + 퐻

(A ndash 1)

Assim considerando que a constante de equiliacutebrio

퐾 = 푎

(A ndash 2)

Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que

퐾 =[퐴 ][퐻 ]

[퐻퐴]

(A ndash 3)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que

log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]

(A ndash 4)

Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado

por

minus log[휑] = 푝휑

(A ndash 5)

Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que

45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

푝퐾 = log[퐻퐴][퐴 ] + 푝퐻

(A ndash 6)

Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por

훼 =[퐴 ]

[퐻퐴] + [퐴 ]

(A ndash 7)

Reescrevendo (A ndash 7) tem-se que

훼 =[퐴 ] [퐻퐴frasl ]

1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =

훼1 minus 훼

(A ndash 8)

Substituindo (A ndash 8) em (A ndash 6) tem-se que

푝퐾 = log훼

1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10

(A ndash 9)

Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos

훼 =1

1 + 10

(A ndash 10)

Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio

퐴 + 퐻 퐻퐴

(A ndash 11)

Pode se escrever a constante de equiliacutebrio como

퐾 =[퐻퐴 ]

[퐴][퐻 ]

(A ndash 12)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que

46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

log퐾 = minus log[퐴]

[퐻퐴 ] minus log[퐻 ]

(A -13)

Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por

훼 =[퐻퐴 ]

[퐴] + [퐻퐴 ]

(A ndash 14)

Assim a equaccedilatildeo (A ndash 13) fica

훼1 minus 훼 = 10

(A ndash 15)

Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo

훼 =10

1 + 10

(A ndash 16)

Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos

modelos expostos

Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]

48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]

49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)

50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])

51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]

52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])

53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)

54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2

55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO

5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

51 Introduccedilatildeo

Segundo Groumlnwall (1941) na fase liacutequida haacute moleacuteculas de proteiacutenas com muitas

configuraccedilotildees k distintas que possuem carga liacutequida i e tambeacutem haacute certas

configuraccedilotildees que tem carga liacutequida nula e satildeo chamadas configuraccedilotildees neutras

Aleacutem disso estas uacuteltimas satildeo aquelas que determinam o equiliacutebrio de fases jaacute que

elas estatildeo em equiliacutebrio com a fase soacutelida na qual soacute haacute moleacuteculas neutras pelo

princiacutepio da eletroneutralidade Eacute tambeacutem afirmado que dado este equiliacutebrio a

atividade das moleacuteculas neutras natildeo se altera com a variaccedilatildeo do pH e eacute

proporcional agraves atividades de qualquer tipo de configuraccedilatildeo neutra

Neste mesmo trabalho eacute atribuiacuteda a Linderstroslashm-Lang o desenvolvimento de uma

teoria de prediccedilatildeo da solubilidade de proteiacutenas com a variaccedilatildeo do pH na regiatildeo do

ponto isoeleacutetrico Este desenvolvimento apresenta um balanccedilo de cargas de um

modo impliacutecito contudo como atestado por Groumlnwall o escasso conhecimento

sobre as estruturas proteacuteicas impediram agravequele tempo uma formulaccedilatildeo mais

pormenorizada do problema

52 Desenvolvimento teoacuterico

A base desta abordagem descrita por Groumlnwall e atribuiacuteda a Linderstroslashm-Lang

reside na hipoacutetese de que a moleacutecula de proteiacutena de configuraccedilatildeo k e carga nula

participa do seguinte equiliacutebrio com os iacuteons H+ e com sua forma de carga i

22 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

푃 + 푖퐻 푃 lowast

(52 ndash 1)

Note-se que o valor de i pode ser negativo A constante do equiliacutebrio quiacutemico

descrita pela equaccedilatildeo (52 ndash 1) pode ser expressa como

퐾 =푎

lowast

푎 푎

(52 ndash 2)

Sabendo que a atividade da moleacutecula de proteiacutena de configuraccedilatildeo k e carga i eacute dada

pelo produto entre sua concentraccedilatildeo e seu coeficiente de atividade tem-se que

푥lowast

= 푎 푎퐾훾

lowast

(52 ndash 3)

Entretanto a solubilidade da proteiacutena eacute soma das concentraccedilotildees de todas as

moleacuteculas de carga i Poreacutem a concentraccedilatildeo das moleacuteculas de carga i eacute a soma das

concentraccedilotildees das moleacuteculas de configuraccedilatildeo k Assim a solubilidade pode ser

escrita como

푠 (푝퐻) = 푎 푎퐾훾

lowast

(52 ndash 4)

Derivando a equaccedilatildeo (52 ndash 4) com respeito agrave atividade do iacuteon H+ considerando

que atividade da moleacutecula neutra eacute constante para qualquer configuraccedilatildeo k e ainda

que o coeficiente de atividade da proteiacutena de carga i independe da atividade do iacuteon

H+ tem-se que

푑푠푑푎 = 푖 ∙ 푎 푎

퐾훾

lowast

(52 ndash 5)

23 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

Sendo

푑 log 푠 (푝퐻)푑(푝퐻) = minus

푎푠 (푝퐻)

푑푠푑푎

(52 ndash 6)

Substituindo as equaccedilotildees (52 ndash 4) e (52 ndash 5) na equaccedilatildeo (52 ndash 6) e

reescrevendo em termos de pH e das concentraccedilotildees das proteiacutenas de carga i tem-

se que

푑 log 푠푑(푝퐻) = minus

sum (푖 ∙ 푥 )sum 푥

(52 ndash 7)

Contudo o termo do lado direito da equaccedilatildeo (52 ndash 7) estaacute associado ao conceito

de valecircncia meacutedia estabelecido por Linderstroslashm-Lang (1924)

횤 =sum (푖 ∙ 푥 )sum 푥

(52 ndash 8)

Os autores natildeo possuiacuteam um modo mais adequado de construir a curva de

solubilidade dada pela equaccedilatildeo (52 ndash 7) do que aproximar por uma funccedilatildeo linear o

perfil de carga liacutequida da proteiacutena obtido experimentalmente e integraacute-lo valendo-se

da analogia entre o conceito de carga liacutequida (Z) e de valecircncia meacutedia ( i ) Entretanto

hoje jaacute se tem uma descriccedilatildeo analiacutetica do perfil de carga liacutequida de proteiacutenas que

pode ser escrita como

푍(푝퐻) = 휈 훼

(52 ndash 9)

Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (52 ndash 9) e a resultante na equaccedilatildeo

(52 ndash 7) tem-se que

24 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

푑 log 푠푑(푝퐻) = minus

12

11 + 10

1 + 휈 + 휈 1 minus 휈 10

(52 ndash 10)

Integrando a equaccedilatildeo (52 ndash 10) de um ponto de referecircncia por exemplo do ponto

isoeleacutetrico (pI) ateacute um pH qualquer tem-se a seguinte relaccedilatildeo

푑 log 푠

( )

( )

= minus12

1

1 + 101 + 휈 + 휈 1 minus 휈 10 푑(푝퐻)

(52 ndash 11)

log푠 (푝퐻)푠 (푝퐼) = minus

12 1 + 휈

11 + 10

푑(푝퐻)

+ 휈 1 minus 휈10

1 + 10푑(푝퐻)

(52 ndash 12)

Fazendo a seguinte substituiccedilatildeo

푢 = 10 푡푎푙 푞푢푒 푑푢푢 = ln 10푑(푝퐻)

(52 ndash 13)

Tem-se que

log푠 (푝퐻)푠 (푝퐼) = minus

12

1 + 휈ln 10

1푢(1 + 푢) 푑푢 +

휈 1 minus 휈ln 10

1(1 + 푢) 푑푢

(52 ndash 14)

log푠 (푝퐻)푠 (푝퐼) = minus

12

1 + 휈ln 10

1푢 푑푢 minus

11 + 푢 푑푢 +

휈 1 minus 휈ln 10

1(1 + 푢) 푑푢

(52 ndash 15)

25 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐼) = minus

12 1 + 휈 log

1010

minus 휈 1 minus 휈 minus 1 + 휈 log1 + 101 + 10

(52 ndash 16)

Sendo

휈 1 minus 휈 minus 1 + 휈 = 휈 minus 휈 minus 1 minus 휈 = minus 1 + 휈 = minus2

(52 ndash 17)

Resultando em

log푠 (푝퐻)푠 (푝퐼) = log

1 + 101 + 10

minus1 + 휈

2 (푝퐻 minus 푝퐼)

(52 ndash 18)

Ainda eacute possiacutevel reescrever a equaccedilatildeo (52 ndash 18) como

log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log

1 + 101 + 10

(52 ndash 19)

Na qual n+ representa o nuacutemero de resiacuteduos ionizaacuteveis que na sua forma carregada

apresentam carga positiva A equaccedilatildeo (52 ndash 19) eacute uma expressatildeo analiacutetica que a

partir de dados da estrutura proteacuteica e de um dado de solubilidade permite predizer

a curva de solubilidade de uma dada proteiacutena em funccedilatildeo do pH na regiatildeo do ponto

isoeleacutetrico mantendo fixas a temperatura e a forccedila iocircnica do sistema

Eacute possiacutevel provar que as equaccedilotildees (42 ndash 8) e (52 ndash 19) satildeo idecircnticas - a prova

disso eacute descrita na seccedilatildeo 6 ndash e assim tem-se que apesar das distintas abordagens

a descriccedilatildeo do fenocircmeno eacute a mesma Note-se que um passo fundamental no

desenvolvimento da Equaccedilatildeo (52 ndash 5) eacute admitir que por hipoacutetese a atividade da

26 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

forma neutra natildeo depende do pH essa hipoacutetese tambeacutem eacute a base da equaccedilatildeo (41

ndash 7) Deve-se registrar o fato de que pelo melhor do nosso conhecimento esta eacute a

primeira vez que uma expressatildeo analiacutetica para o caacutelculo da solubilidade de

proteiacutenas em funccedilatildeo do pH eacute descrita mesmo no limite em que se considera vaacutelida

a lei de Henry

53 Soluccedilatildeo Paraboacutelica da Curva de Solubilidade

Tanto Groumlnwall (1941) quanto Fredericq e Neurath (1950) adotaram a hipoacutetese de

que os perfis de carga liacutequida da -lactoglobulina para um e da insulina para os

outros dois eram lineares na regiatildeo do ponto isoeleacutetrico Esta hipoacutetese eacute bastante

plausiacutevel e simplificadora principalmente a eacutepoca na qual estes trabalhos foram

desenvolvidos em que a estrutura proteacuteica bem como as constantes de ionizaccedilatildeo

dos resiacuteduos com grupos ionizaacuteveis era pouco conhecida De fato ainda hoje a falta

de dados das constantes de ionizaccedilatildeo na cadeia proteacuteica eacute o maior desafio no uso

do modelo rigoroso ndash equaccedilatildeo (52 ndash 18) Por isso o valor desta hipoacutetese de perfil

de carga liacutequida linear eacute notaacutevel

Supondo entatildeo que o perfil de carga seja linear eacute possiacutevel escrevecirc-lo como

푍(푝퐻) = minus퐴(푝퐻 minus 푝퐼) 푐표푚 퐴 gt 0

(53 ndash 1)

Substituindo (53 ndash 1) em (52 ndash 6)

푑 log 푠 (푝퐻)푑(푝퐻) = 퐴(푝퐻 minus 푝퐼)

(53 ndash 2)

Integrando (53 ndash 2) de um pH0 de referecircncia ateacute pH tem-se que

27 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐻 ) = 퐾[푝퐻 minus 2푝퐼(푝퐻 minus 푝퐻 ) minus 푝퐻 ] 푐표푚 퐾 =

퐴2

(53 ndash 3)

Ao se adotar como ponto de referecircncia o ponto isoeleacutetrico a equaccedilatildeo (53 ndash 3)

reduz-se agrave

log푠 (푝퐻)푠 (푝퐼) = 퐾(푝퐻 minus 푝퐼)

(53 ndash 4)

Contudo apesar da soluccedilatildeo quadraacutetica ou paraboacutelica para a equaccedilatildeo estendida de

Linderstroslashm-lang e Groumlnwall expressa na equaccedilatildeo (53 ndash 3) natildeo requerer os dados

das constantes de ionizaccedilatildeo dos resiacuteduos com grupos ionizaacuteveis ela exige a

definiccedilatildeo do paracircmetro A que fisicamente representa a inclinaccedilatildeo da reta de

aproximaccedilatildeo da curva de carga liacutequida e que pode ser calculado por correlaccedilatildeo a

partir de um conjunto de dados experimentais de solubilidade ou de carga liacutequida

6 Identidade entre o Modelo Proposto e a Equaccedilatildeo

Estendida de Linderstroslashm-Lang e Groumlnwall

A equaccedilatildeo final da modelagem termodinacircmica proposta apresentada na seccedilatildeo 4 eacute a

equaccedilatildeo (42 ndash 8) dada por

푠 (푝퐻)푠 (푝퐼) =

1 + 101 + 10

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 1)

Aplicando-se o logaritmo decimal nos dois termos da equaccedilatildeo (6 ndash 1) tem-se que

log푠 (푝퐻)푠 (푝퐼) = log

1 + 101 + 10

+ log

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 2)

Pelo bem da simplificaccedilatildeo desta deduccedilatildeo adotar-se-atildeo as seguintes funccedilotildees

휂 (푝퐻) = log

(6 ndash 3)

휃 (푝퐻) = log

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 4)

Assim pode-se reescrever a equaccedilatildeo (6 ndash 2) por

29 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐼) = 휂 (푝퐻) + 휃 (푝퐻)

(6 ndash 5)

Observando-se a equaccedilatildeo (6 ndash 5) tem-se que a funccedilatildeo j independe do estado de

ionizaccedilatildeo do resiacuteduo j poreacutem a funccedilatildeo jk depende Por isso deve-se analisar esta

funccedilatildeo para cada estado de ionizaccedilatildeo possiacutevel como mostrado na Tabela 61

Tabela 6 1 ndash Anaacutelise da funccedilatildeo jk para cada estado de ionizaccedilatildeo possiacutevel

j jk jk Quantidade de resiacuteduos neste estado

-1 -1 푝퐼 minus 푝퐻 na

0 0 nb

+1 +1 0 nc

0 푝퐼 minus 푝퐻 nd

Pela anaacutelise da Tabela 61 e considerando uma proteiacutena com n resiacuteduos com

grupos ionizaacuteveis infere-se que a equaccedilatildeo (6 ndash 5) pode ser reescrita como

log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)

(6 ndash 6)

Contudo as equaccedilotildees acima descritas satildeo vaacutelidas apenas para configuraccedilotildees

neutras pois apenas as configuraccedilotildees neutras da fase liacutequida estatildeo em equiliacutebrio

com as moleacuteculas de proteiacutena da fase soacutelida Para que uma configuraccedilatildeo seja

neutra vale a seguinte restriccedilatildeo

휀 = 0 hArr 푛 = 푛

(6 ndash 7)

30 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall

Substituindo a restriccedilatildeo dada pela equaccedilatildeo (6 ndash 7) na equaccedilatildeo (6 ndash 6) tem-se que

log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)

(6 ndash 8)

Ora mas a soma de nc e de nd natildeo resulta em outra coisa senatildeo no nuacutemero de

resiacuteduos com grupos ionizaacuteveis da estrutura proteacuteica cujo j seja +1 Assim

substituindo nc mais nd por n+ e substituindo a equaccedilatildeo (6 ndash 3) na equaccedilatildeo (6 ndash 8)

tem-se que

log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log

1 + 101 + 10

(6 ndash 9)

Ao se analisar a equaccedilatildeo (6 ndash 9) observa-se que ela eacute idecircntica a equaccedilatildeo estendida

de Linderstroslashm-Lang e Groumlnwall apresentada pela equaccedilatildeo (52 ndash 19) Com isso

tem-se que apesar das distintas formulaccedilotildees tanto a modelagem termodinacircmica aqui

proposta quanto a extensatildeo a teoria de Linderstroslashm-Lang e Groumlnwall resultam na

mesma descriccedilatildeo do fenocircmeno Aleacutem disso a equaccedilatildeo final dos modelos eacute

extremamente simples e depende apenas de um ponto de referecircncia e dos dados da

estrutura da moleacutecula de proteiacutena cuja solubilidade se deseja estudar

7 Aplicaccedilatildeo dos Modelos Expostos

Para validar o modelo comparando-o com o caacutelculo feito a partir da teoria de Debye-

Huumlckel o criteacuterio que relaciona os pontos calculados pelo modelo com os pontos

experimentais foi estabelecido a partir da seguinte funccedilatildeo objetivo (FO)

퐹푂 =1푁

푠 minus 푠푠

(7 ndash 1)

Contudo a equaccedilatildeo (7 ndash 1) natildeo eacute a melhor definiccedilatildeo de funccedilatildeo objetivo neste caso

pois a derivada da curva de solubilidade eacute razoavelmente grande nos dois lados do

ponto isoeleacutetrico e isso permite que pequenos desvios na direccedilatildeo horizontal

resultem em um grande aumento no valor da funccedilatildeo objetivo Uma soluccedilatildeo possiacutevel

seria substituir essa funccedilatildeo objetivo por uma funccedilatildeo definida pela soma do quadrado

da distacircncia do ponto experimental agrave curva do modelo principalmente se fosse

necessaacuterio calcular algum paracircmetro do modelo via otimizaccedilatildeo da funccedilatildeo objetivo

estipulada Natildeo sendo este o escopo deste trabalho optou-se pelo uso da FO

definida na equaccedilatildeo (7 ndash 1)

71 Solubilidade da Insulina Suiacutena

As Figuras 711 712 e 713 apresentam os graacuteficos da curva de solubilidade

dada pelos pontos experimentais pelo modelo proposto pela abordagem claacutessica e

tambeacutem a curva obtida pela soluccedilatildeo paraboacutelica da Equaccedilatildeo de Linderstroslashm-Lang e

Groumlnwall em trecircs temperaturas distintas

32 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 711 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 25 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

Figura 712 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 15 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

00

40

80

120

160

200

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

00

50

100

150

200

250

300

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

33 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 713 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 5 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

Os desvios da curva obtida pelo modelo proposto para valores de pH distantes do pI

podem ser explicados por ao menos trecircs importantes motivos dois devidos a

hipoacuteteses do modelo e um devido a fenocircmenos intriacutensecos a proteiacutena Sabendo que

no pI a solubilidade eacute miacutenima para valores de pH distantes do pI pode-se ter

solubilidades suficientemente grandes para que a validade da lei de Henry ndash adotada

na formulaccedilatildeo do modelo - seja questionada pois quanto mais distante do pI maior

a solubilidade e menor a validade da lei de Henry jaacute que haacute um aumento da

concentraccedilatildeo do soluto (proteiacutena) na soluccedilatildeo e tambeacutem ao fato do modelo prever

solubilidade infinita quando a fraccedilatildeo de moleacuteculas eletricamente neutras tende a

zero

limrarr푠 = lim

rarr

Φ(푝퐼)푠 (푝퐼)Φ(푝퐻) = +infin

(711 ndash 1)

00

50

100

150

200

250

300

350

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

34 7 Aplicaccedilatildeo dos Modelos Expostos

Todavia ainda haacute um fator de ordem natural que justifica o desvio apresentado para

valores de pH distantes do pI o desnovelamento da cadeia proteacuteica Este fenocircmeno

pode ocorrer de maneira a expor grupos hidroacutefobos resiacuteduos antes natildeo expostos

acrescentando relaccedilotildees de equiliacutebrio quiacutemico natildeo existentes na regiatildeo do pI

alterando o equiliacutebrio de fases e portanto alterando o valor da solubilidade

A Tabela 711 apresenta os valores obtidos para a funccedilatildeo objetivo definida em (7 ndash

1) tanto para o modelo proposto quanto para a abordagem claacutessica para trecircs

diferentes temperaturas

Tabela 711 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada

abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para insulina

suiacutena

T ordmC Abordagem FO

25 P 01857 C 02535

15 P 01981 C 05056

5 P 03595 C 03064

Observando-se a Tabela 711 vecirc-se que o modelo apresentou melhores resultados

do que o caacutelculo efetuado atraveacutes da abordagem claacutessica no que tange a

minimizaccedilatildeo da funccedilatildeo objetivo exceto para os dados a 5 ordmC

Tambeacutem eacute possiacutevel observar que a funccedilatildeo objetivo sofreu aumento com a

diminuiccedilatildeo da temperatura Isto ocorreu principalmente devido agrave dificuldade de

obter dados experimentais de solubilidade a temperaturas baixas o que aumenta o

desvio experimental fazendo com que se tenha um aumento do valor da funccedilatildeo

objetivo como a definida em (5 ndash 1) Um efeito secundaacuterio que tambeacutem pressiona a

35 7 Aplicaccedilatildeo dos Modelos Expostos

funccedilatildeo objetivo eacute o fato dos dados de pKA terem sido obtidos a uma temperatura

especiacutefica o que tende a acrescentar erro no caacutelculo de solubilidades a temperaturas

diferentes ainda que o pKA natildeo varie de forma ab-rupta com a temperatura

Outra observaccedilatildeo que deve ser registrada eacute o fato da funccedilatildeo objetivo para a

abordagem claacutessica na temperatura de 15 ordmC divergir a um valor tatildeo elevado em

relaccedilatildeo aos demais Isto se deve a um ponto experimental especiacutefico a um pH de

45 a solubilidade da insulina suiacutena obtida experimentalmente eacute 230 x 10-5 mol kg-1

enquanto a calculada pelo modelo proposto eacute 230 x 10-5 mol kg-1 e a calculada pela

abordagem claacutessica eacute 520 x 10-5 mol kg-1 Por conta do desvio deste ponto a funccedilatildeo

objetivo para a abordagem claacutessica nesta temperatura tem um aumento significativo

A Tabela 712 apresenta os valores do paracircmetro K da soluccedilatildeo paraboacutelica obtidos

neste trabalho para a insulina suiacutena comparados ao encontrado na literatura

Tabela 712 ndash Valores do paracircmetro K da soluccedilatildeo paraboacutelica para a insulina suiacutena

Referecircncias T ordmC K Fredericq e Neurath (1950) - 081 Neste trabalho 25 104 Neste trabalho 15 101 Neste trabalho 5 145

Pela Tabela 712 pode-se observar que haacute uma diferenccedila pequena entre os

valores do paracircmetro K obtidos neste trabalho e por Fredericq e Neurath (1950) Por

isso natildeo se pode afirmar a que se deve esta diferenccedila se eacute devido a diferenccedilas entre

procedimentos experimentais ou se eacute devido agrave diferenccedila de meacutetodo de caacutelculo do

paracircmetro Apesar de no experimento realizado por Fredericq e Neurath (1950)

haver a presenccedila do acircnion tiocianato e este acircnion interagir com grupos ionizaacuteveis

da cadeia proteacuteica como observado pelos autores do trabalho tambeacutem estes

36 7 Aplicaccedilatildeo dos Modelos Expostos

proacuteprios autores afirmam que a presenccedila deste acircnion natildeo altera a forma da curva

que eacute basicamente determinada pelo paracircmetro K De qualquer modo eacute interessante

observar a proximidade dos valores encontrados neste trabalho com o obtido por

Fredericq e Neurath (1950) pelo menos no que diz respeito agrave ordem de grandeza do

paracircmetro em questatildeo

72 Solubilidade da Lisozima de clara de ovo de galinha

Um modelo para ser validado necessita correlacionar dados experimentais de modo

satisfatoacuterio ou seja um modelo deve buscar fidelidade ao fenocircmeno fiacutesico

observado Assim na procura de dados de solubilidade de proteiacutenas poucos dados

na regiatildeo do pI foram encontrados Este eacute o caso da lisozima de clara de ovo de

galinha que apesar de ter muitos estudos de solubilidade nenhum deles se

encontra na regiatildeo do pI Surgiu assim a necessidade de se obter estes dados

experimentais para poder validar o modelo proposto A escolha da lisozima de clara

de ovo de galinha se deu em parte pela sua importacircncia mas tambeacutem em parte por

ter os valores de pKA conhecidos

A curva de solubilidade da lisozima de clara de ovo de galinha levantada neste

trabalho estaacute apresentada na Figura 721

37 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em

soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e

dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()

Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento

esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH

isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de

soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se

comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto

isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da

soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos

ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente

neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a

solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e

00

10

20

30

40

50

60

70

80

90

100

95 100 105 110 115 120

Solu

bilid

ade

(mg

mL)

pH

38 7 Aplicaccedilatildeo dos Modelos Expostos

alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado

em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo

Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo

a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo

Por conta de falta de dados a este respeito modelou-se apenas a curva de

solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura

722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de

galinha em funccedilatildeo do pH da soluccedilatildeo

Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)

00

10

20

30

40

50

60

70

80

90

96 99 102 105 108 111 114 117 120

Solu

bilid

ade

(mg

mL)

pH

39 7 Aplicaccedilatildeo dos Modelos Expostos

O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721

Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada

abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima

de clara de ovo de galinha

T ordmC Abordagem FO

25 P 4650 C gt7919a

a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado

Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta

aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a

abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca

de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos

anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao

efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de

clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a

variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A

proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de

cargas pontuais de Debye-Huumlckel

8 Conclusotildees

A modelagem termodinacircmica proposta neste trabalho apresentou expressivos

resultados quando comparada a abordagem claacutessica de Debye-Huumlckel

Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o

modelo aproximou melhor os pontos experimentais do que a referida abordagem

comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima

ao ponto isoeleacutetrico

Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica

para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua

construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo

lugar por sua aplicabilidade

Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis

da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva

em regiotildees distantes do ponto isoeleacutetrico

9 Referecircncias Bibliograacuteficas

BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene

Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects

Biophys J 95 1285-1294 2008

FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and

other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72

2684 - 26911950

GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v

93 p 517-542 1931

GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab

Carlsberg v 24 p 185-200 1941

KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native

and mutant insulins pK perturbation of B13-Glu in aggregated species Arch

Biochem Biophys v 283 p 496-502 1990

KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for

the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng

Chem Res v 35 p 4319-4327 1996

42 9 Referecircncias Bibliograacuteficas

KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen

lysozyme J Biochem v 87 p 1215-1219 1980

LADISCH M R Bioseparations Engineering principles practice and

economics John Wiley amp Sons 2001 pp1 116 ndash 117 133

LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab

Carlsberg v 15 p 1-29 1924

PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da

particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas

2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP

PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the

excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte

solutions Fluid Phase Equilib v 269 p 25ndash35 2008

PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-

contribution model involving phase and chemical equilibrium Ind Eng Chem Res

v 33 p 1341-1347 1994

PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277

1973

PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino

acids Fluid Phase Equilib v 152 p 121-132 1998

43 9 Referecircncias Bibliograacuteficas

PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular

Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999

SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of

equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte

solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009

TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J

R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with

carbon dioxide Biotech Bioeng v103 p 909-919 2009

TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer

free energy Biophys J v 95 p 2601-2609 2008

TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in

water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95

2009

Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na

cadeia proteacuteica

Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo

de ionizaccedilatildeo

퐻퐴 퐴 + 퐻

(A ndash 1)

Assim considerando que a constante de equiliacutebrio

퐾 = 푎

(A ndash 2)

Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que

퐾 =[퐴 ][퐻 ]

[퐻퐴]

(A ndash 3)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que

log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]

(A ndash 4)

Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado

por

minus log[휑] = 푝휑

(A ndash 5)

Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que

45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

푝퐾 = log[퐻퐴][퐴 ] + 푝퐻

(A ndash 6)

Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por

훼 =[퐴 ]

[퐻퐴] + [퐴 ]

(A ndash 7)

Reescrevendo (A ndash 7) tem-se que

훼 =[퐴 ] [퐻퐴frasl ]

1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =

훼1 minus 훼

(A ndash 8)

Substituindo (A ndash 8) em (A ndash 6) tem-se que

푝퐾 = log훼

1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10

(A ndash 9)

Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos

훼 =1

1 + 10

(A ndash 10)

Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio

퐴 + 퐻 퐻퐴

(A ndash 11)

Pode se escrever a constante de equiliacutebrio como

퐾 =[퐻퐴 ]

[퐴][퐻 ]

(A ndash 12)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que

46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

log퐾 = minus log[퐴]

[퐻퐴 ] minus log[퐻 ]

(A -13)

Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por

훼 =[퐻퐴 ]

[퐴] + [퐻퐴 ]

(A ndash 14)

Assim a equaccedilatildeo (A ndash 13) fica

훼1 minus 훼 = 10

(A ndash 15)

Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo

훼 =10

1 + 10

(A ndash 16)

Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos

modelos expostos

Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]

48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]

49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)

50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])

51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]

52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])

53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)

54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2

55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO

22 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

푃 + 푖퐻 푃 lowast

(52 ndash 1)

Note-se que o valor de i pode ser negativo A constante do equiliacutebrio quiacutemico

descrita pela equaccedilatildeo (52 ndash 1) pode ser expressa como

퐾 =푎

lowast

푎 푎

(52 ndash 2)

Sabendo que a atividade da moleacutecula de proteiacutena de configuraccedilatildeo k e carga i eacute dada

pelo produto entre sua concentraccedilatildeo e seu coeficiente de atividade tem-se que

푥lowast

= 푎 푎퐾훾

lowast

(52 ndash 3)

Entretanto a solubilidade da proteiacutena eacute soma das concentraccedilotildees de todas as

moleacuteculas de carga i Poreacutem a concentraccedilatildeo das moleacuteculas de carga i eacute a soma das

concentraccedilotildees das moleacuteculas de configuraccedilatildeo k Assim a solubilidade pode ser

escrita como

푠 (푝퐻) = 푎 푎퐾훾

lowast

(52 ndash 4)

Derivando a equaccedilatildeo (52 ndash 4) com respeito agrave atividade do iacuteon H+ considerando

que atividade da moleacutecula neutra eacute constante para qualquer configuraccedilatildeo k e ainda

que o coeficiente de atividade da proteiacutena de carga i independe da atividade do iacuteon

H+ tem-se que

푑푠푑푎 = 푖 ∙ 푎 푎

퐾훾

lowast

(52 ndash 5)

23 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

Sendo

푑 log 푠 (푝퐻)푑(푝퐻) = minus

푎푠 (푝퐻)

푑푠푑푎

(52 ndash 6)

Substituindo as equaccedilotildees (52 ndash 4) e (52 ndash 5) na equaccedilatildeo (52 ndash 6) e

reescrevendo em termos de pH e das concentraccedilotildees das proteiacutenas de carga i tem-

se que

푑 log 푠푑(푝퐻) = minus

sum (푖 ∙ 푥 )sum 푥

(52 ndash 7)

Contudo o termo do lado direito da equaccedilatildeo (52 ndash 7) estaacute associado ao conceito

de valecircncia meacutedia estabelecido por Linderstroslashm-Lang (1924)

횤 =sum (푖 ∙ 푥 )sum 푥

(52 ndash 8)

Os autores natildeo possuiacuteam um modo mais adequado de construir a curva de

solubilidade dada pela equaccedilatildeo (52 ndash 7) do que aproximar por uma funccedilatildeo linear o

perfil de carga liacutequida da proteiacutena obtido experimentalmente e integraacute-lo valendo-se

da analogia entre o conceito de carga liacutequida (Z) e de valecircncia meacutedia ( i ) Entretanto

hoje jaacute se tem uma descriccedilatildeo analiacutetica do perfil de carga liacutequida de proteiacutenas que

pode ser escrita como

푍(푝퐻) = 휈 훼

(52 ndash 9)

Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (52 ndash 9) e a resultante na equaccedilatildeo

(52 ndash 7) tem-se que

24 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

푑 log 푠푑(푝퐻) = minus

12

11 + 10

1 + 휈 + 휈 1 minus 휈 10

(52 ndash 10)

Integrando a equaccedilatildeo (52 ndash 10) de um ponto de referecircncia por exemplo do ponto

isoeleacutetrico (pI) ateacute um pH qualquer tem-se a seguinte relaccedilatildeo

푑 log 푠

( )

( )

= minus12

1

1 + 101 + 휈 + 휈 1 minus 휈 10 푑(푝퐻)

(52 ndash 11)

log푠 (푝퐻)푠 (푝퐼) = minus

12 1 + 휈

11 + 10

푑(푝퐻)

+ 휈 1 minus 휈10

1 + 10푑(푝퐻)

(52 ndash 12)

Fazendo a seguinte substituiccedilatildeo

푢 = 10 푡푎푙 푞푢푒 푑푢푢 = ln 10푑(푝퐻)

(52 ndash 13)

Tem-se que

log푠 (푝퐻)푠 (푝퐼) = minus

12

1 + 휈ln 10

1푢(1 + 푢) 푑푢 +

휈 1 minus 휈ln 10

1(1 + 푢) 푑푢

(52 ndash 14)

log푠 (푝퐻)푠 (푝퐼) = minus

12

1 + 휈ln 10

1푢 푑푢 minus

11 + 푢 푑푢 +

휈 1 minus 휈ln 10

1(1 + 푢) 푑푢

(52 ndash 15)

25 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐼) = minus

12 1 + 휈 log

1010

minus 휈 1 minus 휈 minus 1 + 휈 log1 + 101 + 10

(52 ndash 16)

Sendo

휈 1 minus 휈 minus 1 + 휈 = 휈 minus 휈 minus 1 minus 휈 = minus 1 + 휈 = minus2

(52 ndash 17)

Resultando em

log푠 (푝퐻)푠 (푝퐼) = log

1 + 101 + 10

minus1 + 휈

2 (푝퐻 minus 푝퐼)

(52 ndash 18)

Ainda eacute possiacutevel reescrever a equaccedilatildeo (52 ndash 18) como

log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log

1 + 101 + 10

(52 ndash 19)

Na qual n+ representa o nuacutemero de resiacuteduos ionizaacuteveis que na sua forma carregada

apresentam carga positiva A equaccedilatildeo (52 ndash 19) eacute uma expressatildeo analiacutetica que a

partir de dados da estrutura proteacuteica e de um dado de solubilidade permite predizer

a curva de solubilidade de uma dada proteiacutena em funccedilatildeo do pH na regiatildeo do ponto

isoeleacutetrico mantendo fixas a temperatura e a forccedila iocircnica do sistema

Eacute possiacutevel provar que as equaccedilotildees (42 ndash 8) e (52 ndash 19) satildeo idecircnticas - a prova

disso eacute descrita na seccedilatildeo 6 ndash e assim tem-se que apesar das distintas abordagens

a descriccedilatildeo do fenocircmeno eacute a mesma Note-se que um passo fundamental no

desenvolvimento da Equaccedilatildeo (52 ndash 5) eacute admitir que por hipoacutetese a atividade da

26 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

forma neutra natildeo depende do pH essa hipoacutetese tambeacutem eacute a base da equaccedilatildeo (41

ndash 7) Deve-se registrar o fato de que pelo melhor do nosso conhecimento esta eacute a

primeira vez que uma expressatildeo analiacutetica para o caacutelculo da solubilidade de

proteiacutenas em funccedilatildeo do pH eacute descrita mesmo no limite em que se considera vaacutelida

a lei de Henry

53 Soluccedilatildeo Paraboacutelica da Curva de Solubilidade

Tanto Groumlnwall (1941) quanto Fredericq e Neurath (1950) adotaram a hipoacutetese de

que os perfis de carga liacutequida da -lactoglobulina para um e da insulina para os

outros dois eram lineares na regiatildeo do ponto isoeleacutetrico Esta hipoacutetese eacute bastante

plausiacutevel e simplificadora principalmente a eacutepoca na qual estes trabalhos foram

desenvolvidos em que a estrutura proteacuteica bem como as constantes de ionizaccedilatildeo

dos resiacuteduos com grupos ionizaacuteveis era pouco conhecida De fato ainda hoje a falta

de dados das constantes de ionizaccedilatildeo na cadeia proteacuteica eacute o maior desafio no uso

do modelo rigoroso ndash equaccedilatildeo (52 ndash 18) Por isso o valor desta hipoacutetese de perfil

de carga liacutequida linear eacute notaacutevel

Supondo entatildeo que o perfil de carga seja linear eacute possiacutevel escrevecirc-lo como

푍(푝퐻) = minus퐴(푝퐻 minus 푝퐼) 푐표푚 퐴 gt 0

(53 ndash 1)

Substituindo (53 ndash 1) em (52 ndash 6)

푑 log 푠 (푝퐻)푑(푝퐻) = 퐴(푝퐻 minus 푝퐼)

(53 ndash 2)

Integrando (53 ndash 2) de um pH0 de referecircncia ateacute pH tem-se que

27 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐻 ) = 퐾[푝퐻 minus 2푝퐼(푝퐻 minus 푝퐻 ) minus 푝퐻 ] 푐표푚 퐾 =

퐴2

(53 ndash 3)

Ao se adotar como ponto de referecircncia o ponto isoeleacutetrico a equaccedilatildeo (53 ndash 3)

reduz-se agrave

log푠 (푝퐻)푠 (푝퐼) = 퐾(푝퐻 minus 푝퐼)

(53 ndash 4)

Contudo apesar da soluccedilatildeo quadraacutetica ou paraboacutelica para a equaccedilatildeo estendida de

Linderstroslashm-lang e Groumlnwall expressa na equaccedilatildeo (53 ndash 3) natildeo requerer os dados

das constantes de ionizaccedilatildeo dos resiacuteduos com grupos ionizaacuteveis ela exige a

definiccedilatildeo do paracircmetro A que fisicamente representa a inclinaccedilatildeo da reta de

aproximaccedilatildeo da curva de carga liacutequida e que pode ser calculado por correlaccedilatildeo a

partir de um conjunto de dados experimentais de solubilidade ou de carga liacutequida

6 Identidade entre o Modelo Proposto e a Equaccedilatildeo

Estendida de Linderstroslashm-Lang e Groumlnwall

A equaccedilatildeo final da modelagem termodinacircmica proposta apresentada na seccedilatildeo 4 eacute a

equaccedilatildeo (42 ndash 8) dada por

푠 (푝퐻)푠 (푝퐼) =

1 + 101 + 10

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 1)

Aplicando-se o logaritmo decimal nos dois termos da equaccedilatildeo (6 ndash 1) tem-se que

log푠 (푝퐻)푠 (푝퐼) = log

1 + 101 + 10

+ log

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 2)

Pelo bem da simplificaccedilatildeo desta deduccedilatildeo adotar-se-atildeo as seguintes funccedilotildees

휂 (푝퐻) = log

(6 ndash 3)

휃 (푝퐻) = log

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 4)

Assim pode-se reescrever a equaccedilatildeo (6 ndash 2) por

29 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐼) = 휂 (푝퐻) + 휃 (푝퐻)

(6 ndash 5)

Observando-se a equaccedilatildeo (6 ndash 5) tem-se que a funccedilatildeo j independe do estado de

ionizaccedilatildeo do resiacuteduo j poreacutem a funccedilatildeo jk depende Por isso deve-se analisar esta

funccedilatildeo para cada estado de ionizaccedilatildeo possiacutevel como mostrado na Tabela 61

Tabela 6 1 ndash Anaacutelise da funccedilatildeo jk para cada estado de ionizaccedilatildeo possiacutevel

j jk jk Quantidade de resiacuteduos neste estado

-1 -1 푝퐼 minus 푝퐻 na

0 0 nb

+1 +1 0 nc

0 푝퐼 minus 푝퐻 nd

Pela anaacutelise da Tabela 61 e considerando uma proteiacutena com n resiacuteduos com

grupos ionizaacuteveis infere-se que a equaccedilatildeo (6 ndash 5) pode ser reescrita como

log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)

(6 ndash 6)

Contudo as equaccedilotildees acima descritas satildeo vaacutelidas apenas para configuraccedilotildees

neutras pois apenas as configuraccedilotildees neutras da fase liacutequida estatildeo em equiliacutebrio

com as moleacuteculas de proteiacutena da fase soacutelida Para que uma configuraccedilatildeo seja

neutra vale a seguinte restriccedilatildeo

휀 = 0 hArr 푛 = 푛

(6 ndash 7)

30 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall

Substituindo a restriccedilatildeo dada pela equaccedilatildeo (6 ndash 7) na equaccedilatildeo (6 ndash 6) tem-se que

log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)

(6 ndash 8)

Ora mas a soma de nc e de nd natildeo resulta em outra coisa senatildeo no nuacutemero de

resiacuteduos com grupos ionizaacuteveis da estrutura proteacuteica cujo j seja +1 Assim

substituindo nc mais nd por n+ e substituindo a equaccedilatildeo (6 ndash 3) na equaccedilatildeo (6 ndash 8)

tem-se que

log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log

1 + 101 + 10

(6 ndash 9)

Ao se analisar a equaccedilatildeo (6 ndash 9) observa-se que ela eacute idecircntica a equaccedilatildeo estendida

de Linderstroslashm-Lang e Groumlnwall apresentada pela equaccedilatildeo (52 ndash 19) Com isso

tem-se que apesar das distintas formulaccedilotildees tanto a modelagem termodinacircmica aqui

proposta quanto a extensatildeo a teoria de Linderstroslashm-Lang e Groumlnwall resultam na

mesma descriccedilatildeo do fenocircmeno Aleacutem disso a equaccedilatildeo final dos modelos eacute

extremamente simples e depende apenas de um ponto de referecircncia e dos dados da

estrutura da moleacutecula de proteiacutena cuja solubilidade se deseja estudar

7 Aplicaccedilatildeo dos Modelos Expostos

Para validar o modelo comparando-o com o caacutelculo feito a partir da teoria de Debye-

Huumlckel o criteacuterio que relaciona os pontos calculados pelo modelo com os pontos

experimentais foi estabelecido a partir da seguinte funccedilatildeo objetivo (FO)

퐹푂 =1푁

푠 minus 푠푠

(7 ndash 1)

Contudo a equaccedilatildeo (7 ndash 1) natildeo eacute a melhor definiccedilatildeo de funccedilatildeo objetivo neste caso

pois a derivada da curva de solubilidade eacute razoavelmente grande nos dois lados do

ponto isoeleacutetrico e isso permite que pequenos desvios na direccedilatildeo horizontal

resultem em um grande aumento no valor da funccedilatildeo objetivo Uma soluccedilatildeo possiacutevel

seria substituir essa funccedilatildeo objetivo por uma funccedilatildeo definida pela soma do quadrado

da distacircncia do ponto experimental agrave curva do modelo principalmente se fosse

necessaacuterio calcular algum paracircmetro do modelo via otimizaccedilatildeo da funccedilatildeo objetivo

estipulada Natildeo sendo este o escopo deste trabalho optou-se pelo uso da FO

definida na equaccedilatildeo (7 ndash 1)

71 Solubilidade da Insulina Suiacutena

As Figuras 711 712 e 713 apresentam os graacuteficos da curva de solubilidade

dada pelos pontos experimentais pelo modelo proposto pela abordagem claacutessica e

tambeacutem a curva obtida pela soluccedilatildeo paraboacutelica da Equaccedilatildeo de Linderstroslashm-Lang e

Groumlnwall em trecircs temperaturas distintas

32 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 711 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 25 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

Figura 712 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 15 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

00

40

80

120

160

200

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

00

50

100

150

200

250

300

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

33 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 713 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 5 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

Os desvios da curva obtida pelo modelo proposto para valores de pH distantes do pI

podem ser explicados por ao menos trecircs importantes motivos dois devidos a

hipoacuteteses do modelo e um devido a fenocircmenos intriacutensecos a proteiacutena Sabendo que

no pI a solubilidade eacute miacutenima para valores de pH distantes do pI pode-se ter

solubilidades suficientemente grandes para que a validade da lei de Henry ndash adotada

na formulaccedilatildeo do modelo - seja questionada pois quanto mais distante do pI maior

a solubilidade e menor a validade da lei de Henry jaacute que haacute um aumento da

concentraccedilatildeo do soluto (proteiacutena) na soluccedilatildeo e tambeacutem ao fato do modelo prever

solubilidade infinita quando a fraccedilatildeo de moleacuteculas eletricamente neutras tende a

zero

limrarr푠 = lim

rarr

Φ(푝퐼)푠 (푝퐼)Φ(푝퐻) = +infin

(711 ndash 1)

00

50

100

150

200

250

300

350

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

34 7 Aplicaccedilatildeo dos Modelos Expostos

Todavia ainda haacute um fator de ordem natural que justifica o desvio apresentado para

valores de pH distantes do pI o desnovelamento da cadeia proteacuteica Este fenocircmeno

pode ocorrer de maneira a expor grupos hidroacutefobos resiacuteduos antes natildeo expostos

acrescentando relaccedilotildees de equiliacutebrio quiacutemico natildeo existentes na regiatildeo do pI

alterando o equiliacutebrio de fases e portanto alterando o valor da solubilidade

A Tabela 711 apresenta os valores obtidos para a funccedilatildeo objetivo definida em (7 ndash

1) tanto para o modelo proposto quanto para a abordagem claacutessica para trecircs

diferentes temperaturas

Tabela 711 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada

abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para insulina

suiacutena

T ordmC Abordagem FO

25 P 01857 C 02535

15 P 01981 C 05056

5 P 03595 C 03064

Observando-se a Tabela 711 vecirc-se que o modelo apresentou melhores resultados

do que o caacutelculo efetuado atraveacutes da abordagem claacutessica no que tange a

minimizaccedilatildeo da funccedilatildeo objetivo exceto para os dados a 5 ordmC

Tambeacutem eacute possiacutevel observar que a funccedilatildeo objetivo sofreu aumento com a

diminuiccedilatildeo da temperatura Isto ocorreu principalmente devido agrave dificuldade de

obter dados experimentais de solubilidade a temperaturas baixas o que aumenta o

desvio experimental fazendo com que se tenha um aumento do valor da funccedilatildeo

objetivo como a definida em (5 ndash 1) Um efeito secundaacuterio que tambeacutem pressiona a

35 7 Aplicaccedilatildeo dos Modelos Expostos

funccedilatildeo objetivo eacute o fato dos dados de pKA terem sido obtidos a uma temperatura

especiacutefica o que tende a acrescentar erro no caacutelculo de solubilidades a temperaturas

diferentes ainda que o pKA natildeo varie de forma ab-rupta com a temperatura

Outra observaccedilatildeo que deve ser registrada eacute o fato da funccedilatildeo objetivo para a

abordagem claacutessica na temperatura de 15 ordmC divergir a um valor tatildeo elevado em

relaccedilatildeo aos demais Isto se deve a um ponto experimental especiacutefico a um pH de

45 a solubilidade da insulina suiacutena obtida experimentalmente eacute 230 x 10-5 mol kg-1

enquanto a calculada pelo modelo proposto eacute 230 x 10-5 mol kg-1 e a calculada pela

abordagem claacutessica eacute 520 x 10-5 mol kg-1 Por conta do desvio deste ponto a funccedilatildeo

objetivo para a abordagem claacutessica nesta temperatura tem um aumento significativo

A Tabela 712 apresenta os valores do paracircmetro K da soluccedilatildeo paraboacutelica obtidos

neste trabalho para a insulina suiacutena comparados ao encontrado na literatura

Tabela 712 ndash Valores do paracircmetro K da soluccedilatildeo paraboacutelica para a insulina suiacutena

Referecircncias T ordmC K Fredericq e Neurath (1950) - 081 Neste trabalho 25 104 Neste trabalho 15 101 Neste trabalho 5 145

Pela Tabela 712 pode-se observar que haacute uma diferenccedila pequena entre os

valores do paracircmetro K obtidos neste trabalho e por Fredericq e Neurath (1950) Por

isso natildeo se pode afirmar a que se deve esta diferenccedila se eacute devido a diferenccedilas entre

procedimentos experimentais ou se eacute devido agrave diferenccedila de meacutetodo de caacutelculo do

paracircmetro Apesar de no experimento realizado por Fredericq e Neurath (1950)

haver a presenccedila do acircnion tiocianato e este acircnion interagir com grupos ionizaacuteveis

da cadeia proteacuteica como observado pelos autores do trabalho tambeacutem estes

36 7 Aplicaccedilatildeo dos Modelos Expostos

proacuteprios autores afirmam que a presenccedila deste acircnion natildeo altera a forma da curva

que eacute basicamente determinada pelo paracircmetro K De qualquer modo eacute interessante

observar a proximidade dos valores encontrados neste trabalho com o obtido por

Fredericq e Neurath (1950) pelo menos no que diz respeito agrave ordem de grandeza do

paracircmetro em questatildeo

72 Solubilidade da Lisozima de clara de ovo de galinha

Um modelo para ser validado necessita correlacionar dados experimentais de modo

satisfatoacuterio ou seja um modelo deve buscar fidelidade ao fenocircmeno fiacutesico

observado Assim na procura de dados de solubilidade de proteiacutenas poucos dados

na regiatildeo do pI foram encontrados Este eacute o caso da lisozima de clara de ovo de

galinha que apesar de ter muitos estudos de solubilidade nenhum deles se

encontra na regiatildeo do pI Surgiu assim a necessidade de se obter estes dados

experimentais para poder validar o modelo proposto A escolha da lisozima de clara

de ovo de galinha se deu em parte pela sua importacircncia mas tambeacutem em parte por

ter os valores de pKA conhecidos

A curva de solubilidade da lisozima de clara de ovo de galinha levantada neste

trabalho estaacute apresentada na Figura 721

37 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em

soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e

dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()

Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento

esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH

isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de

soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se

comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto

isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da

soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos

ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente

neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a

solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e

00

10

20

30

40

50

60

70

80

90

100

95 100 105 110 115 120

Solu

bilid

ade

(mg

mL)

pH

38 7 Aplicaccedilatildeo dos Modelos Expostos

alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado

em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo

Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo

a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo

Por conta de falta de dados a este respeito modelou-se apenas a curva de

solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura

722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de

galinha em funccedilatildeo do pH da soluccedilatildeo

Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)

00

10

20

30

40

50

60

70

80

90

96 99 102 105 108 111 114 117 120

Solu

bilid

ade

(mg

mL)

pH

39 7 Aplicaccedilatildeo dos Modelos Expostos

O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721

Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada

abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima

de clara de ovo de galinha

T ordmC Abordagem FO

25 P 4650 C gt7919a

a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado

Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta

aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a

abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca

de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos

anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao

efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de

clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a

variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A

proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de

cargas pontuais de Debye-Huumlckel

8 Conclusotildees

A modelagem termodinacircmica proposta neste trabalho apresentou expressivos

resultados quando comparada a abordagem claacutessica de Debye-Huumlckel

Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o

modelo aproximou melhor os pontos experimentais do que a referida abordagem

comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima

ao ponto isoeleacutetrico

Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica

para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua

construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo

lugar por sua aplicabilidade

Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis

da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva

em regiotildees distantes do ponto isoeleacutetrico

9 Referecircncias Bibliograacuteficas

BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene

Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects

Biophys J 95 1285-1294 2008

FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and

other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72

2684 - 26911950

GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v

93 p 517-542 1931

GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab

Carlsberg v 24 p 185-200 1941

KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native

and mutant insulins pK perturbation of B13-Glu in aggregated species Arch

Biochem Biophys v 283 p 496-502 1990

KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for

the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng

Chem Res v 35 p 4319-4327 1996

42 9 Referecircncias Bibliograacuteficas

KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen

lysozyme J Biochem v 87 p 1215-1219 1980

LADISCH M R Bioseparations Engineering principles practice and

economics John Wiley amp Sons 2001 pp1 116 ndash 117 133

LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab

Carlsberg v 15 p 1-29 1924

PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da

particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas

2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP

PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the

excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte

solutions Fluid Phase Equilib v 269 p 25ndash35 2008

PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-

contribution model involving phase and chemical equilibrium Ind Eng Chem Res

v 33 p 1341-1347 1994

PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277

1973

PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino

acids Fluid Phase Equilib v 152 p 121-132 1998

43 9 Referecircncias Bibliograacuteficas

PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular

Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999

SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of

equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte

solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009

TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J

R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with

carbon dioxide Biotech Bioeng v103 p 909-919 2009

TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer

free energy Biophys J v 95 p 2601-2609 2008

TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in

water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95

2009

Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na

cadeia proteacuteica

Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo

de ionizaccedilatildeo

퐻퐴 퐴 + 퐻

(A ndash 1)

Assim considerando que a constante de equiliacutebrio

퐾 = 푎

(A ndash 2)

Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que

퐾 =[퐴 ][퐻 ]

[퐻퐴]

(A ndash 3)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que

log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]

(A ndash 4)

Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado

por

minus log[휑] = 푝휑

(A ndash 5)

Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que

45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

푝퐾 = log[퐻퐴][퐴 ] + 푝퐻

(A ndash 6)

Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por

훼 =[퐴 ]

[퐻퐴] + [퐴 ]

(A ndash 7)

Reescrevendo (A ndash 7) tem-se que

훼 =[퐴 ] [퐻퐴frasl ]

1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =

훼1 minus 훼

(A ndash 8)

Substituindo (A ndash 8) em (A ndash 6) tem-se que

푝퐾 = log훼

1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10

(A ndash 9)

Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos

훼 =1

1 + 10

(A ndash 10)

Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio

퐴 + 퐻 퐻퐴

(A ndash 11)

Pode se escrever a constante de equiliacutebrio como

퐾 =[퐻퐴 ]

[퐴][퐻 ]

(A ndash 12)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que

46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

log퐾 = minus log[퐴]

[퐻퐴 ] minus log[퐻 ]

(A -13)

Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por

훼 =[퐻퐴 ]

[퐴] + [퐻퐴 ]

(A ndash 14)

Assim a equaccedilatildeo (A ndash 13) fica

훼1 minus 훼 = 10

(A ndash 15)

Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo

훼 =10

1 + 10

(A ndash 16)

Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos

modelos expostos

Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]

48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]

49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)

50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])

51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]

52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])

53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)

54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2

55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO

23 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

Sendo

푑 log 푠 (푝퐻)푑(푝퐻) = minus

푎푠 (푝퐻)

푑푠푑푎

(52 ndash 6)

Substituindo as equaccedilotildees (52 ndash 4) e (52 ndash 5) na equaccedilatildeo (52 ndash 6) e

reescrevendo em termos de pH e das concentraccedilotildees das proteiacutenas de carga i tem-

se que

푑 log 푠푑(푝퐻) = minus

sum (푖 ∙ 푥 )sum 푥

(52 ndash 7)

Contudo o termo do lado direito da equaccedilatildeo (52 ndash 7) estaacute associado ao conceito

de valecircncia meacutedia estabelecido por Linderstroslashm-Lang (1924)

횤 =sum (푖 ∙ 푥 )sum 푥

(52 ndash 8)

Os autores natildeo possuiacuteam um modo mais adequado de construir a curva de

solubilidade dada pela equaccedilatildeo (52 ndash 7) do que aproximar por uma funccedilatildeo linear o

perfil de carga liacutequida da proteiacutena obtido experimentalmente e integraacute-lo valendo-se

da analogia entre o conceito de carga liacutequida (Z) e de valecircncia meacutedia ( i ) Entretanto

hoje jaacute se tem uma descriccedilatildeo analiacutetica do perfil de carga liacutequida de proteiacutenas que

pode ser escrita como

푍(푝퐻) = 휈 훼

(52 ndash 9)

Substituindo a equaccedilatildeo (42 ndash 1) na equaccedilatildeo (52 ndash 9) e a resultante na equaccedilatildeo

(52 ndash 7) tem-se que

24 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

푑 log 푠푑(푝퐻) = minus

12

11 + 10

1 + 휈 + 휈 1 minus 휈 10

(52 ndash 10)

Integrando a equaccedilatildeo (52 ndash 10) de um ponto de referecircncia por exemplo do ponto

isoeleacutetrico (pI) ateacute um pH qualquer tem-se a seguinte relaccedilatildeo

푑 log 푠

( )

( )

= minus12

1

1 + 101 + 휈 + 휈 1 minus 휈 10 푑(푝퐻)

(52 ndash 11)

log푠 (푝퐻)푠 (푝퐼) = minus

12 1 + 휈

11 + 10

푑(푝퐻)

+ 휈 1 minus 휈10

1 + 10푑(푝퐻)

(52 ndash 12)

Fazendo a seguinte substituiccedilatildeo

푢 = 10 푡푎푙 푞푢푒 푑푢푢 = ln 10푑(푝퐻)

(52 ndash 13)

Tem-se que

log푠 (푝퐻)푠 (푝퐼) = minus

12

1 + 휈ln 10

1푢(1 + 푢) 푑푢 +

휈 1 minus 휈ln 10

1(1 + 푢) 푑푢

(52 ndash 14)

log푠 (푝퐻)푠 (푝퐼) = minus

12

1 + 휈ln 10

1푢 푑푢 minus

11 + 푢 푑푢 +

휈 1 minus 휈ln 10

1(1 + 푢) 푑푢

(52 ndash 15)

25 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐼) = minus

12 1 + 휈 log

1010

minus 휈 1 minus 휈 minus 1 + 휈 log1 + 101 + 10

(52 ndash 16)

Sendo

휈 1 minus 휈 minus 1 + 휈 = 휈 minus 휈 minus 1 minus 휈 = minus 1 + 휈 = minus2

(52 ndash 17)

Resultando em

log푠 (푝퐻)푠 (푝퐼) = log

1 + 101 + 10

minus1 + 휈

2 (푝퐻 minus 푝퐼)

(52 ndash 18)

Ainda eacute possiacutevel reescrever a equaccedilatildeo (52 ndash 18) como

log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log

1 + 101 + 10

(52 ndash 19)

Na qual n+ representa o nuacutemero de resiacuteduos ionizaacuteveis que na sua forma carregada

apresentam carga positiva A equaccedilatildeo (52 ndash 19) eacute uma expressatildeo analiacutetica que a

partir de dados da estrutura proteacuteica e de um dado de solubilidade permite predizer

a curva de solubilidade de uma dada proteiacutena em funccedilatildeo do pH na regiatildeo do ponto

isoeleacutetrico mantendo fixas a temperatura e a forccedila iocircnica do sistema

Eacute possiacutevel provar que as equaccedilotildees (42 ndash 8) e (52 ndash 19) satildeo idecircnticas - a prova

disso eacute descrita na seccedilatildeo 6 ndash e assim tem-se que apesar das distintas abordagens

a descriccedilatildeo do fenocircmeno eacute a mesma Note-se que um passo fundamental no

desenvolvimento da Equaccedilatildeo (52 ndash 5) eacute admitir que por hipoacutetese a atividade da

26 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

forma neutra natildeo depende do pH essa hipoacutetese tambeacutem eacute a base da equaccedilatildeo (41

ndash 7) Deve-se registrar o fato de que pelo melhor do nosso conhecimento esta eacute a

primeira vez que uma expressatildeo analiacutetica para o caacutelculo da solubilidade de

proteiacutenas em funccedilatildeo do pH eacute descrita mesmo no limite em que se considera vaacutelida

a lei de Henry

53 Soluccedilatildeo Paraboacutelica da Curva de Solubilidade

Tanto Groumlnwall (1941) quanto Fredericq e Neurath (1950) adotaram a hipoacutetese de

que os perfis de carga liacutequida da -lactoglobulina para um e da insulina para os

outros dois eram lineares na regiatildeo do ponto isoeleacutetrico Esta hipoacutetese eacute bastante

plausiacutevel e simplificadora principalmente a eacutepoca na qual estes trabalhos foram

desenvolvidos em que a estrutura proteacuteica bem como as constantes de ionizaccedilatildeo

dos resiacuteduos com grupos ionizaacuteveis era pouco conhecida De fato ainda hoje a falta

de dados das constantes de ionizaccedilatildeo na cadeia proteacuteica eacute o maior desafio no uso

do modelo rigoroso ndash equaccedilatildeo (52 ndash 18) Por isso o valor desta hipoacutetese de perfil

de carga liacutequida linear eacute notaacutevel

Supondo entatildeo que o perfil de carga seja linear eacute possiacutevel escrevecirc-lo como

푍(푝퐻) = minus퐴(푝퐻 minus 푝퐼) 푐표푚 퐴 gt 0

(53 ndash 1)

Substituindo (53 ndash 1) em (52 ndash 6)

푑 log 푠 (푝퐻)푑(푝퐻) = 퐴(푝퐻 minus 푝퐼)

(53 ndash 2)

Integrando (53 ndash 2) de um pH0 de referecircncia ateacute pH tem-se que

27 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐻 ) = 퐾[푝퐻 minus 2푝퐼(푝퐻 minus 푝퐻 ) minus 푝퐻 ] 푐표푚 퐾 =

퐴2

(53 ndash 3)

Ao se adotar como ponto de referecircncia o ponto isoeleacutetrico a equaccedilatildeo (53 ndash 3)

reduz-se agrave

log푠 (푝퐻)푠 (푝퐼) = 퐾(푝퐻 minus 푝퐼)

(53 ndash 4)

Contudo apesar da soluccedilatildeo quadraacutetica ou paraboacutelica para a equaccedilatildeo estendida de

Linderstroslashm-lang e Groumlnwall expressa na equaccedilatildeo (53 ndash 3) natildeo requerer os dados

das constantes de ionizaccedilatildeo dos resiacuteduos com grupos ionizaacuteveis ela exige a

definiccedilatildeo do paracircmetro A que fisicamente representa a inclinaccedilatildeo da reta de

aproximaccedilatildeo da curva de carga liacutequida e que pode ser calculado por correlaccedilatildeo a

partir de um conjunto de dados experimentais de solubilidade ou de carga liacutequida

6 Identidade entre o Modelo Proposto e a Equaccedilatildeo

Estendida de Linderstroslashm-Lang e Groumlnwall

A equaccedilatildeo final da modelagem termodinacircmica proposta apresentada na seccedilatildeo 4 eacute a

equaccedilatildeo (42 ndash 8) dada por

푠 (푝퐻)푠 (푝퐼) =

1 + 101 + 10

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 1)

Aplicando-se o logaritmo decimal nos dois termos da equaccedilatildeo (6 ndash 1) tem-se que

log푠 (푝퐻)푠 (푝퐼) = log

1 + 101 + 10

+ log

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 2)

Pelo bem da simplificaccedilatildeo desta deduccedilatildeo adotar-se-atildeo as seguintes funccedilotildees

휂 (푝퐻) = log

(6 ndash 3)

휃 (푝퐻) = log

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 4)

Assim pode-se reescrever a equaccedilatildeo (6 ndash 2) por

29 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐼) = 휂 (푝퐻) + 휃 (푝퐻)

(6 ndash 5)

Observando-se a equaccedilatildeo (6 ndash 5) tem-se que a funccedilatildeo j independe do estado de

ionizaccedilatildeo do resiacuteduo j poreacutem a funccedilatildeo jk depende Por isso deve-se analisar esta

funccedilatildeo para cada estado de ionizaccedilatildeo possiacutevel como mostrado na Tabela 61

Tabela 6 1 ndash Anaacutelise da funccedilatildeo jk para cada estado de ionizaccedilatildeo possiacutevel

j jk jk Quantidade de resiacuteduos neste estado

-1 -1 푝퐼 minus 푝퐻 na

0 0 nb

+1 +1 0 nc

0 푝퐼 minus 푝퐻 nd

Pela anaacutelise da Tabela 61 e considerando uma proteiacutena com n resiacuteduos com

grupos ionizaacuteveis infere-se que a equaccedilatildeo (6 ndash 5) pode ser reescrita como

log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)

(6 ndash 6)

Contudo as equaccedilotildees acima descritas satildeo vaacutelidas apenas para configuraccedilotildees

neutras pois apenas as configuraccedilotildees neutras da fase liacutequida estatildeo em equiliacutebrio

com as moleacuteculas de proteiacutena da fase soacutelida Para que uma configuraccedilatildeo seja

neutra vale a seguinte restriccedilatildeo

휀 = 0 hArr 푛 = 푛

(6 ndash 7)

30 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall

Substituindo a restriccedilatildeo dada pela equaccedilatildeo (6 ndash 7) na equaccedilatildeo (6 ndash 6) tem-se que

log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)

(6 ndash 8)

Ora mas a soma de nc e de nd natildeo resulta em outra coisa senatildeo no nuacutemero de

resiacuteduos com grupos ionizaacuteveis da estrutura proteacuteica cujo j seja +1 Assim

substituindo nc mais nd por n+ e substituindo a equaccedilatildeo (6 ndash 3) na equaccedilatildeo (6 ndash 8)

tem-se que

log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log

1 + 101 + 10

(6 ndash 9)

Ao se analisar a equaccedilatildeo (6 ndash 9) observa-se que ela eacute idecircntica a equaccedilatildeo estendida

de Linderstroslashm-Lang e Groumlnwall apresentada pela equaccedilatildeo (52 ndash 19) Com isso

tem-se que apesar das distintas formulaccedilotildees tanto a modelagem termodinacircmica aqui

proposta quanto a extensatildeo a teoria de Linderstroslashm-Lang e Groumlnwall resultam na

mesma descriccedilatildeo do fenocircmeno Aleacutem disso a equaccedilatildeo final dos modelos eacute

extremamente simples e depende apenas de um ponto de referecircncia e dos dados da

estrutura da moleacutecula de proteiacutena cuja solubilidade se deseja estudar

7 Aplicaccedilatildeo dos Modelos Expostos

Para validar o modelo comparando-o com o caacutelculo feito a partir da teoria de Debye-

Huumlckel o criteacuterio que relaciona os pontos calculados pelo modelo com os pontos

experimentais foi estabelecido a partir da seguinte funccedilatildeo objetivo (FO)

퐹푂 =1푁

푠 minus 푠푠

(7 ndash 1)

Contudo a equaccedilatildeo (7 ndash 1) natildeo eacute a melhor definiccedilatildeo de funccedilatildeo objetivo neste caso

pois a derivada da curva de solubilidade eacute razoavelmente grande nos dois lados do

ponto isoeleacutetrico e isso permite que pequenos desvios na direccedilatildeo horizontal

resultem em um grande aumento no valor da funccedilatildeo objetivo Uma soluccedilatildeo possiacutevel

seria substituir essa funccedilatildeo objetivo por uma funccedilatildeo definida pela soma do quadrado

da distacircncia do ponto experimental agrave curva do modelo principalmente se fosse

necessaacuterio calcular algum paracircmetro do modelo via otimizaccedilatildeo da funccedilatildeo objetivo

estipulada Natildeo sendo este o escopo deste trabalho optou-se pelo uso da FO

definida na equaccedilatildeo (7 ndash 1)

71 Solubilidade da Insulina Suiacutena

As Figuras 711 712 e 713 apresentam os graacuteficos da curva de solubilidade

dada pelos pontos experimentais pelo modelo proposto pela abordagem claacutessica e

tambeacutem a curva obtida pela soluccedilatildeo paraboacutelica da Equaccedilatildeo de Linderstroslashm-Lang e

Groumlnwall em trecircs temperaturas distintas

32 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 711 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 25 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

Figura 712 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 15 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

00

40

80

120

160

200

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

00

50

100

150

200

250

300

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

33 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 713 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 5 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

Os desvios da curva obtida pelo modelo proposto para valores de pH distantes do pI

podem ser explicados por ao menos trecircs importantes motivos dois devidos a

hipoacuteteses do modelo e um devido a fenocircmenos intriacutensecos a proteiacutena Sabendo que

no pI a solubilidade eacute miacutenima para valores de pH distantes do pI pode-se ter

solubilidades suficientemente grandes para que a validade da lei de Henry ndash adotada

na formulaccedilatildeo do modelo - seja questionada pois quanto mais distante do pI maior

a solubilidade e menor a validade da lei de Henry jaacute que haacute um aumento da

concentraccedilatildeo do soluto (proteiacutena) na soluccedilatildeo e tambeacutem ao fato do modelo prever

solubilidade infinita quando a fraccedilatildeo de moleacuteculas eletricamente neutras tende a

zero

limrarr푠 = lim

rarr

Φ(푝퐼)푠 (푝퐼)Φ(푝퐻) = +infin

(711 ndash 1)

00

50

100

150

200

250

300

350

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

34 7 Aplicaccedilatildeo dos Modelos Expostos

Todavia ainda haacute um fator de ordem natural que justifica o desvio apresentado para

valores de pH distantes do pI o desnovelamento da cadeia proteacuteica Este fenocircmeno

pode ocorrer de maneira a expor grupos hidroacutefobos resiacuteduos antes natildeo expostos

acrescentando relaccedilotildees de equiliacutebrio quiacutemico natildeo existentes na regiatildeo do pI

alterando o equiliacutebrio de fases e portanto alterando o valor da solubilidade

A Tabela 711 apresenta os valores obtidos para a funccedilatildeo objetivo definida em (7 ndash

1) tanto para o modelo proposto quanto para a abordagem claacutessica para trecircs

diferentes temperaturas

Tabela 711 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada

abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para insulina

suiacutena

T ordmC Abordagem FO

25 P 01857 C 02535

15 P 01981 C 05056

5 P 03595 C 03064

Observando-se a Tabela 711 vecirc-se que o modelo apresentou melhores resultados

do que o caacutelculo efetuado atraveacutes da abordagem claacutessica no que tange a

minimizaccedilatildeo da funccedilatildeo objetivo exceto para os dados a 5 ordmC

Tambeacutem eacute possiacutevel observar que a funccedilatildeo objetivo sofreu aumento com a

diminuiccedilatildeo da temperatura Isto ocorreu principalmente devido agrave dificuldade de

obter dados experimentais de solubilidade a temperaturas baixas o que aumenta o

desvio experimental fazendo com que se tenha um aumento do valor da funccedilatildeo

objetivo como a definida em (5 ndash 1) Um efeito secundaacuterio que tambeacutem pressiona a

35 7 Aplicaccedilatildeo dos Modelos Expostos

funccedilatildeo objetivo eacute o fato dos dados de pKA terem sido obtidos a uma temperatura

especiacutefica o que tende a acrescentar erro no caacutelculo de solubilidades a temperaturas

diferentes ainda que o pKA natildeo varie de forma ab-rupta com a temperatura

Outra observaccedilatildeo que deve ser registrada eacute o fato da funccedilatildeo objetivo para a

abordagem claacutessica na temperatura de 15 ordmC divergir a um valor tatildeo elevado em

relaccedilatildeo aos demais Isto se deve a um ponto experimental especiacutefico a um pH de

45 a solubilidade da insulina suiacutena obtida experimentalmente eacute 230 x 10-5 mol kg-1

enquanto a calculada pelo modelo proposto eacute 230 x 10-5 mol kg-1 e a calculada pela

abordagem claacutessica eacute 520 x 10-5 mol kg-1 Por conta do desvio deste ponto a funccedilatildeo

objetivo para a abordagem claacutessica nesta temperatura tem um aumento significativo

A Tabela 712 apresenta os valores do paracircmetro K da soluccedilatildeo paraboacutelica obtidos

neste trabalho para a insulina suiacutena comparados ao encontrado na literatura

Tabela 712 ndash Valores do paracircmetro K da soluccedilatildeo paraboacutelica para a insulina suiacutena

Referecircncias T ordmC K Fredericq e Neurath (1950) - 081 Neste trabalho 25 104 Neste trabalho 15 101 Neste trabalho 5 145

Pela Tabela 712 pode-se observar que haacute uma diferenccedila pequena entre os

valores do paracircmetro K obtidos neste trabalho e por Fredericq e Neurath (1950) Por

isso natildeo se pode afirmar a que se deve esta diferenccedila se eacute devido a diferenccedilas entre

procedimentos experimentais ou se eacute devido agrave diferenccedila de meacutetodo de caacutelculo do

paracircmetro Apesar de no experimento realizado por Fredericq e Neurath (1950)

haver a presenccedila do acircnion tiocianato e este acircnion interagir com grupos ionizaacuteveis

da cadeia proteacuteica como observado pelos autores do trabalho tambeacutem estes

36 7 Aplicaccedilatildeo dos Modelos Expostos

proacuteprios autores afirmam que a presenccedila deste acircnion natildeo altera a forma da curva

que eacute basicamente determinada pelo paracircmetro K De qualquer modo eacute interessante

observar a proximidade dos valores encontrados neste trabalho com o obtido por

Fredericq e Neurath (1950) pelo menos no que diz respeito agrave ordem de grandeza do

paracircmetro em questatildeo

72 Solubilidade da Lisozima de clara de ovo de galinha

Um modelo para ser validado necessita correlacionar dados experimentais de modo

satisfatoacuterio ou seja um modelo deve buscar fidelidade ao fenocircmeno fiacutesico

observado Assim na procura de dados de solubilidade de proteiacutenas poucos dados

na regiatildeo do pI foram encontrados Este eacute o caso da lisozima de clara de ovo de

galinha que apesar de ter muitos estudos de solubilidade nenhum deles se

encontra na regiatildeo do pI Surgiu assim a necessidade de se obter estes dados

experimentais para poder validar o modelo proposto A escolha da lisozima de clara

de ovo de galinha se deu em parte pela sua importacircncia mas tambeacutem em parte por

ter os valores de pKA conhecidos

A curva de solubilidade da lisozima de clara de ovo de galinha levantada neste

trabalho estaacute apresentada na Figura 721

37 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em

soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e

dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()

Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento

esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH

isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de

soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se

comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto

isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da

soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos

ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente

neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a

solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e

00

10

20

30

40

50

60

70

80

90

100

95 100 105 110 115 120

Solu

bilid

ade

(mg

mL)

pH

38 7 Aplicaccedilatildeo dos Modelos Expostos

alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado

em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo

Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo

a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo

Por conta de falta de dados a este respeito modelou-se apenas a curva de

solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura

722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de

galinha em funccedilatildeo do pH da soluccedilatildeo

Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)

00

10

20

30

40

50

60

70

80

90

96 99 102 105 108 111 114 117 120

Solu

bilid

ade

(mg

mL)

pH

39 7 Aplicaccedilatildeo dos Modelos Expostos

O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721

Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada

abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima

de clara de ovo de galinha

T ordmC Abordagem FO

25 P 4650 C gt7919a

a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado

Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta

aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a

abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca

de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos

anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao

efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de

clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a

variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A

proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de

cargas pontuais de Debye-Huumlckel

8 Conclusotildees

A modelagem termodinacircmica proposta neste trabalho apresentou expressivos

resultados quando comparada a abordagem claacutessica de Debye-Huumlckel

Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o

modelo aproximou melhor os pontos experimentais do que a referida abordagem

comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima

ao ponto isoeleacutetrico

Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica

para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua

construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo

lugar por sua aplicabilidade

Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis

da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva

em regiotildees distantes do ponto isoeleacutetrico

9 Referecircncias Bibliograacuteficas

BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene

Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects

Biophys J 95 1285-1294 2008

FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and

other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72

2684 - 26911950

GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v

93 p 517-542 1931

GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab

Carlsberg v 24 p 185-200 1941

KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native

and mutant insulins pK perturbation of B13-Glu in aggregated species Arch

Biochem Biophys v 283 p 496-502 1990

KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for

the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng

Chem Res v 35 p 4319-4327 1996

42 9 Referecircncias Bibliograacuteficas

KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen

lysozyme J Biochem v 87 p 1215-1219 1980

LADISCH M R Bioseparations Engineering principles practice and

economics John Wiley amp Sons 2001 pp1 116 ndash 117 133

LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab

Carlsberg v 15 p 1-29 1924

PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da

particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas

2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP

PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the

excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte

solutions Fluid Phase Equilib v 269 p 25ndash35 2008

PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-

contribution model involving phase and chemical equilibrium Ind Eng Chem Res

v 33 p 1341-1347 1994

PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277

1973

PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino

acids Fluid Phase Equilib v 152 p 121-132 1998

43 9 Referecircncias Bibliograacuteficas

PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular

Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999

SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of

equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte

solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009

TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J

R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with

carbon dioxide Biotech Bioeng v103 p 909-919 2009

TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer

free energy Biophys J v 95 p 2601-2609 2008

TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in

water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95

2009

Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na

cadeia proteacuteica

Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo

de ionizaccedilatildeo

퐻퐴 퐴 + 퐻

(A ndash 1)

Assim considerando que a constante de equiliacutebrio

퐾 = 푎

(A ndash 2)

Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que

퐾 =[퐴 ][퐻 ]

[퐻퐴]

(A ndash 3)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que

log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]

(A ndash 4)

Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado

por

minus log[휑] = 푝휑

(A ndash 5)

Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que

45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

푝퐾 = log[퐻퐴][퐴 ] + 푝퐻

(A ndash 6)

Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por

훼 =[퐴 ]

[퐻퐴] + [퐴 ]

(A ndash 7)

Reescrevendo (A ndash 7) tem-se que

훼 =[퐴 ] [퐻퐴frasl ]

1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =

훼1 minus 훼

(A ndash 8)

Substituindo (A ndash 8) em (A ndash 6) tem-se que

푝퐾 = log훼

1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10

(A ndash 9)

Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos

훼 =1

1 + 10

(A ndash 10)

Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio

퐴 + 퐻 퐻퐴

(A ndash 11)

Pode se escrever a constante de equiliacutebrio como

퐾 =[퐻퐴 ]

[퐴][퐻 ]

(A ndash 12)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que

46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

log퐾 = minus log[퐴]

[퐻퐴 ] minus log[퐻 ]

(A -13)

Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por

훼 =[퐻퐴 ]

[퐴] + [퐻퐴 ]

(A ndash 14)

Assim a equaccedilatildeo (A ndash 13) fica

훼1 minus 훼 = 10

(A ndash 15)

Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo

훼 =10

1 + 10

(A ndash 16)

Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos

modelos expostos

Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]

48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]

49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)

50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])

51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]

52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])

53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)

54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2

55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO

24 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

푑 log 푠푑(푝퐻) = minus

12

11 + 10

1 + 휈 + 휈 1 minus 휈 10

(52 ndash 10)

Integrando a equaccedilatildeo (52 ndash 10) de um ponto de referecircncia por exemplo do ponto

isoeleacutetrico (pI) ateacute um pH qualquer tem-se a seguinte relaccedilatildeo

푑 log 푠

( )

( )

= minus12

1

1 + 101 + 휈 + 휈 1 minus 휈 10 푑(푝퐻)

(52 ndash 11)

log푠 (푝퐻)푠 (푝퐼) = minus

12 1 + 휈

11 + 10

푑(푝퐻)

+ 휈 1 minus 휈10

1 + 10푑(푝퐻)

(52 ndash 12)

Fazendo a seguinte substituiccedilatildeo

푢 = 10 푡푎푙 푞푢푒 푑푢푢 = ln 10푑(푝퐻)

(52 ndash 13)

Tem-se que

log푠 (푝퐻)푠 (푝퐼) = minus

12

1 + 휈ln 10

1푢(1 + 푢) 푑푢 +

휈 1 minus 휈ln 10

1(1 + 푢) 푑푢

(52 ndash 14)

log푠 (푝퐻)푠 (푝퐼) = minus

12

1 + 휈ln 10

1푢 푑푢 minus

11 + 푢 푑푢 +

휈 1 minus 휈ln 10

1(1 + 푢) 푑푢

(52 ndash 15)

25 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐼) = minus

12 1 + 휈 log

1010

minus 휈 1 minus 휈 minus 1 + 휈 log1 + 101 + 10

(52 ndash 16)

Sendo

휈 1 minus 휈 minus 1 + 휈 = 휈 minus 휈 minus 1 minus 휈 = minus 1 + 휈 = minus2

(52 ndash 17)

Resultando em

log푠 (푝퐻)푠 (푝퐼) = log

1 + 101 + 10

minus1 + 휈

2 (푝퐻 minus 푝퐼)

(52 ndash 18)

Ainda eacute possiacutevel reescrever a equaccedilatildeo (52 ndash 18) como

log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log

1 + 101 + 10

(52 ndash 19)

Na qual n+ representa o nuacutemero de resiacuteduos ionizaacuteveis que na sua forma carregada

apresentam carga positiva A equaccedilatildeo (52 ndash 19) eacute uma expressatildeo analiacutetica que a

partir de dados da estrutura proteacuteica e de um dado de solubilidade permite predizer

a curva de solubilidade de uma dada proteiacutena em funccedilatildeo do pH na regiatildeo do ponto

isoeleacutetrico mantendo fixas a temperatura e a forccedila iocircnica do sistema

Eacute possiacutevel provar que as equaccedilotildees (42 ndash 8) e (52 ndash 19) satildeo idecircnticas - a prova

disso eacute descrita na seccedilatildeo 6 ndash e assim tem-se que apesar das distintas abordagens

a descriccedilatildeo do fenocircmeno eacute a mesma Note-se que um passo fundamental no

desenvolvimento da Equaccedilatildeo (52 ndash 5) eacute admitir que por hipoacutetese a atividade da

26 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

forma neutra natildeo depende do pH essa hipoacutetese tambeacutem eacute a base da equaccedilatildeo (41

ndash 7) Deve-se registrar o fato de que pelo melhor do nosso conhecimento esta eacute a

primeira vez que uma expressatildeo analiacutetica para o caacutelculo da solubilidade de

proteiacutenas em funccedilatildeo do pH eacute descrita mesmo no limite em que se considera vaacutelida

a lei de Henry

53 Soluccedilatildeo Paraboacutelica da Curva de Solubilidade

Tanto Groumlnwall (1941) quanto Fredericq e Neurath (1950) adotaram a hipoacutetese de

que os perfis de carga liacutequida da -lactoglobulina para um e da insulina para os

outros dois eram lineares na regiatildeo do ponto isoeleacutetrico Esta hipoacutetese eacute bastante

plausiacutevel e simplificadora principalmente a eacutepoca na qual estes trabalhos foram

desenvolvidos em que a estrutura proteacuteica bem como as constantes de ionizaccedilatildeo

dos resiacuteduos com grupos ionizaacuteveis era pouco conhecida De fato ainda hoje a falta

de dados das constantes de ionizaccedilatildeo na cadeia proteacuteica eacute o maior desafio no uso

do modelo rigoroso ndash equaccedilatildeo (52 ndash 18) Por isso o valor desta hipoacutetese de perfil

de carga liacutequida linear eacute notaacutevel

Supondo entatildeo que o perfil de carga seja linear eacute possiacutevel escrevecirc-lo como

푍(푝퐻) = minus퐴(푝퐻 minus 푝퐼) 푐표푚 퐴 gt 0

(53 ndash 1)

Substituindo (53 ndash 1) em (52 ndash 6)

푑 log 푠 (푝퐻)푑(푝퐻) = 퐴(푝퐻 minus 푝퐼)

(53 ndash 2)

Integrando (53 ndash 2) de um pH0 de referecircncia ateacute pH tem-se que

27 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐻 ) = 퐾[푝퐻 minus 2푝퐼(푝퐻 minus 푝퐻 ) minus 푝퐻 ] 푐표푚 퐾 =

퐴2

(53 ndash 3)

Ao se adotar como ponto de referecircncia o ponto isoeleacutetrico a equaccedilatildeo (53 ndash 3)

reduz-se agrave

log푠 (푝퐻)푠 (푝퐼) = 퐾(푝퐻 minus 푝퐼)

(53 ndash 4)

Contudo apesar da soluccedilatildeo quadraacutetica ou paraboacutelica para a equaccedilatildeo estendida de

Linderstroslashm-lang e Groumlnwall expressa na equaccedilatildeo (53 ndash 3) natildeo requerer os dados

das constantes de ionizaccedilatildeo dos resiacuteduos com grupos ionizaacuteveis ela exige a

definiccedilatildeo do paracircmetro A que fisicamente representa a inclinaccedilatildeo da reta de

aproximaccedilatildeo da curva de carga liacutequida e que pode ser calculado por correlaccedilatildeo a

partir de um conjunto de dados experimentais de solubilidade ou de carga liacutequida

6 Identidade entre o Modelo Proposto e a Equaccedilatildeo

Estendida de Linderstroslashm-Lang e Groumlnwall

A equaccedilatildeo final da modelagem termodinacircmica proposta apresentada na seccedilatildeo 4 eacute a

equaccedilatildeo (42 ndash 8) dada por

푠 (푝퐻)푠 (푝퐼) =

1 + 101 + 10

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 1)

Aplicando-se o logaritmo decimal nos dois termos da equaccedilatildeo (6 ndash 1) tem-se que

log푠 (푝퐻)푠 (푝퐼) = log

1 + 101 + 10

+ log

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 2)

Pelo bem da simplificaccedilatildeo desta deduccedilatildeo adotar-se-atildeo as seguintes funccedilotildees

휂 (푝퐻) = log

(6 ndash 3)

휃 (푝퐻) = log

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 4)

Assim pode-se reescrever a equaccedilatildeo (6 ndash 2) por

29 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐼) = 휂 (푝퐻) + 휃 (푝퐻)

(6 ndash 5)

Observando-se a equaccedilatildeo (6 ndash 5) tem-se que a funccedilatildeo j independe do estado de

ionizaccedilatildeo do resiacuteduo j poreacutem a funccedilatildeo jk depende Por isso deve-se analisar esta

funccedilatildeo para cada estado de ionizaccedilatildeo possiacutevel como mostrado na Tabela 61

Tabela 6 1 ndash Anaacutelise da funccedilatildeo jk para cada estado de ionizaccedilatildeo possiacutevel

j jk jk Quantidade de resiacuteduos neste estado

-1 -1 푝퐼 minus 푝퐻 na

0 0 nb

+1 +1 0 nc

0 푝퐼 minus 푝퐻 nd

Pela anaacutelise da Tabela 61 e considerando uma proteiacutena com n resiacuteduos com

grupos ionizaacuteveis infere-se que a equaccedilatildeo (6 ndash 5) pode ser reescrita como

log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)

(6 ndash 6)

Contudo as equaccedilotildees acima descritas satildeo vaacutelidas apenas para configuraccedilotildees

neutras pois apenas as configuraccedilotildees neutras da fase liacutequida estatildeo em equiliacutebrio

com as moleacuteculas de proteiacutena da fase soacutelida Para que uma configuraccedilatildeo seja

neutra vale a seguinte restriccedilatildeo

휀 = 0 hArr 푛 = 푛

(6 ndash 7)

30 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall

Substituindo a restriccedilatildeo dada pela equaccedilatildeo (6 ndash 7) na equaccedilatildeo (6 ndash 6) tem-se que

log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)

(6 ndash 8)

Ora mas a soma de nc e de nd natildeo resulta em outra coisa senatildeo no nuacutemero de

resiacuteduos com grupos ionizaacuteveis da estrutura proteacuteica cujo j seja +1 Assim

substituindo nc mais nd por n+ e substituindo a equaccedilatildeo (6 ndash 3) na equaccedilatildeo (6 ndash 8)

tem-se que

log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log

1 + 101 + 10

(6 ndash 9)

Ao se analisar a equaccedilatildeo (6 ndash 9) observa-se que ela eacute idecircntica a equaccedilatildeo estendida

de Linderstroslashm-Lang e Groumlnwall apresentada pela equaccedilatildeo (52 ndash 19) Com isso

tem-se que apesar das distintas formulaccedilotildees tanto a modelagem termodinacircmica aqui

proposta quanto a extensatildeo a teoria de Linderstroslashm-Lang e Groumlnwall resultam na

mesma descriccedilatildeo do fenocircmeno Aleacutem disso a equaccedilatildeo final dos modelos eacute

extremamente simples e depende apenas de um ponto de referecircncia e dos dados da

estrutura da moleacutecula de proteiacutena cuja solubilidade se deseja estudar

7 Aplicaccedilatildeo dos Modelos Expostos

Para validar o modelo comparando-o com o caacutelculo feito a partir da teoria de Debye-

Huumlckel o criteacuterio que relaciona os pontos calculados pelo modelo com os pontos

experimentais foi estabelecido a partir da seguinte funccedilatildeo objetivo (FO)

퐹푂 =1푁

푠 minus 푠푠

(7 ndash 1)

Contudo a equaccedilatildeo (7 ndash 1) natildeo eacute a melhor definiccedilatildeo de funccedilatildeo objetivo neste caso

pois a derivada da curva de solubilidade eacute razoavelmente grande nos dois lados do

ponto isoeleacutetrico e isso permite que pequenos desvios na direccedilatildeo horizontal

resultem em um grande aumento no valor da funccedilatildeo objetivo Uma soluccedilatildeo possiacutevel

seria substituir essa funccedilatildeo objetivo por uma funccedilatildeo definida pela soma do quadrado

da distacircncia do ponto experimental agrave curva do modelo principalmente se fosse

necessaacuterio calcular algum paracircmetro do modelo via otimizaccedilatildeo da funccedilatildeo objetivo

estipulada Natildeo sendo este o escopo deste trabalho optou-se pelo uso da FO

definida na equaccedilatildeo (7 ndash 1)

71 Solubilidade da Insulina Suiacutena

As Figuras 711 712 e 713 apresentam os graacuteficos da curva de solubilidade

dada pelos pontos experimentais pelo modelo proposto pela abordagem claacutessica e

tambeacutem a curva obtida pela soluccedilatildeo paraboacutelica da Equaccedilatildeo de Linderstroslashm-Lang e

Groumlnwall em trecircs temperaturas distintas

32 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 711 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 25 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

Figura 712 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 15 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

00

40

80

120

160

200

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

00

50

100

150

200

250

300

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

33 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 713 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 5 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

Os desvios da curva obtida pelo modelo proposto para valores de pH distantes do pI

podem ser explicados por ao menos trecircs importantes motivos dois devidos a

hipoacuteteses do modelo e um devido a fenocircmenos intriacutensecos a proteiacutena Sabendo que

no pI a solubilidade eacute miacutenima para valores de pH distantes do pI pode-se ter

solubilidades suficientemente grandes para que a validade da lei de Henry ndash adotada

na formulaccedilatildeo do modelo - seja questionada pois quanto mais distante do pI maior

a solubilidade e menor a validade da lei de Henry jaacute que haacute um aumento da

concentraccedilatildeo do soluto (proteiacutena) na soluccedilatildeo e tambeacutem ao fato do modelo prever

solubilidade infinita quando a fraccedilatildeo de moleacuteculas eletricamente neutras tende a

zero

limrarr푠 = lim

rarr

Φ(푝퐼)푠 (푝퐼)Φ(푝퐻) = +infin

(711 ndash 1)

00

50

100

150

200

250

300

350

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

34 7 Aplicaccedilatildeo dos Modelos Expostos

Todavia ainda haacute um fator de ordem natural que justifica o desvio apresentado para

valores de pH distantes do pI o desnovelamento da cadeia proteacuteica Este fenocircmeno

pode ocorrer de maneira a expor grupos hidroacutefobos resiacuteduos antes natildeo expostos

acrescentando relaccedilotildees de equiliacutebrio quiacutemico natildeo existentes na regiatildeo do pI

alterando o equiliacutebrio de fases e portanto alterando o valor da solubilidade

A Tabela 711 apresenta os valores obtidos para a funccedilatildeo objetivo definida em (7 ndash

1) tanto para o modelo proposto quanto para a abordagem claacutessica para trecircs

diferentes temperaturas

Tabela 711 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada

abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para insulina

suiacutena

T ordmC Abordagem FO

25 P 01857 C 02535

15 P 01981 C 05056

5 P 03595 C 03064

Observando-se a Tabela 711 vecirc-se que o modelo apresentou melhores resultados

do que o caacutelculo efetuado atraveacutes da abordagem claacutessica no que tange a

minimizaccedilatildeo da funccedilatildeo objetivo exceto para os dados a 5 ordmC

Tambeacutem eacute possiacutevel observar que a funccedilatildeo objetivo sofreu aumento com a

diminuiccedilatildeo da temperatura Isto ocorreu principalmente devido agrave dificuldade de

obter dados experimentais de solubilidade a temperaturas baixas o que aumenta o

desvio experimental fazendo com que se tenha um aumento do valor da funccedilatildeo

objetivo como a definida em (5 ndash 1) Um efeito secundaacuterio que tambeacutem pressiona a

35 7 Aplicaccedilatildeo dos Modelos Expostos

funccedilatildeo objetivo eacute o fato dos dados de pKA terem sido obtidos a uma temperatura

especiacutefica o que tende a acrescentar erro no caacutelculo de solubilidades a temperaturas

diferentes ainda que o pKA natildeo varie de forma ab-rupta com a temperatura

Outra observaccedilatildeo que deve ser registrada eacute o fato da funccedilatildeo objetivo para a

abordagem claacutessica na temperatura de 15 ordmC divergir a um valor tatildeo elevado em

relaccedilatildeo aos demais Isto se deve a um ponto experimental especiacutefico a um pH de

45 a solubilidade da insulina suiacutena obtida experimentalmente eacute 230 x 10-5 mol kg-1

enquanto a calculada pelo modelo proposto eacute 230 x 10-5 mol kg-1 e a calculada pela

abordagem claacutessica eacute 520 x 10-5 mol kg-1 Por conta do desvio deste ponto a funccedilatildeo

objetivo para a abordagem claacutessica nesta temperatura tem um aumento significativo

A Tabela 712 apresenta os valores do paracircmetro K da soluccedilatildeo paraboacutelica obtidos

neste trabalho para a insulina suiacutena comparados ao encontrado na literatura

Tabela 712 ndash Valores do paracircmetro K da soluccedilatildeo paraboacutelica para a insulina suiacutena

Referecircncias T ordmC K Fredericq e Neurath (1950) - 081 Neste trabalho 25 104 Neste trabalho 15 101 Neste trabalho 5 145

Pela Tabela 712 pode-se observar que haacute uma diferenccedila pequena entre os

valores do paracircmetro K obtidos neste trabalho e por Fredericq e Neurath (1950) Por

isso natildeo se pode afirmar a que se deve esta diferenccedila se eacute devido a diferenccedilas entre

procedimentos experimentais ou se eacute devido agrave diferenccedila de meacutetodo de caacutelculo do

paracircmetro Apesar de no experimento realizado por Fredericq e Neurath (1950)

haver a presenccedila do acircnion tiocianato e este acircnion interagir com grupos ionizaacuteveis

da cadeia proteacuteica como observado pelos autores do trabalho tambeacutem estes

36 7 Aplicaccedilatildeo dos Modelos Expostos

proacuteprios autores afirmam que a presenccedila deste acircnion natildeo altera a forma da curva

que eacute basicamente determinada pelo paracircmetro K De qualquer modo eacute interessante

observar a proximidade dos valores encontrados neste trabalho com o obtido por

Fredericq e Neurath (1950) pelo menos no que diz respeito agrave ordem de grandeza do

paracircmetro em questatildeo

72 Solubilidade da Lisozima de clara de ovo de galinha

Um modelo para ser validado necessita correlacionar dados experimentais de modo

satisfatoacuterio ou seja um modelo deve buscar fidelidade ao fenocircmeno fiacutesico

observado Assim na procura de dados de solubilidade de proteiacutenas poucos dados

na regiatildeo do pI foram encontrados Este eacute o caso da lisozima de clara de ovo de

galinha que apesar de ter muitos estudos de solubilidade nenhum deles se

encontra na regiatildeo do pI Surgiu assim a necessidade de se obter estes dados

experimentais para poder validar o modelo proposto A escolha da lisozima de clara

de ovo de galinha se deu em parte pela sua importacircncia mas tambeacutem em parte por

ter os valores de pKA conhecidos

A curva de solubilidade da lisozima de clara de ovo de galinha levantada neste

trabalho estaacute apresentada na Figura 721

37 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em

soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e

dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()

Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento

esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH

isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de

soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se

comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto

isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da

soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos

ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente

neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a

solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e

00

10

20

30

40

50

60

70

80

90

100

95 100 105 110 115 120

Solu

bilid

ade

(mg

mL)

pH

38 7 Aplicaccedilatildeo dos Modelos Expostos

alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado

em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo

Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo

a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo

Por conta de falta de dados a este respeito modelou-se apenas a curva de

solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura

722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de

galinha em funccedilatildeo do pH da soluccedilatildeo

Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)

00

10

20

30

40

50

60

70

80

90

96 99 102 105 108 111 114 117 120

Solu

bilid

ade

(mg

mL)

pH

39 7 Aplicaccedilatildeo dos Modelos Expostos

O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721

Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada

abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima

de clara de ovo de galinha

T ordmC Abordagem FO

25 P 4650 C gt7919a

a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado

Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta

aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a

abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca

de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos

anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao

efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de

clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a

variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A

proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de

cargas pontuais de Debye-Huumlckel

8 Conclusotildees

A modelagem termodinacircmica proposta neste trabalho apresentou expressivos

resultados quando comparada a abordagem claacutessica de Debye-Huumlckel

Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o

modelo aproximou melhor os pontos experimentais do que a referida abordagem

comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima

ao ponto isoeleacutetrico

Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica

para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua

construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo

lugar por sua aplicabilidade

Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis

da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva

em regiotildees distantes do ponto isoeleacutetrico

9 Referecircncias Bibliograacuteficas

BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene

Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects

Biophys J 95 1285-1294 2008

FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and

other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72

2684 - 26911950

GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v

93 p 517-542 1931

GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab

Carlsberg v 24 p 185-200 1941

KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native

and mutant insulins pK perturbation of B13-Glu in aggregated species Arch

Biochem Biophys v 283 p 496-502 1990

KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for

the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng

Chem Res v 35 p 4319-4327 1996

42 9 Referecircncias Bibliograacuteficas

KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen

lysozyme J Biochem v 87 p 1215-1219 1980

LADISCH M R Bioseparations Engineering principles practice and

economics John Wiley amp Sons 2001 pp1 116 ndash 117 133

LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab

Carlsberg v 15 p 1-29 1924

PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da

particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas

2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP

PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the

excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte

solutions Fluid Phase Equilib v 269 p 25ndash35 2008

PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-

contribution model involving phase and chemical equilibrium Ind Eng Chem Res

v 33 p 1341-1347 1994

PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277

1973

PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino

acids Fluid Phase Equilib v 152 p 121-132 1998

43 9 Referecircncias Bibliograacuteficas

PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular

Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999

SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of

equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte

solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009

TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J

R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with

carbon dioxide Biotech Bioeng v103 p 909-919 2009

TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer

free energy Biophys J v 95 p 2601-2609 2008

TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in

water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95

2009

Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na

cadeia proteacuteica

Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo

de ionizaccedilatildeo

퐻퐴 퐴 + 퐻

(A ndash 1)

Assim considerando que a constante de equiliacutebrio

퐾 = 푎

(A ndash 2)

Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que

퐾 =[퐴 ][퐻 ]

[퐻퐴]

(A ndash 3)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que

log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]

(A ndash 4)

Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado

por

minus log[휑] = 푝휑

(A ndash 5)

Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que

45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

푝퐾 = log[퐻퐴][퐴 ] + 푝퐻

(A ndash 6)

Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por

훼 =[퐴 ]

[퐻퐴] + [퐴 ]

(A ndash 7)

Reescrevendo (A ndash 7) tem-se que

훼 =[퐴 ] [퐻퐴frasl ]

1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =

훼1 minus 훼

(A ndash 8)

Substituindo (A ndash 8) em (A ndash 6) tem-se que

푝퐾 = log훼

1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10

(A ndash 9)

Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos

훼 =1

1 + 10

(A ndash 10)

Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio

퐴 + 퐻 퐻퐴

(A ndash 11)

Pode se escrever a constante de equiliacutebrio como

퐾 =[퐻퐴 ]

[퐴][퐻 ]

(A ndash 12)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que

46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

log퐾 = minus log[퐴]

[퐻퐴 ] minus log[퐻 ]

(A -13)

Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por

훼 =[퐻퐴 ]

[퐴] + [퐻퐴 ]

(A ndash 14)

Assim a equaccedilatildeo (A ndash 13) fica

훼1 minus 훼 = 10

(A ndash 15)

Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo

훼 =10

1 + 10

(A ndash 16)

Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos

modelos expostos

Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]

48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]

49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)

50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])

51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]

52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])

53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)

54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2

55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO

25 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐼) = minus

12 1 + 휈 log

1010

minus 휈 1 minus 휈 minus 1 + 휈 log1 + 101 + 10

(52 ndash 16)

Sendo

휈 1 minus 휈 minus 1 + 휈 = 휈 minus 휈 minus 1 minus 휈 = minus 1 + 휈 = minus2

(52 ndash 17)

Resultando em

log푠 (푝퐻)푠 (푝퐼) = log

1 + 101 + 10

minus1 + 휈

2 (푝퐻 minus 푝퐼)

(52 ndash 18)

Ainda eacute possiacutevel reescrever a equaccedilatildeo (52 ndash 18) como

log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log

1 + 101 + 10

(52 ndash 19)

Na qual n+ representa o nuacutemero de resiacuteduos ionizaacuteveis que na sua forma carregada

apresentam carga positiva A equaccedilatildeo (52 ndash 19) eacute uma expressatildeo analiacutetica que a

partir de dados da estrutura proteacuteica e de um dado de solubilidade permite predizer

a curva de solubilidade de uma dada proteiacutena em funccedilatildeo do pH na regiatildeo do ponto

isoeleacutetrico mantendo fixas a temperatura e a forccedila iocircnica do sistema

Eacute possiacutevel provar que as equaccedilotildees (42 ndash 8) e (52 ndash 19) satildeo idecircnticas - a prova

disso eacute descrita na seccedilatildeo 6 ndash e assim tem-se que apesar das distintas abordagens

a descriccedilatildeo do fenocircmeno eacute a mesma Note-se que um passo fundamental no

desenvolvimento da Equaccedilatildeo (52 ndash 5) eacute admitir que por hipoacutetese a atividade da

26 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

forma neutra natildeo depende do pH essa hipoacutetese tambeacutem eacute a base da equaccedilatildeo (41

ndash 7) Deve-se registrar o fato de que pelo melhor do nosso conhecimento esta eacute a

primeira vez que uma expressatildeo analiacutetica para o caacutelculo da solubilidade de

proteiacutenas em funccedilatildeo do pH eacute descrita mesmo no limite em que se considera vaacutelida

a lei de Henry

53 Soluccedilatildeo Paraboacutelica da Curva de Solubilidade

Tanto Groumlnwall (1941) quanto Fredericq e Neurath (1950) adotaram a hipoacutetese de

que os perfis de carga liacutequida da -lactoglobulina para um e da insulina para os

outros dois eram lineares na regiatildeo do ponto isoeleacutetrico Esta hipoacutetese eacute bastante

plausiacutevel e simplificadora principalmente a eacutepoca na qual estes trabalhos foram

desenvolvidos em que a estrutura proteacuteica bem como as constantes de ionizaccedilatildeo

dos resiacuteduos com grupos ionizaacuteveis era pouco conhecida De fato ainda hoje a falta

de dados das constantes de ionizaccedilatildeo na cadeia proteacuteica eacute o maior desafio no uso

do modelo rigoroso ndash equaccedilatildeo (52 ndash 18) Por isso o valor desta hipoacutetese de perfil

de carga liacutequida linear eacute notaacutevel

Supondo entatildeo que o perfil de carga seja linear eacute possiacutevel escrevecirc-lo como

푍(푝퐻) = minus퐴(푝퐻 minus 푝퐼) 푐표푚 퐴 gt 0

(53 ndash 1)

Substituindo (53 ndash 1) em (52 ndash 6)

푑 log 푠 (푝퐻)푑(푝퐻) = 퐴(푝퐻 minus 푝퐼)

(53 ndash 2)

Integrando (53 ndash 2) de um pH0 de referecircncia ateacute pH tem-se que

27 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐻 ) = 퐾[푝퐻 minus 2푝퐼(푝퐻 minus 푝퐻 ) minus 푝퐻 ] 푐표푚 퐾 =

퐴2

(53 ndash 3)

Ao se adotar como ponto de referecircncia o ponto isoeleacutetrico a equaccedilatildeo (53 ndash 3)

reduz-se agrave

log푠 (푝퐻)푠 (푝퐼) = 퐾(푝퐻 minus 푝퐼)

(53 ndash 4)

Contudo apesar da soluccedilatildeo quadraacutetica ou paraboacutelica para a equaccedilatildeo estendida de

Linderstroslashm-lang e Groumlnwall expressa na equaccedilatildeo (53 ndash 3) natildeo requerer os dados

das constantes de ionizaccedilatildeo dos resiacuteduos com grupos ionizaacuteveis ela exige a

definiccedilatildeo do paracircmetro A que fisicamente representa a inclinaccedilatildeo da reta de

aproximaccedilatildeo da curva de carga liacutequida e que pode ser calculado por correlaccedilatildeo a

partir de um conjunto de dados experimentais de solubilidade ou de carga liacutequida

6 Identidade entre o Modelo Proposto e a Equaccedilatildeo

Estendida de Linderstroslashm-Lang e Groumlnwall

A equaccedilatildeo final da modelagem termodinacircmica proposta apresentada na seccedilatildeo 4 eacute a

equaccedilatildeo (42 ndash 8) dada por

푠 (푝퐻)푠 (푝퐼) =

1 + 101 + 10

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 1)

Aplicando-se o logaritmo decimal nos dois termos da equaccedilatildeo (6 ndash 1) tem-se que

log푠 (푝퐻)푠 (푝퐼) = log

1 + 101 + 10

+ log

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 2)

Pelo bem da simplificaccedilatildeo desta deduccedilatildeo adotar-se-atildeo as seguintes funccedilotildees

휂 (푝퐻) = log

(6 ndash 3)

휃 (푝퐻) = log

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 4)

Assim pode-se reescrever a equaccedilatildeo (6 ndash 2) por

29 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐼) = 휂 (푝퐻) + 휃 (푝퐻)

(6 ndash 5)

Observando-se a equaccedilatildeo (6 ndash 5) tem-se que a funccedilatildeo j independe do estado de

ionizaccedilatildeo do resiacuteduo j poreacutem a funccedilatildeo jk depende Por isso deve-se analisar esta

funccedilatildeo para cada estado de ionizaccedilatildeo possiacutevel como mostrado na Tabela 61

Tabela 6 1 ndash Anaacutelise da funccedilatildeo jk para cada estado de ionizaccedilatildeo possiacutevel

j jk jk Quantidade de resiacuteduos neste estado

-1 -1 푝퐼 minus 푝퐻 na

0 0 nb

+1 +1 0 nc

0 푝퐼 minus 푝퐻 nd

Pela anaacutelise da Tabela 61 e considerando uma proteiacutena com n resiacuteduos com

grupos ionizaacuteveis infere-se que a equaccedilatildeo (6 ndash 5) pode ser reescrita como

log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)

(6 ndash 6)

Contudo as equaccedilotildees acima descritas satildeo vaacutelidas apenas para configuraccedilotildees

neutras pois apenas as configuraccedilotildees neutras da fase liacutequida estatildeo em equiliacutebrio

com as moleacuteculas de proteiacutena da fase soacutelida Para que uma configuraccedilatildeo seja

neutra vale a seguinte restriccedilatildeo

휀 = 0 hArr 푛 = 푛

(6 ndash 7)

30 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall

Substituindo a restriccedilatildeo dada pela equaccedilatildeo (6 ndash 7) na equaccedilatildeo (6 ndash 6) tem-se que

log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)

(6 ndash 8)

Ora mas a soma de nc e de nd natildeo resulta em outra coisa senatildeo no nuacutemero de

resiacuteduos com grupos ionizaacuteveis da estrutura proteacuteica cujo j seja +1 Assim

substituindo nc mais nd por n+ e substituindo a equaccedilatildeo (6 ndash 3) na equaccedilatildeo (6 ndash 8)

tem-se que

log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log

1 + 101 + 10

(6 ndash 9)

Ao se analisar a equaccedilatildeo (6 ndash 9) observa-se que ela eacute idecircntica a equaccedilatildeo estendida

de Linderstroslashm-Lang e Groumlnwall apresentada pela equaccedilatildeo (52 ndash 19) Com isso

tem-se que apesar das distintas formulaccedilotildees tanto a modelagem termodinacircmica aqui

proposta quanto a extensatildeo a teoria de Linderstroslashm-Lang e Groumlnwall resultam na

mesma descriccedilatildeo do fenocircmeno Aleacutem disso a equaccedilatildeo final dos modelos eacute

extremamente simples e depende apenas de um ponto de referecircncia e dos dados da

estrutura da moleacutecula de proteiacutena cuja solubilidade se deseja estudar

7 Aplicaccedilatildeo dos Modelos Expostos

Para validar o modelo comparando-o com o caacutelculo feito a partir da teoria de Debye-

Huumlckel o criteacuterio que relaciona os pontos calculados pelo modelo com os pontos

experimentais foi estabelecido a partir da seguinte funccedilatildeo objetivo (FO)

퐹푂 =1푁

푠 minus 푠푠

(7 ndash 1)

Contudo a equaccedilatildeo (7 ndash 1) natildeo eacute a melhor definiccedilatildeo de funccedilatildeo objetivo neste caso

pois a derivada da curva de solubilidade eacute razoavelmente grande nos dois lados do

ponto isoeleacutetrico e isso permite que pequenos desvios na direccedilatildeo horizontal

resultem em um grande aumento no valor da funccedilatildeo objetivo Uma soluccedilatildeo possiacutevel

seria substituir essa funccedilatildeo objetivo por uma funccedilatildeo definida pela soma do quadrado

da distacircncia do ponto experimental agrave curva do modelo principalmente se fosse

necessaacuterio calcular algum paracircmetro do modelo via otimizaccedilatildeo da funccedilatildeo objetivo

estipulada Natildeo sendo este o escopo deste trabalho optou-se pelo uso da FO

definida na equaccedilatildeo (7 ndash 1)

71 Solubilidade da Insulina Suiacutena

As Figuras 711 712 e 713 apresentam os graacuteficos da curva de solubilidade

dada pelos pontos experimentais pelo modelo proposto pela abordagem claacutessica e

tambeacutem a curva obtida pela soluccedilatildeo paraboacutelica da Equaccedilatildeo de Linderstroslashm-Lang e

Groumlnwall em trecircs temperaturas distintas

32 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 711 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 25 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

Figura 712 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 15 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

00

40

80

120

160

200

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

00

50

100

150

200

250

300

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

33 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 713 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 5 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

Os desvios da curva obtida pelo modelo proposto para valores de pH distantes do pI

podem ser explicados por ao menos trecircs importantes motivos dois devidos a

hipoacuteteses do modelo e um devido a fenocircmenos intriacutensecos a proteiacutena Sabendo que

no pI a solubilidade eacute miacutenima para valores de pH distantes do pI pode-se ter

solubilidades suficientemente grandes para que a validade da lei de Henry ndash adotada

na formulaccedilatildeo do modelo - seja questionada pois quanto mais distante do pI maior

a solubilidade e menor a validade da lei de Henry jaacute que haacute um aumento da

concentraccedilatildeo do soluto (proteiacutena) na soluccedilatildeo e tambeacutem ao fato do modelo prever

solubilidade infinita quando a fraccedilatildeo de moleacuteculas eletricamente neutras tende a

zero

limrarr푠 = lim

rarr

Φ(푝퐼)푠 (푝퐼)Φ(푝퐻) = +infin

(711 ndash 1)

00

50

100

150

200

250

300

350

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

34 7 Aplicaccedilatildeo dos Modelos Expostos

Todavia ainda haacute um fator de ordem natural que justifica o desvio apresentado para

valores de pH distantes do pI o desnovelamento da cadeia proteacuteica Este fenocircmeno

pode ocorrer de maneira a expor grupos hidroacutefobos resiacuteduos antes natildeo expostos

acrescentando relaccedilotildees de equiliacutebrio quiacutemico natildeo existentes na regiatildeo do pI

alterando o equiliacutebrio de fases e portanto alterando o valor da solubilidade

A Tabela 711 apresenta os valores obtidos para a funccedilatildeo objetivo definida em (7 ndash

1) tanto para o modelo proposto quanto para a abordagem claacutessica para trecircs

diferentes temperaturas

Tabela 711 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada

abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para insulina

suiacutena

T ordmC Abordagem FO

25 P 01857 C 02535

15 P 01981 C 05056

5 P 03595 C 03064

Observando-se a Tabela 711 vecirc-se que o modelo apresentou melhores resultados

do que o caacutelculo efetuado atraveacutes da abordagem claacutessica no que tange a

minimizaccedilatildeo da funccedilatildeo objetivo exceto para os dados a 5 ordmC

Tambeacutem eacute possiacutevel observar que a funccedilatildeo objetivo sofreu aumento com a

diminuiccedilatildeo da temperatura Isto ocorreu principalmente devido agrave dificuldade de

obter dados experimentais de solubilidade a temperaturas baixas o que aumenta o

desvio experimental fazendo com que se tenha um aumento do valor da funccedilatildeo

objetivo como a definida em (5 ndash 1) Um efeito secundaacuterio que tambeacutem pressiona a

35 7 Aplicaccedilatildeo dos Modelos Expostos

funccedilatildeo objetivo eacute o fato dos dados de pKA terem sido obtidos a uma temperatura

especiacutefica o que tende a acrescentar erro no caacutelculo de solubilidades a temperaturas

diferentes ainda que o pKA natildeo varie de forma ab-rupta com a temperatura

Outra observaccedilatildeo que deve ser registrada eacute o fato da funccedilatildeo objetivo para a

abordagem claacutessica na temperatura de 15 ordmC divergir a um valor tatildeo elevado em

relaccedilatildeo aos demais Isto se deve a um ponto experimental especiacutefico a um pH de

45 a solubilidade da insulina suiacutena obtida experimentalmente eacute 230 x 10-5 mol kg-1

enquanto a calculada pelo modelo proposto eacute 230 x 10-5 mol kg-1 e a calculada pela

abordagem claacutessica eacute 520 x 10-5 mol kg-1 Por conta do desvio deste ponto a funccedilatildeo

objetivo para a abordagem claacutessica nesta temperatura tem um aumento significativo

A Tabela 712 apresenta os valores do paracircmetro K da soluccedilatildeo paraboacutelica obtidos

neste trabalho para a insulina suiacutena comparados ao encontrado na literatura

Tabela 712 ndash Valores do paracircmetro K da soluccedilatildeo paraboacutelica para a insulina suiacutena

Referecircncias T ordmC K Fredericq e Neurath (1950) - 081 Neste trabalho 25 104 Neste trabalho 15 101 Neste trabalho 5 145

Pela Tabela 712 pode-se observar que haacute uma diferenccedila pequena entre os

valores do paracircmetro K obtidos neste trabalho e por Fredericq e Neurath (1950) Por

isso natildeo se pode afirmar a que se deve esta diferenccedila se eacute devido a diferenccedilas entre

procedimentos experimentais ou se eacute devido agrave diferenccedila de meacutetodo de caacutelculo do

paracircmetro Apesar de no experimento realizado por Fredericq e Neurath (1950)

haver a presenccedila do acircnion tiocianato e este acircnion interagir com grupos ionizaacuteveis

da cadeia proteacuteica como observado pelos autores do trabalho tambeacutem estes

36 7 Aplicaccedilatildeo dos Modelos Expostos

proacuteprios autores afirmam que a presenccedila deste acircnion natildeo altera a forma da curva

que eacute basicamente determinada pelo paracircmetro K De qualquer modo eacute interessante

observar a proximidade dos valores encontrados neste trabalho com o obtido por

Fredericq e Neurath (1950) pelo menos no que diz respeito agrave ordem de grandeza do

paracircmetro em questatildeo

72 Solubilidade da Lisozima de clara de ovo de galinha

Um modelo para ser validado necessita correlacionar dados experimentais de modo

satisfatoacuterio ou seja um modelo deve buscar fidelidade ao fenocircmeno fiacutesico

observado Assim na procura de dados de solubilidade de proteiacutenas poucos dados

na regiatildeo do pI foram encontrados Este eacute o caso da lisozima de clara de ovo de

galinha que apesar de ter muitos estudos de solubilidade nenhum deles se

encontra na regiatildeo do pI Surgiu assim a necessidade de se obter estes dados

experimentais para poder validar o modelo proposto A escolha da lisozima de clara

de ovo de galinha se deu em parte pela sua importacircncia mas tambeacutem em parte por

ter os valores de pKA conhecidos

A curva de solubilidade da lisozima de clara de ovo de galinha levantada neste

trabalho estaacute apresentada na Figura 721

37 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em

soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e

dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()

Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento

esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH

isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de

soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se

comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto

isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da

soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos

ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente

neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a

solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e

00

10

20

30

40

50

60

70

80

90

100

95 100 105 110 115 120

Solu

bilid

ade

(mg

mL)

pH

38 7 Aplicaccedilatildeo dos Modelos Expostos

alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado

em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo

Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo

a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo

Por conta de falta de dados a este respeito modelou-se apenas a curva de

solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura

722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de

galinha em funccedilatildeo do pH da soluccedilatildeo

Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)

00

10

20

30

40

50

60

70

80

90

96 99 102 105 108 111 114 117 120

Solu

bilid

ade

(mg

mL)

pH

39 7 Aplicaccedilatildeo dos Modelos Expostos

O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721

Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada

abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima

de clara de ovo de galinha

T ordmC Abordagem FO

25 P 4650 C gt7919a

a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado

Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta

aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a

abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca

de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos

anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao

efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de

clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a

variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A

proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de

cargas pontuais de Debye-Huumlckel

8 Conclusotildees

A modelagem termodinacircmica proposta neste trabalho apresentou expressivos

resultados quando comparada a abordagem claacutessica de Debye-Huumlckel

Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o

modelo aproximou melhor os pontos experimentais do que a referida abordagem

comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima

ao ponto isoeleacutetrico

Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica

para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua

construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo

lugar por sua aplicabilidade

Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis

da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva

em regiotildees distantes do ponto isoeleacutetrico

9 Referecircncias Bibliograacuteficas

BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene

Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects

Biophys J 95 1285-1294 2008

FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and

other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72

2684 - 26911950

GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v

93 p 517-542 1931

GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab

Carlsberg v 24 p 185-200 1941

KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native

and mutant insulins pK perturbation of B13-Glu in aggregated species Arch

Biochem Biophys v 283 p 496-502 1990

KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for

the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng

Chem Res v 35 p 4319-4327 1996

42 9 Referecircncias Bibliograacuteficas

KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen

lysozyme J Biochem v 87 p 1215-1219 1980

LADISCH M R Bioseparations Engineering principles practice and

economics John Wiley amp Sons 2001 pp1 116 ndash 117 133

LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab

Carlsberg v 15 p 1-29 1924

PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da

particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas

2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP

PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the

excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte

solutions Fluid Phase Equilib v 269 p 25ndash35 2008

PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-

contribution model involving phase and chemical equilibrium Ind Eng Chem Res

v 33 p 1341-1347 1994

PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277

1973

PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino

acids Fluid Phase Equilib v 152 p 121-132 1998

43 9 Referecircncias Bibliograacuteficas

PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular

Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999

SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of

equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte

solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009

TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J

R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with

carbon dioxide Biotech Bioeng v103 p 909-919 2009

TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer

free energy Biophys J v 95 p 2601-2609 2008

TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in

water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95

2009

Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na

cadeia proteacuteica

Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo

de ionizaccedilatildeo

퐻퐴 퐴 + 퐻

(A ndash 1)

Assim considerando que a constante de equiliacutebrio

퐾 = 푎

(A ndash 2)

Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que

퐾 =[퐴 ][퐻 ]

[퐻퐴]

(A ndash 3)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que

log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]

(A ndash 4)

Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado

por

minus log[휑] = 푝휑

(A ndash 5)

Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que

45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

푝퐾 = log[퐻퐴][퐴 ] + 푝퐻

(A ndash 6)

Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por

훼 =[퐴 ]

[퐻퐴] + [퐴 ]

(A ndash 7)

Reescrevendo (A ndash 7) tem-se que

훼 =[퐴 ] [퐻퐴frasl ]

1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =

훼1 minus 훼

(A ndash 8)

Substituindo (A ndash 8) em (A ndash 6) tem-se que

푝퐾 = log훼

1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10

(A ndash 9)

Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos

훼 =1

1 + 10

(A ndash 10)

Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio

퐴 + 퐻 퐻퐴

(A ndash 11)

Pode se escrever a constante de equiliacutebrio como

퐾 =[퐻퐴 ]

[퐴][퐻 ]

(A ndash 12)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que

46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

log퐾 = minus log[퐴]

[퐻퐴 ] minus log[퐻 ]

(A -13)

Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por

훼 =[퐻퐴 ]

[퐴] + [퐻퐴 ]

(A ndash 14)

Assim a equaccedilatildeo (A ndash 13) fica

훼1 minus 훼 = 10

(A ndash 15)

Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo

훼 =10

1 + 10

(A ndash 16)

Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos

modelos expostos

Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]

48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]

49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)

50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])

51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]

52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])

53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)

54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2

55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO

26 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

forma neutra natildeo depende do pH essa hipoacutetese tambeacutem eacute a base da equaccedilatildeo (41

ndash 7) Deve-se registrar o fato de que pelo melhor do nosso conhecimento esta eacute a

primeira vez que uma expressatildeo analiacutetica para o caacutelculo da solubilidade de

proteiacutenas em funccedilatildeo do pH eacute descrita mesmo no limite em que se considera vaacutelida

a lei de Henry

53 Soluccedilatildeo Paraboacutelica da Curva de Solubilidade

Tanto Groumlnwall (1941) quanto Fredericq e Neurath (1950) adotaram a hipoacutetese de

que os perfis de carga liacutequida da -lactoglobulina para um e da insulina para os

outros dois eram lineares na regiatildeo do ponto isoeleacutetrico Esta hipoacutetese eacute bastante

plausiacutevel e simplificadora principalmente a eacutepoca na qual estes trabalhos foram

desenvolvidos em que a estrutura proteacuteica bem como as constantes de ionizaccedilatildeo

dos resiacuteduos com grupos ionizaacuteveis era pouco conhecida De fato ainda hoje a falta

de dados das constantes de ionizaccedilatildeo na cadeia proteacuteica eacute o maior desafio no uso

do modelo rigoroso ndash equaccedilatildeo (52 ndash 18) Por isso o valor desta hipoacutetese de perfil

de carga liacutequida linear eacute notaacutevel

Supondo entatildeo que o perfil de carga seja linear eacute possiacutevel escrevecirc-lo como

푍(푝퐻) = minus퐴(푝퐻 minus 푝퐼) 푐표푚 퐴 gt 0

(53 ndash 1)

Substituindo (53 ndash 1) em (52 ndash 6)

푑 log 푠 (푝퐻)푑(푝퐻) = 퐴(푝퐻 minus 푝퐼)

(53 ndash 2)

Integrando (53 ndash 2) de um pH0 de referecircncia ateacute pH tem-se que

27 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐻 ) = 퐾[푝퐻 minus 2푝퐼(푝퐻 minus 푝퐻 ) minus 푝퐻 ] 푐표푚 퐾 =

퐴2

(53 ndash 3)

Ao se adotar como ponto de referecircncia o ponto isoeleacutetrico a equaccedilatildeo (53 ndash 3)

reduz-se agrave

log푠 (푝퐻)푠 (푝퐼) = 퐾(푝퐻 minus 푝퐼)

(53 ndash 4)

Contudo apesar da soluccedilatildeo quadraacutetica ou paraboacutelica para a equaccedilatildeo estendida de

Linderstroslashm-lang e Groumlnwall expressa na equaccedilatildeo (53 ndash 3) natildeo requerer os dados

das constantes de ionizaccedilatildeo dos resiacuteduos com grupos ionizaacuteveis ela exige a

definiccedilatildeo do paracircmetro A que fisicamente representa a inclinaccedilatildeo da reta de

aproximaccedilatildeo da curva de carga liacutequida e que pode ser calculado por correlaccedilatildeo a

partir de um conjunto de dados experimentais de solubilidade ou de carga liacutequida

6 Identidade entre o Modelo Proposto e a Equaccedilatildeo

Estendida de Linderstroslashm-Lang e Groumlnwall

A equaccedilatildeo final da modelagem termodinacircmica proposta apresentada na seccedilatildeo 4 eacute a

equaccedilatildeo (42 ndash 8) dada por

푠 (푝퐻)푠 (푝퐼) =

1 + 101 + 10

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 1)

Aplicando-se o logaritmo decimal nos dois termos da equaccedilatildeo (6 ndash 1) tem-se que

log푠 (푝퐻)푠 (푝퐼) = log

1 + 101 + 10

+ log

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 2)

Pelo bem da simplificaccedilatildeo desta deduccedilatildeo adotar-se-atildeo as seguintes funccedilotildees

휂 (푝퐻) = log

(6 ndash 3)

휃 (푝퐻) = log

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 4)

Assim pode-se reescrever a equaccedilatildeo (6 ndash 2) por

29 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐼) = 휂 (푝퐻) + 휃 (푝퐻)

(6 ndash 5)

Observando-se a equaccedilatildeo (6 ndash 5) tem-se que a funccedilatildeo j independe do estado de

ionizaccedilatildeo do resiacuteduo j poreacutem a funccedilatildeo jk depende Por isso deve-se analisar esta

funccedilatildeo para cada estado de ionizaccedilatildeo possiacutevel como mostrado na Tabela 61

Tabela 6 1 ndash Anaacutelise da funccedilatildeo jk para cada estado de ionizaccedilatildeo possiacutevel

j jk jk Quantidade de resiacuteduos neste estado

-1 -1 푝퐼 minus 푝퐻 na

0 0 nb

+1 +1 0 nc

0 푝퐼 minus 푝퐻 nd

Pela anaacutelise da Tabela 61 e considerando uma proteiacutena com n resiacuteduos com

grupos ionizaacuteveis infere-se que a equaccedilatildeo (6 ndash 5) pode ser reescrita como

log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)

(6 ndash 6)

Contudo as equaccedilotildees acima descritas satildeo vaacutelidas apenas para configuraccedilotildees

neutras pois apenas as configuraccedilotildees neutras da fase liacutequida estatildeo em equiliacutebrio

com as moleacuteculas de proteiacutena da fase soacutelida Para que uma configuraccedilatildeo seja

neutra vale a seguinte restriccedilatildeo

휀 = 0 hArr 푛 = 푛

(6 ndash 7)

30 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall

Substituindo a restriccedilatildeo dada pela equaccedilatildeo (6 ndash 7) na equaccedilatildeo (6 ndash 6) tem-se que

log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)

(6 ndash 8)

Ora mas a soma de nc e de nd natildeo resulta em outra coisa senatildeo no nuacutemero de

resiacuteduos com grupos ionizaacuteveis da estrutura proteacuteica cujo j seja +1 Assim

substituindo nc mais nd por n+ e substituindo a equaccedilatildeo (6 ndash 3) na equaccedilatildeo (6 ndash 8)

tem-se que

log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log

1 + 101 + 10

(6 ndash 9)

Ao se analisar a equaccedilatildeo (6 ndash 9) observa-se que ela eacute idecircntica a equaccedilatildeo estendida

de Linderstroslashm-Lang e Groumlnwall apresentada pela equaccedilatildeo (52 ndash 19) Com isso

tem-se que apesar das distintas formulaccedilotildees tanto a modelagem termodinacircmica aqui

proposta quanto a extensatildeo a teoria de Linderstroslashm-Lang e Groumlnwall resultam na

mesma descriccedilatildeo do fenocircmeno Aleacutem disso a equaccedilatildeo final dos modelos eacute

extremamente simples e depende apenas de um ponto de referecircncia e dos dados da

estrutura da moleacutecula de proteiacutena cuja solubilidade se deseja estudar

7 Aplicaccedilatildeo dos Modelos Expostos

Para validar o modelo comparando-o com o caacutelculo feito a partir da teoria de Debye-

Huumlckel o criteacuterio que relaciona os pontos calculados pelo modelo com os pontos

experimentais foi estabelecido a partir da seguinte funccedilatildeo objetivo (FO)

퐹푂 =1푁

푠 minus 푠푠

(7 ndash 1)

Contudo a equaccedilatildeo (7 ndash 1) natildeo eacute a melhor definiccedilatildeo de funccedilatildeo objetivo neste caso

pois a derivada da curva de solubilidade eacute razoavelmente grande nos dois lados do

ponto isoeleacutetrico e isso permite que pequenos desvios na direccedilatildeo horizontal

resultem em um grande aumento no valor da funccedilatildeo objetivo Uma soluccedilatildeo possiacutevel

seria substituir essa funccedilatildeo objetivo por uma funccedilatildeo definida pela soma do quadrado

da distacircncia do ponto experimental agrave curva do modelo principalmente se fosse

necessaacuterio calcular algum paracircmetro do modelo via otimizaccedilatildeo da funccedilatildeo objetivo

estipulada Natildeo sendo este o escopo deste trabalho optou-se pelo uso da FO

definida na equaccedilatildeo (7 ndash 1)

71 Solubilidade da Insulina Suiacutena

As Figuras 711 712 e 713 apresentam os graacuteficos da curva de solubilidade

dada pelos pontos experimentais pelo modelo proposto pela abordagem claacutessica e

tambeacutem a curva obtida pela soluccedilatildeo paraboacutelica da Equaccedilatildeo de Linderstroslashm-Lang e

Groumlnwall em trecircs temperaturas distintas

32 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 711 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 25 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

Figura 712 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 15 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

00

40

80

120

160

200

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

00

50

100

150

200

250

300

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

33 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 713 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 5 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

Os desvios da curva obtida pelo modelo proposto para valores de pH distantes do pI

podem ser explicados por ao menos trecircs importantes motivos dois devidos a

hipoacuteteses do modelo e um devido a fenocircmenos intriacutensecos a proteiacutena Sabendo que

no pI a solubilidade eacute miacutenima para valores de pH distantes do pI pode-se ter

solubilidades suficientemente grandes para que a validade da lei de Henry ndash adotada

na formulaccedilatildeo do modelo - seja questionada pois quanto mais distante do pI maior

a solubilidade e menor a validade da lei de Henry jaacute que haacute um aumento da

concentraccedilatildeo do soluto (proteiacutena) na soluccedilatildeo e tambeacutem ao fato do modelo prever

solubilidade infinita quando a fraccedilatildeo de moleacuteculas eletricamente neutras tende a

zero

limrarr푠 = lim

rarr

Φ(푝퐼)푠 (푝퐼)Φ(푝퐻) = +infin

(711 ndash 1)

00

50

100

150

200

250

300

350

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

34 7 Aplicaccedilatildeo dos Modelos Expostos

Todavia ainda haacute um fator de ordem natural que justifica o desvio apresentado para

valores de pH distantes do pI o desnovelamento da cadeia proteacuteica Este fenocircmeno

pode ocorrer de maneira a expor grupos hidroacutefobos resiacuteduos antes natildeo expostos

acrescentando relaccedilotildees de equiliacutebrio quiacutemico natildeo existentes na regiatildeo do pI

alterando o equiliacutebrio de fases e portanto alterando o valor da solubilidade

A Tabela 711 apresenta os valores obtidos para a funccedilatildeo objetivo definida em (7 ndash

1) tanto para o modelo proposto quanto para a abordagem claacutessica para trecircs

diferentes temperaturas

Tabela 711 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada

abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para insulina

suiacutena

T ordmC Abordagem FO

25 P 01857 C 02535

15 P 01981 C 05056

5 P 03595 C 03064

Observando-se a Tabela 711 vecirc-se que o modelo apresentou melhores resultados

do que o caacutelculo efetuado atraveacutes da abordagem claacutessica no que tange a

minimizaccedilatildeo da funccedilatildeo objetivo exceto para os dados a 5 ordmC

Tambeacutem eacute possiacutevel observar que a funccedilatildeo objetivo sofreu aumento com a

diminuiccedilatildeo da temperatura Isto ocorreu principalmente devido agrave dificuldade de

obter dados experimentais de solubilidade a temperaturas baixas o que aumenta o

desvio experimental fazendo com que se tenha um aumento do valor da funccedilatildeo

objetivo como a definida em (5 ndash 1) Um efeito secundaacuterio que tambeacutem pressiona a

35 7 Aplicaccedilatildeo dos Modelos Expostos

funccedilatildeo objetivo eacute o fato dos dados de pKA terem sido obtidos a uma temperatura

especiacutefica o que tende a acrescentar erro no caacutelculo de solubilidades a temperaturas

diferentes ainda que o pKA natildeo varie de forma ab-rupta com a temperatura

Outra observaccedilatildeo que deve ser registrada eacute o fato da funccedilatildeo objetivo para a

abordagem claacutessica na temperatura de 15 ordmC divergir a um valor tatildeo elevado em

relaccedilatildeo aos demais Isto se deve a um ponto experimental especiacutefico a um pH de

45 a solubilidade da insulina suiacutena obtida experimentalmente eacute 230 x 10-5 mol kg-1

enquanto a calculada pelo modelo proposto eacute 230 x 10-5 mol kg-1 e a calculada pela

abordagem claacutessica eacute 520 x 10-5 mol kg-1 Por conta do desvio deste ponto a funccedilatildeo

objetivo para a abordagem claacutessica nesta temperatura tem um aumento significativo

A Tabela 712 apresenta os valores do paracircmetro K da soluccedilatildeo paraboacutelica obtidos

neste trabalho para a insulina suiacutena comparados ao encontrado na literatura

Tabela 712 ndash Valores do paracircmetro K da soluccedilatildeo paraboacutelica para a insulina suiacutena

Referecircncias T ordmC K Fredericq e Neurath (1950) - 081 Neste trabalho 25 104 Neste trabalho 15 101 Neste trabalho 5 145

Pela Tabela 712 pode-se observar que haacute uma diferenccedila pequena entre os

valores do paracircmetro K obtidos neste trabalho e por Fredericq e Neurath (1950) Por

isso natildeo se pode afirmar a que se deve esta diferenccedila se eacute devido a diferenccedilas entre

procedimentos experimentais ou se eacute devido agrave diferenccedila de meacutetodo de caacutelculo do

paracircmetro Apesar de no experimento realizado por Fredericq e Neurath (1950)

haver a presenccedila do acircnion tiocianato e este acircnion interagir com grupos ionizaacuteveis

da cadeia proteacuteica como observado pelos autores do trabalho tambeacutem estes

36 7 Aplicaccedilatildeo dos Modelos Expostos

proacuteprios autores afirmam que a presenccedila deste acircnion natildeo altera a forma da curva

que eacute basicamente determinada pelo paracircmetro K De qualquer modo eacute interessante

observar a proximidade dos valores encontrados neste trabalho com o obtido por

Fredericq e Neurath (1950) pelo menos no que diz respeito agrave ordem de grandeza do

paracircmetro em questatildeo

72 Solubilidade da Lisozima de clara de ovo de galinha

Um modelo para ser validado necessita correlacionar dados experimentais de modo

satisfatoacuterio ou seja um modelo deve buscar fidelidade ao fenocircmeno fiacutesico

observado Assim na procura de dados de solubilidade de proteiacutenas poucos dados

na regiatildeo do pI foram encontrados Este eacute o caso da lisozima de clara de ovo de

galinha que apesar de ter muitos estudos de solubilidade nenhum deles se

encontra na regiatildeo do pI Surgiu assim a necessidade de se obter estes dados

experimentais para poder validar o modelo proposto A escolha da lisozima de clara

de ovo de galinha se deu em parte pela sua importacircncia mas tambeacutem em parte por

ter os valores de pKA conhecidos

A curva de solubilidade da lisozima de clara de ovo de galinha levantada neste

trabalho estaacute apresentada na Figura 721

37 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em

soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e

dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()

Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento

esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH

isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de

soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se

comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto

isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da

soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos

ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente

neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a

solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e

00

10

20

30

40

50

60

70

80

90

100

95 100 105 110 115 120

Solu

bilid

ade

(mg

mL)

pH

38 7 Aplicaccedilatildeo dos Modelos Expostos

alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado

em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo

Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo

a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo

Por conta de falta de dados a este respeito modelou-se apenas a curva de

solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura

722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de

galinha em funccedilatildeo do pH da soluccedilatildeo

Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)

00

10

20

30

40

50

60

70

80

90

96 99 102 105 108 111 114 117 120

Solu

bilid

ade

(mg

mL)

pH

39 7 Aplicaccedilatildeo dos Modelos Expostos

O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721

Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada

abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima

de clara de ovo de galinha

T ordmC Abordagem FO

25 P 4650 C gt7919a

a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado

Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta

aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a

abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca

de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos

anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao

efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de

clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a

variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A

proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de

cargas pontuais de Debye-Huumlckel

8 Conclusotildees

A modelagem termodinacircmica proposta neste trabalho apresentou expressivos

resultados quando comparada a abordagem claacutessica de Debye-Huumlckel

Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o

modelo aproximou melhor os pontos experimentais do que a referida abordagem

comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima

ao ponto isoeleacutetrico

Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica

para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua

construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo

lugar por sua aplicabilidade

Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis

da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva

em regiotildees distantes do ponto isoeleacutetrico

9 Referecircncias Bibliograacuteficas

BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene

Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects

Biophys J 95 1285-1294 2008

FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and

other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72

2684 - 26911950

GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v

93 p 517-542 1931

GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab

Carlsberg v 24 p 185-200 1941

KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native

and mutant insulins pK perturbation of B13-Glu in aggregated species Arch

Biochem Biophys v 283 p 496-502 1990

KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for

the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng

Chem Res v 35 p 4319-4327 1996

42 9 Referecircncias Bibliograacuteficas

KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen

lysozyme J Biochem v 87 p 1215-1219 1980

LADISCH M R Bioseparations Engineering principles practice and

economics John Wiley amp Sons 2001 pp1 116 ndash 117 133

LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab

Carlsberg v 15 p 1-29 1924

PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da

particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas

2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP

PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the

excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte

solutions Fluid Phase Equilib v 269 p 25ndash35 2008

PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-

contribution model involving phase and chemical equilibrium Ind Eng Chem Res

v 33 p 1341-1347 1994

PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277

1973

PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino

acids Fluid Phase Equilib v 152 p 121-132 1998

43 9 Referecircncias Bibliograacuteficas

PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular

Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999

SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of

equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte

solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009

TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J

R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with

carbon dioxide Biotech Bioeng v103 p 909-919 2009

TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer

free energy Biophys J v 95 p 2601-2609 2008

TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in

water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95

2009

Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na

cadeia proteacuteica

Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo

de ionizaccedilatildeo

퐻퐴 퐴 + 퐻

(A ndash 1)

Assim considerando que a constante de equiliacutebrio

퐾 = 푎

(A ndash 2)

Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que

퐾 =[퐴 ][퐻 ]

[퐻퐴]

(A ndash 3)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que

log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]

(A ndash 4)

Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado

por

minus log[휑] = 푝휑

(A ndash 5)

Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que

45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

푝퐾 = log[퐻퐴][퐴 ] + 푝퐻

(A ndash 6)

Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por

훼 =[퐴 ]

[퐻퐴] + [퐴 ]

(A ndash 7)

Reescrevendo (A ndash 7) tem-se que

훼 =[퐴 ] [퐻퐴frasl ]

1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =

훼1 minus 훼

(A ndash 8)

Substituindo (A ndash 8) em (A ndash 6) tem-se que

푝퐾 = log훼

1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10

(A ndash 9)

Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos

훼 =1

1 + 10

(A ndash 10)

Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio

퐴 + 퐻 퐻퐴

(A ndash 11)

Pode se escrever a constante de equiliacutebrio como

퐾 =[퐻퐴 ]

[퐴][퐻 ]

(A ndash 12)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que

46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

log퐾 = minus log[퐴]

[퐻퐴 ] minus log[퐻 ]

(A -13)

Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por

훼 =[퐻퐴 ]

[퐴] + [퐻퐴 ]

(A ndash 14)

Assim a equaccedilatildeo (A ndash 13) fica

훼1 minus 훼 = 10

(A ndash 15)

Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo

훼 =10

1 + 10

(A ndash 16)

Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos

modelos expostos

Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]

48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]

49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)

50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])

51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]

52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])

53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)

54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2

55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO

27 5 Extensatildeo da Equaccedilatildeo de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐻 ) = 퐾[푝퐻 minus 2푝퐼(푝퐻 minus 푝퐻 ) minus 푝퐻 ] 푐표푚 퐾 =

퐴2

(53 ndash 3)

Ao se adotar como ponto de referecircncia o ponto isoeleacutetrico a equaccedilatildeo (53 ndash 3)

reduz-se agrave

log푠 (푝퐻)푠 (푝퐼) = 퐾(푝퐻 minus 푝퐼)

(53 ndash 4)

Contudo apesar da soluccedilatildeo quadraacutetica ou paraboacutelica para a equaccedilatildeo estendida de

Linderstroslashm-lang e Groumlnwall expressa na equaccedilatildeo (53 ndash 3) natildeo requerer os dados

das constantes de ionizaccedilatildeo dos resiacuteduos com grupos ionizaacuteveis ela exige a

definiccedilatildeo do paracircmetro A que fisicamente representa a inclinaccedilatildeo da reta de

aproximaccedilatildeo da curva de carga liacutequida e que pode ser calculado por correlaccedilatildeo a

partir de um conjunto de dados experimentais de solubilidade ou de carga liacutequida

6 Identidade entre o Modelo Proposto e a Equaccedilatildeo

Estendida de Linderstroslashm-Lang e Groumlnwall

A equaccedilatildeo final da modelagem termodinacircmica proposta apresentada na seccedilatildeo 4 eacute a

equaccedilatildeo (42 ndash 8) dada por

푠 (푝퐻)푠 (푝퐼) =

1 + 101 + 10

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 1)

Aplicando-se o logaritmo decimal nos dois termos da equaccedilatildeo (6 ndash 1) tem-se que

log푠 (푝퐻)푠 (푝퐼) = log

1 + 101 + 10

+ log

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 2)

Pelo bem da simplificaccedilatildeo desta deduccedilatildeo adotar-se-atildeo as seguintes funccedilotildees

휂 (푝퐻) = log

(6 ndash 3)

휃 (푝퐻) = log

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 4)

Assim pode-se reescrever a equaccedilatildeo (6 ndash 2) por

29 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐼) = 휂 (푝퐻) + 휃 (푝퐻)

(6 ndash 5)

Observando-se a equaccedilatildeo (6 ndash 5) tem-se que a funccedilatildeo j independe do estado de

ionizaccedilatildeo do resiacuteduo j poreacutem a funccedilatildeo jk depende Por isso deve-se analisar esta

funccedilatildeo para cada estado de ionizaccedilatildeo possiacutevel como mostrado na Tabela 61

Tabela 6 1 ndash Anaacutelise da funccedilatildeo jk para cada estado de ionizaccedilatildeo possiacutevel

j jk jk Quantidade de resiacuteduos neste estado

-1 -1 푝퐼 minus 푝퐻 na

0 0 nb

+1 +1 0 nc

0 푝퐼 minus 푝퐻 nd

Pela anaacutelise da Tabela 61 e considerando uma proteiacutena com n resiacuteduos com

grupos ionizaacuteveis infere-se que a equaccedilatildeo (6 ndash 5) pode ser reescrita como

log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)

(6 ndash 6)

Contudo as equaccedilotildees acima descritas satildeo vaacutelidas apenas para configuraccedilotildees

neutras pois apenas as configuraccedilotildees neutras da fase liacutequida estatildeo em equiliacutebrio

com as moleacuteculas de proteiacutena da fase soacutelida Para que uma configuraccedilatildeo seja

neutra vale a seguinte restriccedilatildeo

휀 = 0 hArr 푛 = 푛

(6 ndash 7)

30 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall

Substituindo a restriccedilatildeo dada pela equaccedilatildeo (6 ndash 7) na equaccedilatildeo (6 ndash 6) tem-se que

log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)

(6 ndash 8)

Ora mas a soma de nc e de nd natildeo resulta em outra coisa senatildeo no nuacutemero de

resiacuteduos com grupos ionizaacuteveis da estrutura proteacuteica cujo j seja +1 Assim

substituindo nc mais nd por n+ e substituindo a equaccedilatildeo (6 ndash 3) na equaccedilatildeo (6 ndash 8)

tem-se que

log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log

1 + 101 + 10

(6 ndash 9)

Ao se analisar a equaccedilatildeo (6 ndash 9) observa-se que ela eacute idecircntica a equaccedilatildeo estendida

de Linderstroslashm-Lang e Groumlnwall apresentada pela equaccedilatildeo (52 ndash 19) Com isso

tem-se que apesar das distintas formulaccedilotildees tanto a modelagem termodinacircmica aqui

proposta quanto a extensatildeo a teoria de Linderstroslashm-Lang e Groumlnwall resultam na

mesma descriccedilatildeo do fenocircmeno Aleacutem disso a equaccedilatildeo final dos modelos eacute

extremamente simples e depende apenas de um ponto de referecircncia e dos dados da

estrutura da moleacutecula de proteiacutena cuja solubilidade se deseja estudar

7 Aplicaccedilatildeo dos Modelos Expostos

Para validar o modelo comparando-o com o caacutelculo feito a partir da teoria de Debye-

Huumlckel o criteacuterio que relaciona os pontos calculados pelo modelo com os pontos

experimentais foi estabelecido a partir da seguinte funccedilatildeo objetivo (FO)

퐹푂 =1푁

푠 minus 푠푠

(7 ndash 1)

Contudo a equaccedilatildeo (7 ndash 1) natildeo eacute a melhor definiccedilatildeo de funccedilatildeo objetivo neste caso

pois a derivada da curva de solubilidade eacute razoavelmente grande nos dois lados do

ponto isoeleacutetrico e isso permite que pequenos desvios na direccedilatildeo horizontal

resultem em um grande aumento no valor da funccedilatildeo objetivo Uma soluccedilatildeo possiacutevel

seria substituir essa funccedilatildeo objetivo por uma funccedilatildeo definida pela soma do quadrado

da distacircncia do ponto experimental agrave curva do modelo principalmente se fosse

necessaacuterio calcular algum paracircmetro do modelo via otimizaccedilatildeo da funccedilatildeo objetivo

estipulada Natildeo sendo este o escopo deste trabalho optou-se pelo uso da FO

definida na equaccedilatildeo (7 ndash 1)

71 Solubilidade da Insulina Suiacutena

As Figuras 711 712 e 713 apresentam os graacuteficos da curva de solubilidade

dada pelos pontos experimentais pelo modelo proposto pela abordagem claacutessica e

tambeacutem a curva obtida pela soluccedilatildeo paraboacutelica da Equaccedilatildeo de Linderstroslashm-Lang e

Groumlnwall em trecircs temperaturas distintas

32 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 711 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 25 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

Figura 712 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 15 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

00

40

80

120

160

200

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

00

50

100

150

200

250

300

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

33 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 713 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 5 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

Os desvios da curva obtida pelo modelo proposto para valores de pH distantes do pI

podem ser explicados por ao menos trecircs importantes motivos dois devidos a

hipoacuteteses do modelo e um devido a fenocircmenos intriacutensecos a proteiacutena Sabendo que

no pI a solubilidade eacute miacutenima para valores de pH distantes do pI pode-se ter

solubilidades suficientemente grandes para que a validade da lei de Henry ndash adotada

na formulaccedilatildeo do modelo - seja questionada pois quanto mais distante do pI maior

a solubilidade e menor a validade da lei de Henry jaacute que haacute um aumento da

concentraccedilatildeo do soluto (proteiacutena) na soluccedilatildeo e tambeacutem ao fato do modelo prever

solubilidade infinita quando a fraccedilatildeo de moleacuteculas eletricamente neutras tende a

zero

limrarr푠 = lim

rarr

Φ(푝퐼)푠 (푝퐼)Φ(푝퐻) = +infin

(711 ndash 1)

00

50

100

150

200

250

300

350

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

34 7 Aplicaccedilatildeo dos Modelos Expostos

Todavia ainda haacute um fator de ordem natural que justifica o desvio apresentado para

valores de pH distantes do pI o desnovelamento da cadeia proteacuteica Este fenocircmeno

pode ocorrer de maneira a expor grupos hidroacutefobos resiacuteduos antes natildeo expostos

acrescentando relaccedilotildees de equiliacutebrio quiacutemico natildeo existentes na regiatildeo do pI

alterando o equiliacutebrio de fases e portanto alterando o valor da solubilidade

A Tabela 711 apresenta os valores obtidos para a funccedilatildeo objetivo definida em (7 ndash

1) tanto para o modelo proposto quanto para a abordagem claacutessica para trecircs

diferentes temperaturas

Tabela 711 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada

abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para insulina

suiacutena

T ordmC Abordagem FO

25 P 01857 C 02535

15 P 01981 C 05056

5 P 03595 C 03064

Observando-se a Tabela 711 vecirc-se que o modelo apresentou melhores resultados

do que o caacutelculo efetuado atraveacutes da abordagem claacutessica no que tange a

minimizaccedilatildeo da funccedilatildeo objetivo exceto para os dados a 5 ordmC

Tambeacutem eacute possiacutevel observar que a funccedilatildeo objetivo sofreu aumento com a

diminuiccedilatildeo da temperatura Isto ocorreu principalmente devido agrave dificuldade de

obter dados experimentais de solubilidade a temperaturas baixas o que aumenta o

desvio experimental fazendo com que se tenha um aumento do valor da funccedilatildeo

objetivo como a definida em (5 ndash 1) Um efeito secundaacuterio que tambeacutem pressiona a

35 7 Aplicaccedilatildeo dos Modelos Expostos

funccedilatildeo objetivo eacute o fato dos dados de pKA terem sido obtidos a uma temperatura

especiacutefica o que tende a acrescentar erro no caacutelculo de solubilidades a temperaturas

diferentes ainda que o pKA natildeo varie de forma ab-rupta com a temperatura

Outra observaccedilatildeo que deve ser registrada eacute o fato da funccedilatildeo objetivo para a

abordagem claacutessica na temperatura de 15 ordmC divergir a um valor tatildeo elevado em

relaccedilatildeo aos demais Isto se deve a um ponto experimental especiacutefico a um pH de

45 a solubilidade da insulina suiacutena obtida experimentalmente eacute 230 x 10-5 mol kg-1

enquanto a calculada pelo modelo proposto eacute 230 x 10-5 mol kg-1 e a calculada pela

abordagem claacutessica eacute 520 x 10-5 mol kg-1 Por conta do desvio deste ponto a funccedilatildeo

objetivo para a abordagem claacutessica nesta temperatura tem um aumento significativo

A Tabela 712 apresenta os valores do paracircmetro K da soluccedilatildeo paraboacutelica obtidos

neste trabalho para a insulina suiacutena comparados ao encontrado na literatura

Tabela 712 ndash Valores do paracircmetro K da soluccedilatildeo paraboacutelica para a insulina suiacutena

Referecircncias T ordmC K Fredericq e Neurath (1950) - 081 Neste trabalho 25 104 Neste trabalho 15 101 Neste trabalho 5 145

Pela Tabela 712 pode-se observar que haacute uma diferenccedila pequena entre os

valores do paracircmetro K obtidos neste trabalho e por Fredericq e Neurath (1950) Por

isso natildeo se pode afirmar a que se deve esta diferenccedila se eacute devido a diferenccedilas entre

procedimentos experimentais ou se eacute devido agrave diferenccedila de meacutetodo de caacutelculo do

paracircmetro Apesar de no experimento realizado por Fredericq e Neurath (1950)

haver a presenccedila do acircnion tiocianato e este acircnion interagir com grupos ionizaacuteveis

da cadeia proteacuteica como observado pelos autores do trabalho tambeacutem estes

36 7 Aplicaccedilatildeo dos Modelos Expostos

proacuteprios autores afirmam que a presenccedila deste acircnion natildeo altera a forma da curva

que eacute basicamente determinada pelo paracircmetro K De qualquer modo eacute interessante

observar a proximidade dos valores encontrados neste trabalho com o obtido por

Fredericq e Neurath (1950) pelo menos no que diz respeito agrave ordem de grandeza do

paracircmetro em questatildeo

72 Solubilidade da Lisozima de clara de ovo de galinha

Um modelo para ser validado necessita correlacionar dados experimentais de modo

satisfatoacuterio ou seja um modelo deve buscar fidelidade ao fenocircmeno fiacutesico

observado Assim na procura de dados de solubilidade de proteiacutenas poucos dados

na regiatildeo do pI foram encontrados Este eacute o caso da lisozima de clara de ovo de

galinha que apesar de ter muitos estudos de solubilidade nenhum deles se

encontra na regiatildeo do pI Surgiu assim a necessidade de se obter estes dados

experimentais para poder validar o modelo proposto A escolha da lisozima de clara

de ovo de galinha se deu em parte pela sua importacircncia mas tambeacutem em parte por

ter os valores de pKA conhecidos

A curva de solubilidade da lisozima de clara de ovo de galinha levantada neste

trabalho estaacute apresentada na Figura 721

37 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em

soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e

dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()

Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento

esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH

isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de

soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se

comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto

isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da

soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos

ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente

neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a

solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e

00

10

20

30

40

50

60

70

80

90

100

95 100 105 110 115 120

Solu

bilid

ade

(mg

mL)

pH

38 7 Aplicaccedilatildeo dos Modelos Expostos

alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado

em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo

Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo

a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo

Por conta de falta de dados a este respeito modelou-se apenas a curva de

solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura

722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de

galinha em funccedilatildeo do pH da soluccedilatildeo

Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)

00

10

20

30

40

50

60

70

80

90

96 99 102 105 108 111 114 117 120

Solu

bilid

ade

(mg

mL)

pH

39 7 Aplicaccedilatildeo dos Modelos Expostos

O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721

Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada

abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima

de clara de ovo de galinha

T ordmC Abordagem FO

25 P 4650 C gt7919a

a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado

Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta

aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a

abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca

de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos

anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao

efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de

clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a

variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A

proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de

cargas pontuais de Debye-Huumlckel

8 Conclusotildees

A modelagem termodinacircmica proposta neste trabalho apresentou expressivos

resultados quando comparada a abordagem claacutessica de Debye-Huumlckel

Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o

modelo aproximou melhor os pontos experimentais do que a referida abordagem

comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima

ao ponto isoeleacutetrico

Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica

para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua

construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo

lugar por sua aplicabilidade

Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis

da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva

em regiotildees distantes do ponto isoeleacutetrico

9 Referecircncias Bibliograacuteficas

BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene

Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects

Biophys J 95 1285-1294 2008

FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and

other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72

2684 - 26911950

GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v

93 p 517-542 1931

GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab

Carlsberg v 24 p 185-200 1941

KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native

and mutant insulins pK perturbation of B13-Glu in aggregated species Arch

Biochem Biophys v 283 p 496-502 1990

KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for

the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng

Chem Res v 35 p 4319-4327 1996

42 9 Referecircncias Bibliograacuteficas

KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen

lysozyme J Biochem v 87 p 1215-1219 1980

LADISCH M R Bioseparations Engineering principles practice and

economics John Wiley amp Sons 2001 pp1 116 ndash 117 133

LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab

Carlsberg v 15 p 1-29 1924

PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da

particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas

2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP

PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the

excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte

solutions Fluid Phase Equilib v 269 p 25ndash35 2008

PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-

contribution model involving phase and chemical equilibrium Ind Eng Chem Res

v 33 p 1341-1347 1994

PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277

1973

PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino

acids Fluid Phase Equilib v 152 p 121-132 1998

43 9 Referecircncias Bibliograacuteficas

PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular

Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999

SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of

equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte

solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009

TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J

R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with

carbon dioxide Biotech Bioeng v103 p 909-919 2009

TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer

free energy Biophys J v 95 p 2601-2609 2008

TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in

water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95

2009

Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na

cadeia proteacuteica

Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo

de ionizaccedilatildeo

퐻퐴 퐴 + 퐻

(A ndash 1)

Assim considerando que a constante de equiliacutebrio

퐾 = 푎

(A ndash 2)

Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que

퐾 =[퐴 ][퐻 ]

[퐻퐴]

(A ndash 3)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que

log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]

(A ndash 4)

Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado

por

minus log[휑] = 푝휑

(A ndash 5)

Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que

45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

푝퐾 = log[퐻퐴][퐴 ] + 푝퐻

(A ndash 6)

Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por

훼 =[퐴 ]

[퐻퐴] + [퐴 ]

(A ndash 7)

Reescrevendo (A ndash 7) tem-se que

훼 =[퐴 ] [퐻퐴frasl ]

1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =

훼1 minus 훼

(A ndash 8)

Substituindo (A ndash 8) em (A ndash 6) tem-se que

푝퐾 = log훼

1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10

(A ndash 9)

Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos

훼 =1

1 + 10

(A ndash 10)

Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio

퐴 + 퐻 퐻퐴

(A ndash 11)

Pode se escrever a constante de equiliacutebrio como

퐾 =[퐻퐴 ]

[퐴][퐻 ]

(A ndash 12)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que

46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

log퐾 = minus log[퐴]

[퐻퐴 ] minus log[퐻 ]

(A -13)

Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por

훼 =[퐻퐴 ]

[퐴] + [퐻퐴 ]

(A ndash 14)

Assim a equaccedilatildeo (A ndash 13) fica

훼1 minus 훼 = 10

(A ndash 15)

Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo

훼 =10

1 + 10

(A ndash 16)

Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos

modelos expostos

Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]

48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]

49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)

50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])

51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]

52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])

53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)

54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2

55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO

6 Identidade entre o Modelo Proposto e a Equaccedilatildeo

Estendida de Linderstroslashm-Lang e Groumlnwall

A equaccedilatildeo final da modelagem termodinacircmica proposta apresentada na seccedilatildeo 4 eacute a

equaccedilatildeo (42 ndash 8) dada por

푠 (푝퐻)푠 (푝퐼) =

1 + 101 + 10

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 1)

Aplicando-se o logaritmo decimal nos dois termos da equaccedilatildeo (6 ndash 1) tem-se que

log푠 (푝퐻)푠 (푝퐼) = log

1 + 101 + 10

+ log

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 2)

Pelo bem da simplificaccedilatildeo desta deduccedilatildeo adotar-se-atildeo as seguintes funccedilotildees

휂 (푝퐻) = log

(6 ndash 3)

휃 (푝퐻) = log

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

1 + 휈2 minus 휈 휀 10 minus

휈 minus 12 minus 휈 휀

(6 ndash 4)

Assim pode-se reescrever a equaccedilatildeo (6 ndash 2) por

29 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐼) = 휂 (푝퐻) + 휃 (푝퐻)

(6 ndash 5)

Observando-se a equaccedilatildeo (6 ndash 5) tem-se que a funccedilatildeo j independe do estado de

ionizaccedilatildeo do resiacuteduo j poreacutem a funccedilatildeo jk depende Por isso deve-se analisar esta

funccedilatildeo para cada estado de ionizaccedilatildeo possiacutevel como mostrado na Tabela 61

Tabela 6 1 ndash Anaacutelise da funccedilatildeo jk para cada estado de ionizaccedilatildeo possiacutevel

j jk jk Quantidade de resiacuteduos neste estado

-1 -1 푝퐼 minus 푝퐻 na

0 0 nb

+1 +1 0 nc

0 푝퐼 minus 푝퐻 nd

Pela anaacutelise da Tabela 61 e considerando uma proteiacutena com n resiacuteduos com

grupos ionizaacuteveis infere-se que a equaccedilatildeo (6 ndash 5) pode ser reescrita como

log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)

(6 ndash 6)

Contudo as equaccedilotildees acima descritas satildeo vaacutelidas apenas para configuraccedilotildees

neutras pois apenas as configuraccedilotildees neutras da fase liacutequida estatildeo em equiliacutebrio

com as moleacuteculas de proteiacutena da fase soacutelida Para que uma configuraccedilatildeo seja

neutra vale a seguinte restriccedilatildeo

휀 = 0 hArr 푛 = 푛

(6 ndash 7)

30 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall

Substituindo a restriccedilatildeo dada pela equaccedilatildeo (6 ndash 7) na equaccedilatildeo (6 ndash 6) tem-se que

log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)

(6 ndash 8)

Ora mas a soma de nc e de nd natildeo resulta em outra coisa senatildeo no nuacutemero de

resiacuteduos com grupos ionizaacuteveis da estrutura proteacuteica cujo j seja +1 Assim

substituindo nc mais nd por n+ e substituindo a equaccedilatildeo (6 ndash 3) na equaccedilatildeo (6 ndash 8)

tem-se que

log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log

1 + 101 + 10

(6 ndash 9)

Ao se analisar a equaccedilatildeo (6 ndash 9) observa-se que ela eacute idecircntica a equaccedilatildeo estendida

de Linderstroslashm-Lang e Groumlnwall apresentada pela equaccedilatildeo (52 ndash 19) Com isso

tem-se que apesar das distintas formulaccedilotildees tanto a modelagem termodinacircmica aqui

proposta quanto a extensatildeo a teoria de Linderstroslashm-Lang e Groumlnwall resultam na

mesma descriccedilatildeo do fenocircmeno Aleacutem disso a equaccedilatildeo final dos modelos eacute

extremamente simples e depende apenas de um ponto de referecircncia e dos dados da

estrutura da moleacutecula de proteiacutena cuja solubilidade se deseja estudar

7 Aplicaccedilatildeo dos Modelos Expostos

Para validar o modelo comparando-o com o caacutelculo feito a partir da teoria de Debye-

Huumlckel o criteacuterio que relaciona os pontos calculados pelo modelo com os pontos

experimentais foi estabelecido a partir da seguinte funccedilatildeo objetivo (FO)

퐹푂 =1푁

푠 minus 푠푠

(7 ndash 1)

Contudo a equaccedilatildeo (7 ndash 1) natildeo eacute a melhor definiccedilatildeo de funccedilatildeo objetivo neste caso

pois a derivada da curva de solubilidade eacute razoavelmente grande nos dois lados do

ponto isoeleacutetrico e isso permite que pequenos desvios na direccedilatildeo horizontal

resultem em um grande aumento no valor da funccedilatildeo objetivo Uma soluccedilatildeo possiacutevel

seria substituir essa funccedilatildeo objetivo por uma funccedilatildeo definida pela soma do quadrado

da distacircncia do ponto experimental agrave curva do modelo principalmente se fosse

necessaacuterio calcular algum paracircmetro do modelo via otimizaccedilatildeo da funccedilatildeo objetivo

estipulada Natildeo sendo este o escopo deste trabalho optou-se pelo uso da FO

definida na equaccedilatildeo (7 ndash 1)

71 Solubilidade da Insulina Suiacutena

As Figuras 711 712 e 713 apresentam os graacuteficos da curva de solubilidade

dada pelos pontos experimentais pelo modelo proposto pela abordagem claacutessica e

tambeacutem a curva obtida pela soluccedilatildeo paraboacutelica da Equaccedilatildeo de Linderstroslashm-Lang e

Groumlnwall em trecircs temperaturas distintas

32 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 711 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 25 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

Figura 712 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 15 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

00

40

80

120

160

200

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

00

50

100

150

200

250

300

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

33 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 713 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 5 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

Os desvios da curva obtida pelo modelo proposto para valores de pH distantes do pI

podem ser explicados por ao menos trecircs importantes motivos dois devidos a

hipoacuteteses do modelo e um devido a fenocircmenos intriacutensecos a proteiacutena Sabendo que

no pI a solubilidade eacute miacutenima para valores de pH distantes do pI pode-se ter

solubilidades suficientemente grandes para que a validade da lei de Henry ndash adotada

na formulaccedilatildeo do modelo - seja questionada pois quanto mais distante do pI maior

a solubilidade e menor a validade da lei de Henry jaacute que haacute um aumento da

concentraccedilatildeo do soluto (proteiacutena) na soluccedilatildeo e tambeacutem ao fato do modelo prever

solubilidade infinita quando a fraccedilatildeo de moleacuteculas eletricamente neutras tende a

zero

limrarr푠 = lim

rarr

Φ(푝퐼)푠 (푝퐼)Φ(푝퐻) = +infin

(711 ndash 1)

00

50

100

150

200

250

300

350

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

34 7 Aplicaccedilatildeo dos Modelos Expostos

Todavia ainda haacute um fator de ordem natural que justifica o desvio apresentado para

valores de pH distantes do pI o desnovelamento da cadeia proteacuteica Este fenocircmeno

pode ocorrer de maneira a expor grupos hidroacutefobos resiacuteduos antes natildeo expostos

acrescentando relaccedilotildees de equiliacutebrio quiacutemico natildeo existentes na regiatildeo do pI

alterando o equiliacutebrio de fases e portanto alterando o valor da solubilidade

A Tabela 711 apresenta os valores obtidos para a funccedilatildeo objetivo definida em (7 ndash

1) tanto para o modelo proposto quanto para a abordagem claacutessica para trecircs

diferentes temperaturas

Tabela 711 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada

abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para insulina

suiacutena

T ordmC Abordagem FO

25 P 01857 C 02535

15 P 01981 C 05056

5 P 03595 C 03064

Observando-se a Tabela 711 vecirc-se que o modelo apresentou melhores resultados

do que o caacutelculo efetuado atraveacutes da abordagem claacutessica no que tange a

minimizaccedilatildeo da funccedilatildeo objetivo exceto para os dados a 5 ordmC

Tambeacutem eacute possiacutevel observar que a funccedilatildeo objetivo sofreu aumento com a

diminuiccedilatildeo da temperatura Isto ocorreu principalmente devido agrave dificuldade de

obter dados experimentais de solubilidade a temperaturas baixas o que aumenta o

desvio experimental fazendo com que se tenha um aumento do valor da funccedilatildeo

objetivo como a definida em (5 ndash 1) Um efeito secundaacuterio que tambeacutem pressiona a

35 7 Aplicaccedilatildeo dos Modelos Expostos

funccedilatildeo objetivo eacute o fato dos dados de pKA terem sido obtidos a uma temperatura

especiacutefica o que tende a acrescentar erro no caacutelculo de solubilidades a temperaturas

diferentes ainda que o pKA natildeo varie de forma ab-rupta com a temperatura

Outra observaccedilatildeo que deve ser registrada eacute o fato da funccedilatildeo objetivo para a

abordagem claacutessica na temperatura de 15 ordmC divergir a um valor tatildeo elevado em

relaccedilatildeo aos demais Isto se deve a um ponto experimental especiacutefico a um pH de

45 a solubilidade da insulina suiacutena obtida experimentalmente eacute 230 x 10-5 mol kg-1

enquanto a calculada pelo modelo proposto eacute 230 x 10-5 mol kg-1 e a calculada pela

abordagem claacutessica eacute 520 x 10-5 mol kg-1 Por conta do desvio deste ponto a funccedilatildeo

objetivo para a abordagem claacutessica nesta temperatura tem um aumento significativo

A Tabela 712 apresenta os valores do paracircmetro K da soluccedilatildeo paraboacutelica obtidos

neste trabalho para a insulina suiacutena comparados ao encontrado na literatura

Tabela 712 ndash Valores do paracircmetro K da soluccedilatildeo paraboacutelica para a insulina suiacutena

Referecircncias T ordmC K Fredericq e Neurath (1950) - 081 Neste trabalho 25 104 Neste trabalho 15 101 Neste trabalho 5 145

Pela Tabela 712 pode-se observar que haacute uma diferenccedila pequena entre os

valores do paracircmetro K obtidos neste trabalho e por Fredericq e Neurath (1950) Por

isso natildeo se pode afirmar a que se deve esta diferenccedila se eacute devido a diferenccedilas entre

procedimentos experimentais ou se eacute devido agrave diferenccedila de meacutetodo de caacutelculo do

paracircmetro Apesar de no experimento realizado por Fredericq e Neurath (1950)

haver a presenccedila do acircnion tiocianato e este acircnion interagir com grupos ionizaacuteveis

da cadeia proteacuteica como observado pelos autores do trabalho tambeacutem estes

36 7 Aplicaccedilatildeo dos Modelos Expostos

proacuteprios autores afirmam que a presenccedila deste acircnion natildeo altera a forma da curva

que eacute basicamente determinada pelo paracircmetro K De qualquer modo eacute interessante

observar a proximidade dos valores encontrados neste trabalho com o obtido por

Fredericq e Neurath (1950) pelo menos no que diz respeito agrave ordem de grandeza do

paracircmetro em questatildeo

72 Solubilidade da Lisozima de clara de ovo de galinha

Um modelo para ser validado necessita correlacionar dados experimentais de modo

satisfatoacuterio ou seja um modelo deve buscar fidelidade ao fenocircmeno fiacutesico

observado Assim na procura de dados de solubilidade de proteiacutenas poucos dados

na regiatildeo do pI foram encontrados Este eacute o caso da lisozima de clara de ovo de

galinha que apesar de ter muitos estudos de solubilidade nenhum deles se

encontra na regiatildeo do pI Surgiu assim a necessidade de se obter estes dados

experimentais para poder validar o modelo proposto A escolha da lisozima de clara

de ovo de galinha se deu em parte pela sua importacircncia mas tambeacutem em parte por

ter os valores de pKA conhecidos

A curva de solubilidade da lisozima de clara de ovo de galinha levantada neste

trabalho estaacute apresentada na Figura 721

37 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em

soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e

dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()

Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento

esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH

isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de

soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se

comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto

isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da

soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos

ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente

neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a

solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e

00

10

20

30

40

50

60

70

80

90

100

95 100 105 110 115 120

Solu

bilid

ade

(mg

mL)

pH

38 7 Aplicaccedilatildeo dos Modelos Expostos

alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado

em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo

Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo

a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo

Por conta de falta de dados a este respeito modelou-se apenas a curva de

solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura

722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de

galinha em funccedilatildeo do pH da soluccedilatildeo

Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)

00

10

20

30

40

50

60

70

80

90

96 99 102 105 108 111 114 117 120

Solu

bilid

ade

(mg

mL)

pH

39 7 Aplicaccedilatildeo dos Modelos Expostos

O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721

Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada

abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima

de clara de ovo de galinha

T ordmC Abordagem FO

25 P 4650 C gt7919a

a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado

Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta

aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a

abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca

de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos

anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao

efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de

clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a

variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A

proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de

cargas pontuais de Debye-Huumlckel

8 Conclusotildees

A modelagem termodinacircmica proposta neste trabalho apresentou expressivos

resultados quando comparada a abordagem claacutessica de Debye-Huumlckel

Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o

modelo aproximou melhor os pontos experimentais do que a referida abordagem

comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima

ao ponto isoeleacutetrico

Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica

para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua

construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo

lugar por sua aplicabilidade

Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis

da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva

em regiotildees distantes do ponto isoeleacutetrico

9 Referecircncias Bibliograacuteficas

BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene

Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects

Biophys J 95 1285-1294 2008

FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and

other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72

2684 - 26911950

GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v

93 p 517-542 1931

GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab

Carlsberg v 24 p 185-200 1941

KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native

and mutant insulins pK perturbation of B13-Glu in aggregated species Arch

Biochem Biophys v 283 p 496-502 1990

KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for

the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng

Chem Res v 35 p 4319-4327 1996

42 9 Referecircncias Bibliograacuteficas

KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen

lysozyme J Biochem v 87 p 1215-1219 1980

LADISCH M R Bioseparations Engineering principles practice and

economics John Wiley amp Sons 2001 pp1 116 ndash 117 133

LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab

Carlsberg v 15 p 1-29 1924

PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da

particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas

2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP

PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the

excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte

solutions Fluid Phase Equilib v 269 p 25ndash35 2008

PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-

contribution model involving phase and chemical equilibrium Ind Eng Chem Res

v 33 p 1341-1347 1994

PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277

1973

PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino

acids Fluid Phase Equilib v 152 p 121-132 1998

43 9 Referecircncias Bibliograacuteficas

PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular

Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999

SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of

equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte

solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009

TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J

R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with

carbon dioxide Biotech Bioeng v103 p 909-919 2009

TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer

free energy Biophys J v 95 p 2601-2609 2008

TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in

water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95

2009

Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na

cadeia proteacuteica

Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo

de ionizaccedilatildeo

퐻퐴 퐴 + 퐻

(A ndash 1)

Assim considerando que a constante de equiliacutebrio

퐾 = 푎

(A ndash 2)

Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que

퐾 =[퐴 ][퐻 ]

[퐻퐴]

(A ndash 3)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que

log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]

(A ndash 4)

Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado

por

minus log[휑] = 푝휑

(A ndash 5)

Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que

45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

푝퐾 = log[퐻퐴][퐴 ] + 푝퐻

(A ndash 6)

Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por

훼 =[퐴 ]

[퐻퐴] + [퐴 ]

(A ndash 7)

Reescrevendo (A ndash 7) tem-se que

훼 =[퐴 ] [퐻퐴frasl ]

1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =

훼1 minus 훼

(A ndash 8)

Substituindo (A ndash 8) em (A ndash 6) tem-se que

푝퐾 = log훼

1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10

(A ndash 9)

Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos

훼 =1

1 + 10

(A ndash 10)

Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio

퐴 + 퐻 퐻퐴

(A ndash 11)

Pode se escrever a constante de equiliacutebrio como

퐾 =[퐻퐴 ]

[퐴][퐻 ]

(A ndash 12)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que

46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

log퐾 = minus log[퐴]

[퐻퐴 ] minus log[퐻 ]

(A -13)

Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por

훼 =[퐻퐴 ]

[퐴] + [퐻퐴 ]

(A ndash 14)

Assim a equaccedilatildeo (A ndash 13) fica

훼1 minus 훼 = 10

(A ndash 15)

Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo

훼 =10

1 + 10

(A ndash 16)

Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos

modelos expostos

Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]

48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]

49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)

50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])

51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]

52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])

53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)

54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2

55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO

29 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall

log푠 (푝퐻)푠 (푝퐼) = 휂 (푝퐻) + 휃 (푝퐻)

(6 ndash 5)

Observando-se a equaccedilatildeo (6 ndash 5) tem-se que a funccedilatildeo j independe do estado de

ionizaccedilatildeo do resiacuteduo j poreacutem a funccedilatildeo jk depende Por isso deve-se analisar esta

funccedilatildeo para cada estado de ionizaccedilatildeo possiacutevel como mostrado na Tabela 61

Tabela 6 1 ndash Anaacutelise da funccedilatildeo jk para cada estado de ionizaccedilatildeo possiacutevel

j jk jk Quantidade de resiacuteduos neste estado

-1 -1 푝퐼 minus 푝퐻 na

0 0 nb

+1 +1 0 nc

0 푝퐼 minus 푝퐻 nd

Pela anaacutelise da Tabela 61 e considerando uma proteiacutena com n resiacuteduos com

grupos ionizaacuteveis infere-se que a equaccedilatildeo (6 ndash 5) pode ser reescrita como

log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)

(6 ndash 6)

Contudo as equaccedilotildees acima descritas satildeo vaacutelidas apenas para configuraccedilotildees

neutras pois apenas as configuraccedilotildees neutras da fase liacutequida estatildeo em equiliacutebrio

com as moleacuteculas de proteiacutena da fase soacutelida Para que uma configuraccedilatildeo seja

neutra vale a seguinte restriccedilatildeo

휀 = 0 hArr 푛 = 푛

(6 ndash 7)

30 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall

Substituindo a restriccedilatildeo dada pela equaccedilatildeo (6 ndash 7) na equaccedilatildeo (6 ndash 6) tem-se que

log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)

(6 ndash 8)

Ora mas a soma de nc e de nd natildeo resulta em outra coisa senatildeo no nuacutemero de

resiacuteduos com grupos ionizaacuteveis da estrutura proteacuteica cujo j seja +1 Assim

substituindo nc mais nd por n+ e substituindo a equaccedilatildeo (6 ndash 3) na equaccedilatildeo (6 ndash 8)

tem-se que

log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log

1 + 101 + 10

(6 ndash 9)

Ao se analisar a equaccedilatildeo (6 ndash 9) observa-se que ela eacute idecircntica a equaccedilatildeo estendida

de Linderstroslashm-Lang e Groumlnwall apresentada pela equaccedilatildeo (52 ndash 19) Com isso

tem-se que apesar das distintas formulaccedilotildees tanto a modelagem termodinacircmica aqui

proposta quanto a extensatildeo a teoria de Linderstroslashm-Lang e Groumlnwall resultam na

mesma descriccedilatildeo do fenocircmeno Aleacutem disso a equaccedilatildeo final dos modelos eacute

extremamente simples e depende apenas de um ponto de referecircncia e dos dados da

estrutura da moleacutecula de proteiacutena cuja solubilidade se deseja estudar

7 Aplicaccedilatildeo dos Modelos Expostos

Para validar o modelo comparando-o com o caacutelculo feito a partir da teoria de Debye-

Huumlckel o criteacuterio que relaciona os pontos calculados pelo modelo com os pontos

experimentais foi estabelecido a partir da seguinte funccedilatildeo objetivo (FO)

퐹푂 =1푁

푠 minus 푠푠

(7 ndash 1)

Contudo a equaccedilatildeo (7 ndash 1) natildeo eacute a melhor definiccedilatildeo de funccedilatildeo objetivo neste caso

pois a derivada da curva de solubilidade eacute razoavelmente grande nos dois lados do

ponto isoeleacutetrico e isso permite que pequenos desvios na direccedilatildeo horizontal

resultem em um grande aumento no valor da funccedilatildeo objetivo Uma soluccedilatildeo possiacutevel

seria substituir essa funccedilatildeo objetivo por uma funccedilatildeo definida pela soma do quadrado

da distacircncia do ponto experimental agrave curva do modelo principalmente se fosse

necessaacuterio calcular algum paracircmetro do modelo via otimizaccedilatildeo da funccedilatildeo objetivo

estipulada Natildeo sendo este o escopo deste trabalho optou-se pelo uso da FO

definida na equaccedilatildeo (7 ndash 1)

71 Solubilidade da Insulina Suiacutena

As Figuras 711 712 e 713 apresentam os graacuteficos da curva de solubilidade

dada pelos pontos experimentais pelo modelo proposto pela abordagem claacutessica e

tambeacutem a curva obtida pela soluccedilatildeo paraboacutelica da Equaccedilatildeo de Linderstroslashm-Lang e

Groumlnwall em trecircs temperaturas distintas

32 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 711 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 25 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

Figura 712 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 15 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

00

40

80

120

160

200

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

00

50

100

150

200

250

300

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

33 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 713 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 5 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

Os desvios da curva obtida pelo modelo proposto para valores de pH distantes do pI

podem ser explicados por ao menos trecircs importantes motivos dois devidos a

hipoacuteteses do modelo e um devido a fenocircmenos intriacutensecos a proteiacutena Sabendo que

no pI a solubilidade eacute miacutenima para valores de pH distantes do pI pode-se ter

solubilidades suficientemente grandes para que a validade da lei de Henry ndash adotada

na formulaccedilatildeo do modelo - seja questionada pois quanto mais distante do pI maior

a solubilidade e menor a validade da lei de Henry jaacute que haacute um aumento da

concentraccedilatildeo do soluto (proteiacutena) na soluccedilatildeo e tambeacutem ao fato do modelo prever

solubilidade infinita quando a fraccedilatildeo de moleacuteculas eletricamente neutras tende a

zero

limrarr푠 = lim

rarr

Φ(푝퐼)푠 (푝퐼)Φ(푝퐻) = +infin

(711 ndash 1)

00

50

100

150

200

250

300

350

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

34 7 Aplicaccedilatildeo dos Modelos Expostos

Todavia ainda haacute um fator de ordem natural que justifica o desvio apresentado para

valores de pH distantes do pI o desnovelamento da cadeia proteacuteica Este fenocircmeno

pode ocorrer de maneira a expor grupos hidroacutefobos resiacuteduos antes natildeo expostos

acrescentando relaccedilotildees de equiliacutebrio quiacutemico natildeo existentes na regiatildeo do pI

alterando o equiliacutebrio de fases e portanto alterando o valor da solubilidade

A Tabela 711 apresenta os valores obtidos para a funccedilatildeo objetivo definida em (7 ndash

1) tanto para o modelo proposto quanto para a abordagem claacutessica para trecircs

diferentes temperaturas

Tabela 711 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada

abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para insulina

suiacutena

T ordmC Abordagem FO

25 P 01857 C 02535

15 P 01981 C 05056

5 P 03595 C 03064

Observando-se a Tabela 711 vecirc-se que o modelo apresentou melhores resultados

do que o caacutelculo efetuado atraveacutes da abordagem claacutessica no que tange a

minimizaccedilatildeo da funccedilatildeo objetivo exceto para os dados a 5 ordmC

Tambeacutem eacute possiacutevel observar que a funccedilatildeo objetivo sofreu aumento com a

diminuiccedilatildeo da temperatura Isto ocorreu principalmente devido agrave dificuldade de

obter dados experimentais de solubilidade a temperaturas baixas o que aumenta o

desvio experimental fazendo com que se tenha um aumento do valor da funccedilatildeo

objetivo como a definida em (5 ndash 1) Um efeito secundaacuterio que tambeacutem pressiona a

35 7 Aplicaccedilatildeo dos Modelos Expostos

funccedilatildeo objetivo eacute o fato dos dados de pKA terem sido obtidos a uma temperatura

especiacutefica o que tende a acrescentar erro no caacutelculo de solubilidades a temperaturas

diferentes ainda que o pKA natildeo varie de forma ab-rupta com a temperatura

Outra observaccedilatildeo que deve ser registrada eacute o fato da funccedilatildeo objetivo para a

abordagem claacutessica na temperatura de 15 ordmC divergir a um valor tatildeo elevado em

relaccedilatildeo aos demais Isto se deve a um ponto experimental especiacutefico a um pH de

45 a solubilidade da insulina suiacutena obtida experimentalmente eacute 230 x 10-5 mol kg-1

enquanto a calculada pelo modelo proposto eacute 230 x 10-5 mol kg-1 e a calculada pela

abordagem claacutessica eacute 520 x 10-5 mol kg-1 Por conta do desvio deste ponto a funccedilatildeo

objetivo para a abordagem claacutessica nesta temperatura tem um aumento significativo

A Tabela 712 apresenta os valores do paracircmetro K da soluccedilatildeo paraboacutelica obtidos

neste trabalho para a insulina suiacutena comparados ao encontrado na literatura

Tabela 712 ndash Valores do paracircmetro K da soluccedilatildeo paraboacutelica para a insulina suiacutena

Referecircncias T ordmC K Fredericq e Neurath (1950) - 081 Neste trabalho 25 104 Neste trabalho 15 101 Neste trabalho 5 145

Pela Tabela 712 pode-se observar que haacute uma diferenccedila pequena entre os

valores do paracircmetro K obtidos neste trabalho e por Fredericq e Neurath (1950) Por

isso natildeo se pode afirmar a que se deve esta diferenccedila se eacute devido a diferenccedilas entre

procedimentos experimentais ou se eacute devido agrave diferenccedila de meacutetodo de caacutelculo do

paracircmetro Apesar de no experimento realizado por Fredericq e Neurath (1950)

haver a presenccedila do acircnion tiocianato e este acircnion interagir com grupos ionizaacuteveis

da cadeia proteacuteica como observado pelos autores do trabalho tambeacutem estes

36 7 Aplicaccedilatildeo dos Modelos Expostos

proacuteprios autores afirmam que a presenccedila deste acircnion natildeo altera a forma da curva

que eacute basicamente determinada pelo paracircmetro K De qualquer modo eacute interessante

observar a proximidade dos valores encontrados neste trabalho com o obtido por

Fredericq e Neurath (1950) pelo menos no que diz respeito agrave ordem de grandeza do

paracircmetro em questatildeo

72 Solubilidade da Lisozima de clara de ovo de galinha

Um modelo para ser validado necessita correlacionar dados experimentais de modo

satisfatoacuterio ou seja um modelo deve buscar fidelidade ao fenocircmeno fiacutesico

observado Assim na procura de dados de solubilidade de proteiacutenas poucos dados

na regiatildeo do pI foram encontrados Este eacute o caso da lisozima de clara de ovo de

galinha que apesar de ter muitos estudos de solubilidade nenhum deles se

encontra na regiatildeo do pI Surgiu assim a necessidade de se obter estes dados

experimentais para poder validar o modelo proposto A escolha da lisozima de clara

de ovo de galinha se deu em parte pela sua importacircncia mas tambeacutem em parte por

ter os valores de pKA conhecidos

A curva de solubilidade da lisozima de clara de ovo de galinha levantada neste

trabalho estaacute apresentada na Figura 721

37 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em

soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e

dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()

Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento

esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH

isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de

soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se

comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto

isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da

soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos

ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente

neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a

solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e

00

10

20

30

40

50

60

70

80

90

100

95 100 105 110 115 120

Solu

bilid

ade

(mg

mL)

pH

38 7 Aplicaccedilatildeo dos Modelos Expostos

alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado

em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo

Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo

a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo

Por conta de falta de dados a este respeito modelou-se apenas a curva de

solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura

722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de

galinha em funccedilatildeo do pH da soluccedilatildeo

Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)

00

10

20

30

40

50

60

70

80

90

96 99 102 105 108 111 114 117 120

Solu

bilid

ade

(mg

mL)

pH

39 7 Aplicaccedilatildeo dos Modelos Expostos

O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721

Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada

abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima

de clara de ovo de galinha

T ordmC Abordagem FO

25 P 4650 C gt7919a

a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado

Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta

aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a

abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca

de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos

anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao

efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de

clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a

variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A

proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de

cargas pontuais de Debye-Huumlckel

8 Conclusotildees

A modelagem termodinacircmica proposta neste trabalho apresentou expressivos

resultados quando comparada a abordagem claacutessica de Debye-Huumlckel

Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o

modelo aproximou melhor os pontos experimentais do que a referida abordagem

comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima

ao ponto isoeleacutetrico

Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica

para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua

construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo

lugar por sua aplicabilidade

Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis

da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva

em regiotildees distantes do ponto isoeleacutetrico

9 Referecircncias Bibliograacuteficas

BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene

Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects

Biophys J 95 1285-1294 2008

FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and

other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72

2684 - 26911950

GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v

93 p 517-542 1931

GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab

Carlsberg v 24 p 185-200 1941

KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native

and mutant insulins pK perturbation of B13-Glu in aggregated species Arch

Biochem Biophys v 283 p 496-502 1990

KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for

the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng

Chem Res v 35 p 4319-4327 1996

42 9 Referecircncias Bibliograacuteficas

KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen

lysozyme J Biochem v 87 p 1215-1219 1980

LADISCH M R Bioseparations Engineering principles practice and

economics John Wiley amp Sons 2001 pp1 116 ndash 117 133

LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab

Carlsberg v 15 p 1-29 1924

PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da

particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas

2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP

PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the

excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte

solutions Fluid Phase Equilib v 269 p 25ndash35 2008

PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-

contribution model involving phase and chemical equilibrium Ind Eng Chem Res

v 33 p 1341-1347 1994

PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277

1973

PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino

acids Fluid Phase Equilib v 152 p 121-132 1998

43 9 Referecircncias Bibliograacuteficas

PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular

Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999

SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of

equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte

solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009

TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J

R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with

carbon dioxide Biotech Bioeng v103 p 909-919 2009

TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer

free energy Biophys J v 95 p 2601-2609 2008

TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in

water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95

2009

Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na

cadeia proteacuteica

Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo

de ionizaccedilatildeo

퐻퐴 퐴 + 퐻

(A ndash 1)

Assim considerando que a constante de equiliacutebrio

퐾 = 푎

(A ndash 2)

Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que

퐾 =[퐴 ][퐻 ]

[퐻퐴]

(A ndash 3)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que

log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]

(A ndash 4)

Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado

por

minus log[휑] = 푝휑

(A ndash 5)

Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que

45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

푝퐾 = log[퐻퐴][퐴 ] + 푝퐻

(A ndash 6)

Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por

훼 =[퐴 ]

[퐻퐴] + [퐴 ]

(A ndash 7)

Reescrevendo (A ndash 7) tem-se que

훼 =[퐴 ] [퐻퐴frasl ]

1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =

훼1 minus 훼

(A ndash 8)

Substituindo (A ndash 8) em (A ndash 6) tem-se que

푝퐾 = log훼

1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10

(A ndash 9)

Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos

훼 =1

1 + 10

(A ndash 10)

Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio

퐴 + 퐻 퐻퐴

(A ndash 11)

Pode se escrever a constante de equiliacutebrio como

퐾 =[퐻퐴 ]

[퐴][퐻 ]

(A ndash 12)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que

46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

log퐾 = minus log[퐴]

[퐻퐴 ] minus log[퐻 ]

(A -13)

Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por

훼 =[퐻퐴 ]

[퐴] + [퐻퐴 ]

(A ndash 14)

Assim a equaccedilatildeo (A ndash 13) fica

훼1 minus 훼 = 10

(A ndash 15)

Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo

훼 =10

1 + 10

(A ndash 16)

Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos

modelos expostos

Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]

48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]

49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)

50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])

51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]

52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])

53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)

54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2

55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO

30 6 Identidade entre o Modelo Proposto e a Equaccedilatildeo Estendida de Linderstroslashm-Lang e Groumlnwall

Substituindo a restriccedilatildeo dada pela equaccedilatildeo (6 ndash 7) na equaccedilatildeo (6 ndash 6) tem-se que

log푠 (푝퐻)푠 (푝퐼) = (푛 + 푛 )(푝퐼 minus 푝퐻) + 휂 (푝퐻)

(6 ndash 8)

Ora mas a soma de nc e de nd natildeo resulta em outra coisa senatildeo no nuacutemero de

resiacuteduos com grupos ionizaacuteveis da estrutura proteacuteica cujo j seja +1 Assim

substituindo nc mais nd por n+ e substituindo a equaccedilatildeo (6 ndash 3) na equaccedilatildeo (6 ndash 8)

tem-se que

log푠 (푝퐻)푠 (푝퐼) = 푛 (푝퐼 minus 푝퐻) + log

1 + 101 + 10

(6 ndash 9)

Ao se analisar a equaccedilatildeo (6 ndash 9) observa-se que ela eacute idecircntica a equaccedilatildeo estendida

de Linderstroslashm-Lang e Groumlnwall apresentada pela equaccedilatildeo (52 ndash 19) Com isso

tem-se que apesar das distintas formulaccedilotildees tanto a modelagem termodinacircmica aqui

proposta quanto a extensatildeo a teoria de Linderstroslashm-Lang e Groumlnwall resultam na

mesma descriccedilatildeo do fenocircmeno Aleacutem disso a equaccedilatildeo final dos modelos eacute

extremamente simples e depende apenas de um ponto de referecircncia e dos dados da

estrutura da moleacutecula de proteiacutena cuja solubilidade se deseja estudar

7 Aplicaccedilatildeo dos Modelos Expostos

Para validar o modelo comparando-o com o caacutelculo feito a partir da teoria de Debye-

Huumlckel o criteacuterio que relaciona os pontos calculados pelo modelo com os pontos

experimentais foi estabelecido a partir da seguinte funccedilatildeo objetivo (FO)

퐹푂 =1푁

푠 minus 푠푠

(7 ndash 1)

Contudo a equaccedilatildeo (7 ndash 1) natildeo eacute a melhor definiccedilatildeo de funccedilatildeo objetivo neste caso

pois a derivada da curva de solubilidade eacute razoavelmente grande nos dois lados do

ponto isoeleacutetrico e isso permite que pequenos desvios na direccedilatildeo horizontal

resultem em um grande aumento no valor da funccedilatildeo objetivo Uma soluccedilatildeo possiacutevel

seria substituir essa funccedilatildeo objetivo por uma funccedilatildeo definida pela soma do quadrado

da distacircncia do ponto experimental agrave curva do modelo principalmente se fosse

necessaacuterio calcular algum paracircmetro do modelo via otimizaccedilatildeo da funccedilatildeo objetivo

estipulada Natildeo sendo este o escopo deste trabalho optou-se pelo uso da FO

definida na equaccedilatildeo (7 ndash 1)

71 Solubilidade da Insulina Suiacutena

As Figuras 711 712 e 713 apresentam os graacuteficos da curva de solubilidade

dada pelos pontos experimentais pelo modelo proposto pela abordagem claacutessica e

tambeacutem a curva obtida pela soluccedilatildeo paraboacutelica da Equaccedilatildeo de Linderstroslashm-Lang e

Groumlnwall em trecircs temperaturas distintas

32 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 711 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 25 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

Figura 712 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 15 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

00

40

80

120

160

200

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

00

50

100

150

200

250

300

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

33 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 713 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 5 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

Os desvios da curva obtida pelo modelo proposto para valores de pH distantes do pI

podem ser explicados por ao menos trecircs importantes motivos dois devidos a

hipoacuteteses do modelo e um devido a fenocircmenos intriacutensecos a proteiacutena Sabendo que

no pI a solubilidade eacute miacutenima para valores de pH distantes do pI pode-se ter

solubilidades suficientemente grandes para que a validade da lei de Henry ndash adotada

na formulaccedilatildeo do modelo - seja questionada pois quanto mais distante do pI maior

a solubilidade e menor a validade da lei de Henry jaacute que haacute um aumento da

concentraccedilatildeo do soluto (proteiacutena) na soluccedilatildeo e tambeacutem ao fato do modelo prever

solubilidade infinita quando a fraccedilatildeo de moleacuteculas eletricamente neutras tende a

zero

limrarr푠 = lim

rarr

Φ(푝퐼)푠 (푝퐼)Φ(푝퐻) = +infin

(711 ndash 1)

00

50

100

150

200

250

300

350

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

34 7 Aplicaccedilatildeo dos Modelos Expostos

Todavia ainda haacute um fator de ordem natural que justifica o desvio apresentado para

valores de pH distantes do pI o desnovelamento da cadeia proteacuteica Este fenocircmeno

pode ocorrer de maneira a expor grupos hidroacutefobos resiacuteduos antes natildeo expostos

acrescentando relaccedilotildees de equiliacutebrio quiacutemico natildeo existentes na regiatildeo do pI

alterando o equiliacutebrio de fases e portanto alterando o valor da solubilidade

A Tabela 711 apresenta os valores obtidos para a funccedilatildeo objetivo definida em (7 ndash

1) tanto para o modelo proposto quanto para a abordagem claacutessica para trecircs

diferentes temperaturas

Tabela 711 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada

abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para insulina

suiacutena

T ordmC Abordagem FO

25 P 01857 C 02535

15 P 01981 C 05056

5 P 03595 C 03064

Observando-se a Tabela 711 vecirc-se que o modelo apresentou melhores resultados

do que o caacutelculo efetuado atraveacutes da abordagem claacutessica no que tange a

minimizaccedilatildeo da funccedilatildeo objetivo exceto para os dados a 5 ordmC

Tambeacutem eacute possiacutevel observar que a funccedilatildeo objetivo sofreu aumento com a

diminuiccedilatildeo da temperatura Isto ocorreu principalmente devido agrave dificuldade de

obter dados experimentais de solubilidade a temperaturas baixas o que aumenta o

desvio experimental fazendo com que se tenha um aumento do valor da funccedilatildeo

objetivo como a definida em (5 ndash 1) Um efeito secundaacuterio que tambeacutem pressiona a

35 7 Aplicaccedilatildeo dos Modelos Expostos

funccedilatildeo objetivo eacute o fato dos dados de pKA terem sido obtidos a uma temperatura

especiacutefica o que tende a acrescentar erro no caacutelculo de solubilidades a temperaturas

diferentes ainda que o pKA natildeo varie de forma ab-rupta com a temperatura

Outra observaccedilatildeo que deve ser registrada eacute o fato da funccedilatildeo objetivo para a

abordagem claacutessica na temperatura de 15 ordmC divergir a um valor tatildeo elevado em

relaccedilatildeo aos demais Isto se deve a um ponto experimental especiacutefico a um pH de

45 a solubilidade da insulina suiacutena obtida experimentalmente eacute 230 x 10-5 mol kg-1

enquanto a calculada pelo modelo proposto eacute 230 x 10-5 mol kg-1 e a calculada pela

abordagem claacutessica eacute 520 x 10-5 mol kg-1 Por conta do desvio deste ponto a funccedilatildeo

objetivo para a abordagem claacutessica nesta temperatura tem um aumento significativo

A Tabela 712 apresenta os valores do paracircmetro K da soluccedilatildeo paraboacutelica obtidos

neste trabalho para a insulina suiacutena comparados ao encontrado na literatura

Tabela 712 ndash Valores do paracircmetro K da soluccedilatildeo paraboacutelica para a insulina suiacutena

Referecircncias T ordmC K Fredericq e Neurath (1950) - 081 Neste trabalho 25 104 Neste trabalho 15 101 Neste trabalho 5 145

Pela Tabela 712 pode-se observar que haacute uma diferenccedila pequena entre os

valores do paracircmetro K obtidos neste trabalho e por Fredericq e Neurath (1950) Por

isso natildeo se pode afirmar a que se deve esta diferenccedila se eacute devido a diferenccedilas entre

procedimentos experimentais ou se eacute devido agrave diferenccedila de meacutetodo de caacutelculo do

paracircmetro Apesar de no experimento realizado por Fredericq e Neurath (1950)

haver a presenccedila do acircnion tiocianato e este acircnion interagir com grupos ionizaacuteveis

da cadeia proteacuteica como observado pelos autores do trabalho tambeacutem estes

36 7 Aplicaccedilatildeo dos Modelos Expostos

proacuteprios autores afirmam que a presenccedila deste acircnion natildeo altera a forma da curva

que eacute basicamente determinada pelo paracircmetro K De qualquer modo eacute interessante

observar a proximidade dos valores encontrados neste trabalho com o obtido por

Fredericq e Neurath (1950) pelo menos no que diz respeito agrave ordem de grandeza do

paracircmetro em questatildeo

72 Solubilidade da Lisozima de clara de ovo de galinha

Um modelo para ser validado necessita correlacionar dados experimentais de modo

satisfatoacuterio ou seja um modelo deve buscar fidelidade ao fenocircmeno fiacutesico

observado Assim na procura de dados de solubilidade de proteiacutenas poucos dados

na regiatildeo do pI foram encontrados Este eacute o caso da lisozima de clara de ovo de

galinha que apesar de ter muitos estudos de solubilidade nenhum deles se

encontra na regiatildeo do pI Surgiu assim a necessidade de se obter estes dados

experimentais para poder validar o modelo proposto A escolha da lisozima de clara

de ovo de galinha se deu em parte pela sua importacircncia mas tambeacutem em parte por

ter os valores de pKA conhecidos

A curva de solubilidade da lisozima de clara de ovo de galinha levantada neste

trabalho estaacute apresentada na Figura 721

37 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em

soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e

dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()

Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento

esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH

isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de

soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se

comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto

isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da

soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos

ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente

neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a

solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e

00

10

20

30

40

50

60

70

80

90

100

95 100 105 110 115 120

Solu

bilid

ade

(mg

mL)

pH

38 7 Aplicaccedilatildeo dos Modelos Expostos

alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado

em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo

Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo

a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo

Por conta de falta de dados a este respeito modelou-se apenas a curva de

solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura

722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de

galinha em funccedilatildeo do pH da soluccedilatildeo

Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)

00

10

20

30

40

50

60

70

80

90

96 99 102 105 108 111 114 117 120

Solu

bilid

ade

(mg

mL)

pH

39 7 Aplicaccedilatildeo dos Modelos Expostos

O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721

Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada

abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima

de clara de ovo de galinha

T ordmC Abordagem FO

25 P 4650 C gt7919a

a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado

Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta

aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a

abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca

de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos

anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao

efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de

clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a

variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A

proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de

cargas pontuais de Debye-Huumlckel

8 Conclusotildees

A modelagem termodinacircmica proposta neste trabalho apresentou expressivos

resultados quando comparada a abordagem claacutessica de Debye-Huumlckel

Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o

modelo aproximou melhor os pontos experimentais do que a referida abordagem

comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima

ao ponto isoeleacutetrico

Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica

para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua

construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo

lugar por sua aplicabilidade

Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis

da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva

em regiotildees distantes do ponto isoeleacutetrico

9 Referecircncias Bibliograacuteficas

BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene

Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects

Biophys J 95 1285-1294 2008

FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and

other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72

2684 - 26911950

GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v

93 p 517-542 1931

GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab

Carlsberg v 24 p 185-200 1941

KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native

and mutant insulins pK perturbation of B13-Glu in aggregated species Arch

Biochem Biophys v 283 p 496-502 1990

KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for

the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng

Chem Res v 35 p 4319-4327 1996

42 9 Referecircncias Bibliograacuteficas

KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen

lysozyme J Biochem v 87 p 1215-1219 1980

LADISCH M R Bioseparations Engineering principles practice and

economics John Wiley amp Sons 2001 pp1 116 ndash 117 133

LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab

Carlsberg v 15 p 1-29 1924

PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da

particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas

2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP

PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the

excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte

solutions Fluid Phase Equilib v 269 p 25ndash35 2008

PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-

contribution model involving phase and chemical equilibrium Ind Eng Chem Res

v 33 p 1341-1347 1994

PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277

1973

PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino

acids Fluid Phase Equilib v 152 p 121-132 1998

43 9 Referecircncias Bibliograacuteficas

PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular

Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999

SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of

equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte

solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009

TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J

R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with

carbon dioxide Biotech Bioeng v103 p 909-919 2009

TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer

free energy Biophys J v 95 p 2601-2609 2008

TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in

water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95

2009

Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na

cadeia proteacuteica

Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo

de ionizaccedilatildeo

퐻퐴 퐴 + 퐻

(A ndash 1)

Assim considerando que a constante de equiliacutebrio

퐾 = 푎

(A ndash 2)

Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que

퐾 =[퐴 ][퐻 ]

[퐻퐴]

(A ndash 3)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que

log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]

(A ndash 4)

Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado

por

minus log[휑] = 푝휑

(A ndash 5)

Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que

45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

푝퐾 = log[퐻퐴][퐴 ] + 푝퐻

(A ndash 6)

Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por

훼 =[퐴 ]

[퐻퐴] + [퐴 ]

(A ndash 7)

Reescrevendo (A ndash 7) tem-se que

훼 =[퐴 ] [퐻퐴frasl ]

1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =

훼1 minus 훼

(A ndash 8)

Substituindo (A ndash 8) em (A ndash 6) tem-se que

푝퐾 = log훼

1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10

(A ndash 9)

Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos

훼 =1

1 + 10

(A ndash 10)

Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio

퐴 + 퐻 퐻퐴

(A ndash 11)

Pode se escrever a constante de equiliacutebrio como

퐾 =[퐻퐴 ]

[퐴][퐻 ]

(A ndash 12)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que

46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

log퐾 = minus log[퐴]

[퐻퐴 ] minus log[퐻 ]

(A -13)

Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por

훼 =[퐻퐴 ]

[퐴] + [퐻퐴 ]

(A ndash 14)

Assim a equaccedilatildeo (A ndash 13) fica

훼1 minus 훼 = 10

(A ndash 15)

Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo

훼 =10

1 + 10

(A ndash 16)

Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos

modelos expostos

Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]

48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]

49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)

50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])

51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]

52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])

53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)

54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2

55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO

7 Aplicaccedilatildeo dos Modelos Expostos

Para validar o modelo comparando-o com o caacutelculo feito a partir da teoria de Debye-

Huumlckel o criteacuterio que relaciona os pontos calculados pelo modelo com os pontos

experimentais foi estabelecido a partir da seguinte funccedilatildeo objetivo (FO)

퐹푂 =1푁

푠 minus 푠푠

(7 ndash 1)

Contudo a equaccedilatildeo (7 ndash 1) natildeo eacute a melhor definiccedilatildeo de funccedilatildeo objetivo neste caso

pois a derivada da curva de solubilidade eacute razoavelmente grande nos dois lados do

ponto isoeleacutetrico e isso permite que pequenos desvios na direccedilatildeo horizontal

resultem em um grande aumento no valor da funccedilatildeo objetivo Uma soluccedilatildeo possiacutevel

seria substituir essa funccedilatildeo objetivo por uma funccedilatildeo definida pela soma do quadrado

da distacircncia do ponto experimental agrave curva do modelo principalmente se fosse

necessaacuterio calcular algum paracircmetro do modelo via otimizaccedilatildeo da funccedilatildeo objetivo

estipulada Natildeo sendo este o escopo deste trabalho optou-se pelo uso da FO

definida na equaccedilatildeo (7 ndash 1)

71 Solubilidade da Insulina Suiacutena

As Figuras 711 712 e 713 apresentam os graacuteficos da curva de solubilidade

dada pelos pontos experimentais pelo modelo proposto pela abordagem claacutessica e

tambeacutem a curva obtida pela soluccedilatildeo paraboacutelica da Equaccedilatildeo de Linderstroslashm-Lang e

Groumlnwall em trecircs temperaturas distintas

32 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 711 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 25 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

Figura 712 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 15 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

00

40

80

120

160

200

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

00

50

100

150

200

250

300

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

33 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 713 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 5 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

Os desvios da curva obtida pelo modelo proposto para valores de pH distantes do pI

podem ser explicados por ao menos trecircs importantes motivos dois devidos a

hipoacuteteses do modelo e um devido a fenocircmenos intriacutensecos a proteiacutena Sabendo que

no pI a solubilidade eacute miacutenima para valores de pH distantes do pI pode-se ter

solubilidades suficientemente grandes para que a validade da lei de Henry ndash adotada

na formulaccedilatildeo do modelo - seja questionada pois quanto mais distante do pI maior

a solubilidade e menor a validade da lei de Henry jaacute que haacute um aumento da

concentraccedilatildeo do soluto (proteiacutena) na soluccedilatildeo e tambeacutem ao fato do modelo prever

solubilidade infinita quando a fraccedilatildeo de moleacuteculas eletricamente neutras tende a

zero

limrarr푠 = lim

rarr

Φ(푝퐼)푠 (푝퐼)Φ(푝퐻) = +infin

(711 ndash 1)

00

50

100

150

200

250

300

350

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

34 7 Aplicaccedilatildeo dos Modelos Expostos

Todavia ainda haacute um fator de ordem natural que justifica o desvio apresentado para

valores de pH distantes do pI o desnovelamento da cadeia proteacuteica Este fenocircmeno

pode ocorrer de maneira a expor grupos hidroacutefobos resiacuteduos antes natildeo expostos

acrescentando relaccedilotildees de equiliacutebrio quiacutemico natildeo existentes na regiatildeo do pI

alterando o equiliacutebrio de fases e portanto alterando o valor da solubilidade

A Tabela 711 apresenta os valores obtidos para a funccedilatildeo objetivo definida em (7 ndash

1) tanto para o modelo proposto quanto para a abordagem claacutessica para trecircs

diferentes temperaturas

Tabela 711 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada

abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para insulina

suiacutena

T ordmC Abordagem FO

25 P 01857 C 02535

15 P 01981 C 05056

5 P 03595 C 03064

Observando-se a Tabela 711 vecirc-se que o modelo apresentou melhores resultados

do que o caacutelculo efetuado atraveacutes da abordagem claacutessica no que tange a

minimizaccedilatildeo da funccedilatildeo objetivo exceto para os dados a 5 ordmC

Tambeacutem eacute possiacutevel observar que a funccedilatildeo objetivo sofreu aumento com a

diminuiccedilatildeo da temperatura Isto ocorreu principalmente devido agrave dificuldade de

obter dados experimentais de solubilidade a temperaturas baixas o que aumenta o

desvio experimental fazendo com que se tenha um aumento do valor da funccedilatildeo

objetivo como a definida em (5 ndash 1) Um efeito secundaacuterio que tambeacutem pressiona a

35 7 Aplicaccedilatildeo dos Modelos Expostos

funccedilatildeo objetivo eacute o fato dos dados de pKA terem sido obtidos a uma temperatura

especiacutefica o que tende a acrescentar erro no caacutelculo de solubilidades a temperaturas

diferentes ainda que o pKA natildeo varie de forma ab-rupta com a temperatura

Outra observaccedilatildeo que deve ser registrada eacute o fato da funccedilatildeo objetivo para a

abordagem claacutessica na temperatura de 15 ordmC divergir a um valor tatildeo elevado em

relaccedilatildeo aos demais Isto se deve a um ponto experimental especiacutefico a um pH de

45 a solubilidade da insulina suiacutena obtida experimentalmente eacute 230 x 10-5 mol kg-1

enquanto a calculada pelo modelo proposto eacute 230 x 10-5 mol kg-1 e a calculada pela

abordagem claacutessica eacute 520 x 10-5 mol kg-1 Por conta do desvio deste ponto a funccedilatildeo

objetivo para a abordagem claacutessica nesta temperatura tem um aumento significativo

A Tabela 712 apresenta os valores do paracircmetro K da soluccedilatildeo paraboacutelica obtidos

neste trabalho para a insulina suiacutena comparados ao encontrado na literatura

Tabela 712 ndash Valores do paracircmetro K da soluccedilatildeo paraboacutelica para a insulina suiacutena

Referecircncias T ordmC K Fredericq e Neurath (1950) - 081 Neste trabalho 25 104 Neste trabalho 15 101 Neste trabalho 5 145

Pela Tabela 712 pode-se observar que haacute uma diferenccedila pequena entre os

valores do paracircmetro K obtidos neste trabalho e por Fredericq e Neurath (1950) Por

isso natildeo se pode afirmar a que se deve esta diferenccedila se eacute devido a diferenccedilas entre

procedimentos experimentais ou se eacute devido agrave diferenccedila de meacutetodo de caacutelculo do

paracircmetro Apesar de no experimento realizado por Fredericq e Neurath (1950)

haver a presenccedila do acircnion tiocianato e este acircnion interagir com grupos ionizaacuteveis

da cadeia proteacuteica como observado pelos autores do trabalho tambeacutem estes

36 7 Aplicaccedilatildeo dos Modelos Expostos

proacuteprios autores afirmam que a presenccedila deste acircnion natildeo altera a forma da curva

que eacute basicamente determinada pelo paracircmetro K De qualquer modo eacute interessante

observar a proximidade dos valores encontrados neste trabalho com o obtido por

Fredericq e Neurath (1950) pelo menos no que diz respeito agrave ordem de grandeza do

paracircmetro em questatildeo

72 Solubilidade da Lisozima de clara de ovo de galinha

Um modelo para ser validado necessita correlacionar dados experimentais de modo

satisfatoacuterio ou seja um modelo deve buscar fidelidade ao fenocircmeno fiacutesico

observado Assim na procura de dados de solubilidade de proteiacutenas poucos dados

na regiatildeo do pI foram encontrados Este eacute o caso da lisozima de clara de ovo de

galinha que apesar de ter muitos estudos de solubilidade nenhum deles se

encontra na regiatildeo do pI Surgiu assim a necessidade de se obter estes dados

experimentais para poder validar o modelo proposto A escolha da lisozima de clara

de ovo de galinha se deu em parte pela sua importacircncia mas tambeacutem em parte por

ter os valores de pKA conhecidos

A curva de solubilidade da lisozima de clara de ovo de galinha levantada neste

trabalho estaacute apresentada na Figura 721

37 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em

soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e

dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()

Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento

esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH

isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de

soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se

comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto

isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da

soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos

ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente

neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a

solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e

00

10

20

30

40

50

60

70

80

90

100

95 100 105 110 115 120

Solu

bilid

ade

(mg

mL)

pH

38 7 Aplicaccedilatildeo dos Modelos Expostos

alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado

em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo

Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo

a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo

Por conta de falta de dados a este respeito modelou-se apenas a curva de

solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura

722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de

galinha em funccedilatildeo do pH da soluccedilatildeo

Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)

00

10

20

30

40

50

60

70

80

90

96 99 102 105 108 111 114 117 120

Solu

bilid

ade

(mg

mL)

pH

39 7 Aplicaccedilatildeo dos Modelos Expostos

O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721

Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada

abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima

de clara de ovo de galinha

T ordmC Abordagem FO

25 P 4650 C gt7919a

a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado

Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta

aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a

abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca

de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos

anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao

efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de

clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a

variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A

proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de

cargas pontuais de Debye-Huumlckel

8 Conclusotildees

A modelagem termodinacircmica proposta neste trabalho apresentou expressivos

resultados quando comparada a abordagem claacutessica de Debye-Huumlckel

Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o

modelo aproximou melhor os pontos experimentais do que a referida abordagem

comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima

ao ponto isoeleacutetrico

Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica

para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua

construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo

lugar por sua aplicabilidade

Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis

da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva

em regiotildees distantes do ponto isoeleacutetrico

9 Referecircncias Bibliograacuteficas

BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene

Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects

Biophys J 95 1285-1294 2008

FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and

other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72

2684 - 26911950

GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v

93 p 517-542 1931

GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab

Carlsberg v 24 p 185-200 1941

KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native

and mutant insulins pK perturbation of B13-Glu in aggregated species Arch

Biochem Biophys v 283 p 496-502 1990

KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for

the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng

Chem Res v 35 p 4319-4327 1996

42 9 Referecircncias Bibliograacuteficas

KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen

lysozyme J Biochem v 87 p 1215-1219 1980

LADISCH M R Bioseparations Engineering principles practice and

economics John Wiley amp Sons 2001 pp1 116 ndash 117 133

LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab

Carlsberg v 15 p 1-29 1924

PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da

particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas

2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP

PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the

excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte

solutions Fluid Phase Equilib v 269 p 25ndash35 2008

PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-

contribution model involving phase and chemical equilibrium Ind Eng Chem Res

v 33 p 1341-1347 1994

PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277

1973

PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino

acids Fluid Phase Equilib v 152 p 121-132 1998

43 9 Referecircncias Bibliograacuteficas

PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular

Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999

SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of

equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte

solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009

TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J

R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with

carbon dioxide Biotech Bioeng v103 p 909-919 2009

TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer

free energy Biophys J v 95 p 2601-2609 2008

TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in

water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95

2009

Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na

cadeia proteacuteica

Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo

de ionizaccedilatildeo

퐻퐴 퐴 + 퐻

(A ndash 1)

Assim considerando que a constante de equiliacutebrio

퐾 = 푎

(A ndash 2)

Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que

퐾 =[퐴 ][퐻 ]

[퐻퐴]

(A ndash 3)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que

log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]

(A ndash 4)

Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado

por

minus log[휑] = 푝휑

(A ndash 5)

Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que

45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

푝퐾 = log[퐻퐴][퐴 ] + 푝퐻

(A ndash 6)

Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por

훼 =[퐴 ]

[퐻퐴] + [퐴 ]

(A ndash 7)

Reescrevendo (A ndash 7) tem-se que

훼 =[퐴 ] [퐻퐴frasl ]

1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =

훼1 minus 훼

(A ndash 8)

Substituindo (A ndash 8) em (A ndash 6) tem-se que

푝퐾 = log훼

1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10

(A ndash 9)

Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos

훼 =1

1 + 10

(A ndash 10)

Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio

퐴 + 퐻 퐻퐴

(A ndash 11)

Pode se escrever a constante de equiliacutebrio como

퐾 =[퐻퐴 ]

[퐴][퐻 ]

(A ndash 12)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que

46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

log퐾 = minus log[퐴]

[퐻퐴 ] minus log[퐻 ]

(A -13)

Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por

훼 =[퐻퐴 ]

[퐴] + [퐻퐴 ]

(A ndash 14)

Assim a equaccedilatildeo (A ndash 13) fica

훼1 minus 훼 = 10

(A ndash 15)

Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo

훼 =10

1 + 10

(A ndash 16)

Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos

modelos expostos

Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]

48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]

49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)

50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])

51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]

52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])

53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)

54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2

55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO

32 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 711 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 25 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

Figura 712 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 15 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

00

40

80

120

160

200

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

00

50

100

150

200

250

300

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

33 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 713 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 5 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

Os desvios da curva obtida pelo modelo proposto para valores de pH distantes do pI

podem ser explicados por ao menos trecircs importantes motivos dois devidos a

hipoacuteteses do modelo e um devido a fenocircmenos intriacutensecos a proteiacutena Sabendo que

no pI a solubilidade eacute miacutenima para valores de pH distantes do pI pode-se ter

solubilidades suficientemente grandes para que a validade da lei de Henry ndash adotada

na formulaccedilatildeo do modelo - seja questionada pois quanto mais distante do pI maior

a solubilidade e menor a validade da lei de Henry jaacute que haacute um aumento da

concentraccedilatildeo do soluto (proteiacutena) na soluccedilatildeo e tambeacutem ao fato do modelo prever

solubilidade infinita quando a fraccedilatildeo de moleacuteculas eletricamente neutras tende a

zero

limrarr푠 = lim

rarr

Φ(푝퐼)푠 (푝퐼)Φ(푝퐻) = +infin

(711 ndash 1)

00

50

100

150

200

250

300

350

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

34 7 Aplicaccedilatildeo dos Modelos Expostos

Todavia ainda haacute um fator de ordem natural que justifica o desvio apresentado para

valores de pH distantes do pI o desnovelamento da cadeia proteacuteica Este fenocircmeno

pode ocorrer de maneira a expor grupos hidroacutefobos resiacuteduos antes natildeo expostos

acrescentando relaccedilotildees de equiliacutebrio quiacutemico natildeo existentes na regiatildeo do pI

alterando o equiliacutebrio de fases e portanto alterando o valor da solubilidade

A Tabela 711 apresenta os valores obtidos para a funccedilatildeo objetivo definida em (7 ndash

1) tanto para o modelo proposto quanto para a abordagem claacutessica para trecircs

diferentes temperaturas

Tabela 711 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada

abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para insulina

suiacutena

T ordmC Abordagem FO

25 P 01857 C 02535

15 P 01981 C 05056

5 P 03595 C 03064

Observando-se a Tabela 711 vecirc-se que o modelo apresentou melhores resultados

do que o caacutelculo efetuado atraveacutes da abordagem claacutessica no que tange a

minimizaccedilatildeo da funccedilatildeo objetivo exceto para os dados a 5 ordmC

Tambeacutem eacute possiacutevel observar que a funccedilatildeo objetivo sofreu aumento com a

diminuiccedilatildeo da temperatura Isto ocorreu principalmente devido agrave dificuldade de

obter dados experimentais de solubilidade a temperaturas baixas o que aumenta o

desvio experimental fazendo com que se tenha um aumento do valor da funccedilatildeo

objetivo como a definida em (5 ndash 1) Um efeito secundaacuterio que tambeacutem pressiona a

35 7 Aplicaccedilatildeo dos Modelos Expostos

funccedilatildeo objetivo eacute o fato dos dados de pKA terem sido obtidos a uma temperatura

especiacutefica o que tende a acrescentar erro no caacutelculo de solubilidades a temperaturas

diferentes ainda que o pKA natildeo varie de forma ab-rupta com a temperatura

Outra observaccedilatildeo que deve ser registrada eacute o fato da funccedilatildeo objetivo para a

abordagem claacutessica na temperatura de 15 ordmC divergir a um valor tatildeo elevado em

relaccedilatildeo aos demais Isto se deve a um ponto experimental especiacutefico a um pH de

45 a solubilidade da insulina suiacutena obtida experimentalmente eacute 230 x 10-5 mol kg-1

enquanto a calculada pelo modelo proposto eacute 230 x 10-5 mol kg-1 e a calculada pela

abordagem claacutessica eacute 520 x 10-5 mol kg-1 Por conta do desvio deste ponto a funccedilatildeo

objetivo para a abordagem claacutessica nesta temperatura tem um aumento significativo

A Tabela 712 apresenta os valores do paracircmetro K da soluccedilatildeo paraboacutelica obtidos

neste trabalho para a insulina suiacutena comparados ao encontrado na literatura

Tabela 712 ndash Valores do paracircmetro K da soluccedilatildeo paraboacutelica para a insulina suiacutena

Referecircncias T ordmC K Fredericq e Neurath (1950) - 081 Neste trabalho 25 104 Neste trabalho 15 101 Neste trabalho 5 145

Pela Tabela 712 pode-se observar que haacute uma diferenccedila pequena entre os

valores do paracircmetro K obtidos neste trabalho e por Fredericq e Neurath (1950) Por

isso natildeo se pode afirmar a que se deve esta diferenccedila se eacute devido a diferenccedilas entre

procedimentos experimentais ou se eacute devido agrave diferenccedila de meacutetodo de caacutelculo do

paracircmetro Apesar de no experimento realizado por Fredericq e Neurath (1950)

haver a presenccedila do acircnion tiocianato e este acircnion interagir com grupos ionizaacuteveis

da cadeia proteacuteica como observado pelos autores do trabalho tambeacutem estes

36 7 Aplicaccedilatildeo dos Modelos Expostos

proacuteprios autores afirmam que a presenccedila deste acircnion natildeo altera a forma da curva

que eacute basicamente determinada pelo paracircmetro K De qualquer modo eacute interessante

observar a proximidade dos valores encontrados neste trabalho com o obtido por

Fredericq e Neurath (1950) pelo menos no que diz respeito agrave ordem de grandeza do

paracircmetro em questatildeo

72 Solubilidade da Lisozima de clara de ovo de galinha

Um modelo para ser validado necessita correlacionar dados experimentais de modo

satisfatoacuterio ou seja um modelo deve buscar fidelidade ao fenocircmeno fiacutesico

observado Assim na procura de dados de solubilidade de proteiacutenas poucos dados

na regiatildeo do pI foram encontrados Este eacute o caso da lisozima de clara de ovo de

galinha que apesar de ter muitos estudos de solubilidade nenhum deles se

encontra na regiatildeo do pI Surgiu assim a necessidade de se obter estes dados

experimentais para poder validar o modelo proposto A escolha da lisozima de clara

de ovo de galinha se deu em parte pela sua importacircncia mas tambeacutem em parte por

ter os valores de pKA conhecidos

A curva de solubilidade da lisozima de clara de ovo de galinha levantada neste

trabalho estaacute apresentada na Figura 721

37 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em

soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e

dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()

Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento

esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH

isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de

soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se

comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto

isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da

soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos

ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente

neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a

solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e

00

10

20

30

40

50

60

70

80

90

100

95 100 105 110 115 120

Solu

bilid

ade

(mg

mL)

pH

38 7 Aplicaccedilatildeo dos Modelos Expostos

alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado

em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo

Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo

a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo

Por conta de falta de dados a este respeito modelou-se apenas a curva de

solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura

722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de

galinha em funccedilatildeo do pH da soluccedilatildeo

Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)

00

10

20

30

40

50

60

70

80

90

96 99 102 105 108 111 114 117 120

Solu

bilid

ade

(mg

mL)

pH

39 7 Aplicaccedilatildeo dos Modelos Expostos

O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721

Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada

abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima

de clara de ovo de galinha

T ordmC Abordagem FO

25 P 4650 C gt7919a

a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado

Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta

aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a

abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca

de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos

anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao

efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de

clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a

variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A

proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de

cargas pontuais de Debye-Huumlckel

8 Conclusotildees

A modelagem termodinacircmica proposta neste trabalho apresentou expressivos

resultados quando comparada a abordagem claacutessica de Debye-Huumlckel

Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o

modelo aproximou melhor os pontos experimentais do que a referida abordagem

comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima

ao ponto isoeleacutetrico

Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica

para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua

construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo

lugar por sua aplicabilidade

Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis

da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva

em regiotildees distantes do ponto isoeleacutetrico

9 Referecircncias Bibliograacuteficas

BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene

Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects

Biophys J 95 1285-1294 2008

FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and

other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72

2684 - 26911950

GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v

93 p 517-542 1931

GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab

Carlsberg v 24 p 185-200 1941

KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native

and mutant insulins pK perturbation of B13-Glu in aggregated species Arch

Biochem Biophys v 283 p 496-502 1990

KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for

the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng

Chem Res v 35 p 4319-4327 1996

42 9 Referecircncias Bibliograacuteficas

KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen

lysozyme J Biochem v 87 p 1215-1219 1980

LADISCH M R Bioseparations Engineering principles practice and

economics John Wiley amp Sons 2001 pp1 116 ndash 117 133

LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab

Carlsberg v 15 p 1-29 1924

PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da

particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas

2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP

PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the

excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte

solutions Fluid Phase Equilib v 269 p 25ndash35 2008

PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-

contribution model involving phase and chemical equilibrium Ind Eng Chem Res

v 33 p 1341-1347 1994

PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277

1973

PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino

acids Fluid Phase Equilib v 152 p 121-132 1998

43 9 Referecircncias Bibliograacuteficas

PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular

Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999

SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of

equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte

solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009

TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J

R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with

carbon dioxide Biotech Bioeng v103 p 909-919 2009

TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer

free energy Biophys J v 95 p 2601-2609 2008

TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in

water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95

2009

Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na

cadeia proteacuteica

Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo

de ionizaccedilatildeo

퐻퐴 퐴 + 퐻

(A ndash 1)

Assim considerando que a constante de equiliacutebrio

퐾 = 푎

(A ndash 2)

Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que

퐾 =[퐴 ][퐻 ]

[퐻퐴]

(A ndash 3)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que

log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]

(A ndash 4)

Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado

por

minus log[휑] = 푝휑

(A ndash 5)

Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que

45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

푝퐾 = log[퐻퐴][퐴 ] + 푝퐻

(A ndash 6)

Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por

훼 =[퐴 ]

[퐻퐴] + [퐴 ]

(A ndash 7)

Reescrevendo (A ndash 7) tem-se que

훼 =[퐴 ] [퐻퐴frasl ]

1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =

훼1 minus 훼

(A ndash 8)

Substituindo (A ndash 8) em (A ndash 6) tem-se que

푝퐾 = log훼

1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10

(A ndash 9)

Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos

훼 =1

1 + 10

(A ndash 10)

Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio

퐴 + 퐻 퐻퐴

(A ndash 11)

Pode se escrever a constante de equiliacutebrio como

퐾 =[퐻퐴 ]

[퐴][퐻 ]

(A ndash 12)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que

46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

log퐾 = minus log[퐴]

[퐻퐴 ] minus log[퐻 ]

(A -13)

Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por

훼 =[퐻퐴 ]

[퐴] + [퐻퐴 ]

(A ndash 14)

Assim a equaccedilatildeo (A ndash 13) fica

훼1 minus 훼 = 10

(A ndash 15)

Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo

훼 =10

1 + 10

(A ndash 16)

Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos

modelos expostos

Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]

48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]

49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)

50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])

51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]

52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])

53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)

54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2

55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO

33 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 713 - Solubilidade da insulina suiacutena em meio aquoso em funccedilatildeo do pH a 5 ordmC Dados experimentais () Tashima et al 2009 modelo proposto (linha contiacutenua) abordagem claacutessica (linha descontiacutenua) e soluccedilatildeo paraboacutelica (linha semi-contiacutenua)

Os desvios da curva obtida pelo modelo proposto para valores de pH distantes do pI

podem ser explicados por ao menos trecircs importantes motivos dois devidos a

hipoacuteteses do modelo e um devido a fenocircmenos intriacutensecos a proteiacutena Sabendo que

no pI a solubilidade eacute miacutenima para valores de pH distantes do pI pode-se ter

solubilidades suficientemente grandes para que a validade da lei de Henry ndash adotada

na formulaccedilatildeo do modelo - seja questionada pois quanto mais distante do pI maior

a solubilidade e menor a validade da lei de Henry jaacute que haacute um aumento da

concentraccedilatildeo do soluto (proteiacutena) na soluccedilatildeo e tambeacutem ao fato do modelo prever

solubilidade infinita quando a fraccedilatildeo de moleacuteculas eletricamente neutras tende a

zero

limrarr푠 = lim

rarr

Φ(푝퐼)푠 (푝퐼)Φ(푝퐻) = +infin

(711 ndash 1)

00

50

100

150

200

250

300

350

40 43 45 48 50 53 55 58 60

Solu

bilid

ade

(10-5

mol

kg-1

)

pH

34 7 Aplicaccedilatildeo dos Modelos Expostos

Todavia ainda haacute um fator de ordem natural que justifica o desvio apresentado para

valores de pH distantes do pI o desnovelamento da cadeia proteacuteica Este fenocircmeno

pode ocorrer de maneira a expor grupos hidroacutefobos resiacuteduos antes natildeo expostos

acrescentando relaccedilotildees de equiliacutebrio quiacutemico natildeo existentes na regiatildeo do pI

alterando o equiliacutebrio de fases e portanto alterando o valor da solubilidade

A Tabela 711 apresenta os valores obtidos para a funccedilatildeo objetivo definida em (7 ndash

1) tanto para o modelo proposto quanto para a abordagem claacutessica para trecircs

diferentes temperaturas

Tabela 711 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada

abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para insulina

suiacutena

T ordmC Abordagem FO

25 P 01857 C 02535

15 P 01981 C 05056

5 P 03595 C 03064

Observando-se a Tabela 711 vecirc-se que o modelo apresentou melhores resultados

do que o caacutelculo efetuado atraveacutes da abordagem claacutessica no que tange a

minimizaccedilatildeo da funccedilatildeo objetivo exceto para os dados a 5 ordmC

Tambeacutem eacute possiacutevel observar que a funccedilatildeo objetivo sofreu aumento com a

diminuiccedilatildeo da temperatura Isto ocorreu principalmente devido agrave dificuldade de

obter dados experimentais de solubilidade a temperaturas baixas o que aumenta o

desvio experimental fazendo com que se tenha um aumento do valor da funccedilatildeo

objetivo como a definida em (5 ndash 1) Um efeito secundaacuterio que tambeacutem pressiona a

35 7 Aplicaccedilatildeo dos Modelos Expostos

funccedilatildeo objetivo eacute o fato dos dados de pKA terem sido obtidos a uma temperatura

especiacutefica o que tende a acrescentar erro no caacutelculo de solubilidades a temperaturas

diferentes ainda que o pKA natildeo varie de forma ab-rupta com a temperatura

Outra observaccedilatildeo que deve ser registrada eacute o fato da funccedilatildeo objetivo para a

abordagem claacutessica na temperatura de 15 ordmC divergir a um valor tatildeo elevado em

relaccedilatildeo aos demais Isto se deve a um ponto experimental especiacutefico a um pH de

45 a solubilidade da insulina suiacutena obtida experimentalmente eacute 230 x 10-5 mol kg-1

enquanto a calculada pelo modelo proposto eacute 230 x 10-5 mol kg-1 e a calculada pela

abordagem claacutessica eacute 520 x 10-5 mol kg-1 Por conta do desvio deste ponto a funccedilatildeo

objetivo para a abordagem claacutessica nesta temperatura tem um aumento significativo

A Tabela 712 apresenta os valores do paracircmetro K da soluccedilatildeo paraboacutelica obtidos

neste trabalho para a insulina suiacutena comparados ao encontrado na literatura

Tabela 712 ndash Valores do paracircmetro K da soluccedilatildeo paraboacutelica para a insulina suiacutena

Referecircncias T ordmC K Fredericq e Neurath (1950) - 081 Neste trabalho 25 104 Neste trabalho 15 101 Neste trabalho 5 145

Pela Tabela 712 pode-se observar que haacute uma diferenccedila pequena entre os

valores do paracircmetro K obtidos neste trabalho e por Fredericq e Neurath (1950) Por

isso natildeo se pode afirmar a que se deve esta diferenccedila se eacute devido a diferenccedilas entre

procedimentos experimentais ou se eacute devido agrave diferenccedila de meacutetodo de caacutelculo do

paracircmetro Apesar de no experimento realizado por Fredericq e Neurath (1950)

haver a presenccedila do acircnion tiocianato e este acircnion interagir com grupos ionizaacuteveis

da cadeia proteacuteica como observado pelos autores do trabalho tambeacutem estes

36 7 Aplicaccedilatildeo dos Modelos Expostos

proacuteprios autores afirmam que a presenccedila deste acircnion natildeo altera a forma da curva

que eacute basicamente determinada pelo paracircmetro K De qualquer modo eacute interessante

observar a proximidade dos valores encontrados neste trabalho com o obtido por

Fredericq e Neurath (1950) pelo menos no que diz respeito agrave ordem de grandeza do

paracircmetro em questatildeo

72 Solubilidade da Lisozima de clara de ovo de galinha

Um modelo para ser validado necessita correlacionar dados experimentais de modo

satisfatoacuterio ou seja um modelo deve buscar fidelidade ao fenocircmeno fiacutesico

observado Assim na procura de dados de solubilidade de proteiacutenas poucos dados

na regiatildeo do pI foram encontrados Este eacute o caso da lisozima de clara de ovo de

galinha que apesar de ter muitos estudos de solubilidade nenhum deles se

encontra na regiatildeo do pI Surgiu assim a necessidade de se obter estes dados

experimentais para poder validar o modelo proposto A escolha da lisozima de clara

de ovo de galinha se deu em parte pela sua importacircncia mas tambeacutem em parte por

ter os valores de pKA conhecidos

A curva de solubilidade da lisozima de clara de ovo de galinha levantada neste

trabalho estaacute apresentada na Figura 721

37 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em

soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e

dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()

Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento

esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH

isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de

soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se

comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto

isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da

soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos

ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente

neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a

solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e

00

10

20

30

40

50

60

70

80

90

100

95 100 105 110 115 120

Solu

bilid

ade

(mg

mL)

pH

38 7 Aplicaccedilatildeo dos Modelos Expostos

alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado

em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo

Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo

a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo

Por conta de falta de dados a este respeito modelou-se apenas a curva de

solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura

722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de

galinha em funccedilatildeo do pH da soluccedilatildeo

Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)

00

10

20

30

40

50

60

70

80

90

96 99 102 105 108 111 114 117 120

Solu

bilid

ade

(mg

mL)

pH

39 7 Aplicaccedilatildeo dos Modelos Expostos

O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721

Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada

abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima

de clara de ovo de galinha

T ordmC Abordagem FO

25 P 4650 C gt7919a

a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado

Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta

aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a

abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca

de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos

anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao

efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de

clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a

variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A

proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de

cargas pontuais de Debye-Huumlckel

8 Conclusotildees

A modelagem termodinacircmica proposta neste trabalho apresentou expressivos

resultados quando comparada a abordagem claacutessica de Debye-Huumlckel

Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o

modelo aproximou melhor os pontos experimentais do que a referida abordagem

comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima

ao ponto isoeleacutetrico

Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica

para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua

construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo

lugar por sua aplicabilidade

Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis

da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva

em regiotildees distantes do ponto isoeleacutetrico

9 Referecircncias Bibliograacuteficas

BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene

Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects

Biophys J 95 1285-1294 2008

FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and

other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72

2684 - 26911950

GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v

93 p 517-542 1931

GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab

Carlsberg v 24 p 185-200 1941

KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native

and mutant insulins pK perturbation of B13-Glu in aggregated species Arch

Biochem Biophys v 283 p 496-502 1990

KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for

the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng

Chem Res v 35 p 4319-4327 1996

42 9 Referecircncias Bibliograacuteficas

KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen

lysozyme J Biochem v 87 p 1215-1219 1980

LADISCH M R Bioseparations Engineering principles practice and

economics John Wiley amp Sons 2001 pp1 116 ndash 117 133

LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab

Carlsberg v 15 p 1-29 1924

PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da

particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas

2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP

PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the

excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte

solutions Fluid Phase Equilib v 269 p 25ndash35 2008

PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-

contribution model involving phase and chemical equilibrium Ind Eng Chem Res

v 33 p 1341-1347 1994

PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277

1973

PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino

acids Fluid Phase Equilib v 152 p 121-132 1998

43 9 Referecircncias Bibliograacuteficas

PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular

Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999

SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of

equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte

solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009

TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J

R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with

carbon dioxide Biotech Bioeng v103 p 909-919 2009

TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer

free energy Biophys J v 95 p 2601-2609 2008

TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in

water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95

2009

Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na

cadeia proteacuteica

Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo

de ionizaccedilatildeo

퐻퐴 퐴 + 퐻

(A ndash 1)

Assim considerando que a constante de equiliacutebrio

퐾 = 푎

(A ndash 2)

Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que

퐾 =[퐴 ][퐻 ]

[퐻퐴]

(A ndash 3)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que

log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]

(A ndash 4)

Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado

por

minus log[휑] = 푝휑

(A ndash 5)

Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que

45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

푝퐾 = log[퐻퐴][퐴 ] + 푝퐻

(A ndash 6)

Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por

훼 =[퐴 ]

[퐻퐴] + [퐴 ]

(A ndash 7)

Reescrevendo (A ndash 7) tem-se que

훼 =[퐴 ] [퐻퐴frasl ]

1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =

훼1 minus 훼

(A ndash 8)

Substituindo (A ndash 8) em (A ndash 6) tem-se que

푝퐾 = log훼

1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10

(A ndash 9)

Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos

훼 =1

1 + 10

(A ndash 10)

Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio

퐴 + 퐻 퐻퐴

(A ndash 11)

Pode se escrever a constante de equiliacutebrio como

퐾 =[퐻퐴 ]

[퐴][퐻 ]

(A ndash 12)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que

46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

log퐾 = minus log[퐴]

[퐻퐴 ] minus log[퐻 ]

(A -13)

Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por

훼 =[퐻퐴 ]

[퐴] + [퐻퐴 ]

(A ndash 14)

Assim a equaccedilatildeo (A ndash 13) fica

훼1 minus 훼 = 10

(A ndash 15)

Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo

훼 =10

1 + 10

(A ndash 16)

Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos

modelos expostos

Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]

48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]

49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)

50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])

51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]

52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])

53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)

54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2

55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO

34 7 Aplicaccedilatildeo dos Modelos Expostos

Todavia ainda haacute um fator de ordem natural que justifica o desvio apresentado para

valores de pH distantes do pI o desnovelamento da cadeia proteacuteica Este fenocircmeno

pode ocorrer de maneira a expor grupos hidroacutefobos resiacuteduos antes natildeo expostos

acrescentando relaccedilotildees de equiliacutebrio quiacutemico natildeo existentes na regiatildeo do pI

alterando o equiliacutebrio de fases e portanto alterando o valor da solubilidade

A Tabela 711 apresenta os valores obtidos para a funccedilatildeo objetivo definida em (7 ndash

1) tanto para o modelo proposto quanto para a abordagem claacutessica para trecircs

diferentes temperaturas

Tabela 711 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada

abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para insulina

suiacutena

T ordmC Abordagem FO

25 P 01857 C 02535

15 P 01981 C 05056

5 P 03595 C 03064

Observando-se a Tabela 711 vecirc-se que o modelo apresentou melhores resultados

do que o caacutelculo efetuado atraveacutes da abordagem claacutessica no que tange a

minimizaccedilatildeo da funccedilatildeo objetivo exceto para os dados a 5 ordmC

Tambeacutem eacute possiacutevel observar que a funccedilatildeo objetivo sofreu aumento com a

diminuiccedilatildeo da temperatura Isto ocorreu principalmente devido agrave dificuldade de

obter dados experimentais de solubilidade a temperaturas baixas o que aumenta o

desvio experimental fazendo com que se tenha um aumento do valor da funccedilatildeo

objetivo como a definida em (5 ndash 1) Um efeito secundaacuterio que tambeacutem pressiona a

35 7 Aplicaccedilatildeo dos Modelos Expostos

funccedilatildeo objetivo eacute o fato dos dados de pKA terem sido obtidos a uma temperatura

especiacutefica o que tende a acrescentar erro no caacutelculo de solubilidades a temperaturas

diferentes ainda que o pKA natildeo varie de forma ab-rupta com a temperatura

Outra observaccedilatildeo que deve ser registrada eacute o fato da funccedilatildeo objetivo para a

abordagem claacutessica na temperatura de 15 ordmC divergir a um valor tatildeo elevado em

relaccedilatildeo aos demais Isto se deve a um ponto experimental especiacutefico a um pH de

45 a solubilidade da insulina suiacutena obtida experimentalmente eacute 230 x 10-5 mol kg-1

enquanto a calculada pelo modelo proposto eacute 230 x 10-5 mol kg-1 e a calculada pela

abordagem claacutessica eacute 520 x 10-5 mol kg-1 Por conta do desvio deste ponto a funccedilatildeo

objetivo para a abordagem claacutessica nesta temperatura tem um aumento significativo

A Tabela 712 apresenta os valores do paracircmetro K da soluccedilatildeo paraboacutelica obtidos

neste trabalho para a insulina suiacutena comparados ao encontrado na literatura

Tabela 712 ndash Valores do paracircmetro K da soluccedilatildeo paraboacutelica para a insulina suiacutena

Referecircncias T ordmC K Fredericq e Neurath (1950) - 081 Neste trabalho 25 104 Neste trabalho 15 101 Neste trabalho 5 145

Pela Tabela 712 pode-se observar que haacute uma diferenccedila pequena entre os

valores do paracircmetro K obtidos neste trabalho e por Fredericq e Neurath (1950) Por

isso natildeo se pode afirmar a que se deve esta diferenccedila se eacute devido a diferenccedilas entre

procedimentos experimentais ou se eacute devido agrave diferenccedila de meacutetodo de caacutelculo do

paracircmetro Apesar de no experimento realizado por Fredericq e Neurath (1950)

haver a presenccedila do acircnion tiocianato e este acircnion interagir com grupos ionizaacuteveis

da cadeia proteacuteica como observado pelos autores do trabalho tambeacutem estes

36 7 Aplicaccedilatildeo dos Modelos Expostos

proacuteprios autores afirmam que a presenccedila deste acircnion natildeo altera a forma da curva

que eacute basicamente determinada pelo paracircmetro K De qualquer modo eacute interessante

observar a proximidade dos valores encontrados neste trabalho com o obtido por

Fredericq e Neurath (1950) pelo menos no que diz respeito agrave ordem de grandeza do

paracircmetro em questatildeo

72 Solubilidade da Lisozima de clara de ovo de galinha

Um modelo para ser validado necessita correlacionar dados experimentais de modo

satisfatoacuterio ou seja um modelo deve buscar fidelidade ao fenocircmeno fiacutesico

observado Assim na procura de dados de solubilidade de proteiacutenas poucos dados

na regiatildeo do pI foram encontrados Este eacute o caso da lisozima de clara de ovo de

galinha que apesar de ter muitos estudos de solubilidade nenhum deles se

encontra na regiatildeo do pI Surgiu assim a necessidade de se obter estes dados

experimentais para poder validar o modelo proposto A escolha da lisozima de clara

de ovo de galinha se deu em parte pela sua importacircncia mas tambeacutem em parte por

ter os valores de pKA conhecidos

A curva de solubilidade da lisozima de clara de ovo de galinha levantada neste

trabalho estaacute apresentada na Figura 721

37 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em

soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e

dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()

Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento

esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH

isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de

soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se

comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto

isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da

soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos

ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente

neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a

solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e

00

10

20

30

40

50

60

70

80

90

100

95 100 105 110 115 120

Solu

bilid

ade

(mg

mL)

pH

38 7 Aplicaccedilatildeo dos Modelos Expostos

alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado

em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo

Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo

a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo

Por conta de falta de dados a este respeito modelou-se apenas a curva de

solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura

722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de

galinha em funccedilatildeo do pH da soluccedilatildeo

Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)

00

10

20

30

40

50

60

70

80

90

96 99 102 105 108 111 114 117 120

Solu

bilid

ade

(mg

mL)

pH

39 7 Aplicaccedilatildeo dos Modelos Expostos

O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721

Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada

abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima

de clara de ovo de galinha

T ordmC Abordagem FO

25 P 4650 C gt7919a

a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado

Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta

aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a

abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca

de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos

anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao

efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de

clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a

variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A

proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de

cargas pontuais de Debye-Huumlckel

8 Conclusotildees

A modelagem termodinacircmica proposta neste trabalho apresentou expressivos

resultados quando comparada a abordagem claacutessica de Debye-Huumlckel

Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o

modelo aproximou melhor os pontos experimentais do que a referida abordagem

comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima

ao ponto isoeleacutetrico

Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica

para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua

construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo

lugar por sua aplicabilidade

Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis

da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva

em regiotildees distantes do ponto isoeleacutetrico

9 Referecircncias Bibliograacuteficas

BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene

Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects

Biophys J 95 1285-1294 2008

FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and

other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72

2684 - 26911950

GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v

93 p 517-542 1931

GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab

Carlsberg v 24 p 185-200 1941

KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native

and mutant insulins pK perturbation of B13-Glu in aggregated species Arch

Biochem Biophys v 283 p 496-502 1990

KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for

the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng

Chem Res v 35 p 4319-4327 1996

42 9 Referecircncias Bibliograacuteficas

KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen

lysozyme J Biochem v 87 p 1215-1219 1980

LADISCH M R Bioseparations Engineering principles practice and

economics John Wiley amp Sons 2001 pp1 116 ndash 117 133

LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab

Carlsberg v 15 p 1-29 1924

PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da

particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas

2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP

PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the

excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte

solutions Fluid Phase Equilib v 269 p 25ndash35 2008

PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-

contribution model involving phase and chemical equilibrium Ind Eng Chem Res

v 33 p 1341-1347 1994

PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277

1973

PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino

acids Fluid Phase Equilib v 152 p 121-132 1998

43 9 Referecircncias Bibliograacuteficas

PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular

Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999

SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of

equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte

solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009

TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J

R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with

carbon dioxide Biotech Bioeng v103 p 909-919 2009

TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer

free energy Biophys J v 95 p 2601-2609 2008

TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in

water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95

2009

Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na

cadeia proteacuteica

Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo

de ionizaccedilatildeo

퐻퐴 퐴 + 퐻

(A ndash 1)

Assim considerando que a constante de equiliacutebrio

퐾 = 푎

(A ndash 2)

Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que

퐾 =[퐴 ][퐻 ]

[퐻퐴]

(A ndash 3)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que

log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]

(A ndash 4)

Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado

por

minus log[휑] = 푝휑

(A ndash 5)

Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que

45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

푝퐾 = log[퐻퐴][퐴 ] + 푝퐻

(A ndash 6)

Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por

훼 =[퐴 ]

[퐻퐴] + [퐴 ]

(A ndash 7)

Reescrevendo (A ndash 7) tem-se que

훼 =[퐴 ] [퐻퐴frasl ]

1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =

훼1 minus 훼

(A ndash 8)

Substituindo (A ndash 8) em (A ndash 6) tem-se que

푝퐾 = log훼

1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10

(A ndash 9)

Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos

훼 =1

1 + 10

(A ndash 10)

Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio

퐴 + 퐻 퐻퐴

(A ndash 11)

Pode se escrever a constante de equiliacutebrio como

퐾 =[퐻퐴 ]

[퐴][퐻 ]

(A ndash 12)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que

46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

log퐾 = minus log[퐴]

[퐻퐴 ] minus log[퐻 ]

(A -13)

Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por

훼 =[퐻퐴 ]

[퐴] + [퐻퐴 ]

(A ndash 14)

Assim a equaccedilatildeo (A ndash 13) fica

훼1 minus 훼 = 10

(A ndash 15)

Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo

훼 =10

1 + 10

(A ndash 16)

Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos

modelos expostos

Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]

48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]

49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)

50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])

51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]

52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])

53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)

54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2

55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO

35 7 Aplicaccedilatildeo dos Modelos Expostos

funccedilatildeo objetivo eacute o fato dos dados de pKA terem sido obtidos a uma temperatura

especiacutefica o que tende a acrescentar erro no caacutelculo de solubilidades a temperaturas

diferentes ainda que o pKA natildeo varie de forma ab-rupta com a temperatura

Outra observaccedilatildeo que deve ser registrada eacute o fato da funccedilatildeo objetivo para a

abordagem claacutessica na temperatura de 15 ordmC divergir a um valor tatildeo elevado em

relaccedilatildeo aos demais Isto se deve a um ponto experimental especiacutefico a um pH de

45 a solubilidade da insulina suiacutena obtida experimentalmente eacute 230 x 10-5 mol kg-1

enquanto a calculada pelo modelo proposto eacute 230 x 10-5 mol kg-1 e a calculada pela

abordagem claacutessica eacute 520 x 10-5 mol kg-1 Por conta do desvio deste ponto a funccedilatildeo

objetivo para a abordagem claacutessica nesta temperatura tem um aumento significativo

A Tabela 712 apresenta os valores do paracircmetro K da soluccedilatildeo paraboacutelica obtidos

neste trabalho para a insulina suiacutena comparados ao encontrado na literatura

Tabela 712 ndash Valores do paracircmetro K da soluccedilatildeo paraboacutelica para a insulina suiacutena

Referecircncias T ordmC K Fredericq e Neurath (1950) - 081 Neste trabalho 25 104 Neste trabalho 15 101 Neste trabalho 5 145

Pela Tabela 712 pode-se observar que haacute uma diferenccedila pequena entre os

valores do paracircmetro K obtidos neste trabalho e por Fredericq e Neurath (1950) Por

isso natildeo se pode afirmar a que se deve esta diferenccedila se eacute devido a diferenccedilas entre

procedimentos experimentais ou se eacute devido agrave diferenccedila de meacutetodo de caacutelculo do

paracircmetro Apesar de no experimento realizado por Fredericq e Neurath (1950)

haver a presenccedila do acircnion tiocianato e este acircnion interagir com grupos ionizaacuteveis

da cadeia proteacuteica como observado pelos autores do trabalho tambeacutem estes

36 7 Aplicaccedilatildeo dos Modelos Expostos

proacuteprios autores afirmam que a presenccedila deste acircnion natildeo altera a forma da curva

que eacute basicamente determinada pelo paracircmetro K De qualquer modo eacute interessante

observar a proximidade dos valores encontrados neste trabalho com o obtido por

Fredericq e Neurath (1950) pelo menos no que diz respeito agrave ordem de grandeza do

paracircmetro em questatildeo

72 Solubilidade da Lisozima de clara de ovo de galinha

Um modelo para ser validado necessita correlacionar dados experimentais de modo

satisfatoacuterio ou seja um modelo deve buscar fidelidade ao fenocircmeno fiacutesico

observado Assim na procura de dados de solubilidade de proteiacutenas poucos dados

na regiatildeo do pI foram encontrados Este eacute o caso da lisozima de clara de ovo de

galinha que apesar de ter muitos estudos de solubilidade nenhum deles se

encontra na regiatildeo do pI Surgiu assim a necessidade de se obter estes dados

experimentais para poder validar o modelo proposto A escolha da lisozima de clara

de ovo de galinha se deu em parte pela sua importacircncia mas tambeacutem em parte por

ter os valores de pKA conhecidos

A curva de solubilidade da lisozima de clara de ovo de galinha levantada neste

trabalho estaacute apresentada na Figura 721

37 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em

soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e

dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()

Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento

esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH

isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de

soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se

comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto

isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da

soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos

ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente

neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a

solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e

00

10

20

30

40

50

60

70

80

90

100

95 100 105 110 115 120

Solu

bilid

ade

(mg

mL)

pH

38 7 Aplicaccedilatildeo dos Modelos Expostos

alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado

em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo

Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo

a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo

Por conta de falta de dados a este respeito modelou-se apenas a curva de

solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura

722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de

galinha em funccedilatildeo do pH da soluccedilatildeo

Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)

00

10

20

30

40

50

60

70

80

90

96 99 102 105 108 111 114 117 120

Solu

bilid

ade

(mg

mL)

pH

39 7 Aplicaccedilatildeo dos Modelos Expostos

O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721

Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada

abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima

de clara de ovo de galinha

T ordmC Abordagem FO

25 P 4650 C gt7919a

a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado

Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta

aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a

abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca

de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos

anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao

efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de

clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a

variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A

proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de

cargas pontuais de Debye-Huumlckel

8 Conclusotildees

A modelagem termodinacircmica proposta neste trabalho apresentou expressivos

resultados quando comparada a abordagem claacutessica de Debye-Huumlckel

Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o

modelo aproximou melhor os pontos experimentais do que a referida abordagem

comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima

ao ponto isoeleacutetrico

Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica

para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua

construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo

lugar por sua aplicabilidade

Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis

da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva

em regiotildees distantes do ponto isoeleacutetrico

9 Referecircncias Bibliograacuteficas

BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene

Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects

Biophys J 95 1285-1294 2008

FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and

other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72

2684 - 26911950

GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v

93 p 517-542 1931

GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab

Carlsberg v 24 p 185-200 1941

KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native

and mutant insulins pK perturbation of B13-Glu in aggregated species Arch

Biochem Biophys v 283 p 496-502 1990

KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for

the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng

Chem Res v 35 p 4319-4327 1996

42 9 Referecircncias Bibliograacuteficas

KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen

lysozyme J Biochem v 87 p 1215-1219 1980

LADISCH M R Bioseparations Engineering principles practice and

economics John Wiley amp Sons 2001 pp1 116 ndash 117 133

LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab

Carlsberg v 15 p 1-29 1924

PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da

particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas

2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP

PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the

excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte

solutions Fluid Phase Equilib v 269 p 25ndash35 2008

PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-

contribution model involving phase and chemical equilibrium Ind Eng Chem Res

v 33 p 1341-1347 1994

PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277

1973

PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino

acids Fluid Phase Equilib v 152 p 121-132 1998

43 9 Referecircncias Bibliograacuteficas

PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular

Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999

SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of

equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte

solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009

TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J

R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with

carbon dioxide Biotech Bioeng v103 p 909-919 2009

TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer

free energy Biophys J v 95 p 2601-2609 2008

TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in

water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95

2009

Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na

cadeia proteacuteica

Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo

de ionizaccedilatildeo

퐻퐴 퐴 + 퐻

(A ndash 1)

Assim considerando que a constante de equiliacutebrio

퐾 = 푎

(A ndash 2)

Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que

퐾 =[퐴 ][퐻 ]

[퐻퐴]

(A ndash 3)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que

log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]

(A ndash 4)

Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado

por

minus log[휑] = 푝휑

(A ndash 5)

Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que

45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

푝퐾 = log[퐻퐴][퐴 ] + 푝퐻

(A ndash 6)

Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por

훼 =[퐴 ]

[퐻퐴] + [퐴 ]

(A ndash 7)

Reescrevendo (A ndash 7) tem-se que

훼 =[퐴 ] [퐻퐴frasl ]

1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =

훼1 minus 훼

(A ndash 8)

Substituindo (A ndash 8) em (A ndash 6) tem-se que

푝퐾 = log훼

1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10

(A ndash 9)

Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos

훼 =1

1 + 10

(A ndash 10)

Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio

퐴 + 퐻 퐻퐴

(A ndash 11)

Pode se escrever a constante de equiliacutebrio como

퐾 =[퐻퐴 ]

[퐴][퐻 ]

(A ndash 12)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que

46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

log퐾 = minus log[퐴]

[퐻퐴 ] minus log[퐻 ]

(A -13)

Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por

훼 =[퐻퐴 ]

[퐴] + [퐻퐴 ]

(A ndash 14)

Assim a equaccedilatildeo (A ndash 13) fica

훼1 minus 훼 = 10

(A ndash 15)

Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo

훼 =10

1 + 10

(A ndash 16)

Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos

modelos expostos

Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]

48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]

49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)

50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])

51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]

52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])

53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)

54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2

55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO

36 7 Aplicaccedilatildeo dos Modelos Expostos

proacuteprios autores afirmam que a presenccedila deste acircnion natildeo altera a forma da curva

que eacute basicamente determinada pelo paracircmetro K De qualquer modo eacute interessante

observar a proximidade dos valores encontrados neste trabalho com o obtido por

Fredericq e Neurath (1950) pelo menos no que diz respeito agrave ordem de grandeza do

paracircmetro em questatildeo

72 Solubilidade da Lisozima de clara de ovo de galinha

Um modelo para ser validado necessita correlacionar dados experimentais de modo

satisfatoacuterio ou seja um modelo deve buscar fidelidade ao fenocircmeno fiacutesico

observado Assim na procura de dados de solubilidade de proteiacutenas poucos dados

na regiatildeo do pI foram encontrados Este eacute o caso da lisozima de clara de ovo de

galinha que apesar de ter muitos estudos de solubilidade nenhum deles se

encontra na regiatildeo do pI Surgiu assim a necessidade de se obter estes dados

experimentais para poder validar o modelo proposto A escolha da lisozima de clara

de ovo de galinha se deu em parte pela sua importacircncia mas tambeacutem em parte por

ter os valores de pKA conhecidos

A curva de solubilidade da lisozima de clara de ovo de galinha levantada neste

trabalho estaacute apresentada na Figura 721

37 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em

soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e

dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()

Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento

esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH

isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de

soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se

comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto

isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da

soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos

ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente

neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a

solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e

00

10

20

30

40

50

60

70

80

90

100

95 100 105 110 115 120

Solu

bilid

ade

(mg

mL)

pH

38 7 Aplicaccedilatildeo dos Modelos Expostos

alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado

em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo

Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo

a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo

Por conta de falta de dados a este respeito modelou-se apenas a curva de

solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura

722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de

galinha em funccedilatildeo do pH da soluccedilatildeo

Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)

00

10

20

30

40

50

60

70

80

90

96 99 102 105 108 111 114 117 120

Solu

bilid

ade

(mg

mL)

pH

39 7 Aplicaccedilatildeo dos Modelos Expostos

O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721

Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada

abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima

de clara de ovo de galinha

T ordmC Abordagem FO

25 P 4650 C gt7919a

a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado

Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta

aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a

abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca

de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos

anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao

efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de

clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a

variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A

proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de

cargas pontuais de Debye-Huumlckel

8 Conclusotildees

A modelagem termodinacircmica proposta neste trabalho apresentou expressivos

resultados quando comparada a abordagem claacutessica de Debye-Huumlckel

Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o

modelo aproximou melhor os pontos experimentais do que a referida abordagem

comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima

ao ponto isoeleacutetrico

Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica

para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua

construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo

lugar por sua aplicabilidade

Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis

da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva

em regiotildees distantes do ponto isoeleacutetrico

9 Referecircncias Bibliograacuteficas

BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene

Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects

Biophys J 95 1285-1294 2008

FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and

other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72

2684 - 26911950

GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v

93 p 517-542 1931

GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab

Carlsberg v 24 p 185-200 1941

KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native

and mutant insulins pK perturbation of B13-Glu in aggregated species Arch

Biochem Biophys v 283 p 496-502 1990

KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for

the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng

Chem Res v 35 p 4319-4327 1996

42 9 Referecircncias Bibliograacuteficas

KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen

lysozyme J Biochem v 87 p 1215-1219 1980

LADISCH M R Bioseparations Engineering principles practice and

economics John Wiley amp Sons 2001 pp1 116 ndash 117 133

LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab

Carlsberg v 15 p 1-29 1924

PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da

particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas

2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP

PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the

excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte

solutions Fluid Phase Equilib v 269 p 25ndash35 2008

PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-

contribution model involving phase and chemical equilibrium Ind Eng Chem Res

v 33 p 1341-1347 1994

PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277

1973

PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino

acids Fluid Phase Equilib v 152 p 121-132 1998

43 9 Referecircncias Bibliograacuteficas

PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular

Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999

SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of

equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte

solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009

TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J

R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with

carbon dioxide Biotech Bioeng v103 p 909-919 2009

TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer

free energy Biophys J v 95 p 2601-2609 2008

TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in

water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95

2009

Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na

cadeia proteacuteica

Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo

de ionizaccedilatildeo

퐻퐴 퐴 + 퐻

(A ndash 1)

Assim considerando que a constante de equiliacutebrio

퐾 = 푎

(A ndash 2)

Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que

퐾 =[퐴 ][퐻 ]

[퐻퐴]

(A ndash 3)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que

log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]

(A ndash 4)

Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado

por

minus log[휑] = 푝휑

(A ndash 5)

Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que

45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

푝퐾 = log[퐻퐴][퐴 ] + 푝퐻

(A ndash 6)

Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por

훼 =[퐴 ]

[퐻퐴] + [퐴 ]

(A ndash 7)

Reescrevendo (A ndash 7) tem-se que

훼 =[퐴 ] [퐻퐴frasl ]

1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =

훼1 minus 훼

(A ndash 8)

Substituindo (A ndash 8) em (A ndash 6) tem-se que

푝퐾 = log훼

1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10

(A ndash 9)

Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos

훼 =1

1 + 10

(A ndash 10)

Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio

퐴 + 퐻 퐻퐴

(A ndash 11)

Pode se escrever a constante de equiliacutebrio como

퐾 =[퐻퐴 ]

[퐴][퐻 ]

(A ndash 12)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que

46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

log퐾 = minus log[퐴]

[퐻퐴 ] minus log[퐻 ]

(A -13)

Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por

훼 =[퐻퐴 ]

[퐴] + [퐻퐴 ]

(A ndash 14)

Assim a equaccedilatildeo (A ndash 13) fica

훼1 minus 훼 = 10

(A ndash 15)

Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo

훼 =10

1 + 10

(A ndash 16)

Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos

modelos expostos

Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]

48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]

49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)

50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])

51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]

52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])

53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)

54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2

55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO

37 7 Aplicaccedilatildeo dos Modelos Expostos

Figura 721 ndash Solubilidade da lisozima da clara de ovo de galinha a 29815 K e em

soluccedilatildeo 250 mmolar Dados extraiacutedos em soluccedilatildeo-tampatildeo a base de Na2HCO3 () e

dados obtidos a partir de soluccedilotildees-tampatildeo a base de Na2HPO4 ()

Pela Figura 721 eacute possiacutevel observar que a lisozima segue o comportamento

esperado para proteiacutenas atingindo o miacutenimo de solubilidade e um pH proacuteximo ao pH

isoeleacutetrico calculado (pI = 1097) para soluccedilotildees-tampatildeo a base de bicarbonato de

soacutedio No entanto para soluccedilotildees-tampatildeo a base de Na2HPO4 a lisozima se

comporta de forma anocircmala natildeo apresentando miacutenimo de solubilidade no ponto

isoeleacutetrico Dada a uacutenica diferenccedila entre os experimentos ser o acircnion do sal da

soluccedilatildeo tamponante infere-se que o iacuteon fosfato deve interagir com resiacuteduos

ionizaacuteveis da lisozima alterando sua populaccedilatildeo de configuraccedilotildees eletricamente

neutras e por consequumlecircncia as suas propriedades fiacutesico-quiacutemicas como a

solubilidade em soluccedilotildees aquosas Este fenocircmeno de interaccedilatildeo entre o iacuteon fosfato e

00

10

20

30

40

50

60

70

80

90

100

95 100 105 110 115 120

Solu

bilid

ade

(mg

mL)

pH

38 7 Aplicaccedilatildeo dos Modelos Expostos

alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado

em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo

Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo

a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo

Por conta de falta de dados a este respeito modelou-se apenas a curva de

solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura

722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de

galinha em funccedilatildeo do pH da soluccedilatildeo

Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)

00

10

20

30

40

50

60

70

80

90

96 99 102 105 108 111 114 117 120

Solu

bilid

ade

(mg

mL)

pH

39 7 Aplicaccedilatildeo dos Modelos Expostos

O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721

Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada

abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima

de clara de ovo de galinha

T ordmC Abordagem FO

25 P 4650 C gt7919a

a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado

Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta

aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a

abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca

de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos

anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao

efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de

clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a

variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A

proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de

cargas pontuais de Debye-Huumlckel

8 Conclusotildees

A modelagem termodinacircmica proposta neste trabalho apresentou expressivos

resultados quando comparada a abordagem claacutessica de Debye-Huumlckel

Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o

modelo aproximou melhor os pontos experimentais do que a referida abordagem

comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima

ao ponto isoeleacutetrico

Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica

para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua

construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo

lugar por sua aplicabilidade

Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis

da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva

em regiotildees distantes do ponto isoeleacutetrico

9 Referecircncias Bibliograacuteficas

BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene

Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects

Biophys J 95 1285-1294 2008

FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and

other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72

2684 - 26911950

GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v

93 p 517-542 1931

GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab

Carlsberg v 24 p 185-200 1941

KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native

and mutant insulins pK perturbation of B13-Glu in aggregated species Arch

Biochem Biophys v 283 p 496-502 1990

KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for

the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng

Chem Res v 35 p 4319-4327 1996

42 9 Referecircncias Bibliograacuteficas

KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen

lysozyme J Biochem v 87 p 1215-1219 1980

LADISCH M R Bioseparations Engineering principles practice and

economics John Wiley amp Sons 2001 pp1 116 ndash 117 133

LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab

Carlsberg v 15 p 1-29 1924

PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da

particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas

2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP

PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the

excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte

solutions Fluid Phase Equilib v 269 p 25ndash35 2008

PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-

contribution model involving phase and chemical equilibrium Ind Eng Chem Res

v 33 p 1341-1347 1994

PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277

1973

PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino

acids Fluid Phase Equilib v 152 p 121-132 1998

43 9 Referecircncias Bibliograacuteficas

PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular

Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999

SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of

equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte

solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009

TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J

R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with

carbon dioxide Biotech Bioeng v103 p 909-919 2009

TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer

free energy Biophys J v 95 p 2601-2609 2008

TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in

water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95

2009

Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na

cadeia proteacuteica

Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo

de ionizaccedilatildeo

퐻퐴 퐴 + 퐻

(A ndash 1)

Assim considerando que a constante de equiliacutebrio

퐾 = 푎

(A ndash 2)

Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que

퐾 =[퐴 ][퐻 ]

[퐻퐴]

(A ndash 3)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que

log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]

(A ndash 4)

Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado

por

minus log[휑] = 푝휑

(A ndash 5)

Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que

45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

푝퐾 = log[퐻퐴][퐴 ] + 푝퐻

(A ndash 6)

Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por

훼 =[퐴 ]

[퐻퐴] + [퐴 ]

(A ndash 7)

Reescrevendo (A ndash 7) tem-se que

훼 =[퐴 ] [퐻퐴frasl ]

1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =

훼1 minus 훼

(A ndash 8)

Substituindo (A ndash 8) em (A ndash 6) tem-se que

푝퐾 = log훼

1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10

(A ndash 9)

Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos

훼 =1

1 + 10

(A ndash 10)

Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio

퐴 + 퐻 퐻퐴

(A ndash 11)

Pode se escrever a constante de equiliacutebrio como

퐾 =[퐻퐴 ]

[퐴][퐻 ]

(A ndash 12)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que

46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

log퐾 = minus log[퐴]

[퐻퐴 ] minus log[퐻 ]

(A -13)

Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por

훼 =[퐻퐴 ]

[퐴] + [퐻퐴 ]

(A ndash 14)

Assim a equaccedilatildeo (A ndash 13) fica

훼1 minus 훼 = 10

(A ndash 15)

Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo

훼 =10

1 + 10

(A ndash 16)

Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos

modelos expostos

Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]

48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]

49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)

50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])

51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]

52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])

53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)

54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2

55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO

38 7 Aplicaccedilatildeo dos Modelos Expostos

alguns resiacuteduos de aminoaacutecidos dispostos em cadeias proteacuteicas tem sido observado

em algumas proteiacutenas e eacute denominado fosforizaccedilatildeo

Esta interaccedilatildeo por alterar a configuraccedilatildeo proteacuteica natildeo pode ser prevista pelo modelo

a menos que se conheccedila a constante de interaccedilatildeo fosfato-resiacuteduo

Por conta de falta de dados a este respeito modelou-se apenas a curva de

solubilidade obtida em soluccedilotildees tamponantes de bicarbonato de soacutedio A Figura

722 apresenta a prediccedilatildeo da curva de solubilidade da lisozima da clara de ovo de

galinha em funccedilatildeo do pH da soluccedilatildeo

Figura 722 ndash Curva de solubilidade de lisozima de clara de ovo de galinha em soluccedilotildees aquosas com bicarbonato de soacutedio como sal tamponante a 29815 K e 250 mmolar Dados experimentais () modelo proposto (linha contiacutenua) e abordagem claacutessica (linha descontiacutenua)

00

10

20

30

40

50

60

70

80

90

96 99 102 105 108 111 114 117 120

Solu

bilid

ade

(mg

mL)

pH

39 7 Aplicaccedilatildeo dos Modelos Expostos

O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721

Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada

abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima

de clara de ovo de galinha

T ordmC Abordagem FO

25 P 4650 C gt7919a

a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado

Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta

aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a

abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca

de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos

anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao

efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de

clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a

variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A

proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de

cargas pontuais de Debye-Huumlckel

8 Conclusotildees

A modelagem termodinacircmica proposta neste trabalho apresentou expressivos

resultados quando comparada a abordagem claacutessica de Debye-Huumlckel

Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o

modelo aproximou melhor os pontos experimentais do que a referida abordagem

comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima

ao ponto isoeleacutetrico

Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica

para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua

construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo

lugar por sua aplicabilidade

Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis

da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva

em regiotildees distantes do ponto isoeleacutetrico

9 Referecircncias Bibliograacuteficas

BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene

Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects

Biophys J 95 1285-1294 2008

FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and

other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72

2684 - 26911950

GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v

93 p 517-542 1931

GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab

Carlsberg v 24 p 185-200 1941

KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native

and mutant insulins pK perturbation of B13-Glu in aggregated species Arch

Biochem Biophys v 283 p 496-502 1990

KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for

the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng

Chem Res v 35 p 4319-4327 1996

42 9 Referecircncias Bibliograacuteficas

KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen

lysozyme J Biochem v 87 p 1215-1219 1980

LADISCH M R Bioseparations Engineering principles practice and

economics John Wiley amp Sons 2001 pp1 116 ndash 117 133

LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab

Carlsberg v 15 p 1-29 1924

PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da

particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas

2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP

PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the

excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte

solutions Fluid Phase Equilib v 269 p 25ndash35 2008

PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-

contribution model involving phase and chemical equilibrium Ind Eng Chem Res

v 33 p 1341-1347 1994

PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277

1973

PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino

acids Fluid Phase Equilib v 152 p 121-132 1998

43 9 Referecircncias Bibliograacuteficas

PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular

Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999

SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of

equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte

solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009

TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J

R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with

carbon dioxide Biotech Bioeng v103 p 909-919 2009

TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer

free energy Biophys J v 95 p 2601-2609 2008

TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in

water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95

2009

Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na

cadeia proteacuteica

Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo

de ionizaccedilatildeo

퐻퐴 퐴 + 퐻

(A ndash 1)

Assim considerando que a constante de equiliacutebrio

퐾 = 푎

(A ndash 2)

Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que

퐾 =[퐴 ][퐻 ]

[퐻퐴]

(A ndash 3)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que

log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]

(A ndash 4)

Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado

por

minus log[휑] = 푝휑

(A ndash 5)

Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que

45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

푝퐾 = log[퐻퐴][퐴 ] + 푝퐻

(A ndash 6)

Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por

훼 =[퐴 ]

[퐻퐴] + [퐴 ]

(A ndash 7)

Reescrevendo (A ndash 7) tem-se que

훼 =[퐴 ] [퐻퐴frasl ]

1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =

훼1 minus 훼

(A ndash 8)

Substituindo (A ndash 8) em (A ndash 6) tem-se que

푝퐾 = log훼

1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10

(A ndash 9)

Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos

훼 =1

1 + 10

(A ndash 10)

Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio

퐴 + 퐻 퐻퐴

(A ndash 11)

Pode se escrever a constante de equiliacutebrio como

퐾 =[퐻퐴 ]

[퐴][퐻 ]

(A ndash 12)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que

46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

log퐾 = minus log[퐴]

[퐻퐴 ] minus log[퐻 ]

(A -13)

Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por

훼 =[퐻퐴 ]

[퐴] + [퐻퐴 ]

(A ndash 14)

Assim a equaccedilatildeo (A ndash 13) fica

훼1 minus 훼 = 10

(A ndash 15)

Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo

훼 =10

1 + 10

(A ndash 16)

Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos

modelos expostos

Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]

48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]

49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)

50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])

51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]

52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])

53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)

54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2

55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO

39 7 Aplicaccedilatildeo dos Modelos Expostos

O valor da funccedilatildeo objetivo para cada modelo estaacute apresentado na Tabela 721

Tabela 721 - Comparaccedilatildeo entre os valores da Funccedilatildeo Objetivo (FO) para cada

abordagem (Proposta - P ou Claacutessica ndash C) em diferentes temperaturas para lisozima

de clara de ovo de galinha

T ordmC Abordagem FO

25 P 4650 C gt7919a

a Natildeo foi possiacutevel calcular o valor da FO para todos os pontos experimentais pois o meacutetodo numeacuterico aplicado divergiu em alguns pontos Assim sabe-se apenas um valor miacutenimo possiacutevel de ser calculado

Pela Figura 722 e pela Tabela 721 observa-se que a modelagem proposta

aproxima de forma muito mais satisfatoacuteria os dados experimentais do que a

abordagem claacutessica de Debye-Huumlckel Ainda assim a modelagem eacute restrita a cerca

de uma unidade de pH em torno do ponto isoeleacutetrico pelos motivos expressos

anteriormente Jaacute o insucesso da abordagem claacutessica se deve principalmente ao

efeito da carga Diferente de sais inorgacircnicos ou mesmo aminoaacutecidos a lisozima de

clara de ovo de galinha tem uma amplitude muito maior de variaccedilatildeo de carga com a

variaccedilatildeo de pH devido ao nuacutemero de grupos ionizaacuteveis em sua cadeia A

proximidade entre estes grupos eacute uma realidade que difere muito da hipoacutetese de

cargas pontuais de Debye-Huumlckel

8 Conclusotildees

A modelagem termodinacircmica proposta neste trabalho apresentou expressivos

resultados quando comparada a abordagem claacutessica de Debye-Huumlckel

Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o

modelo aproximou melhor os pontos experimentais do que a referida abordagem

comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima

ao ponto isoeleacutetrico

Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica

para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua

construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo

lugar por sua aplicabilidade

Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis

da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva

em regiotildees distantes do ponto isoeleacutetrico

9 Referecircncias Bibliograacuteficas

BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene

Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects

Biophys J 95 1285-1294 2008

FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and

other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72

2684 - 26911950

GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v

93 p 517-542 1931

GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab

Carlsberg v 24 p 185-200 1941

KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native

and mutant insulins pK perturbation of B13-Glu in aggregated species Arch

Biochem Biophys v 283 p 496-502 1990

KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for

the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng

Chem Res v 35 p 4319-4327 1996

42 9 Referecircncias Bibliograacuteficas

KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen

lysozyme J Biochem v 87 p 1215-1219 1980

LADISCH M R Bioseparations Engineering principles practice and

economics John Wiley amp Sons 2001 pp1 116 ndash 117 133

LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab

Carlsberg v 15 p 1-29 1924

PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da

particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas

2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP

PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the

excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte

solutions Fluid Phase Equilib v 269 p 25ndash35 2008

PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-

contribution model involving phase and chemical equilibrium Ind Eng Chem Res

v 33 p 1341-1347 1994

PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277

1973

PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino

acids Fluid Phase Equilib v 152 p 121-132 1998

43 9 Referecircncias Bibliograacuteficas

PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular

Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999

SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of

equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte

solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009

TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J

R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with

carbon dioxide Biotech Bioeng v103 p 909-919 2009

TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer

free energy Biophys J v 95 p 2601-2609 2008

TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in

water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95

2009

Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na

cadeia proteacuteica

Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo

de ionizaccedilatildeo

퐻퐴 퐴 + 퐻

(A ndash 1)

Assim considerando que a constante de equiliacutebrio

퐾 = 푎

(A ndash 2)

Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que

퐾 =[퐴 ][퐻 ]

[퐻퐴]

(A ndash 3)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que

log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]

(A ndash 4)

Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado

por

minus log[휑] = 푝휑

(A ndash 5)

Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que

45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

푝퐾 = log[퐻퐴][퐴 ] + 푝퐻

(A ndash 6)

Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por

훼 =[퐴 ]

[퐻퐴] + [퐴 ]

(A ndash 7)

Reescrevendo (A ndash 7) tem-se que

훼 =[퐴 ] [퐻퐴frasl ]

1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =

훼1 minus 훼

(A ndash 8)

Substituindo (A ndash 8) em (A ndash 6) tem-se que

푝퐾 = log훼

1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10

(A ndash 9)

Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos

훼 =1

1 + 10

(A ndash 10)

Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio

퐴 + 퐻 퐻퐴

(A ndash 11)

Pode se escrever a constante de equiliacutebrio como

퐾 =[퐻퐴 ]

[퐴][퐻 ]

(A ndash 12)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que

46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

log퐾 = minus log[퐴]

[퐻퐴 ] minus log[퐻 ]

(A -13)

Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por

훼 =[퐻퐴 ]

[퐴] + [퐻퐴 ]

(A ndash 14)

Assim a equaccedilatildeo (A ndash 13) fica

훼1 minus 훼 = 10

(A ndash 15)

Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo

훼 =10

1 + 10

(A ndash 16)

Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos

modelos expostos

Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]

48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]

49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)

50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])

51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]

52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])

53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)

54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2

55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO

8 Conclusotildees

A modelagem termodinacircmica proposta neste trabalho apresentou expressivos

resultados quando comparada a abordagem claacutessica de Debye-Huumlckel

Tanto para a insulina suiacutena quanto para a lisozima de clara de ovo de galinha o

modelo aproximou melhor os pontos experimentais do que a referida abordagem

comparativa Verificou-se que o modelo tem uma validade restrita a regiatildeo proacutexima

ao ponto isoeleacutetrico

Entretanto este modelo tem uma importacircncia iacutempar na modelagem termodinacircmica

para equiliacutebrios de fases de soluccedilotildees proteacuteicas devido em primeiro lugar a sua

construccedilatildeo baseada em fundamentos da termodinacircmica claacutessica e em segundo

lugar por sua aplicabilidade

Contudo restam questotildees a respeito do fenocircmeno da interaccedilatildeo de grupos ionizaacuteveis

da cadeia proteacuteica e iacuteons em soluccedilatildeo e tambeacutem a respeito da modelagem da curva

em regiotildees distantes do ponto isoeleacutetrico

9 Referecircncias Bibliograacuteficas

BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene

Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects

Biophys J 95 1285-1294 2008

FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and

other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72

2684 - 26911950

GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v

93 p 517-542 1931

GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab

Carlsberg v 24 p 185-200 1941

KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native

and mutant insulins pK perturbation of B13-Glu in aggregated species Arch

Biochem Biophys v 283 p 496-502 1990

KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for

the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng

Chem Res v 35 p 4319-4327 1996

42 9 Referecircncias Bibliograacuteficas

KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen

lysozyme J Biochem v 87 p 1215-1219 1980

LADISCH M R Bioseparations Engineering principles practice and

economics John Wiley amp Sons 2001 pp1 116 ndash 117 133

LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab

Carlsberg v 15 p 1-29 1924

PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da

particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas

2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP

PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the

excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte

solutions Fluid Phase Equilib v 269 p 25ndash35 2008

PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-

contribution model involving phase and chemical equilibrium Ind Eng Chem Res

v 33 p 1341-1347 1994

PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277

1973

PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino

acids Fluid Phase Equilib v 152 p 121-132 1998

43 9 Referecircncias Bibliograacuteficas

PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular

Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999

SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of

equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte

solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009

TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J

R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with

carbon dioxide Biotech Bioeng v103 p 909-919 2009

TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer

free energy Biophys J v 95 p 2601-2609 2008

TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in

water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95

2009

Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na

cadeia proteacuteica

Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo

de ionizaccedilatildeo

퐻퐴 퐴 + 퐻

(A ndash 1)

Assim considerando que a constante de equiliacutebrio

퐾 = 푎

(A ndash 2)

Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que

퐾 =[퐴 ][퐻 ]

[퐻퐴]

(A ndash 3)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que

log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]

(A ndash 4)

Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado

por

minus log[휑] = 푝휑

(A ndash 5)

Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que

45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

푝퐾 = log[퐻퐴][퐴 ] + 푝퐻

(A ndash 6)

Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por

훼 =[퐴 ]

[퐻퐴] + [퐴 ]

(A ndash 7)

Reescrevendo (A ndash 7) tem-se que

훼 =[퐴 ] [퐻퐴frasl ]

1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =

훼1 minus 훼

(A ndash 8)

Substituindo (A ndash 8) em (A ndash 6) tem-se que

푝퐾 = log훼

1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10

(A ndash 9)

Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos

훼 =1

1 + 10

(A ndash 10)

Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio

퐴 + 퐻 퐻퐴

(A ndash 11)

Pode se escrever a constante de equiliacutebrio como

퐾 =[퐻퐴 ]

[퐴][퐻 ]

(A ndash 12)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que

46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

log퐾 = minus log[퐴]

[퐻퐴 ] minus log[퐻 ]

(A -13)

Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por

훼 =[퐻퐴 ]

[퐴] + [퐻퐴 ]

(A ndash 14)

Assim a equaccedilatildeo (A ndash 13) fica

훼1 minus 훼 = 10

(A ndash 15)

Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo

훼 =10

1 + 10

(A ndash 16)

Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos

modelos expostos

Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]

48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]

49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)

50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])

51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]

52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])

53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)

54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2

55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO

9 Referecircncias Bibliograacuteficas

BONČINA M REŠČIČ J VLACHYV Solubility of Lysozime in Polyethylene

Glycol-Electrolyte Mixtures the depletion interaction and ion-specific effects

Biophys J 95 1285-1294 2008

FREDERICQ E NEURATH H The Interaction of Insulin with Thiocyanate and

other Anions The Minimum Molecular Weight of Insulin J Am Chem Soc 72

2684 - 26911950

GREEN A A Studies in the physical chemistry of the proteins (IX) J Biol Chem v

93 p 517-542 1931

GROumlNWALL A Studies on the solubility of lactoglobulin Compt rend trav Lab

Carlsberg v 24 p 185-200 1941

KAARSHOLM N C HAVELUNG S HOUGAARD P Ionization behavior of native

and mutant insulins pK perturbation of B13-Glu in aggregated species Arch

Biochem Biophys v 283 p 496-502 1990

KHOSHKBARCHI M K VERA J H A simplified perturbed hard-sphere model for

the activity coefficients of amino acids and peptides in aqueous solutions Ind Eng

Chem Res v 35 p 4319-4327 1996

42 9 Referecircncias Bibliograacuteficas

KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen

lysozyme J Biochem v 87 p 1215-1219 1980

LADISCH M R Bioseparations Engineering principles practice and

economics John Wiley amp Sons 2001 pp1 116 ndash 117 133

LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab

Carlsberg v 15 p 1-29 1924

PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da

particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas

2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP

PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the

excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte

solutions Fluid Phase Equilib v 269 p 25ndash35 2008

PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-

contribution model involving phase and chemical equilibrium Ind Eng Chem Res

v 33 p 1341-1347 1994

PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277

1973

PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino

acids Fluid Phase Equilib v 152 p 121-132 1998

43 9 Referecircncias Bibliograacuteficas

PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular

Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999

SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of

equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte

solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009

TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J

R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with

carbon dioxide Biotech Bioeng v103 p 909-919 2009

TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer

free energy Biophys J v 95 p 2601-2609 2008

TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in

water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95

2009

Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na

cadeia proteacuteica

Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo

de ionizaccedilatildeo

퐻퐴 퐴 + 퐻

(A ndash 1)

Assim considerando que a constante de equiliacutebrio

퐾 = 푎

(A ndash 2)

Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que

퐾 =[퐴 ][퐻 ]

[퐻퐴]

(A ndash 3)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que

log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]

(A ndash 4)

Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado

por

minus log[휑] = 푝휑

(A ndash 5)

Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que

45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

푝퐾 = log[퐻퐴][퐴 ] + 푝퐻

(A ndash 6)

Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por

훼 =[퐴 ]

[퐻퐴] + [퐴 ]

(A ndash 7)

Reescrevendo (A ndash 7) tem-se que

훼 =[퐴 ] [퐻퐴frasl ]

1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =

훼1 minus 훼

(A ndash 8)

Substituindo (A ndash 8) em (A ndash 6) tem-se que

푝퐾 = log훼

1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10

(A ndash 9)

Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos

훼 =1

1 + 10

(A ndash 10)

Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio

퐴 + 퐻 퐻퐴

(A ndash 11)

Pode se escrever a constante de equiliacutebrio como

퐾 =[퐻퐴 ]

[퐴][퐻 ]

(A ndash 12)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que

46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

log퐾 = minus log[퐴]

[퐻퐴 ] minus log[퐻 ]

(A -13)

Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por

훼 =[퐻퐴 ]

[퐴] + [퐻퐴 ]

(A ndash 14)

Assim a equaccedilatildeo (A ndash 13) fica

훼1 minus 훼 = 10

(A ndash 15)

Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo

훼 =10

1 + 10

(A ndash 16)

Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos

modelos expostos

Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]

48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]

49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)

50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])

51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]

52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])

53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)

54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2

55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO

42 9 Referecircncias Bibliograacuteficas

KURAMITSU S HAMAGUCHI K Analysis of the acid-base titration curve of hen

lysozyme J Biochem v 87 p 1215-1219 1980

LADISCH M R Bioseparations Engineering principles practice and

economics John Wiley amp Sons 2001 pp1 116 ndash 117 133

LINDERSTROslashM-LANG K On the ionisation of proteins Compt rend trav Lab

Carlsberg v 15 p 1-29 1924

PESSOcircA FILHO P A Contribuiccedilotildees agrave modelagem do equiliacutebrio de fases e da

particcedilatildeo de moleacuteculas bioloacutegicas em sistemas aquosos bifaacutesicos Campinas

2002 Tese de Doutorado Faculdade de Engenharia Quiacutemica UNICAMP

PESSOcircA FILHO P A MAURER G An extension of the Pitzer equation for the

excess Gibbs energy of aqueous electrolyte systems to aqueous polyelectrolyte

solutions Fluid Phase Equilib v 269 p 25ndash35 2008

PINHO S P SILVA C M MACEDO E A Solubility of amino acids a group-

contribution model involving phase and chemical equilibrium Ind Eng Chem Res

v 33 p 1341-1347 1994

PITZER K S Thermodynamics of electrolytes J Phys Chem v 77 p 268-277

1973

PRADHAN A A VERA J H Effects of acids and bases on the solubility of amino

acids Fluid Phase Equilib v 152 p 121-132 1998

43 9 Referecircncias Bibliograacuteficas

PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular

Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999

SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of

equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte

solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009

TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J

R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with

carbon dioxide Biotech Bioeng v103 p 909-919 2009

TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer

free energy Biophys J v 95 p 2601-2609 2008

TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in

water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95

2009

Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na

cadeia proteacuteica

Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo

de ionizaccedilatildeo

퐻퐴 퐴 + 퐻

(A ndash 1)

Assim considerando que a constante de equiliacutebrio

퐾 = 푎

(A ndash 2)

Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que

퐾 =[퐴 ][퐻 ]

[퐻퐴]

(A ndash 3)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que

log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]

(A ndash 4)

Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado

por

minus log[휑] = 푝휑

(A ndash 5)

Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que

45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

푝퐾 = log[퐻퐴][퐴 ] + 푝퐻

(A ndash 6)

Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por

훼 =[퐴 ]

[퐻퐴] + [퐴 ]

(A ndash 7)

Reescrevendo (A ndash 7) tem-se que

훼 =[퐴 ] [퐻퐴frasl ]

1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =

훼1 minus 훼

(A ndash 8)

Substituindo (A ndash 8) em (A ndash 6) tem-se que

푝퐾 = log훼

1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10

(A ndash 9)

Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos

훼 =1

1 + 10

(A ndash 10)

Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio

퐴 + 퐻 퐻퐴

(A ndash 11)

Pode se escrever a constante de equiliacutebrio como

퐾 =[퐻퐴 ]

[퐴][퐻 ]

(A ndash 12)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que

46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

log퐾 = minus log[퐴]

[퐻퐴 ] minus log[퐻 ]

(A -13)

Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por

훼 =[퐻퐴 ]

[퐴] + [퐻퐴 ]

(A ndash 14)

Assim a equaccedilatildeo (A ndash 13) fica

훼1 minus 훼 = 10

(A ndash 15)

Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo

훼 =10

1 + 10

(A ndash 16)

Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos

modelos expostos

Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]

48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]

49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)

50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])

51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]

52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])

53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)

54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2

55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO

43 9 Referecircncias Bibliograacuteficas

PRAUSNITZ J M LICHTENTHALER R N AZEVEDO E G De Molecular

Thermodynamics of Fluid-Phase Equilibria 3 ed Prentice Hall PTR 1999

SEYFI S PAZUKI G AGHAMIRI S F BEHESHTI M On the prediction of

equilibrium phase behavior of amino acids in aqueous and aqueous-electrolyte

solutions using SAFT equation of state Fluid Phase Equilib v 287 p 15-22 2009

TASHIMA A K OTTENS M VAN DER WIELEN L A CINTRA D E PAULI J

R PESSOcircA FILHO P A MIRANDA E A Precipitatoin of porcine insulin with

carbon dioxide Biotech Bioeng v103 p 909-919 2009

TJONG H ZHOU H X Prediction of protein solubility from calculation of transfer

free energy Biophys J v 95 p 2601-2609 2008

TSENG H C LEE C Y WENG W L SHIAH I M Solubilities of amino acids in

water at various pH values under 29815 K Fluid Phase Equilib v 285 p 90-95

2009

Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na

cadeia proteacuteica

Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo

de ionizaccedilatildeo

퐻퐴 퐴 + 퐻

(A ndash 1)

Assim considerando que a constante de equiliacutebrio

퐾 = 푎

(A ndash 2)

Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que

퐾 =[퐴 ][퐻 ]

[퐻퐴]

(A ndash 3)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que

log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]

(A ndash 4)

Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado

por

minus log[휑] = 푝휑

(A ndash 5)

Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que

45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

푝퐾 = log[퐻퐴][퐴 ] + 푝퐻

(A ndash 6)

Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por

훼 =[퐴 ]

[퐻퐴] + [퐴 ]

(A ndash 7)

Reescrevendo (A ndash 7) tem-se que

훼 =[퐴 ] [퐻퐴frasl ]

1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =

훼1 minus 훼

(A ndash 8)

Substituindo (A ndash 8) em (A ndash 6) tem-se que

푝퐾 = log훼

1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10

(A ndash 9)

Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos

훼 =1

1 + 10

(A ndash 10)

Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio

퐴 + 퐻 퐻퐴

(A ndash 11)

Pode se escrever a constante de equiliacutebrio como

퐾 =[퐻퐴 ]

[퐴][퐻 ]

(A ndash 12)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que

46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

log퐾 = minus log[퐴]

[퐻퐴 ] minus log[퐻 ]

(A -13)

Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por

훼 =[퐻퐴 ]

[퐴] + [퐻퐴 ]

(A ndash 14)

Assim a equaccedilatildeo (A ndash 13) fica

훼1 minus 훼 = 10

(A ndash 15)

Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo

훼 =10

1 + 10

(A ndash 16)

Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos

modelos expostos

Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]

48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]

49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)

50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])

51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]

52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])

53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)

54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2

55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO

Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

Considere-se que haja grupos ionizaacuteveis aacutecidos e grupos ionizaacuteveis baacutesicos na

cadeia proteacuteica

Entatildeo pode-se descrever a dissociaccedilatildeo de cada grupo aacutecido pela seguinte reaccedilatildeo

de ionizaccedilatildeo

퐻퐴 퐴 + 퐻

(A ndash 1)

Assim considerando que a constante de equiliacutebrio

퐾 = 푎

(A ndash 2)

Para a reaccedilatildeo (A ndash 1) considerando soluccedilotildees ideais tem-se que

퐾 =[퐴 ][퐻 ]

[퐻퐴]

(A ndash 3)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 3) pode-se escrever que

log퐾 = minus log[퐻퐴][퐴 ] + log[퐻 ]

(A ndash 4)

Considerando uma grandeza φ tem-se que o seu co-logaritmo pode ser denotado

por

minus log[휑] = 푝휑

(A ndash 5)

Assim substituindo esta notaccedilatildeo em (A ndash 4) tem-se que

45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

푝퐾 = log[퐻퐴][퐴 ] + 푝퐻

(A ndash 6)

Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por

훼 =[퐴 ]

[퐻퐴] + [퐴 ]

(A ndash 7)

Reescrevendo (A ndash 7) tem-se que

훼 =[퐴 ] [퐻퐴frasl ]

1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =

훼1 minus 훼

(A ndash 8)

Substituindo (A ndash 8) em (A ndash 6) tem-se que

푝퐾 = log훼

1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10

(A ndash 9)

Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos

훼 =1

1 + 10

(A ndash 10)

Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio

퐴 + 퐻 퐻퐴

(A ndash 11)

Pode se escrever a constante de equiliacutebrio como

퐾 =[퐻퐴 ]

[퐴][퐻 ]

(A ndash 12)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que

46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

log퐾 = minus log[퐴]

[퐻퐴 ] minus log[퐻 ]

(A -13)

Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por

훼 =[퐻퐴 ]

[퐴] + [퐻퐴 ]

(A ndash 14)

Assim a equaccedilatildeo (A ndash 13) fica

훼1 minus 훼 = 10

(A ndash 15)

Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo

훼 =10

1 + 10

(A ndash 16)

Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos

modelos expostos

Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]

48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]

49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)

50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])

51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]

52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])

53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)

54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2

55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO

45 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

푝퐾 = log[퐻퐴][퐴 ] + 푝퐻

(A ndash 6)

Contudo a fraccedilatildeo de resiacuteduos carregados α eacute dada por

훼 =[퐴 ]

[퐻퐴] + [퐴 ]

(A ndash 7)

Reescrevendo (A ndash 7) tem-se que

훼 =[퐴 ] [퐻퐴frasl ]

1 + [퐴 ] [퐻퐴]frasl rArr[퐴 ][퐻퐴] =

훼1 minus 훼

(A ndash 8)

Substituindo (A ndash 8) em (A ndash 6) tem-se que

푝퐾 = log훼

1 minus 훼 + 푝퐻 rArr1 minus 훼훼 = 10

(A ndash 9)

Rearranjando (A ndash 9) tem-se para resiacuteduos aacutecidos

훼 =1

1 + 10

(A ndash 10)

Analogamente para resiacuteduos baacutesicos pode se escrever uma reaccedilatildeo de equiliacutebrio

퐴 + 퐻 퐻퐴

(A ndash 11)

Pode se escrever a constante de equiliacutebrio como

퐾 =[퐻퐴 ]

[퐴][퐻 ]

(A ndash 12)

Aplicando o logaritmo decimal a equaccedilatildeo (A ndash 12) tem-se que

46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

log퐾 = minus log[퐴]

[퐻퐴 ] minus log[퐻 ]

(A -13)

Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por

훼 =[퐻퐴 ]

[퐴] + [퐻퐴 ]

(A ndash 14)

Assim a equaccedilatildeo (A ndash 13) fica

훼1 minus 훼 = 10

(A ndash 15)

Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo

훼 =10

1 + 10

(A ndash 16)

Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos

modelos expostos

Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]

48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]

49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)

50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])

51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]

52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])

53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)

54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2

55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO

46 Apecircndice A ndash Equaccedilotildees de Henderson - Hasselbach

log퐾 = minus log[퐴]

[퐻퐴 ] minus log[퐻 ]

(A -13)

Por analogia a fraccedilatildeo de resiacuteduos carregados eacute dada por

훼 =[퐻퐴 ]

[퐴] + [퐻퐴 ]

(A ndash 14)

Assim a equaccedilatildeo (A ndash 13) fica

훼1 minus 훼 = 10

(A ndash 15)

Por fim pode se escrever para resiacuteduos baacutesicos a seguinte equaccedilatildeo

훼 =10

1 + 10

(A ndash 16)

Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos

modelos expostos

Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]

48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]

49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)

50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])

51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]

52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])

53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)

54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2

55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO

Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos

modelos expostos

Polytechnic School of the University of Satildeo Paulo Biochemical Engineering Laboratory - Department of Chemical Engineering Thermodynamic modeling of solid-liquid equilibrium in protein aqueous systems effect of pH Calculus of the protein solubility as a function of pH Developed by Luiacutes Fernando Mercier Franco Advisor Professor Pedro de Alcacircntara Pessocirca Filho include ltstdiohgt include ltstdlibhgt include ltmathhgt include ltstringhgt include lttimehgt define MAX 10000 define MIN 150 define NITER 1001 Prototypes of the auxiliaries functions Function that minimizes the objective function by Golden Section Method double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double solpH0 double pH0 double pI int n) Function that calculates the objective function double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int main() Variables description int i counter of pH int j counter of gi int k counter of configurations int n number of gi int npexp number of experimental points int nexp int gi[MAX] vector of gi int gi1[MAX] vector of gi that have variable alphas in the interval int soma sum of the charges of gi that have imutable alphas int sum int min minimum int med medium int iter number of iterations int npos double pH[MAX] vector of pH double pKA[MIN] vector of pKA double ex double toler double termo1 double pI pI isoeletric point double mod module of a number double epsilon double solexp[MAX] experimental solubility double pHexp[MAX] double solexp1[MAX]

48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]

49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)

50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])

51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]

52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])

53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)

54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2

55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO

48 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double pHexp1[MAX] double solcalc[MAX] double solpI pI solubility double pitch pitch between two pH double soli double solant double tol double aux double ionforce ionic force double PI the number pi = 31415 double KB double NAV Avogadros constant double PER0 double EE eletric charge of an eletron double TC double DC double TDL double T temperature double DDL double DM double CPER double BPER double PER double D double BB double Z2 the square of the average charge double Z[MAX] the average charge double soldh[MAX] solubility calculated by the classical approach double e the number e = 271 double CC double ifr double Z4 double CC2 double ifo1 double solcalcdh[MAX] double soldhit[NITER] double ionforce0 double fun double fun1[MAX] double derivfun double lnCC double lns double del double range double OF double AY double BY double CY double ymin double OFDH double tacid double tbasic double tlog double termof double OFML double somatorio double prod double s[MAX] double s0 double pH0 double intcarga[MAX] double termosum double ex0 double scalc[MAX] double OFLLG double ZLLG[MAX] double OFMDH double slin[MAX]

49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)

50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])

51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]

52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])

53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)

54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2

55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO

49 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double A double XMIN double OFLIN double termo2 double termo22 double termo23 double termo3 double termo12 double AF double OFMLIN double solcalclin[MAX] char name[40] char aminoacid[40] char nfile[40] char get[40] time_t t1 t2 FILE ARQUI RESULTS RES HELPFILE (void) time(ampt1) printf(-----------------------------------------------------------------) printf(n) printf(nt POLYTECHNIC SCHOOL OF THE UNIVERSITY OF SAO PAULO n) printf(nt DEPARTMENT OF CHEMICAL ENGINEERING n) printf(nt BIOCHEMICAL ENGINEERING LABORATORY n) printf(nt ) printf(nt PROTEIN SOLID-LIQUID EQUILIBRIUM ) printf(nt n) printf( nt Developed by Luis Fernando Mercier Franco) printf( nt Advisor Professor Pedro de Alcantara Pessoa Filho) printf( nt FAPESP (IC 200906575-0)n) printf( nt Calculus of the protein solubility curve as a function) printf( nt of pHnn) printf(n Data inputn) printf( Data file name ) scanf(s ampnfile) med = 10000 min = 150 Reading the file (txt) that contains the input values ARQUI = fopen(nfile r) fscanf(ARQUI S get) fscanf(ARQUI s ampname) fscanf(ARQUI S get) fscanf(ARQUI lf ampT) fscanf(ARQUI S get) fscanf(ARQUI lf ampionforce0) fscanf(ARQUI S get) fscanf(ARQUI d ampn) fscanf(ARQUI S get) for (j = 0 j lt n j++) fscanf(ARQUI s ampaminoacid[j]) fscanf(ARQUI d ampgi[j]) fscanf(ARQUI lf amppKA[j]) fscanf(ARQUI S get) fscanf(ARQUI lf amppH[0]) fscanf(ARQUI lf amppH[MAX-1]) fscanf(ARQUI S get) fscanf(ARQUI lf amppI) fscanf(ARQUI lf ampsolpI) fscanf(ARQUI S get) fscanf(ARQUI lf amppH0) fscanf(ARQUI lf amps0) fscanf(ARQUI S get)

50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])

51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]

52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])

53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)

54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2

55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO

50 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

fscanf(ARQUI d ampnpexp) fscanf(ARQUI S get) for (k = 0 k lt npexp k++) fscanf(ARQUI lf amppHexp1[k]) fscanf(ARQUI lf ampsolexp1[k]) fclose(ARQUI) Vector pH (1 - 14) pitch = (pH[med-1] - pH[0]) (med - 1) epsilon = 05 pitch for (i = 0 i lt med - 1 i++) pH[i+1] = pH[i] + pitch Calculating the net charge profile for (i = 0 i lt med i++) somatorio = 0 for (j = 0 j lt n j++) ex = pow(10 pH[i] - pKA[j]) tacid = (10 gi[j]) (1 - (10 gi[j])) ex tbasic = (1 + (10 gi[j])) termosum = (1 (1 + ex)) (tbasic + tacid) somatorio = somatorio + termosum Z[i] = 05 somatorio Calculating solubility by LLG theory for (i = 0 i lt med i++) prod = 1 npos = 0 for (j = 0 j lt n j++) ex = 1 + pow(10 pH[i] - pKA[j]) ex0 = 1 + pow(10 pH0 - pKA[j]) prod = prod (ex ex0) npos = npos + (1 + gi[j]) 2 s[i] = s0 pow(10 10 npos (pH0 - pH[i])) prod termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = s[i-1] soli = s[i] scalc[k] = solant + del (soli - solant) i = med termof = termof + pow((scalc[k] - solexp1[k])solexp1[k] 2) OFML = pow(termof npexp 05) Quadratic solution of Linderstrom-Lang and Groumlnwall equation OFLIN = FMIN(ampXMIN pHexp1 solexp1 s0 pH0 pI npexp) A = XMIN for (i = 0 i lt med i++) slin[i] = s0pow(10 A2(pH[i]pH[i]-2pI(pH[i]-pH0)-pH0pH0)) termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i] if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i])

51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]

52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])

53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)

54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2

55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO

51 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

solant = slin[i-1] soli = slin[i] solcalclin[k] = solant + del (soli - solant) i = med termof = termof + pow((solcalclin[k] - solexp1[k])solexp1[k] 2) OFMLIN = pow(termof npexp 05) Classical approach with Debye-Huumlckel theory PI = 314159265 KB = 138066 pow(10 -23) NAV = 602205 pow(10 23) PER0 = 885419 pow(10 -12) EE = 160218 pow(10 -19) TC = 64714 DC = 3220 e = exp(1) toler = solpI pow(10 -3) TDL = 1 - T TC DDL = 1+199206pow(TDL13)+110123pow(TDL23)-0512506pow(TDL53) DDL = DDL-175263pow(TDL163)-454485pow(TDL433) DDL = DDL-675615pow(105)pow(TDL1103) DM = DDL DC CPER = -20525+31159(-18289+T) BPER = -80325+42142pow(106)T+21417T PER = 34279exp(-50866pow(10-3)T+9469pow(10-7)pow(T2)) PER = PER + CPER log((BPER + 1) (BPER + 1000)) D = 4 PI PER PER0 termo1 = 10 30 termo12 = 2 PI NAV DM termo2 = pow(termo12 05) termo22 = pow(EE 2)DKBT termo23 = 30 20 termo3 = pow(termo22 termo23) AF = termo1 termo2 termo3 BB = 12 Newton-Raphson Method for (i = 0 i lt med i++) soldhit[0] = solpI Z2 = pow(Z[i] 2) Z4 = pow(Z[i] 4) for (iter = 0 iter lt NITER - 1 iter++) ifo1 = 05 soldhit[iter] Z2 ionforce = ionforce0 + ifo1 ifr = pow(ionforce 12) CC = 1 + BB ifr lnCC = log(CC)log(e) CC2 = pow(CC 2) lns = log(solpI soldhit[iter]) log(e) fun = lns + AF Z2 ((ifr CC) + (2 BB lnCC)) derivfun = -1soldhit[iter]+AFZ4(15+BBifr)(2ifrCC2) soldhit[iter+1] = soldhit[iter] - fun derivfun mod = fabs(soldhit[iter+1] - soldhit[iter]) if (mod lt= toler) soldh[i] = soldhit[iter+1] iter = NITER if (iter == NITER - 1) soldh[i] = soldhit[iter+1] termof = 0 for (k = 0 k lt npexp k++) for (i = 0 i lt med i++) fun1[i] = pHexp1[k] - pH[i]

52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])

53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)

54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2

55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO

52 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (i gt 0 ampamp fun1[i] fun1[i-1] lt 0) del = fun1[i-1] (fun1[i-1] - fun1[i]) solant = soldh[i-1] soli = soldh[i] solcalcdh[k] = solant + del (soli - solant) i = med if (solcalcdh[k] gt 05 solpI) termof = termof + pow((solcalcdh[k] - solexp1[k])solexp1[k] 2) OFMDH = pow(termof npexp 05) Printing the results in a file which extension is csv RESULTS = fopen(REScsv w) fprintf(RESULTS pHZsol(DH)sol(LLG)sollinpHexpsolexpn) for (i = 0 i lt med i++) if (i lt npexp) fprintf(RESULTS eeeeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6) pHexp1[i] pow(10 -6) solexp1[i] pow(10 -6)) else fprintf(RESULTS eeeeen pH[i] pow(10 -6) Z[i] pow(10 -6) soldh[i] pow(10 -6) s[i] pow(10 -6) slin[i] pow(10 -6)) fclose(RESULTS) Printing the results in a file which extension is txt RES = fopen(REStxt w) fprintf(RES n Protein snn name) fprintf(RES n Temperature 2lfKn T) fprintf(RES n I 1lf mMn ionforce0 1000) fprintf(RES n Number of I G dn n) fprintf(RES n aminoacids | I G | pKAn) fprintf(RES --------------------------------n) for (j = 0 j lt n j++) fprintf(RES c | aminoacid[j]) if (gi[j] == 1) fprintf(RES d | gi[j]) if (gi[j] == -1) fprintf(RES d | gi[j]) if (pKA[j] 100 lt 1) fprintf(RES 2lfn pKA[j]) if (pKA[j] 100 gt= 1) fprintf(RES 2lfn pKA[j]) fprintf(RES nn Values of solubilitynn) fprintf(RES pH | sol exp | sol calc | sol (D-H)n) fprintf(RES ----------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) fprintf(RES 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) fprintf(RES 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) fprintf(RES 2e | 2e | NCn solexp1[k] scalc[k])

53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)

54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2

55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO

53 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

if (solcalcdh[k] gt= solpI) fprintf(RES 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k]) fprintf(RES n OF valuesn) fprintf(RES n For the Debye-Huumlckel theory 3en OFMDH) fprintf(RES n For the Linderstrom-Lang theory 3en OFML) (void) time(ampt2) fprintf(RES nn Time to do this = d secondsn (int) t2-t1) fclose(RES) Printing the results in the screen printf(n Result summarynn) printf(n Protein name snn name) printf(n Temperature 2lfKn T) printf(n I 1lf mMn ionforce0 1000) printf(n Number of ionizable groups (G I) dn n) printf(n Aminoacids | G I | pKAn) printf( --------------------------------n) for (j = 0 j lt n j++) printf( c | aminoacid[j]) if (gi[j] == 1) printf( d | gi[j]) if (gi[j] == -1) printf( d | gi[j]) if (pKA[j] 100 lt 1) printf( 2lfn pKA[j]) if (pKA[j] 100 gt= 1) printf( 2lfn pKA[j]) printf(nn Solubility valuesnn) printf( pH | sol exp | sol calc | sol (D-H) | sol Qn) printf( --------------------------------------------------------------n) for (k = 0 k lt npexp k++) if (pHexp1[k] 100 lt 1) printf( 2lf | pHexp1[k]) if (pHexp1[k] 100 gt= 1) printf( 2lf | pHexp1[k]) if (solcalcdh[k] lt solpI) printf(2e | 2e | NC | 2en solexp1[k] scalc[k] solcalclin[k]) if (solcalcdh[k] gt= solpI) printf(2e | 2e | 2e | 2en solexp1[k] scalc[k] solcalcdh[k] solcalclin[k]) printf(n OF valuesn) printf(n For Debye-Huckel theory 3en OFMDH) printf(n For Linderstrom-Lang and Gronwall Extended Equation 3enOFML) printf(n K = lfn A 2) (void) time(ampt2) printf(nn Execution time = d secondsn (int) t2-t1) printf(n The results are stored in a file called REStxtnn) printf( Press Enter to close this windownn) printf(-----------------------------------------------------------------) getch() return (0)

54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2

55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO

54 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double FMIN(double XMIN double pexp[MAX] double sexp[MAX] double spH0 double pH0 double pI int n) int max double AX double BX double CX double tol double R double C double X0 double X1 double X2 double X3 double F1 double F2 double FMIN max = 280 AX = 0 CX = 100 BX = (CX - AX) 3 tol = pow(10 -10) R = 061803399 C = 1 - R X0 = AX X3 = CX if (fabs(CX - BX) lt fabs(BX - AX)) X1 = BX X2 = BX + C (CX - BX) else X2 = BX X1 = BX - C (CX - BX) F1 = of(X1 spH0 pH0 pI pexp sexp n) F2 = of(X2 spH0 pH0 pI pexp sexp n) while (fabs(X3 - X0) gt tol (X1 + X2)) if (F2 lt F1) X0 = X1 X1 = X2 X2 = R X1 + C X3 F1 = F2 F2 = of(X2 spH0 pH0 pI pexp sexp n) else X3 = X2 X2 = X1 X1 = R X2 + C X0 F2 = F1 F1 = of(X1 spH0 pH0 pI pexp sexp n) if (F1 lt F2) FMIN = F1 XMIN = X1 else FMIN = F2 XMIN = X2 return FMIN double of(double A double spH0 double pH0 double pI double pH[MAX] double sexp[MAX] int n) int k double FO double sum double pH2

55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO

55 Apecircndice B ndash Coacutedigo ndash fonte do programa de caacutelculo dos modelos expostos

double m double pH02 sum = 0 for (k = 0 k lt n k++) pH2 = pH[k] pH[k] m = 2 pI (pH[k] - pH0) pH02 = pH0 pH0 sum = sum + (sexp[k] - spH0pow(10 A2(pH2 - m - pH02)))sexp[k] FO = pow(sum (10 n) 05) return FO

top related