marcia_val_springer_doutorado.pdf

Upload: veronica-maynard

Post on 03-Jun-2018

221 views

Category:

Documents


0 download

TRANSCRIPT

  • 8/12/2019 Marcia_Val_Springer_doutorado.pdf

    1/100

    APLICAO DE INTELIGNCIA COMPUTACIONAL NA CARACTERIZAO

    GEOQUMICA DE LEOS

    Marcia Val Springer

    Tese de Doutorado apresentada ao Programa de

    Ps-graduao em Engenharia Civil, COPPE,

    da Universidade Federal do Rio de Janeiro,como parte dos requisitos necessrios

    obteno do ttulo de Doutor em Engenharia

    Civil.

    Orientador(es): Dbora de Almeida Azevedo

    Luiz Landau

    Rio de Janeiro

    Dezembro de 2012

  • 8/12/2019 Marcia_Val_Springer_doutorado.pdf

    2/100

    APLICAO DE INTELIGNCIA COMPUTACIONAL NA CARACTERIZAO

    GEOQUMICA DE LEOS

    Marcia Val Springer

    TESE SUBMETIDA AO CORPO DOCENTE DO INSTITUTO ALBERTO LUIZ

    COIMBRA DE PS-GRADUAO E PESQUISA DE ENGENHARIA (COPPE)

    DA UNIVERSIDADE FEDERAL DO RIO DE JANEIRO COMO PARTE DOS

    REQUISITOS NECESSRIOS PARA A OBTENO DO GRAU DE DOUTOR

    EM CINCIAS EM ENGENHARIA CIVIL.

    Examinada por:

    ________________________________________________Profa. Dbora de Almeida Azevedo, D.Sc.

    ________________________________________________Prof. Luiz Landau, D.Sc.

    ________________________________________________Dr. Eugnio Vaz dos Santos Neto

    ________________________________________________Profa. Celeste Yara dos Santos Siqueira, D.Sc.

    ________________________________________________Prof. Nelson Francisco Favilla Ebecken

    RIO DE JANEIRO, RJ - BRASIL

    DEZEMBRO DE 2012

  • 8/12/2019 Marcia_Val_Springer_doutorado.pdf

    3/100

  • 8/12/2019 Marcia_Val_Springer_doutorado.pdf

    4/100

    iv

    Dedico esta tese aos meus pais, ao meu querido irmo, a minha querida Tia Marizete,ao meu querido esposo Antonio pela pacincia do dia a dia e incansvel apoio, e

    todas as pessoas que amo.

  • 8/12/2019 Marcia_Val_Springer_doutorado.pdf

    5/100

    v

    "No existe sorte. Sorte quando a preparao encontra oportunidade".

    (autor desconhecido)

  • 8/12/2019 Marcia_Val_Springer_doutorado.pdf

    6/100

    vi

    AGRADECIMENTOS

    A Deus, graas sempre.

    Aos meus pais, Luiz e Juara, por tudo sempre.

    Ao meu esposo, Antonio, por seu amor, com amor sempre. Ele que foi o maissacrificado pelas minhas frequentes ausncias e indisponibilidades. Pelo apoioincondicional que me deu desde sempre.

    Ao meu querido irmo, Marcus, um dos grandes incentivadores desta jornada.

    A minha querida Tia Marizete, por seu apoio e carinho incondicional, estando

    sempre ao meu lado.

    A minha querida dinda, Regina, e prima, Juju, pelo incentivo.

    A minha orientadora Dbora pela orientao, dedicao, compreenso e confianaprestadas a mim durante todos esses anos. Todo meu crescimento profissional,Mestrado e agora doutorado, foi regido por ela.

    Ao coordenador do curso Sistemas Petrolferos Luiz Landau, pelo empenho deoferecer um curso altamente qualificado e por todo apoio fornecido.

    A todos os professores que compartilharam os conhecimentos e experinciasprofissionais.

    A minha querida amiga Tatiana, pelo incentivo, apoio e animao diria,indispensveis, e por nunca permitir que eu desanimasse.

    A minha amiga Kaza, por todo apoio e carinho.

    Ao amigo Jean, pelo companheirismo e pacincia.

    Aos funcionrios do LAMCE e LAB2M, em especial Mnica, Srgio, Marcos eVernica.

    Aos funcionrio do PEC, em especial Beth e ao Jairo, por seu excelente trabalho,carinho e ateno.

    Aos meus amigos do IFRJ, toda a equipe de fsico-qumica, e a amiga Regina pela

    torcida e incentivo.

  • 8/12/2019 Marcia_Val_Springer_doutorado.pdf

    7/100

    vii

    Aos membros da banca.

    Gostaria de agradecer ao Programa de Formao de Recursos Humanos da AgnciaNacional de Petrleo (PRH-02).

    A todos vocs que moram no meu corao um sincero Obrigado......

  • 8/12/2019 Marcia_Val_Springer_doutorado.pdf

    8/100

    viii

    Resumo da Tese apresentada COPPE/UFRJ como parte dos requisitos necessrios

    para a obteno do grau de Doutor em Cincias (D.Sc.)

    APLICAO DE INTELIGNCIA COMPUTACIONAL NA CARACTERIZAO

    GEOQUMICA DE LEOS

    Marcia Val Springer

    Dezembro/2012

    Orientadores: Dbora de Almeida Azevedo

    Luiz Landau

    Programa: Engenharia Civil

    Durante os ltimos anos, em funo da demanda da explorao de petrleo,

    tem-se verificado um crescimento substancial da quantidade e complexidade de dados

    armazenados na forma digital na rea da geoqumica orgnica. Diante deste cenrio,

    busca-se testar o desempenho do mtodo de descoberta do conhecimento no apoio ao

    agrupamento de amostras de leos a partir de parmetros geoqumicos, para estimar a

    maturao trmica e identificar a origem. Em vista disso, o presente trabalho teve

    como objetivo propor um mtodo para extrao de informaes desconhecidas a partir

    de uma base de dados, contendo parmetros geoqumicos envolvendo biomarcadores

    e diamantides e tendo como resultados a visualizao de agrupamentos fuzzy de

    amostras de leos. Este mtodo foi desenvolvido sobre dados envolvendo baciassedimentares brasileiras e a bacia sedimentar colombiana,Llanos Orientales. Segundo

    esse mtodo, as amostras foram agrupadas em cinco grupos diferentes quanto ao

    parmetro de maturao trmica. Na caracterizao do ambiente deposicional,

    observou-se que as amostras puderam ser divididas em quatro grupos principais:

    grupo 1 possui uma contribuio marinha; grupo 2 indicativos de uma mistura

    (marinho e terrestre); grupo 3 possui caractersticas de uma mistura contendo,

    tambm, uma contribuio marinha e grupo 4 possui caractersticas terrestres.

  • 8/12/2019 Marcia_Val_Springer_doutorado.pdf

    9/100

    ix

    Abstract of Thesis presented to COPPE/UFRJ as a partial fulfillment of the

    requirements for the degree of Doctor of Science (D.Sc.)

    APPLICATION OF COMPUTATIONAL INTELLIGENCE IN GEOCHEMICAL

    CHARACTERIZATION OF OILS

    Marcia Val Springer

    December/2012

    Advisors: Dbora de Almeida Azevedo

    Luiz Landau

    Department: Civil Engineering

    Organic Geochemistry is a powerful tool to aid oil exploration. During recent

    years, due to the demand of oil, there has been a substantial increase in the amount

    and complexity of data stored in digital form. Given this scenario, we seek to test the

    performance of the method of knowledge discovery in supporting the grouping of oil

    samples from geochemical parameters to evaluate thermal maturity and identify

    source. Therefore, the present work aimed to propose a method to extract unknown

    information from a database, with the results to visualize fuzzy clusters of oil samples

    from geochemical parameters, involving biomarkers and diamondoid. This method

    was developed on data using Brazilian sedimentary basins and the Colombian

    sedimentary basin, named Llanos Orientales. Under this method, the samples weregrouped into five different groups as the parameter of thermal maturation. In the

    characterization of the depositional environment, it was observed that the samples

    could be divided into four main groups: group 1 has a marine contribution, group 2

    indicating a mixture (marine and terrestrial), group 3 has characteristics of a mixture

    containing a marine contribution, and group 4 has terrestrial features.

  • 8/12/2019 Marcia_Val_Springer_doutorado.pdf

    10/100

    x

    ndice

    Captulo1.......................................................................................................................1

    1.1) Introduo e Motivao ................................................................................................1

    1.2) Objetivo......................................................................................................................6

    Captulo 2: rea de Estudo .........................................................................................

    Captulo3: Parmetros Geoqumicos ....................................................................... 14

    Captulo4: Fundamentao Terica ........................................................................26

    4.1) Anlise de agrupamento Clustering....................................................................26

    4.2) Mtodo de AgrupamentoFuzzy .................................................................................29

    4.2.1) Mtodo de ClusterizaoFuzzy c-means (FCM) ...............................................324.2.2) Ajuste dos parmetros .........................................................................................36

    Captulo5: Materiais e Mtodos ...............................................................................40

    5.1) Procedimentos Analticos ...........................................................................................40

    5.1.1) Tcnicas Analticas Utilizadas.............................................................................42

    5.2) Avaliao Estatstica dos dados .................................................................................44

    Captulo6: Base de Dados - Descrio......................................................................47

    Captulo7: Resultados e Discusso ...........................................................................50

    7.1) Parmetros de Maturao ..........................................................................................50

    7.1.1) Interpretao dos resultados pela caracterizao de Biomarcadores eDiamantides ..................................................................................................................50

    7.1.2) Anlise de agrupamento FCM fuzzy c-means.................................................60

    7.2) Parmetros de Ambientes Deposicionais (Origem)..................................................66

    7.2.1) Interpretao dos resultados pela caracterizao de Biomarcadores eDiamantides ..................................................................................................................66

    7.2.2) Anlise de agrupamento FCM fuzzy c-means.................................................73

    Captulo 8: Concluso................................................................................................ 80

    Captulo 9: Recomendaes ......................................................................................82

    Captulo 10: Referncias Bibliogrficas...................................................................83

  • 8/12/2019 Marcia_Val_Springer_doutorado.pdf

    11/100

    1

    Captulo 1.

    1.1) Introduo e Motivao

    Atualmente as organizaes tm-se mostrado extremamente eficientes em

    obter, organizar e armazenar grandes quantidades de dados, obtidos de suas operaes

    dirias ou pesquisas cientficas, porm a maioria no usa adequadamente essa

    gigantesca quantidade de dados para transform-la em conhecimentos e que poderiam

    ser utilizados em suas prprias atividades, sejam elas comerciais ou cientficas.

    Para explorar e extrair informaes teis de um banco de dados foi proposto,

    em 1989, o processo de KDD(Knowledge Discovery Database). Este processo refere-

    se s etapas que produzem conhecimento a partir de dados e, principalmente, etapa

    de minerao de dados, que a fase que transforma dados em informao (FAYYAD

    et al.,1996). O conceito deData-Mining(minerao de dados) est se tornando cada

    vez mais popular como uma ferramenta de descoberta de informaes, que podem

    revelar estruturas de conhecimentos, que possam guiar decises em condies de

    certeza limitada. Este processo de obter informaes a partir de um banco de dadosno uma tarefa trivial, pois envolve algumas etapas com muitas decises realizadas

    pelo analista (Figura 1), como: Criao de um conjunto de dados alvos (SELEO);

    Pr-processamento e limpeza dos dados; Reduo de dados e projeo

    (TRANSFORMAO); Busca por padres e/ou associaes (MINERAO DE

    DADOS); Interpretao dos padres minerados.

  • 8/12/2019 Marcia_Val_Springer_doutorado.pdf

    12/100

    2

    Figura 1: Processo de extrao de conhecimento em bases de dados e suas etapas (adaptadoFAYAAD et al. 1996)

    A seleo de dados tem como objetivo identificar as origens internas e externas

    da informao, extraindo um subconjunto de dados necessrio para a aplicao da

    minerao de dados, selecionando apenas atributos relevantes aos objetivos do

    processo de extrao de conhecimento (MACEDO et al.,2010).

    A etapa de processamento dos dados visa assegurar a qualidade dos dados

    selecionados. Como o resultado do processo de extrao possivelmente ser utilizado

    no processo de tomada de deciso, a qualidade dos dados um fator extremamente

    importante. Esta fase inicia-se com uma reviso geral da estrutura dos dados e a

    definio de medidas de qualidade, utilizando uma combinao de mtodos

    estatsticos e tcnicas de visualizao de dados. A seguir encontram-se descritos os

    problemas tratados na etapa de processamento dos dados, segundo BOENTE &

    GOLDSCHMIDT & ESTRELA (2008):

    Eliminao de dados duplicados - so removidos dados duplicados e/ou

    corrompidos;

    Tratamento de outliers- so valores significantemente fora do esperado

    para uma varivel;

    Valores faltantes - valores que no esto presentes no conjunto

    selecionado e valores invlidos que foram eliminados durante a detecode outliers.

  • 8/12/2019 Marcia_Val_Springer_doutorado.pdf

    13/100

    3

    A etapa de transformao de dados tem como objetivo converter o conjunto

    bruto de dados em uma forma padro de uso, tornando os dados teis para a

    minerao (BOENTE, OLIVEIRA & ROSA, 2007). Devido s restries de espao

    em memria e tempo de processamento, o nmero de atributos disponveis para

    anlise pode inviabilizar a minerao de dados. Com isso, tcnicas de reduo de

    dados so aplicadas, sendo feitas de trs modos:

    Reduo do nmero de exemplos deve ser feita mantendo as caractersticas

    do conjunto de dados original, por meio da gerao de amostras

    representativas dos dados;

    Reduo do nmero de atributos realizada pelo especialista do domnio,seleciona-se um subconjunto dos atributos de forma que no tenha impacto na

    qualidade do conjunto final;

    Reduo do nmero de valores de um atributo consiste na reduo do

    nmero de valores de um atributo, geralmente utilizando-se tcnicas de

    discretizao e suavizao de valores. A discretizao de um atributo consiste

    na substituio de um atributo contnuo por um atributo discreto, por meio do

    agrupamento de seus valores. A suavizao de valores agrupa determinados

    atributos em um valor numrico que o represente, podendo ser, por exemplo, a

    mdia ou a mediana.

    Essa etapa auxilia na reduo do tempo de processamento para a tcnica de

    minerao, diminuindo o espao de busca. As transformaes devem, entretanto,

    preservar ao mximo, nas amostras geradas, as informaes presentes nos dadosbrutos.

    A minerao de dados a etapa mais importante do processo de KDD e

    caracteriza-se pela existncia de uma tcnica de minerao capaz de extrair

    conhecimento implcito de um banco de dados em funo de um objetivo proposto

    (JACKSON, 2002).

  • 8/12/2019 Marcia_Val_Springer_doutorado.pdf

    14/100

    4

    As tcnicas de minerao de dados podem ter gerado uma quantidade enorme

    de padres, dos quais podem no ser relevantes ou interessantes ao usurio. Um dos

    objetivos principais do processo de KDD que o usurio possa compreender e utilizar

    o conhecimento descoberto (FAYAAD et al., 1996). Mas, podem ocorrer casos em que

    os modelos so muito complexos ou no fazem sentido para os especialistas. Existem

    algumas formas de se caracterizar a qualidade dos resultados obtidos, como a

    compreensibilidade e a interessabilidade. A compreensibilidade de um

    conjunto de regras relaciona-se com a facilidade de interpretao dessas regras por um

    ser humano. Assim, quanto menor a quantidade de regras de um dado modelo e menor

    o nmero de condies por regra, maior ser a compreensibilidade das regras

    descobertas. A interessabilidade uma medida de qualidade que tenta estimar o

    quanto de conhecimento interessante ou inesperado existe, e deve combinar fatores

    numa medida que reflete como o especialista julga o padro.

    Aps a anlise do conhecimento, caso esse no seja de interesse do usurio final

    ou no cumpra os objetivos propostos, o processo de extrao pode ser repetido,

    ajustando-se os parmetros ou melhorando o processo de escolha dos dados, para a

    obteno de melhores resultados em uma prxima iterao.

    Diferentes modelos podem ser aplicados aos bancos de dados para dar o suporte

    necessrio aos distintos problemas nas mais diversas reas. Estes modelos so

    divididos de acordo com a natureza da atividade, e os principais so: predio,

    agrupamento (Clustering) e classificao. No captulo 4 sero apresentadas em

    maiores detalhes as tcnicas de anlise de cluster (agrupamento), que o foco

    principal deste trabalho.

    Para a obteno destes modelos, diferentes tcnicas computacionais baseadas

    em paradigmas da inteligncia computacional tm sido empregadas na indstria do

    petrleo. Dentre estas tcnicas esto as Redes Neurais, Lgica Fuzzy, Regras de

    Associao, rvores de deciso, Algoritmos Genticos, entre outros.

    A construo de modelos determinsticos e de interpretao tem sido

    crescentemente substituda por estes mtodos computacionais. A diversidade destas

    aplicaes de minerao de dados usadas nos problemas de campos de leo e gs e a

  • 8/12/2019 Marcia_Val_Springer_doutorado.pdf

    15/100

    5

    aceitao destas metodologias tm se manifestado em grande interesse principalmente

    por parte de engenheiros e cientistas em todo o mundo.

    Durante os ltimos anos, em funo no apenas da demanda da explorao de

    petrleo, mas tambm do desenvolvimento das tcnicas analticas, tem-se verificado

    um crescimento substancial da quantidade e complexidade de dados armazenados na

    forma digital na geoqumica orgnica. Este grande volume de dados acaba sendo

    invivel de ser analisado por especialistas atravs de mtodos convencionais, tais

    como planilhas de clculo e relatrios informativos operacionais, onde o especialista

    testa sua hiptese contra a base de dados. Estatsticas tradicionais so limitadas se

    levarmos em conta que a anlise se torna bastante trabalhosa quando o nmero de

    variveis a serem investigadas cresce seguidamente. Tais mtodos possuem condies

    que limitam o nmero de casos a utilizar, fazendo com que apenas uma pequena parte

    do universo esteja disponvel para a anlise e, quando os relacionamentos dos dados

    no so lineares, torna-se difcil empregar os mtodos estatsticos tradicionais.

    Na Geoqumica Orgnica, as pesquisas envolvendo Inteligncia Artificial tm

    sua atuao de forma pontual. De um modo geral, as pesquisas baseadas em grandes

    volumes de dados na rea de Geoqumica Orgnica vm sendo norteadas a partir de

    uma perspectiva descritiva e preditiva, onde a estatstica a ferramenta.

    Diante deste cenrio, busca-se testar o desempenho do mtodo de descoberta do

    conhecimento no apoio ao agrupamento de amostras de leos a partir de parmetros

    geoqumicos, como maturao e ambiente deposicional (origem).

    A anlise de agrupamento tem por objetivo agrupar dados semelhantes emconjunto para que possam ser generalizadas como um grupo. H muitos algoritmos

    para anlise de cluster, com base em estatsticas, redes neurais e dos conjuntos fuzzy.

    Em vista disso, o presente trabalho tem como proposta a introduo da tcnica de

    Minerao de Dados baseados em Sistemas Fuzzy. O processo de clusterizao

    (agrupamento) escolhido para desenvolver o trabalho foi o algoritmo Fuzzy C-means

    (FCM).

  • 8/12/2019 Marcia_Val_Springer_doutorado.pdf

    16/100

    6

    1.2) Objetivo

    No presente trabalho, foram analisadas amostras de leos provenientes de bacias

    sedimentares brasileiras e da bacia sedimentar colombianaLlanos Orientales.

    O principal objetivo deste estudo propor um mtodo para extrao de

    informaes desconhecidas a partir de uma base de dados, tendo como resultado a

    visualizao de agrupamentos fuzzy de amostras de leo a partir de parmetros

    geoqumicos para avaliar a maturao trmica e identificar a origem.

  • 8/12/2019 Marcia_Val_Springer_doutorado.pdf

    17/100

    7

    Captulo 2.

    rea de estudo

    O banco de dados para a realizao deste estudo apresenta parmetros

    geoqumicos de maturao e ambiente deposicional para amostras provenientes de

    bacias sedimentares da margem continental brasileira e da bacia sedimentar

    colombiana Llanos Orientales. As amostras de leo provenientes de bacias

    sedimentares brasileiras, exploradas neste presente trabalho, foram caracterizadas

    geoquimicamente nos trabalhos: JESUINO (2005), TAMANQUEIRA (2006),

    CALDAS (2009) e SILVA (2010). J as amostras de leo provenientes da bacia

    colombiana foram caracterizadas previamente no trabalho desenvolvido por

    SPRINGER (2007). A seguir, ser apresentada uma breve descrio das reas de

    estudo envolvidas.

    - Bacias sedimentares brasileiras da margem continental

    O Brasil um pas com uma das maiores extenses de margem continental do

    mundo, englobando diversos segmentos com bacias sedimentares com caractersticas

    geolgicas distintas e diferentes graus de conhecimento do potencial exploratrio,

    figura 2 (MELLO, 1988; MELLO et al., 1988a, b). A origem das bacias sedimentares

    da margem continental brasileira est diretamente relacionada ao processo de ruptura

    e separao das placas tectnicas africana e sul-americana, figura 3 (BIZZI et al.,

    2003).

    A margem divergente da Amrica do Sul, estendendo-se por mais de 12.000 kmdesde o Delta do Orinoco no Oriente Venezuelano at a Terra do Fogo, no extremo

    sul da Argentina, inclui um sistema contnuo de bacias sedimentares originadas pelos

    mecanismos de distenso litosfrica que, a partir do Mesozico, conduziram ruptura

    do paleocontinente Gondwana, e separao definitiva das placas Africana e Sul-

    Americana, acompanhando a formao do Oceano Atlntico Sul.

    Considerando-se a natureza e a orientao dos campos de tenses regionaisdurante a fase de rifteamento e a dinmica das placas Africana e Sul-Americana

  • 8/12/2019 Marcia_Val_Springer_doutorado.pdf

    18/100

    8

    durante a fase de deriva continental, trs domnios distintos podem ser reconhecidos

    ao longo da margem: uma regio dominantemente distensiva, entre o sul da Argentina

    e o extremo nordeste da costa brasileira; um segmento de natureza transformante,

    correspondente ao Atlntico Equatorial; e a regio ao norte da Foz do Amazonas,

    onde novamente operaram processos de carter dominantemente distensional

    (MILANI & THOMAZ FILHO, 2000).

    No domnio distensivo meridional, o estilo estrutural durante a fase rift foi

    marcado pela atividade de falhas normais orientadas principalmente na direo

    paralela costa. Este estilo pode ser observado em cada uma das bacias individuais ao

    longo da margem. Falhas de transferncia ocorrem a altos ngulos em relao

    direo regional de desenvolvimento das falhas normais. O conjunto de falhas

    normais evoluiu e acabou por definir a orientao regional de abertura da margem

    passiva, e as zonas de transferncia do riftnuclearam as grandes falhas transformantes

    do assoalho ocenico, cuja projeo contra a borda do continente se d em ngulo reto

    (MILANI et al., 2000).

    O estilo tectnico da margem adjacente ao Atlntico Equatorial foi diferente.

    Cisalhamento dextrgiro foi o mecanismo responsvel pela ruptura crustal, originando

    um padro de falhas oblquas subverticais que controlaram o rifteamentoe evoluram

    para grandes zonas de fratura ocenicas paralelas costa entre as quais se incluem

    Fernando de Noronha, Chain, Romanche e So Paulo.

    Uma terceira regio na margem divergente da Amrica do Sul corresponde ao

    trecho situado ao norte da Foz do Amazonas. Tal domnio faz parte de outro contexto

    distensivo, o do Oceano Atlntico Central, mais antigo que o restante da margem umavez que l se encontram documentados processos de ruptura ativos j no Trissico.

    Os vrios setores individuais ou bacias ao longo da extensa e contnua

    margem divergente do continente compartilham algumas caractersticas comuns,

    como por exemplo, os clssicos estgios tectono-sedimentares evolutivos que incluem

    o rift, a fase transicional e a marinha aberta (MILANI et al.,2000).

  • 8/12/2019 Marcia_Val_Springer_doutorado.pdf

    19/100

    9

    Como resultado de sua histria evolutiva, o registro sedimentar dessas bacias

    pode ser subdividido em quatro grandes seqncias: pr-rift, rift, transicional, e drift.

    A sequncia pr-rift, depositada do final do Jurssico ao inicio do Cretceo,

    caracterizada por sedimentos continentais, principalmente lacustres, fluviais e

    delticos. A seqncia rift, de idade Neocomiana a Barremiana, se depositou na fase

    de extenso crustal e caracterizada pelo predomnio de sedimentos lacustres de gua

    doce/salobra a salina, e secundariamente, por depsitos flvio-delticos. A seqncia

    transicional, de idade Aptiana, depositou-se entre o final da fase rift e o incio do

    estgio drift, sendo caracterizada por depsitos fluviais, delticos e lacustres com

    influncia marinha e alta salinidade. Finalmente, a seqncia drift depositou-se do

    Albiano ao presente, em resposta ao processo de separao entre as placas africana e

    sul-americana e formao do oceano Atlntico, sendo que seus depsitos so

    essencialmente marinhos (BIZZI et al., 2003).

  • 8/12/2019 Marcia_Val_Springer_doutorado.pdf

    20/100

    10

    Figura 2: Mapa de localizao das bacias sedimentares da margem continental brasileira(modificado de MELLO et al., 1988b).

  • 8/12/2019 Marcia_Val_Springer_doutorado.pdf

    21/100

    11

    Figura 3: Mapa com a distribuio das bacias marginais dos litorais brasileiro e africano,apresentando reconstruo tectnica das bacias sedimentares na configurao pr-derivacontinental, ajustado a reconstruo paleogrfica de 124Ma. (BIZZI et al., 2003).

  • 8/12/2019 Marcia_Val_Springer_doutorado.pdf

    22/100

    12

    - Bacia sedimentar colombiana,Llanos Orientales

    A bacia sedimentar colombiana Llanos Orientales est localizada no final

    norte de uma longa srie de bacias subandinas, estendidas desde a Argentina at a

    Venezuela (Figura 4). A maior parte da bacia est localizada na Colmbia, cobrindo

    uma rea de aproximadamente 200.000 Km2, com uma pequena poro no sudeste da

    Venezuela. A bacia dos Llanos Orientales cercada ao oeste pela Cordilheira

    Oriental; ao norte pela bacia Apure e pela Cordilheira de Mrida na Venezuela; a leste

    pelo escudo cratnico Guiana e ao sul pela Bacia Amaznica. A bacia dos Llanos

    Orientales, situada na Colmbia, tem sua historia geolgica ligada ao

    desenvolvimento da parte norte dos Andes. Embora a formao desta bacia e o

    preenchimento inicial com sedimentos tenham sido provocados por mecanismos de

    subsidncia tectnica e termal associados com eventos de extenso litosfrica (rift

    intracratnico e back-arc), a geometria atual e os processos de carga do petrleo esto

    associados a mecanismos compressivos que provocaram inverso tectnica e o

    soerguimento dos Andes no Negeno.

    Esses ltimos eventos criaram novas estruturas ou transformaram

    drasticamente aquelas mais antigas, modificando os regimes termal e de presses e

    tendo importantes implicaes no funcionamento dos sistemas petrolferos,

    principalmente na distribuio e qualidade das acumulaes (BAUTISTA, 2008).

    A ltima seo do Cretceo do nordeste da Amrica Latina contm excelentes

    rochas geradoras, que tem originado a maioria dos leos encontrados na Colmbia,

    Equador e Venezuela. Os sedimentos ricos em matria orgnica da formaoLa Luna

    so descritos como de fontes marinhas, alglicas e carbonticas (ZUMBERGE, 1983).Entretanto, reconstrues estratigrficas e paleogeogrficas mostram que este

    esquema um pouco simplista. A complexa evoluo tectnica do nordeste da

    Amrica do Sul resulta em uma grande variedade de ambientes deposicionais e

    condies paleogeogrficas, que controlam o tipo e a quantidade de matria orgnica

    preservada. Essas mudanas nas caractersticas da rocha geradora resultam em

    diferentes tipos de leos (BAUTISTA, 2008).

  • 8/12/2019 Marcia_Val_Springer_doutorado.pdf

    23/100

    13

    Figura 4: Mapa de localizao da bacia sedimentar colombiana Llanos Orientales,apresentando os campos explorados ( ).

    "Bacia

    Llanos Orientales

    10 N

    80 W 75 WN

    1120000 1140000 1160000 1180000 1200000 1220000 1240000 1260000 1280000 1300000 1320000 13400001000000

    1020000

    1040000

    1060000

    1080000

    1100000

    1120000

    YOPAL

    LA GLORIA NORTE

    EL PALMARJUNCAL

    CUPIAGUA

    CUSIANALA GLORIA

    FLORENA

    SARDINAS

    CONCESIONTRINIDAD

    TOCARIA

    CANO GARZA LAS ABEJAS

    0 m 25000 m 50000 m

    BUENOS AIRES

    RIO CHITAMENA

    PAUTO SUR

    CaribbeanSea

    PacificOcean "

    BaciaLlanos Orientales

    10 N

    80 W 75 WNN

    1120000 1140000 1160000 1180000 1200000 1220000 1240000 1260000 1280000 1300000 1320000 13400001000000

    1020000

    1040000

    1060000

    1080000

    1100000

    1120000

    YOPAL

    LA GLORIA NORTE

    EL PALMARJUNCAL

    CUPIAGUA

    CUSIANALA GLORIA

    FLORENA

    SARDINAS

    CONCESIONTRINIDAD

    TOCARIA

    CANO GARZA LAS ABEJAS

    0 m 25000 m 50000 m

    BUENOS AIRES

    RIO CHITAMENA

    PAUTO SUR

    1120000 1140000 1160000 1180000 1200000 1220000 1240000 1260000 1280000 1300000 1320000 13400001120000 1140000 1160000 1180000 1200000 1220000 1240000 1260000 1280000 1300000 1320000 13400001000000

    1020000

    1040000

    1060000

    1080000

    1100000

    1120000

    1000000

    1020000

    1040000

    1060000

    1080000

    1100000

    1120000

    YOPALYOPAL

    LA GLORIA NORTE

    EL PALMARJUNCAL

    CUPIAGUA

    CUSIANALA GLORIA

    FLORENA

    SARDINAS

    CONCESIONTRINIDAD

    TOCARIA

    CANO GARZA LAS ABEJAS

    0 m 25000 m 50000 m

    BUENOS AIRES

    RIO CHITAMENA

    PAUTO SUR

    Mar do Caribe

    OceanoPacfico

  • 8/12/2019 Marcia_Val_Springer_doutorado.pdf

    24/100

  • 8/12/2019 Marcia_Val_Springer_doutorado.pdf

    25/100

    15

    A diagnese o processo inicial de alterao fsica, qumica e biolgica da

    matria orgnica sob condies de soterramento incipiente e baixas temperaturas. Ao

    final dessa etapa, a biomassa de origem sedimentar se transforma em querognio,

    constituinte orgnico das rochas sedimentares, insolvel em solventes orgnicos

    (TISSOT & WELTE, 1984). Com o aumento da presso e temperatura (soterramento

    progressivo), o querognio degradado para a formao do petrleo, iniciando o

    estgio denominado catagnese, e a matria orgnica passa por uma srie de

    transformaes qumicas, tais como reaes de isomerizao, aromatizao e

    craqueamento, que resultam na converso do querognio em leo. Sob condies de

    soterramento ainda maiores, chega-se ao estdio denominado metagnese, onde

    mudanas mais severas no material orgnico ocasionam a formao de metano e

    restando apenas resduos carbonosos.

    O grupo dos hidrocarbonetos saturados constitui o grupo mais abundante e a

    classe mais investigada, pois onde se encontram os biomarcadores (terpanos e

    esteranos) e os diamantides.

    A concentrao de hidrocarbonetos saturados no petrleo depende das suas

    geradoras que por sua vez esto relacionadas ao tipo de matria orgnica e seu

    respectivo ambiente deposicional. leos mais pesados e leos originados de matria

    orgnica de origem continental possuem maior proporo destes compostos, enquanto

    que leos derivados de matria orgnica de origem marinha, ou uma mistura destes

    dois tipos de matria orgnica geram um petrleo mais rico em compostos cclicos

    (TISSOT & WELTE, 1984).

    A caracterizao dos sistemas petrolferos, atravs de parmetros de geoqumica

    orgnica, fundamental para o desenvolvimento de modelos preditivos para a

    explorao de petrleo nas bacias sedimentares. A maturao trmica e o tipo da

    matria orgnica constituem as principais variveis que controlam a gerao de

    hidrocarbonetos nas bacias sedimentares. So vrios os parmetros geoqumicos

    utilizados para avaliar o nvel de evoluo trmica e para caracterizar o ambiente

    deposicional das rochas geradoras (PETERS & MOLDOWAN, 1993); os mais

  • 8/12/2019 Marcia_Val_Springer_doutorado.pdf

    26/100

    16

    utilizados se baseiam nas reaes de isomerizao de biomarcadores, particularmente

    das famlias dos esteranos e terpanos, e na concentrao de diamantides.

    Os biomarcadores so compostos orgnicos complexos que apresentam tomos

    de carbono e hidrognio, e so encontrados em rochas e sedimentos. So fsseis

    moleculares derivados de substncias presentes em organismos vivos, que mostram

    pequenas mudanas na estrutura herdada das molculas orgnicas originais

    (ZUNBERGE, 1987a; PETERS & MOLDOWAN, 1993). Durante a diagnese, as

    molculas dos precursores, os triterpenides e esterides, que contm um ou mais

    tomos de oxignio e que frequentemente apresentam ligaes duplas, passam por

    reaes qumicas nas quais perdem os tomos de oxignio. Suas ligaes duplas so

    reduzidas para produzir o biomarcador saturado mais estvel, preservado nas amostras

    geolgicas. Estes compostos representam uma pequena frao do petrleo, porm so

    de grande importncia, pois permitem a correlao entre leo e a rocha geradora, a

    avaliao do grau de evoluo trmica e do nvel de biodegradao que o leo foi

    submetido (WAPLES & MACHIHARA, 1991).

    Os parmetros de biomarcadores tm sido amplamente utilizados para a

    caracterizao de ambientes deposicionais das rochas geradoras de petrleo. Vrios

    autores descrevem a distribuio dos biomarcadores como uma ferramenta til para

    distinguir rochas geradoras depositadas em diferentes ambientes. As razes de

    biomarcadores, quando comparadas com outros parmetros, so teis na inferncia do

    tipo de rocha geradora mesmo quando apenas amostras de leos esto disponveis

    (PETERS et al., 2005). Os organismos que apresentam os precursores biolgicos dos

    biomarcadores vivem em determinadas condies ambientais. Logo, os

    biomarcadores podem ser utilizados como indicadores dessas condies de vida(WALPES & MACHIHARA, 1991).

    A seguir, esto listados os parmetros mais utilizados na caracterizao de

    ambientes deposicionais:

  • 8/12/2019 Marcia_Val_Springer_doutorado.pdf

    27/100

  • 8/12/2019 Marcia_Val_Springer_doutorado.pdf

    28/100

    18

    Razo Hopano/Esteranos

    Um dos principais parmetros de biomarcadores para anlise de origem a

    razo entre os hopanos/esteranos. Esta razo foi obtida abrangendo os esteranos C27

    -

    C29(20S+20R) + esteranos C27-C29(20S+20R) e os hopanos C29, C30,

    C31-C33 (22S+22R). Esta razo mostra a maior contribuio de organismos

    eucariticos (especialmente algas) ou contribuio de organismos procariticos

    (bactrias). Em geral, altas concentraes de esteranos e baixos valores da razo

    hopanos/esteranos (menor ou igual a 4) indicam deposio de matria orgnica

    marinha com maior contribuio de organismos planctnicos e/ou algas.

    Diferentemente, baixas concentraes de esteranos e altos valores de razo

    hopano/esterano (maior que 7) indicam deposio de matria orgnica continental

    e/ou microbiana retrabalhada (PETERS et al., 2005).

    Razo TPP/DIA

    Outro importante parmetro de origem a razo dos poliprenides tetracclicos

    (TPPs) / Diasteranos C27 13(H),17(H) (20S+20R). HOLBA et al. (2000, 2003)

    mostraram que indicadores especficos, os tetracclicos poliprenides (TPP),

    permitem uma melhor diferenciao entre os ambientes lacustres e marinhos. A

    caracterizao desses ambientes mais complexa porque eles possuem uma enorme

    variedade de condies deposicionais. Estes autores mostraram que a abundncia

    destes compostos no petrleo reflete a natureza do ambiente. Altas concentraes

    relativas de TPPs em leos e rochas geradoras em relao aos disteranos indicam

    deposio em ambientes marinhos.

    Razo Diasteranos/Esteranos

    A razo disteranos/esteranos dada por [(C27 13, 17(H) 20S + 20R)/(C27

    5,14,17(H) 20S + 20R)]. Os diasteranos esto presentes em quantidades

    significativas em leos que apresentam alta maturao trmica (WAPLES &

    MACHIHARA, 1991). So formados facilmente emsedimentos clsticos, logo a razo

    disteranos/esteranos frequentemente usada para diferenciar rochas geradorascarbonticas de clsticas (WALPES & MACHIHARA, 1991; PETERS et al., 2005).

  • 8/12/2019 Marcia_Val_Springer_doutorado.pdf

    29/100

  • 8/12/2019 Marcia_Val_Springer_doutorado.pdf

    30/100

    20

    Esta razo bastante utilizada na caracterizao de ambientes deposicionais, e

    de acordo com alguns estudos, as maiores abundncias do terpano tetracclico C24

    foram encontradas em ambientes marinho deltaicose lacustres salinos (MELLO,

    1988). No entanto, este autor afirma que na ausncia de outras evidncias a alta

    abundncia relativa do terpano tetracclico C24indica abundante deposio de matria

    orgnica terrestre.

    Razo Ts/Tm

    SEIFERT & MOLDOWAN. (1980), mostraram que esta razo s era afetada

    pela maturao trmica. Porm, alguns estudos posteriores mostraram a correlao de

    Ts e Tm com condies diagenticas. Apesar da relao entre Ts/Tm e a litologia

    ainda no ser bastante clara, vrios estudos j mostraram que os valores de Ts/Tmso

    menores em ambientes hipersalinos e maiores em carbonticos (RULLKOTTER &

    MARZI, 1988; WAPLES & MACHIHARA, 1991). ROBINSON, (1987), mostrou

    tambm que em leos de origem terrestre os valores de Tmso maiores e nos leos de

    origem lacustre so baixos.

    O avano das transformaes qumicas sofridas pelo querognio e o petrleo sob

    condies crescentes de soterramento e temperatura resultam na formao de

    hidrocarbonetos mais leves que podem ser monitorados por uma srie de indicadores

    geoqumicos, conhecidos como parmetros de maturao trmica (TISSOT &

    WELTE, 1984).

    Distribuies de biomarcadores so amplamente utilizados na avaliao da

    maturidade do leo (PETERS & MOLDOWAN, 1993). Muitos dos parmetros de

    maturao, envolvendo biomarcadores, atingem o equilbrio antesda janela de leo, e

    em alguns casos, mostram inverso em nveis elevados de maturidade.

    Consequentemente, estas propores no so eficazes como indicadores de maturao

    para leos de alta maturidade (FARRIMOND et al., 1998).

    Os parmetros de maturao trmica mais usados so:

  • 8/12/2019 Marcia_Val_Springer_doutorado.pdf

    31/100

    21

    22S/(22S+22R); razo de isomerizao dos homohopanos

    Isomerizao no C22dos 17(H)-hopanos C31a C35ocorre antes que muitas razes

    de biomarcadores usados para estimar a maturao trmica de leos e sedimentos. O

    precursor biolgico possui a configurao 22R que gradualmente convertida em

    uma mistura de diastereoismeros 22R e 22S. As propores de 22R e 22S podem ser

    calculadas para todos ou apenas um homohopano. Porm, como os homlogos C33,

    C34e C35podem apresentar problemas de coeluio de picos, os mais utilizados para

    calcular esta razo so os homlogos C31e C32 (PETERS et al., 2005).

    A razo 22S/(22S+22R) varia de 0 a 0,6 (valor de equilbrio 0,57 a 0,62) durante

    o processo de maturao trmica. Alguns estudos mostram que essa razo sofre

    influncia de alguns fatores, como por exemplo, a litologia da bacia. Portanto, essa

    razo deve ser utilizada com cautela (PETERS et al., 2005).

    Terpanos Tricclicos/17(H)-hopanos

    Esta razo aumenta com o aumento da maturao trmica. Isto ocorre porque

    mais tricclicos so liberados do querognio em altos nveis de maturao. A origem

    dos terpanos tricclicos pode ser o resultado da diagnese de vrios precursores

    biolgicos; logo esta razo pode variar consideravelmente entre leos de diferentes

    rochas geradoras ou diferentesfcies orgnicas da mesma rocha geradora (PETERS et

    al., 2005).

    Ts/(Ts+Tm)

    Durante a catagnese, C2717(H)-trisnorhopano (Tm ou 17(H)-22,29,30-

    trisnorhopano) apresenta menor estabilidade do que o C27 18(H)-trisnorhopano II (Ts

    ou 18 (H)-22,29,30-trisnorneohopano).

    Esta razo deveras dependente quanto maturidade e quanto origem. Por

    isso, um bom indicador de maturao quando utilizada para avaliar leos de mesma

    origem com fcies orgnicas compatveis (PETERS et al., 2005).

  • 8/12/2019 Marcia_Val_Springer_doutorado.pdf

    32/100

    22

    20S/(20S+20R), razo de isomerizao dos esteranos

    Devido facilidade na anlise usando os cromatogramas de massa do on m/z

    217, as razes de isomerizao dos esteranos so calculadas nos compostos C29

    (24-

    etilcolestanos, estigmastanos ou sistostanos), visto que os compostos C27 e C28

    apresentam interferncia de coeluio de picos (PETERS et al., 2005).

    medida que aumenta a maturao trmica, a configurao R no C20, existente

    nos precursores esteroidais presentes nos organismos vivos, convertida em uma

    mistura de configuraes R e S. A isomerizao no C20do C295(H),14(H),17(H)

    aumenta a razo de zero para aproximadamente 0,5, sendo o valor de equilbrio entre

    0,52 e 0,55.

    Alguns fatores como variaes organofcies e a biodegradao podem afetar

    razes de esteranos. No caso da biodegradao, h a remoo seletiva dos epmeros

    resultando no aumento da razo para valores acima de 0,55 (PETERS et al., 2005).

    /(+), C29esteranos

    A isomerizao no C-14 e C-17 nos C29esteranos regulares 20S e 20S gera um

    aumento na razo /(+), que varia de valores prximos de zero at 0,7 (valores

    de equilbrio 0,67 a 0,71). O grfico /(+) versus 20S/(20S+20R) para os

    esteranos C29 so eficazes na caracterizao da maturao trmica das rochas

    geradoras e leos, sendo muito utilizado no estudo de sistemas petrolferos (SEIFERT

    & MOLDOWAN, 1986).

    Geralmente, os parmetros de maturao baseados em biomarcadores saturados

    no podem ser aplicados em amostras de leo altamente maturo como dito

    anteriormente. Sendo assim, utiliza-se uma anlise integrada dos parmetros de

    biomarcadores e diamantides, j que estes so mais estveis degradao trmica.

  • 8/12/2019 Marcia_Val_Springer_doutorado.pdf

    33/100

    23

    Os diamantides j foram identificados em vrios leos brutos (WEI et al.,

    2007; AZEVEDO etal., 2008e referncias, SPRINGERetal., 2010; FANG et al.,

    2012).Elesso rgidos,emais estveis do queos hidrocarbonetos: uma vez formados,

    eles so resistentes destruio trmicae biolgica (WINGERT, 1992). Variaes na

    estabilidade trmica de diamantides metil-substitudos levaram utilizao de

    determinadas propores de ismeroscomo parmetrosde maturaode leos brutos

    e rochasgeradoras, especialmenteem fasesde alta gerao dehidrocarboneto(CHEN

    etal., 1995;1996).

    Usando as relaes de diamantides em combinao com os biomarcadores,

    podemos efetuar uma avaliao mais refinada de maturidade e de ambiente

    deposicional (DAHL et al., 1999; AZEVEDO et al., 2008; SPRINGER et al., 2010).

    Os parmetros de diamantides empregados na avaliao das amostras de leo

    do presente estudo foram os ndices IMA (ndice metil-adamantano) e IMD (ndice

    dimetiladamantano), proposto por CHEN et al. (1996), e os ndices do grfico de

    DAHL et al. (1999) para avaliao do grau de maturao trmica, apresentados a

    seguir.

    Os estudos de DAHL et al. (1999) propuseram que a estabilidade trmica dos

    diamantides conduz sua concentrao progressiva durante o craqueamento do leo,

    enquanto a concentrao de biomarcadores diminui. Este mtodo particularmente

    til para condensados altamente maturos, onde outros mtodos podem no ser

    confiveis. Os biomarcadores, por geralmente apresentarem ligaes que podem ser

    rompidas, com o aumento da maturao trmica, sua concentrao decresce antes do

    craqueamento da maioria dos componentes de leos. Os diamantides, queapresentam estrutura molecular bastante estvel quando comparada a outros

    componentes do petrleo, tendem a ter concentraes maiores no leo residual. Desta

    forma, o craqueamento intenso de um leo acarreta a destruio da maioria dos

    componentes e o aumento da concentrao de diamantides. Segundo DAHL et al.

    (1999), diferentes biomarcadores apresentam comportamentos diferentes frente

    estabilidade trmica.

  • 8/12/2019 Marcia_Val_Springer_doutorado.pdf

    34/100

  • 8/12/2019 Marcia_Val_Springer_doutorado.pdf

    35/100

    25

    Esses parmetros de maturao foram escolhidos por serem mais resistentes ao

    estresse trmico, e j terem sido amplamente estudados (PETERS & MOLDOWAN,

    1993; AZEVEDO et al., 2008;SPRINGER et al., 2010).

  • 8/12/2019 Marcia_Val_Springer_doutorado.pdf

    36/100

    26

    Captulo 4.

    Fundamentao Terica

    4.1) Anlise de agrupamento Clustering

    A anlise de agrupamento uma das etapas na minerao de dados que

    rotineiramente utilizada como um primeiro passo para descobrir a estrutura oculta

    do conjunto de dados no ordenados, criando grupos com certa similaridade, ou seja,

    cria grupos associados a uma funo de pertinncia (HLLERMEIER, 2005). Por

    esse critrio: sendo um conjunto de dados representados pelos registros e valores das

    variveis, deseja-se criar uma funo que determine qual grupo cada registro pertence.

    O objetivo desta tcnica dividir o conjunto de dados em subconjuntos homogneos.

    A anlise de agrupamento possui diversas etapas:

    representao dos padres (podendo incluir extrao ou seleo de

    caractersticas): envolve definio do nmero, tipo e modo de apresentao

    dos atributos que descrevem cada padro;

    seleo de caractersticas: processo de identificao do subconjunto mais

    efetivo dos atributos disponveis para descrever cada padro;

    extrao de caractersticas: uso de uma ou mais transformaes junto aos

    atributos de entrada de modo a salientar uma ou mais caracterstica dentre

    aquelas que esto presentes nos dados.

    medida de similaridade: fornecida por uma funo de distncia definida entre

    pares de dados ou padres. possvel incluir na medida de distncia aspectos

    conceituais (qualitativos) ou ento numricos (quantitativos).

    agrupamento: os grupos podem ser definidos como conjuntos crisp (um

    padro pertence ou no-pertence a um dado grupo) oufuzzy(um padro pode

    apresentar graus de pertinncia aos grupos). O processo de agrupamento pode

  • 8/12/2019 Marcia_Val_Springer_doutorado.pdf

    37/100

  • 8/12/2019 Marcia_Val_Springer_doutorado.pdf

    38/100

    28

    Sendo um ramo da estatstica, a clusterizaotem sido vastamente estudada por

    muitos anos, baseando-se na introduo de uma medida de distncia entre os objetos.

    A partir da utilizao dessa medida, determina-se um critrioque expressa a ideia da

    clusterizao, isto , que particiona o conjunto de objetos em nclustersindividuais e

    homogneos, nos quais elementos de um cluster so to similares entre si quanto

    possvel, e to diferentes quanto possvel, dos elementos dos outros clusters. Segundo

    BRAILOVSKY (1991), a minimizao desse critrio resulta em clusters timos.

    A anlise de agrupamentos lida com a descoberta de estruturas e grupos de um

    conjunto de dados, e para melhor proveito, dados multivariados. Assim sendo,

    dificilmente algum poder afirmar que a descoberta de determinado grupo ser

    perfeita. De fato, rudos ou imprecises no podem ser completamente eliminados

    (HOPPNER et al., 2000).

    Na anlise de agrupamento clssica, cada objeto atribudo a um clusterde

    uma maneira inequvoca. Consequentemente, os grupos individuais so separados por

    uma fronteira acentuada, abrupta. Na prtica, tais limites no so frequentemente

    muito naturais. Na verdade, a fronteira entre os clusterse a transio entre eles so

    geralmente suave e no abrupta. Isso pode ser feito por meio do uso da Teoria de

    Conjuntos Fuzzy (TCF) para representar valores imprecisos. Nos mtodos de

    agrupamentofuzzy, um objeto pode pertencer a diferentes grupos ao mesmo tempo, o

    grau que cada objeto pertence a um grupo particular expresso em termos de uma

    funo de pertinncia (HLLERMEIER, 2005).

    No presente trabalho, o algoritmo adotado o fuzzy c-means (FCM), que

    pertence ao grupo de algoritmos para agrupamentos fuzzy, desenvolvido segundo

    EVSUKOFF et al., 2004. A seguir ser apresentado o mecanismo de agrupamento via

    fuzzy c-means.

  • 8/12/2019 Marcia_Val_Springer_doutorado.pdf

    39/100

    29

    4.2) Mtodo de AgrupamentoFuzzy

    Como visto anteriormente, na anlise de clusterclssica (crisp), essas classes

    devem formar uma partio de X; indivduos que pertencem ao mesmo bloco (classe)

    da partio esto totalmente relacionados (so indistinguveis) e indivduos que

    pertencem a blocos distintos no esto relacionados. Em outras palavras, indivduos

    esto totalmente relacionados entre si ou no esto relacionados. Em muitas

    aplicaes prticas, no entanto, uma partio crisppode ser muito restritiva e invivel,

    devido, muitas vezes, impreciso ou a no completeza dos dados.

    Segundo BEZDEK & PAL (1992), a impreciso nos dados pode surgir de

    diversas fontes. Por exemplo, erros em instrumentos ou rudos no experimento podem

    levar a valores parcialmente confiveis de determinados atributos. Em alguns casos, o

    custo envolvido na extrao de valores muito precisos de um atributo pode ser alto.

    Em outros casos, pode ser difcil decidir quais so os atributos mais relevantes que

    caracterizam um elemento. Por essas razes, torna-se conveniente o uso de variveis

    lingusticas e limitaes para descrever os valores de atributos, em vez de tentar

    fornecer uma representao numrica exata para os dados com valores incertos dos

    atributos. Isso pode ser feito por meio do uso da Teoria de Conjuntos Fuzzy (TCF)

    para representar valores imprecisos. Conjuntos Fuzzyesto inerentemente inclinados a

    lidar com o conhecimento e domnio lingustico produzindo solues mais

    interpretveis. Essa teoria de conjuntosfuzzyfoi introduzida primeiramente por Zadeh

    em meados da dcada de 60, e construa a partir dos conceitos j estabelecidos da

    lgica clssica.

    Na teoria clssica dos conjuntos, as relaes entre um elemento e um conjunto

    so bem definidas: dado um conjunto A em um universo U, os elementos deste

    universo pertencem ou no pertencem quele conjunto. Esta relao expressa por

    uma funo caracterstica fA: se fA(x) = 1, x pertence a A; se fA(x) = 0, x no

    pertence a A.

  • 8/12/2019 Marcia_Val_Springer_doutorado.pdf

    40/100

    30

    Zadeh props uma generalizao: a funo caracterstica pode assumir um

    nmero infinito de valores no intervalo de [0,1]. Sendo assim, um conjunto fuzzyA

    em um universo U definido por uma funo de pertinncia A(x): U[0,1]. Um

    determinado elemento do universo pode pertencer simultaneamente a um conjunto e

    ao seu complementar, sendo representado pela funo de pertinncia (REZENDE,

    2005).

    Segundo KLIR & YUAN (1995), a teoria de conjuntos fuzzypode ser utilizada

    em pelo menos dois nveis no problema de clusterizao: 1) no nvel de atributos,

    para representar os elementos do conjunto como um vetor de graus de pertinncia,

    sendo que cada um desses graus representa o grau de posse do atributo em questo,

    por parte desses elementos; e 2) no nvel de classificao, para representar a

    pertinncia desses elementos s classes, bem como para prover uma estimativa das

    informaes incompletas em termos de valores de pertinncia. Em ambos os casos,

    permitem-se diferentes graus de relacionamento entre elementos do conjunto, sendo

    que um elemento pode pertencer a mais de uma classe. Com a utilizao da

    abordagem fuzzy, o problema passa ento a ser caracterizado como um problema de

    clusterizao fuzzy, cujo objetivo a obteno de uma partio fuzzyem um conjunto

    de dados X. No agrupamento fuzzy, cada cluster um conjunto fuzzyde todos os

    padres, como apresentado na Figura 8, que exemplifica agrupamentos nebulosos e

    no nebulosos sendo os retngulos H1 e H2 agrupamentos crisp (hard) e as elipses F1

    e F2 a sada do algoritmo nebuloso.

  • 8/12/2019 Marcia_Val_Springer_doutorado.pdf

    41/100

    31

    Figura 8: Comparao entre agrupamentos clssicos (conjuntos H1 e H2) eagrupamentos fuzzy (conjuntos F1 e F2) (modificado de JAIN, MURTY, FLYNN,1999).

    Existem muitos algoritmos de clusterizaodisponveis na literatura, sendo

    que a sua escolha depende dos tipos de dados disponveis e da aplicao desejada

    (GAN et al., 2007). Dois tipos so mais aceitos: algoritmos de mtodos hierrquicos e

    de mtodos de partio. O primeiro organiza o conjunto de dados em uma forma

    hierrquica de acordo com a proximidade entre os indivduos e os resultados so

    visualizados na forma de um dendrograma. J os mtodos particionais associam um

    conjunto de indivduos a k grupos sem criar uma estrutura hierrquica.

    A maioria dos algoritmos de clusterizao de alguma forma dependente de

    uma distncia a qual utilizada para definir que registros so similares e quais no.

    Vrios mtodos tm sido desenvolvidos para obter tanto clusters baseados na teoria

    clssica quanto fuzzya partir de um determinado conjunto de dados. Para o caso da

    abordagemfuzzy, foco deste trabalho, na seo seguinte ser apresentado o algoritmo

    de relevncia e aplicabilidade para este estudo, o algoritmo Fuzzy c-means.

  • 8/12/2019 Marcia_Val_Springer_doutorado.pdf

    42/100

    32

    4.2.1) Mtodo de AgrupamentoFuzzy C-means(FCM)

    Fuzzy C-means o algoritmo de clusterizao de mtodo de partio mais

    popular, e derivado do algoritmo K-means. O mtodo de clusterizaoFCM feitosubstituindo a funo caracterstica por uma funo de pertinncia, que gera uma

    transio suave, ou seja, permite que um dado pertena a dois ou mais agrupamentos

    simultaneamente (EVSUKOFF et al., 2004; EVSUKOFF et al., 2006; OLIVEIRA &

    PEDRYCZ, 2007). Pode ser descrito da seguinte maneira:

    Supondo um conjunto de indivduos X={x1,...,xn}, x Rp

    (espao p

    dimensional), deseja-se organiz-los em clusters, C={C1,..., Cc}. O algoritmo FCM

    objetiva fornecer uma partio fuzzy de um conjunto de indivduos em c clusters.

    Sendo assim, ele define e minimiza uma funo objetivo (Jm), a qual mede a

    adequao entre os indivduos e os clusters:

    Onde, m>1 representa o fator de nebulosidade que existe entre uma categoria e outra.

    O algoritmo possui V={v1,...,vc} como um conjunto de vetores que representa os

    centros das categorias. Urepresenta a matriz de graus de incluso nebulosos, e ij o

    grau de incluso do ponto j na categoria i. A matriz U deve seguir as seguintescondies: a soma dos valores de pertinncia de um registro a todas as classes igual

    a 1, ou melhor, a soma de todas as colunas de uma linha da matriz U igual a 1; cada

    registro deve pertencer a pelo menos um agrupamento e nenhum deles deve conter

    todos registros, ou seja, a soma de todas as linhas da matriz Udeve ser maior que 0 e

    menor que n.

    O mtodo fuzzy c-means pode ser equacionado por meio de um algoritmoiterativo, baseado na minimizao de um ndice de desempenho, que indica a

  • 8/12/2019 Marcia_Val_Springer_doutorado.pdf

    43/100

    33

    adequabilidade da pseudopartio gerada. O desempenho do algoritmo influenciado

    pela escolha do nmero de classes c, dos centros de cluster iniciais, da ordem na qual

    os vetores so processados, da medida de distncia, do critrio de parada e pelas

    propriedades geomtricas dos dados. Os conjuntos que apresentam clusters

    compactos, bem separados e com formas hiperesfricas, so apropriados para este

    mtodo, mas para encontrar agrupamentos adequados necessrio realizar extensivos

    testes com vrios valores de c, distncias, critrios de parada, centros de cluster

    iniciais e diferentes ordens de amostras.

    Assim, o algoritmo assume como entrada os seguintes parmetros: o nmero

    desejado de clustersc; uma medida de distncia m (1,), que define a distncia

    permitida entre os pontos e os centros de cluster; e um nmero pequeno > 0,

    utilizado como um critrio de parada, alm da instanciao inicial dos graus de

    pertinncia dos objetos a cada uma das classes e dos centros de cluster dessas classes.

    A seguir, sero descritos os passos do algoritmo.

    Passo1: Considere t = 0 representando a iterao 0. Defina P(0) como uma

    pseudopartio P = {A1,A2,,Ac}, atribuindo os graus de pertinncia dos elementos

    s classes dessa pseudopartio, os quais podem ser informados ou calculados de

    forma aleatria.

    Passo2:No caso de t = 0, fornea osccentros de cluster1(t), c

    (t)iniciais. Para t >

    0, calcule osccentros de cluster1(t), c

    (t)pela equao abaixo para P(t) e o valor de

    m fornecido.

    A varivel real m> 1 chamada de ndice defuzzificaoe usada para definir

    a distncia permitida entre os pontos e o centro que est sendo calculado. Quanto

    maior o valor de m, mais elementos do conjunto so considerados como pertencentes

  • 8/12/2019 Marcia_Val_Springer_doutorado.pdf

    44/100

    34

    a uma pseudopartio. Esse parmetro escolhido de acordo com o problema

    considerado. No existe nenhuma base terica para uma escolha tima do valor de m.

    O vetor i, calculado pela equao acima visto como o centro do cluster Ai a mdia

    ponderada dos dados em Ai. O peso do dado X a m-sima potncia do seu grau depertinncia ao conjuntofuzzyAi.

    Passo3:Atualize P(t)para P(t+1) usando o seguinte procedimento: para cada xkX e

    para todo i {1,2,,c}, se ||xk- i(t)||2>0, calcule o grau de pertinncia do elemento

    xk classe Ai, pela frmula abaixo, sendo que as classes Aipodem ser selecionadas

    em uma ordem pr-definida ou aleatoriamente.

    Assume- se que || || alguma norma indicada para o produto interno no espao R pe

    ||xk-i(t)||2representa a distncia entre xkei.

    Por meio da frmula acima, a distncia de cada elemento xkao centro de cluster

    ida pseudopartio atual Ai comparada distncia do mesmo elemento ao centro

    de cluster jde todas as demais pseudoparties Aj, de modo a atribuir um grau de

    pertinncia ao elemento xk no cluster Ai que seja proporcional ao seu grau de

    pertinncia aos demais clusters Aj.

    Quando ||xk- i(t)||2= 0 para algum i I {1,2,,c}, o que indica que xkcorresponde

    ao centro de cluster i, defina Ai(t+1) (xk) como um nmero real no negativo que

    satisfaz a equao abaixo e defina Ai(t+1)(xk)= 0 para i {1,2,,c} -I.

  • 8/12/2019 Marcia_Val_Springer_doutorado.pdf

    45/100

    35

    Em casos como este, quando o elemento coincide com o centro de clusterde

    uma classe Ai, o ideal seria que o algoritmo atribusse a tal elemento o grau de

    pertinncia mximo (1) quela classe e o grau de pertinncia mnimo (0) s demais

    classes. No entanto, o teste realizado pela frmula acima se torna necessrio, uma vez

    que esse elemento pode ter sido associado a outras classes com um grau de

    pertinncia maior que zero, se Aino for a primeira classe selecionada pelo algoritmo.

    Nota- se, portanto, a influncia da ordem na qual as pseudoparties so escolhidas.

    Passo 4:Como critrio de parada, compare P(t)e P(t+1). Se |P(t)-P(t+1)| , ento pare;

    caso contrrio, faa t = t + 1 e retorne ao Passo 2.

    Neste teste, |P(t)- P(t+1)| denota a distncia entre P(t+1)e P(t), dada pela frmula:

    Essa frmula verifica se a mxima diferena entre o grau de pertinncia de

    qualquer elemento xkem uma dada classe Aina iterao atual e na iterao anterior

    menor que o erro definido e, sendo isso feito para todas as classes. Em caso positivo,

    o algoritmo deve parar e retornar os graus de pertinncias atuais de todos os

    elementos, em todas as classes, como resultado. Note que, quanto menor o valor de ,

    maior o nmero de passos e, consequentemente, mais refinada a pseudopartio

    final obtida.

    Ao final da ltima iterao do algoritmo, a pseudopartio obtida deve ser

    analisada segundo algum critrio que expresse a ideia geral de que as associaes so

    fortes dentro do cluster e fracas entre clusters. Este critrio pode ser definido, por

    exemplo, em termos de ndices de desempenho, tal como o ndice Jm(P), dado em

    funo dos centros de clustere de m pela frmula a seguir.

  • 8/12/2019 Marcia_Val_Springer_doutorado.pdf

    46/100

  • 8/12/2019 Marcia_Val_Springer_doutorado.pdf

    47/100

    37

    ainda pesquisas sendo desenvolvidas a esse respeito, como em KIM et al. (2004) e

    WU & YANG (2005), com uma tentativa de encontrar um ndice que se encaixe a

    qualquer estrutura de dados.

    Um dos ndices mais recentes de validao, o PBM, foi proposto por trs

    pesquisadores: Pakhira, Bandyopadhyay e Maulik. Este ndice o produto de trs

    fatores, cuja maximizao garante uma partio formada por um nmero pequeno de

    clusters e compactos separados (PAKHIRA et al., 2004). Esse ndice pode ser

    definido por:

    sendoc o nmero de agrupamentos e,

    tal que,

    e,

    N o nmero total de pontos do conjunto, U(X) = [uki]cN uma matriz de

    pertinncia para os dados e vi a matriz de centro do i -simo agrupamento. O

    objetivo maximizar o ndice para obter o nmero de agrupamentos. Quanto maior o

    ndice PBM, melhor ser a clusterizao fuzzy.

  • 8/12/2019 Marcia_Val_Springer_doutorado.pdf

    48/100

  • 8/12/2019 Marcia_Val_Springer_doutorado.pdf

    49/100

    39

    ndices de validao como PBM, Calinski-Harabasz, Xie-Beni, de maneira

    geral, tentam avaliar a capacidade intra-cluster e a separao inter-cluster (PAKHIRA

    et al., 2004).

    Note-se que o uso concomitante de um conjunto de ndices diferentes pode

    representar um subsdio mais robusto na escolha do melhor nmero de grupos. Isto

    porque resultados de ndices de origens diferentes e com interpretaes diversas que

    apresentam recomendaes coincidentes reforam as convices para a escolha a ser

    feita.

    O ndice de validao PBM obteve bons resultados em vrios bancos de dados

    quando comparado com outros ndices (PAKHIRA et al., 2004). Sendo assim, o

    ndice PBM foi aplicado na realizao deste trabalho.

  • 8/12/2019 Marcia_Val_Springer_doutorado.pdf

    50/100

    40

    Captulo 5.Materiais e Mtodos

    A utilizao das tcnicas geoqumicas permite correlacionar os leos entre si e

    com as rochas geradoras caracterizadas, correlaes essas que podem levar a

    concluses a respeito dos tipos de petrleo presentes em uma provncia produtora, e

    seus graus de evoluo trmica.

    Para a realizao deste estudo foi selecionado um conjunto de amostras de leos

    que foram caracterizadas por parmetros geoqumicos, envolvendo biomarcadores e

    diamantides.

    A preparao das amostras e os mtodos analticos empregados foram

    realizadas do laboratrio LAGOA- Laboratrio de Geoqumica Orgnica Molecular eAmbiental do Instituto de Qumica da UFRJ.

    5.1) Procedimentos Analticos

    As anlises geoqumicas realizadas nas amostras de leo, descritas a seguir,

    foram: separao em fraes por cromatografia lquida; cromatografia gasosa do leo

    total (whole oil) e cromatografia gasosa acoplada a espectrometria de massas dafrao dos hidrocarbonetos saturados. O procedimento analtico realizado no

    laboratrio est representado na figura9.

  • 8/12/2019 Marcia_Val_Springer_doutorado.pdf

    51/100

    41

    ()

    /

    (2)

    /

    (1)

    Figura 9: Esquema ilustrativo da sequncia de anlises para as amostras de leosselecionados.

  • 8/12/2019 Marcia_Val_Springer_doutorado.pdf

    52/100

    42

    5.1.1) Tcnicas analticas utilizadas

    As amostras de leos foram analisadas utilizando-se cromatografia lquida,

    cromatografia gasosa (CG) e cromatografia gasosa acoplada espectrometria de

    massas (CG-EM).

    - Cromatografia lquida

    A cromatografia lquida utilizada para separar os leos em fraes:

    hidrocarbonetos saturados, hidrocarbonetos aromticos e compostos polares

    (denominados NSO), a partir da propriedade da polaridade especfica que cada

    composto possui.

    Aproximadamente, 100 mg de leo bruto foi pesado e dissolvido em 5,0 mL de

    hexano, e acrescentou-se 0,5 mL da mistura de padres preparada previamente (n-

    dodecano-d26, n-hexadecano-d34 (Chiron S.A., Noruega), e n-tetracosano-d50

    (Cambridge Isotopes Laboratories, USA)). A soluo foi adicionada no topo da

    coluna cromatogrfica contendo 2,5 mg de slica gel ativada, e foi eluda com hexano.

    Sendo assim, as fraes de hidrocarbonetos saturados (1 frao), hidrocarbonetos

    aromticos (2 frao) e compostos NSO (3 frao) foram separadas (GRICE et al.

    2000; AZEVEDO et al., 2008; SPRINGER et al., 2010).

    A frao de hidrocarbonetos saturados (1 frao) foi eluda com 5,0 mL de n-

    hexano e recolhida em frascos de 2,0 mL, totalizando um volume final de

    aproximadamente 1,5 mL e logo em seguida analisada por cromatografia gasosa

    acoplada espectrometria de massas para a deteco dos diamantides.

  • 8/12/2019 Marcia_Val_Springer_doutorado.pdf

    53/100

    43

    Posteriormente, o volume final foi reduzido a aproximadamente 800 L, para anlise

    dos biomarcadores.

    A frao de hidrocarbonetos aromticos (2 frao) foi eluda com 10,0 mL de n-

    hexano/diclorometano (8:2), enquanto a frao dos compostos polares (3 frao) foi

    eluda com 10,0 mL de diclorometano/metanol (9:1).

    - Cromatografia gasosa

    A Cromatografia Gasosa (CG) uma tcnica de separao e anlise de misturas

    de substncias volatilizveis. A cromatografia em fase gasosa permite uma separao

    mais refinada dos compostos orgnicos presentes em leos ou extrato de rocha do que

    a cromatografia lquida. Seus resultados so apresentados sob a forma de grfico

    (cromatograma) onde observada a distribuio dos compostos orgnicos presentes.

    A anlise de leo total (Whole oil) foi realizada em um cromatgrafo gasoso

    Agilent Technologies modelo HP5890 srie II, coluna capilar DB-5 de 30 metros de

    comprimento, 0,25 mm de dimetro interno e 0,25 m de espessura de fase

    estacionria. As condies cromatogrficas utilizadas para as anlises foram:

    temperatura de 40C (isoterma de 1 minuto) a 310C (isoterma de 19 minutos), com

    taxa de aquecimento de 6C min-1. A temperatura do injetor foi de 290C e do detector

    foi de 320C.

    - Cromatografia Gasosa acoplada Espectrometria de Massas (CG-EM)

    A cromatografia gasosa no revela a informao estrutural sobre os compostos

    em anlise, por isso importante o acoplamento de um cromatgrafo a gs com um

    detector mais especfico, como por exemplo, o detector seletivo de massas. Este

    acoplamento leva obteno do espectro de massas de cada analito que eludo da

    cromatografia (CG). A interpretao do espectro de massas (EM) permite a

    identificao dos componentes de interesse.

  • 8/12/2019 Marcia_Val_Springer_doutorado.pdf

    54/100

    44

    As fraes dos hidrocarbonetos saturados separadas por cromatografia em

    coluna de slica foram analisadas por cromatografia gasosa de alta resoluo acoplada

    a espectrometria de massas (CG/EM). Estas foram realizadas em um instrumento

    Agilent Technologies 6890N acoplado a um detector seletivo de massas Agilent

    Technologies 5973 utilizando uma coluna capilar de slica fundida recoberta com DB-

    5 (J&W; 30 m X 0,25 mm d.i.; df = 0,25 m).

    As amostras foram analisadas por CG-EM atravs do modo de monitoramento

    seletivo de ons (MSI). Para a caracterizao dos biomarcadores foram selecionados

    os seguintes ons: m/z 217 para os -esteranos, m/z 218 para os -esteranos e m/z

    191 para terpanos, m/z177, 259 e 231, e m/z 66 para os padres internos (n-alcanos

    perdeuterados: n-dodecano-d26, n-hexadecano-d34 e n-tetracosano-d50). As

    condies cromatogrficas utilizadas para as anlises foram: temperatura 70C a

    170C com taxa de aquecimento 20C min-1, de 170C a 310C com aquecimento de

    2C min-1e isoterma de 310C durante 10 minutos. Foi realizada injeo automtica

    de 1,0 L da amostra, com impacto de eltrons a 70 eV, utilizando hlio como gs de

    carreador, a uma presso constante de 10 psi.

    No caso dos diamantides foram selecionados os seguintes ons: m/z 135, 136,

    149, 163, 177 (adamantanos); m/z 187, 188, 201, 215 (diamantanos) e m/z 66 para os

    padres internos (n-alcanos perdeuterados: n-dodecano-d26, nhexadecano-d34 e n-

    tetracosano-d50). As condies cromatogrficas utilizadas para as anlises foram:

    temperatura 40C a 180 C com taxa de aquecimento 3 C min-1, de 180 C a 310C

    com aquecimento de 6C min-1e isoterma de 310C durante 10 minutos. Foi realizada

    injeo automtica de 1,0 L da amostra, com impacto de eltrons a 70 eV, utilizando

    hlio como gs de carreador, a uma presso constante de 10 psi.

    5.2) Avaliao estatstica dos dados

    Hoje em dia, existem diversas ferramentas encontradas no mercado que seriam

    passveis de serem utilizadas na execuo deste estudo. Dentre elas destacam-se: o

    Statistica, MatLab, Clementine, Intelligent Miner e Weka. Porm, para a

    realizao deste trabalho optou-se pela utilizao do MatLab verso 6.5, de fcilinterface com o usurio e com mdulos de visualizao j contemplados no pacote.

  • 8/12/2019 Marcia_Val_Springer_doutorado.pdf

    55/100

    45

    O MatLab um "software" interativo de alta performance voltado para o

    clculo numrico, que integra anlise numrica, clculo com matrizes, processamento

    de sinais e construo de grficos em ambiente fcil de usar onde problemas e

    solues so expressos somente como eles so escritos matematicamente, ao contrrio

    da programao tradicional (SANTOS, 2009).

    A modelagem pode ser dividida em quatro blocos principais, conforme

    apresentado na Figura 10.

    Figura 10: Esquema de viso geral do processo para anlise de grupos.

    A Seleo e Tratamento de Dados o processo responsvel pelo pr-

    processamento dos dados. O processo de anlise de agrupamento de dados inicia-se

    com a seleo e preparao do conjunto de dados a ser utilizado na fase de

    agrupamento. Estas duas etapas envolvem a seleo de um conjunto de dados

    representativo da base de dados e a realizao de processos de tratamento de dados, a

    fim de garantir a qualidade dos dados que sero utilizados nas etapas seguintes do

    processo.

  • 8/12/2019 Marcia_Val_Springer_doutorado.pdf

    56/100

  • 8/12/2019 Marcia_Val_Springer_doutorado.pdf

    57/100

    47

    Captulo 6.

    Base de Dados - Descrio

    A caracterizao dos sistemas petrolferos, atravs de parmetros de geoqumica

    orgnica, fundamental para o desenvolvimento de modelos preditivos para a

    explorao de petrleo. A maturao trmica e a caracterizao do ambiente

    deposicional das rochas geradoras constituem os principais parmetros controladores

    de gerao de hidrocarbonetos nas rochas sedimentares, e muitos autores tmmostrado que as evidncias geoqumicas e as distribuies dos biomarcadores e

    diamantides podem fornecer critrios para distinguir rochas geradoras depositadas

    em diferentes ambientes, como j discutido no captulo 3.

    Como j citado anteriormente, a base de dadoscontem registros de parmetros

    de maturao trmica e ambiente deposicional de 69 amostras, envolvendo razes de

    biomarcadores e diamantides, que foram selecionadas a partir de trabalhos j

    desenvolvidos anteriormente. Essas amostras de leos so provenientes de bacias

    sedimentares brasileiras e da bacia sedimentar Llanos Orientales, sendo no total 7

    bacias diferentes, como apresentado na Tabela 2. A seguir, ser apresentado um

    resumo destes estudos, mostrando a caracterizao geoqumica quanto aos parmetros

    de maturao e origem.

  • 8/12/2019 Marcia_Val_Springer_doutorado.pdf

    58/100

  • 8/12/2019 Marcia_Val_Springer_doutorado.pdf

    59/100

    49

    Portanto, a integrao das anlises de diamantides e biomarcadores foi decisiva para

    a caracterizao dos leos. Os diamantides permitiram a obteno de resultados mais

    consistentes. As anlises destes compostos sugerem que os leos das bacias

    envolvidas apresentam diferentes estgios de maturao: foram encontradas amostras

    com alto grau de evoluo trmica e amostras pouco evoludas termicamente.

    A origem dos leos foi diagnosticada como sendo marinha, mas diferentes graus

    de influncia de matria orgnica depositada em ambiente continental (ou lacustre).

    No estudo desenvolvido por SPRINGER (2007), cujo objetivo foi a

    caracterizao geoqumica de leos provenientes da bacia sedimentar colombiana,

    Llanos Orientales, as amostras de leo analisadas apresentaram, tambm, diferentes

    estgios de maturao. O estudo realizado demonstrou que os leos estudados foram

    classificados como biodegradados de baixa maturidade a alta maturidade e, tambm,

    como craqueados. Essa caracterizao tambm s foi possvel de ser determinada

    pela integrao de parmetros de biomarcadores e diamantides, segundo Dahl et al.

    (1999).

    Na caracterizao do ambiente deposicional, baseados em parmetros de

    biomarcadores, o estudo demonstrou que algumas amostras possuem caractersticas

    de matria orgnica marinha, outras de matria orgnica terrestre e, a grande maioria

    se comporta como mistura.

  • 8/12/2019 Marcia_Val_Springer_doutorado.pdf

    60/100

    50

    Captulo 7.Resultados e Discusso

    Este captulo apresenta primeiramente a interpretao dos resultados atravs dos

    mtodos tradicionais, ou seja, correlaes entre os parmetros envolvidos, tanto

    para a caracterizao da maturao quanto para a caracterizao da origem. Em

    seguida, apresenta os resultados da execuo do algoritmo Fuzzy c-means.

    7.1) Parmetros de Maturao

    7.1.1) Interpretao dos resultados pela caracterizao deBiomarcadores e Diamantides

    Para a caracterizao geoqumica dos leos em estudo, alguns parmetros de

    biomarcadores e diamantides propostos na literatura como indicadores do nvel de

    evoluo trmica (SEIFERT & MOLDOWAN, 1991; WAPLES & MACHIHARA,

    1991; CHEN et al., 1996; WASEDA & NISHITA, 1998; DAHL et al., 1999; PETERS

    et al., 2005) foram calculados e avaliados, como mostra a Tabela 3.

  • 8/12/2019 Marcia_Val_Springer_doutorado.pdf

    61/100

    51

    Tabela 3: Valores dos parmetros de biomarcadores dependentes de maturao trmica paraas amostras de leo estudadas. As amostras de BA a BG pertencem s bacias brasileiras, e as

    BH, bacia colombiana.

    AMOSTRAS IMD IMA

    3-+4-Metildiamantanos

    (ppm)Estigmastano

    (ppm)Esteranos

    /(+)(C29)Esteranos

    S/(S+R) C29BA1 0,58 0,67 90,89 9,25 0,61 0,55BA2 0,68 0,69 137,17 21,32 0,61 0,63BA3 0,57 0,68 91,77 106,02 0,52 0,56BA4 0,58 0,68 130,39 50,65 0,51 0,54BA5 0,55 0,69 111,08 8,33 0,41 0,5

    BA6 0,53 0,76 29,77 3,78 0,49 0,58BB1 0,39 0,63 0,37 34,19 0,34 0,49BB2 0,33 0,57 1,84 83,13 0,43 0,5BB3 0,40 0,64 2,41 73,63 0,31 0,41BC1 0,46 0,61 45,35 342,66 0,53 0,57BC2 0,44 0,68 44,34 721,40 0,35 0,54BC3 0,47 0,68 21,04 28,64 0,24 0,41BC4 0,44 0,69 22,87 235,57 0,55 0,69BC5 0,38 0,60 16,67 766,88 0,3 0,48

    BC6 0,44 0,68 25,83 688,90 0,23 0,49BC7 0,42 0,61 20,03 41,25 0,48 0,51BC8 0,41 0,65 5,54 29,80 0,6 0,58BC9 0,40 0,68 7,48 30,82 0,6 0,54

    BC10 0,39 0,64 4,38 24,64 0,39 0,59BC11 0,30 0,62 86,56 20,09 0,5 0,58BC12 0,31 0,62 30,08 44,66 0,32 0,48BC13 0,38 0,68 9,21 19,69 0,6 0,7BC14 0,38 0,62 8,16 294,14 0,43 0,43

    BC15 0,27 0,69 45,85 6,16 0,4 0,38BC16 0,44 0,74 4,00 8,69 0,35 0,52BC17 0,34 0,62 83,52 25,99 0,45 0,24BC18 0,44 0,69 4,62 7,61 0,39 0,42BC19 0,42 0,57 26,82 76,34 0,4 0,52BC20 0,41 0,64 5,14 11,28 0,42 0,53BC21 0,43 0,72 32,33 13,46 0,52 0,52BC22 0,45 0,71 30,00 23,74 0,34 0,52BC23 0,45 0,73 150,16 0,50 0,33 0,54

    BC24 0,44 0,70 19,03 148,70 0,41 0,52BC25 0,44 0,72 19,96 112,44 0,37 0,4

  • 8/12/2019 Marcia_Val_Springer_doutorado.pdf

    62/100

  • 8/12/2019 Marcia_Val_Springer_doutorado.pdf

    63/100

    53

    Para a caracterizao geoqumica das amostras de leos em estudo, podemos

    destacar duas razes de biomarcadores que envolvem a isomerizao de esteranos,

    muito utilizadas na avaliao da maturao de leos: a razo dos C29 20S/

    (20S+20R) e a razo dos C29/ (+) (FARRIMOND et al., 1998).

    A razo 20S/ (20S + 20R) esterano C29 usada para medir a evoluo trmica

    da rocha geradora ao longo da zona imatura e parte da zona principal de gerao do

    leo, chamada janela de gerao do leo (PETERS & MOLDOWAN, 1993).

    Apenas a configurao R no C-20 est presente nos precursores esteroidais oriundos

    de organismos vivos. Esta configurao convertida ao longo do processo de

    maturao para uma mistura de esteranos de configuraes R e S e atinge seus valores

    de equilbrio antes ou durante o incio da janela de gerao do leo. Esses valores

    variam de zero at aproximadamente 0,5, sendo que os valores 0,52 e 0,55 se

    encontram na faixa de equilbrio (SEIFERT & MOLDOWAN, 1986; PETERS et al.,

    2005).

    A razo / ( + )-esterano C29 uma razo de isomerizao importante

    nos estudos de maturao. Seus valores de equilbrio atingem a janela de gerao do

    leo, variando de zero a aproximadamente 0,7, sendo que os valores 0,67 e 0,71 se

    encontram na fase de equilbrio. A configurao dos esteranos a produzida

    biologicamente. Com o avano do processo da diagnese, esta forma

    progressivamente, converte-se em uma mistura de epmeros e . Esta

    transformao ainda no bem conhecida, acredita-se que dois tomos de hidrognio

    prximos mudam simultaneamente da posio alfa () para a posio beta (). J que

    existem os diastereoismeros 20S e 20R para cada forma, e respectivamente,

    existiro quatro espcies distintas em cada uma das famlias (C27, C28e C29esteranos).

    A isomerizao no C-14 e C-17 nos C29 esteranos regulares 20S e 20R gera um

    aumento na razo / (+), que com o progressivo aumento da maturao, varia

    de valores prximos a zero at valores prximos a 0,7 (PETERS et al., 2005).

  • 8/12/2019 Marcia_Val_Springer_doutorado.pdf

    64/100

  • 8/12/2019 Marcia_Val_Springer_doutorado.pdf

    65/100

    55

    A fim de auxiliar no estudo do grau de evoluo trmica dos leos selecionados,

    utilizaram-se os diamantides atravs dos ndices propostos por Chen et al., (1996),

    detalhados no captulo 3: MAI = 1-MA/(1-MA + 2-MA) e MDI = 4-MD/(1-MD + 3-

    MD + 4-MD). A Figura 12 apresenta o grfico que correlaciona esses ndices.

    Na avaliao das amostras sob a influncia dos parmetros de CHEN et al.

    (1996) foi observado que as amostras de leo estudadas esto distribudas em regies

    de altos valores dos ndices IMD e IMA. Os leos da bacia BA e alguns leos das

    bacias BC, BF e BG se destacam (crculo azul) apresentando os maiores valores para

    ambos os ndices, indicando um elevado grau de evoluo trmica. Por outro lado,

    alguns leos da bacia BC e uma amostra da bacia BB (destacado no crculo vermelho)

    apresentam os menores valores de MAI e MDI, sendo considerado os leos menos

    evoludo termicamente em relao aos demais.

    Figura 12: Grfico entre os ndices de metiladamantanos (MDI) e metildiamantanos (MAI)para as amostras de leo selecionadas.

  • 8/12/2019 Marcia_Val_Springer_doutorado.pdf

    66/100

    56

    Outras correlaes realizadas foram entre o MDI e as razes de biomarcadores

    / (+) e 20S/ (20S + 20R) esterano C29, Figuras 13A e 13B,

    respectivamente. A partir destes grficos, podemos observar que o parmetro origem

    pode ser um grande controlador sob alguns fatores maturao: no existe umatendncia linear para todo o grupo, e sim um visvel agrupamento por bacia. Na figura

    13B, observa-se uma clara separao entre as amostras da bacia BH (bacia

    colombiana) e as demais amostras, provenientes de bacias sedimentares brasileiras.

    No grfico da figura 13A, observou-se uma disperso linear para as amostras das

    bacias brasileiras, destacando as amostras da bacia BA como as mais evoludas

    termicamente.

  • 8/12/2019 Marcia_Val_Springer_doutorado.pdf

    67/100

    57

    Figura 13: Grficos de : (A) correlao entre MDI e a razo / (+); (B) correlaoentre MDI e a razo 20S/ (20S + 20R) esterano C29.

    Aumento damaturao

    A

    B

  • 8/12/2019 Marcia_Val_Springer_doutorado.pdf

    68/100

    58

    Outra correlao muito estudada para analisar a evoluo trmica dos leos foi

    proposta por DAHL et al. (1999). A resistncia estabilidade trmica dos

    diamantides leva a um consequente aumento da sua concentrao durante a evoluotrmica do leo, enquanto a concentrao dos biomarcadores, que so menos

    resistentes a essas condies, diminui. Com o aumento do estresse trmico os

    biomarcadores so degradados, este fato pode ser observado pela diminuio da

    concentrao do estigmastano (5,14,17(H)-24-etil-colestano 20 R). Por outro lado,

    ocorre um enriquecimento da concentrao de diamantides, neste caso foi usado o

    somatrio do 3-metildiamantano e 4-metildiamantano.

    O resultado do grfico entre as concentraes de 3-+4-metildiamantanos e

    Estigmastano est representado nas Figuras 14A e 14B. Para as amostras em estudo,

    possvel observar que as amostras da bacia BC tm caractersticas tanto imaturas

    (amostras destacadas pelo crculo vermelho) quanto maturas e altamente maturas. As

    amostras da bacia BB so maturas, mas ainda no se encontram na fase de

    craqueamento. A maioria das amostras das bacias BA e BH so altamente maturas,

    sendo que algumas j se encontram na fase de craqueamento, assim como uma

    amostra da bacia BG. Algumas amostras das bacias BA e BH apresentam altas

    concentraes de estigmastano e diamantides, que segundo DAHL e colaboradores

    (1999), pode ser considerado mistura de leos em diferentes pulsos de migrao com

    nveis diferenciados de maturao.

  • 8/12/2019 Marcia_Val_Springer_doutorado.pdf

    69/100

    59

    Figura 14: Grfico de correlao entre 3-+4- metildiamantano versusEstigmastano, propostopor DAHL et al. (1999).

    Mistura

    B

    A

    maturao

    craqueamento

  • 8/12/2019 Marcia_Val_Springer_doutorado.pdf

    70/100

    60

    7.1.2) Anlise de agrupamento FCM Fuzzy c-means

    A anlise de agrupamento foi realizada utilizando os parmetros e valores

    mostrados na Tabela 2. Pela anlise de cluster as amostras foram diferenciadas em

    cinco grupos de diferentes graus de maturao. Os resultados so discutidos a seguir.

    Antes de realizar o processo de clusterizao foi efetuado o pr-tratamento dos

    dados, analisando a presena de valores ausentes e correlaes entre as variveis,

    seguindo o procedimento de Data Mining.

    Com a finalidade de determinar o melhor nmero possvel de agrupamentos foi

    utilizado o ndice de validao PBM, detalhado no captulo 4 (PAKHIRA et al.,

    2004).. Analisando a Tabela 4, que apresenta diferentes valores de m para cada

    agrupamento, o ndice de validao indica cinco grupos.

    Tabela 4: Determinao do nmero de grupos.

    Grupos m=1,2 m=1,4 m=1,6 m=1,8 m=2,0

    2 0,125 0,081 0,044 0,026 0,011

    3 0,185 0,124 0,073 0,050 0,033

    4 0,360 0,158 0,081 0,047 0,033

    5 1,207 0,417 0,166 0,053 0,028

    6 1,116 0,145 0,085 0,050 0,023

  • 8/12/2019 Marcia_Val_Springer_doutorado.pdf

    71/100

  • 8/12/2019 Marcia_Val_Springer_doutorado.pdf

    72/100

    62

    Figura 16: Grfico de distribuio dos grupos em porcentagem para os parmetros dematurao selecionados.

  • 8/12/2019 Marcia_Val_Springer_doutorado.pdf

    73/100

    63

    Figura 17: Grfico de funo de pertinncia para os parmetros de maturao, usando FCM,com ndice de fuzzificaom=1,2 e, componentes principais CP1 e CP2.

    Como j discutido no captulo de fundamentao terica (captulo 4), e

    observando a tabela 4, com o aumento do valor do parmetro de fuzzificao (m)o

    valor do ndice diminui, pois mais imprecisas so as parties geradas. Nas Figuras

    18A e 18B observa-se a disposio das funes de pertinncia para diferentes valoresde m, m=1,2 e m=1,8, respectivamente.

  • 8/12/2019 Marcia_Val_Springer_doutorado.pdf

    74/100

    64

    Figura 18: Grficos de funes de pertinncia para os parmetros de maturao, usando FCM:(A) m =1,2; (B) m = 1,8.

    A interpretao de cada cluster pode ser realizada pelos centros de suas

    respectivas coordenadas. Observando a Tabela 5, podem-se fazer algumasconsideraes relatadas a seguir.

    A

    B

  • 8/12/2019 Marcia_Val_Springer_doutorado.pdf

    75/100

    65

    Tabela 5: Valores dos Parmetros de Maturao nos Centros de Grupos.

    Parmetros Grupo 1 Grupo 2 Grupo 3 Grupo 4 Grupo 5

    MAI 1,68 1,67 1,69 1,67 1,73

    MDI 1,44 1,50 1,50 1,44 1,45

    3+4 metildiamantanos 84,64 98,80 119,58 111,37 138,93Estigmastano 108,96 105,10 99,00 129,02 78,06

    /(+)(C29) 1,52 1,58 1,61 1,66 1,50

    S/(S+R) C29 1,51 1,48 1,50 1,56 1,53

    Os parmetros 3-+4- metildiamantanos e Estigmastano so os que possuem

    maior ponderao em cada grupo, ou seja, so mais significativos. No grupo 1, acontribuio de Estigmastano supera a contribuio de metildiamantanos, o que pode

    sugerir um grupo de amostras de leo pouco maturo, evento que tambm ocorre no

    grupo 2. Porm, este apresenta uma maior contribuio dos metildiamantanos em

    relao aquele. Sendo assim, o grupo 2 pode ser considerado mais evoludo

    termicamente que o grupo 1.

    J nos grupos 3 e 5 a contribuio dos metildiamantanos maior que a dobiomarcador estigmastano: o grupo 5 apresenta o menor valor de estigmastano e o

    maior valor de metildiamantano em relao aos demais grupos, mostrando ser assim o

    mais evoludo termicamente; o grupo 3 possui menor valor de metildiamantano e

    maior valor de estigmastano que o grupo 5, mostrando ser menos maturo que este,

    mas com maior maturidade que os grupos 1 e 2.

    Analisando os resultados para o grupo 4, observam-se valores elevados de

    biomarcadores e valores elevados de diamantides. Consequentemente, suspeita-se de

    mistura de leos em diferentes pulsos de migrao com nveis diferenciados de

    maturao (DAHL et al., 1999).

    Conforme os resultados discutidos anteriormente, os parmetros 3-+4-

    metildiamantanos e Estigmastano apresentam uma contribuio muito superior aos

    demais parmetros. Sendo assim, considerados parmetros decisivos para o

    agrupamento das amostras do estudo. Estes resultados, vo de encontro com os

  • 8/12/2019 Marcia_Val_Springer_doutorado.pdf