relatório de iniciação científica

Upload: douglas-eduardo-parra

Post on 08-Apr-2018

219 views

Category:

Documents


0 download

TRANSCRIPT

  • 8/6/2019 Relatrio de Iniciao Cientfica

    1/8

    Relatrio de IniciaoCientfica

    Ttulo: Deteco de Comunidades Baseada na

    Competio e Cooperao de Partculas

    Discente: Douglas Eduardo Parra

    Orientador: Prof. Dr. Marcos Gonalves Quiles

    Curso: Cincias da Computao

    So Jos dos Campos

    Fevereiro de 2011

  • 8/6/2019 Relatrio de Iniciao Cientfica

    2/8

    1 Identificao

    Nome do Bolsista: Douglas Eduardo Parra Nome do Orientador: Prof. Dr. Marcos Gonalves Quiles Local de execuo: Unifesp Campus So Jos dos Campos Perodo de Vigncia: Setembro/2010 a Junho/2011 Ttulo do Projeto: Deteco de Comunidades Baseada na Competio e

    Cooperao de Partculas

    2 Introduo

    Na ltima dcada do sculo XX, com a publicao de novas descobertas

    relacionadas ao conceito de redes (grafos), um novo tema de pesquisa, denominado

    redes complexas, foi estabelecido e desde ento tem revolucionado no apenas as

    teorias de redes, mas tambm diversas cincias [1]. Dentre as muitas propriedades que

    podem ser extradas / estudadas em diversas redes complexas, uma caracterstica

    notvel a presena de estruturas modulares locais conhecidas como comunidades [3,

    8]. Tais comunidades podem ser definidas como grupos de vrtices da rede densamente

    conectados, enquanto que conexes entre vrtices pertencentes a grupos (comunidades)

    diferentes so esparsas [9]. Essas comunidades representam padres de interao entre

    os vrtices da rede e sua identificao importante no entendimento dos mecanismos de

    crescimento e formao desta [2]. Alm disso, um fator importante referente estrutura

    das comunidades est na similaridade das caractersticas dos vrtices que as compem.

    Assim, por meio da identificao e estudo das comunidades possvel obter

    informaes pertinentes ao domnio da rede. Por exemplo, observando-se a estrutura de

    ligaes entre pginas da World Wide Web possvel constatar que pginas descrevendo

    tpicos relacionados tendem a ser mais densamente conectadas entre si do que com o

    restante da rede [4]. Esta propriedade tambm compartilhada por redes reais

    provenientes de outros domnios, como redes biolgicas [7], rotas de transporte areo

    [6], redes metablicas [5], dentre outras.

    O processo de deteco de comunidades em uma rede no

    computacionalmente trivial. Por exemplo, o problema de dividir um grafo em duas

    partes de mesmo tamanho de tal forma que nmero de arestas ligando estas partes seja

    mnimo definido como um problema NP-Completo [3]. Para complicar ainda maiseste problema, que pode ser visto como um caso simples da tarefa de deteco de

  • 8/6/2019 Relatrio de Iniciao Cientfica

    3/8

    comunidades, as redes reais podem ser compostas por um nmero no conhecido de

    comunidades e no apenas duas como no caso anterior. Alm disso, as comunidades por

    si s podem ser definidas por estruturas hierrquicas na qual uma comunidade

    formada por outras sub-comunidades aninhadas [3, 11]. Devido a importncia do

    problema e a dificuldade computacional em sua soluo, diversos autores tm proposto

    modelos computacionais para realizar de forma automtica a deteco de comunidades

    em redes complexas. Entretanto, a preciso no processo de deteco das comunidades e

    a complexidade computacional desses algoritmos podem ser vistas como caractersticas

    antagnicas, na qual os modelos que apresentam alta eficincia computacional

    geralmente apresentam uma baixa preciso. Por outro lado, modelos com alta preciso

    demandam um alto custo de processamento [3].

    Recentemente foi proposto por Quiles et al. [10] um novo modelo de deteco

    de comunidades baseado em competio de partculas. Neste modelo, diversas

    partculas caminham em uma rede competindo entre si para marcar seus vrtices. Ao

    mesmo tempo, partculas intrusas so repelidas ao entrarem em territrios pertencentes a

    outras partculas. Aps algum tempo de execuo, cada partcula se isola permanecendo

    confinada dentro de uma comunidade da rede. Desta forma, observando a partcula que

    ocupa os vrtices, possvel identificar as comunidades. Este modelo apresenta uma

    alta preciso mantendo um custo computacional baixo, sendo este ltimo item um ponto

    crtico de outras tcnicas de deteco de comunidade [3].

    Entretanto, o modelo proposto em [10] ainda apresenta algumas limitaes que

    necessitam ser investigadas, como por exemplo:

    Apenas redes sem peso foram consideradas. Assim, o modelo poderia serestendido de tal forma a considerar outras formas de redes, como redes

    com pesos e redes direcionadas;

    No permite o tratamento de comunidades hierrquicas; A dinmica por trs do processo de deteco de comunidades um fator

    positivo, possibilitando que este seja aplicado em redes cuja a estrutura

    no esttica, isto , redes onde novas arestas ou vrtices podem ser

    inseridos ou mesmo removidos ao longo do tempo. Porm, este fato

    ainda no foi investigado;

  • 8/6/2019 Relatrio de Iniciao Cientfica

    4/8

    Apenas uma partcula utilizada para definir cada comunidade na rede.Um mecanismo de cooperao de partculas poderia ser considerado com

    objetivo de melhorar a eficincia no processo de deteco;

    O nmero de comunidades deve ser informado a priori. Embora onmero de comunidades possa ser estimado atravs de aplicaes

    sucessivas do modelo variando o nmero de partculas, este processo no

    vantajoso computacionalmente. Desta forma, a gerao do nmero

    automtico de partculas (comunidades) representaria uma importante

    extenso do modelo original;

    O critrio de parada do algoritmo no completamente estabelecido.

    Desta forma, a investigao dessas limitaes mencionadas pode resultar na

    elaborao de um modelo mais eficiente ou mais geral que o modelo de competio

    original.

    Os seguintes objetivos apresentados em ordem decrescente de prioridade foram

    estabelecidos:

    1. Introduzir um mecanismo de cooperao de partculas com o objetivo de

    melhorar a eficincia computacional do modelo;

    2. Adaptar o modelo para tratar redes gerais (redes com pesos e redes com

    arestas direcionadas);

    3. Permitir que o nmero de partculas se adapte automaticamente, permitindo

    que o algoritmo identifique, segundo algum critrio fornecido, o nmero de

    comunidades presentes na rede. Esta adaptao automtica tambm pode permitir que

    comunidades hierarquicamente configuradas sejam detectadas.

    As atividades desenvolvidas se resumem ao estudo do Modelo de Competio de

    Partculas, assim como a leitura de toda a bibliografia, implementao do gerador de

    Redes Sintticas e, o que est por vir, o estudo e implementao das modificaes do

    modelo original e futuros testes utilizando as redes sintticas.

  • 8/6/2019 Relatrio de Iniciao Cientfica

    5/8

    3 - Material e Mtodos

    Este projeto tem sido realizado utilizando-se estritamente um computador para a

    programao do Modelo de Competio de Partculas, na linguagem Java, por meio doambiente de programao Eclipse Ganymede e NetBeans 6.9.1. Alm deles, a biblioteca

    Java Jung, para visualizao de grafos, foi includa no projeto.

    Primeiramente, foi estudado o modelo de partculas proposto por Quiles et. al

    [10] e, junto a esse estudo, tambm o da biblioteca Jung mencionada. Antes, contudo,

    de implementar o modelo, foi visto o conceito de Redes Sintticas, aplicando-se na

    prtica um programa simples que gera randomicamente tais redes, e, somente ento,

    utilizando das ferramentas citadas, o modelo citado em [10] foi desenvolvido.

    A fase atual do projeto est no desenvolvimento de uma aplicao grfica para

    demonstrao dos resultados obtidos at ento para, por fim, investigar e implementar

    formas de contornar as limitaes do Modelo de Competio de Partculas.

    4 Resultados

    Os resultados obtidos at ento so tanto a implementao do modelo proposto

    por Quiles et. al [10], e, com o uso da biblioteca Java Jung, pode-se visualizar o modelo

    de Competio de Partculas atravs de um grafo simples, onde cada partcula

    representada por uma cor, e, os vrtices que possuem essa cor so dominadas pela

    partcula respectiva, como se observa na Figura 1, abaixo:

  • 8/6/2019 Relatrio de Iniciao Cientfica

    6/8

    Figura 1: Visualizao do Modelo de Competio de Partculas

    Ento, pode-se notar que existem quatro partculas no grafo, dominando os 32

    vrtices existentes. O mesmo modelo atualmente pode ser aplicado facilmente com

    maior nmero tanto de vrtices quanto de partculas. Entretanto, para uma melhor

    visualizao futura, ser feito o agrupamento de vrtices que possuem a mesma

    partcula dominadora em cada canto do grafo, tornando mais fcil a visualizao

    completa.

    5 - Discusso / Concluses

    Esses resultados at o presente momento indicam que, pronto o Modelo de

    Competio de Partculas proposto no incio do projeto e tambm a visualizao do

    mesmo, pode-se ento avanar para o estudo e implementao das modificaes que

    tornaro este Modelo, um mais geral, no qual se espera uma melhora na eficincia

    computacional, alm de tratar redes gerais, ou seja, com pesos e/ou arestas direcionadas,

    e tambm permitir que o nmero de partculas se adapte automaticamente, sem a

  • 8/6/2019 Relatrio de Iniciao Cientfica

    7/8

    necessidade da informao prvia de quantas comunidades devero existir, por meio de

    algum critrio existente no algoritmo.

    At ento, notou-se algumas dificuldades em trabalhar mais com a biblioteca

    Java Jung do que com o Modelo de Competio de Partculas em si, alm da interface

    grfica que est sendo desenvolvida atualmente para facilitar a demonstrao do

    modelo.

    Apesar desses pontos, espera-se que at o final do perodo de vigncia da

    Iniciao Cientfica as adaptaes requeridas no modelo estejam desenvolvidas,

    melhorando o modelo atual.

    6 Bibliografia

    [1] Barabsi, A.-L. (2003).Linked: How Everything Is Connected to Everything

    Else and What It Means. Plume.

    [2] Clauset, A. (2005). Finding local community structure in networks. Physical

    Review E 72, 026132(1-6).

    [3] Danon, L., A. Daz-Guilera, J. Duch, and A. Arenas (2005). Comparing

    community structure identification. Journal of Statistical Mechanics: Theory and

    ExperimentP09008, 1-10.

    [4] Flake, G. W., S. Lawrence, C. L. Giles, and F. M. Coetzee (2002). Self-

    organization and identication of web communities. IEEE Computer 35 (3), 66-70.

    [5] Guimer, R. and L. A. N. Amaral (2005). Functional cartography of complex

    metabolic networks.Nature 433, 895-900.

    [6] Guimer, R., S. Mossa, A. Turtschi, and L. A. N. Amaral (2003). The

    worldwide air transportation network: Anomalous centrality, community structure, and

    cities' global roles. Proceedings of the National Academy of Sciences of the USA 102

    (22), 7704-7709.

  • 8/6/2019 Relatrio de Iniciao Cientfica

    8/8

    [7] Jeong, H., B. Tombor, R. Albert, Z. N. Oltvai, and A.-L. Barabsi (2000).

    The large scale organization of metabolic networks.Nature 407, 651-654.

    [8] Newman, M. E. J. (2004). Detecting community structure in networks. The

    European Physical Journal B 38, 321-330.

    [9] Newman, M. E. J. and M. Girvan (2004). Finding and evaluating community

    structure in networks. Physical Review E 69, 026113(1-15).

    [10] Quiles, M. G., L. Zhao, R. L. Alonso, and R. A. F. Romero (2008). Particle

    competition for complex network community detection. Chaos (Woodbury) 18, 1-10

    (DOI: 10.1063/1.2956982).

    [11] Ravasz, E. and A.-L. Barabasi (2003). Hierarchical organization in complex

    networks. Physical Review E 67, 026112(1-7).

    7 Apoio

    O projeto teve o financiamento do Conselho Nacional de DesenvolvimentoCientfico e Tecnolgico (CNPq).