relatório de iniciação científica
TRANSCRIPT
-
8/6/2019 Relatrio de Iniciao Cientfica
1/8
Relatrio de IniciaoCientfica
Ttulo: Deteco de Comunidades Baseada na
Competio e Cooperao de Partculas
Discente: Douglas Eduardo Parra
Orientador: Prof. Dr. Marcos Gonalves Quiles
Curso: Cincias da Computao
So Jos dos Campos
Fevereiro de 2011
-
8/6/2019 Relatrio de Iniciao Cientfica
2/8
1 Identificao
Nome do Bolsista: Douglas Eduardo Parra Nome do Orientador: Prof. Dr. Marcos Gonalves Quiles Local de execuo: Unifesp Campus So Jos dos Campos Perodo de Vigncia: Setembro/2010 a Junho/2011 Ttulo do Projeto: Deteco de Comunidades Baseada na Competio e
Cooperao de Partculas
2 Introduo
Na ltima dcada do sculo XX, com a publicao de novas descobertas
relacionadas ao conceito de redes (grafos), um novo tema de pesquisa, denominado
redes complexas, foi estabelecido e desde ento tem revolucionado no apenas as
teorias de redes, mas tambm diversas cincias [1]. Dentre as muitas propriedades que
podem ser extradas / estudadas em diversas redes complexas, uma caracterstica
notvel a presena de estruturas modulares locais conhecidas como comunidades [3,
8]. Tais comunidades podem ser definidas como grupos de vrtices da rede densamente
conectados, enquanto que conexes entre vrtices pertencentes a grupos (comunidades)
diferentes so esparsas [9]. Essas comunidades representam padres de interao entre
os vrtices da rede e sua identificao importante no entendimento dos mecanismos de
crescimento e formao desta [2]. Alm disso, um fator importante referente estrutura
das comunidades est na similaridade das caractersticas dos vrtices que as compem.
Assim, por meio da identificao e estudo das comunidades possvel obter
informaes pertinentes ao domnio da rede. Por exemplo, observando-se a estrutura de
ligaes entre pginas da World Wide Web possvel constatar que pginas descrevendo
tpicos relacionados tendem a ser mais densamente conectadas entre si do que com o
restante da rede [4]. Esta propriedade tambm compartilhada por redes reais
provenientes de outros domnios, como redes biolgicas [7], rotas de transporte areo
[6], redes metablicas [5], dentre outras.
O processo de deteco de comunidades em uma rede no
computacionalmente trivial. Por exemplo, o problema de dividir um grafo em duas
partes de mesmo tamanho de tal forma que nmero de arestas ligando estas partes seja
mnimo definido como um problema NP-Completo [3]. Para complicar ainda maiseste problema, que pode ser visto como um caso simples da tarefa de deteco de
-
8/6/2019 Relatrio de Iniciao Cientfica
3/8
comunidades, as redes reais podem ser compostas por um nmero no conhecido de
comunidades e no apenas duas como no caso anterior. Alm disso, as comunidades por
si s podem ser definidas por estruturas hierrquicas na qual uma comunidade
formada por outras sub-comunidades aninhadas [3, 11]. Devido a importncia do
problema e a dificuldade computacional em sua soluo, diversos autores tm proposto
modelos computacionais para realizar de forma automtica a deteco de comunidades
em redes complexas. Entretanto, a preciso no processo de deteco das comunidades e
a complexidade computacional desses algoritmos podem ser vistas como caractersticas
antagnicas, na qual os modelos que apresentam alta eficincia computacional
geralmente apresentam uma baixa preciso. Por outro lado, modelos com alta preciso
demandam um alto custo de processamento [3].
Recentemente foi proposto por Quiles et al. [10] um novo modelo de deteco
de comunidades baseado em competio de partculas. Neste modelo, diversas
partculas caminham em uma rede competindo entre si para marcar seus vrtices. Ao
mesmo tempo, partculas intrusas so repelidas ao entrarem em territrios pertencentes a
outras partculas. Aps algum tempo de execuo, cada partcula se isola permanecendo
confinada dentro de uma comunidade da rede. Desta forma, observando a partcula que
ocupa os vrtices, possvel identificar as comunidades. Este modelo apresenta uma
alta preciso mantendo um custo computacional baixo, sendo este ltimo item um ponto
crtico de outras tcnicas de deteco de comunidade [3].
Entretanto, o modelo proposto em [10] ainda apresenta algumas limitaes que
necessitam ser investigadas, como por exemplo:
Apenas redes sem peso foram consideradas. Assim, o modelo poderia serestendido de tal forma a considerar outras formas de redes, como redes
com pesos e redes direcionadas;
No permite o tratamento de comunidades hierrquicas; A dinmica por trs do processo de deteco de comunidades um fator
positivo, possibilitando que este seja aplicado em redes cuja a estrutura
no esttica, isto , redes onde novas arestas ou vrtices podem ser
inseridos ou mesmo removidos ao longo do tempo. Porm, este fato
ainda no foi investigado;
-
8/6/2019 Relatrio de Iniciao Cientfica
4/8
Apenas uma partcula utilizada para definir cada comunidade na rede.Um mecanismo de cooperao de partculas poderia ser considerado com
objetivo de melhorar a eficincia no processo de deteco;
O nmero de comunidades deve ser informado a priori. Embora onmero de comunidades possa ser estimado atravs de aplicaes
sucessivas do modelo variando o nmero de partculas, este processo no
vantajoso computacionalmente. Desta forma, a gerao do nmero
automtico de partculas (comunidades) representaria uma importante
extenso do modelo original;
O critrio de parada do algoritmo no completamente estabelecido.
Desta forma, a investigao dessas limitaes mencionadas pode resultar na
elaborao de um modelo mais eficiente ou mais geral que o modelo de competio
original.
Os seguintes objetivos apresentados em ordem decrescente de prioridade foram
estabelecidos:
1. Introduzir um mecanismo de cooperao de partculas com o objetivo de
melhorar a eficincia computacional do modelo;
2. Adaptar o modelo para tratar redes gerais (redes com pesos e redes com
arestas direcionadas);
3. Permitir que o nmero de partculas se adapte automaticamente, permitindo
que o algoritmo identifique, segundo algum critrio fornecido, o nmero de
comunidades presentes na rede. Esta adaptao automtica tambm pode permitir que
comunidades hierarquicamente configuradas sejam detectadas.
As atividades desenvolvidas se resumem ao estudo do Modelo de Competio de
Partculas, assim como a leitura de toda a bibliografia, implementao do gerador de
Redes Sintticas e, o que est por vir, o estudo e implementao das modificaes do
modelo original e futuros testes utilizando as redes sintticas.
-
8/6/2019 Relatrio de Iniciao Cientfica
5/8
3 - Material e Mtodos
Este projeto tem sido realizado utilizando-se estritamente um computador para a
programao do Modelo de Competio de Partculas, na linguagem Java, por meio doambiente de programao Eclipse Ganymede e NetBeans 6.9.1. Alm deles, a biblioteca
Java Jung, para visualizao de grafos, foi includa no projeto.
Primeiramente, foi estudado o modelo de partculas proposto por Quiles et. al
[10] e, junto a esse estudo, tambm o da biblioteca Jung mencionada. Antes, contudo,
de implementar o modelo, foi visto o conceito de Redes Sintticas, aplicando-se na
prtica um programa simples que gera randomicamente tais redes, e, somente ento,
utilizando das ferramentas citadas, o modelo citado em [10] foi desenvolvido.
A fase atual do projeto est no desenvolvimento de uma aplicao grfica para
demonstrao dos resultados obtidos at ento para, por fim, investigar e implementar
formas de contornar as limitaes do Modelo de Competio de Partculas.
4 Resultados
Os resultados obtidos at ento so tanto a implementao do modelo proposto
por Quiles et. al [10], e, com o uso da biblioteca Java Jung, pode-se visualizar o modelo
de Competio de Partculas atravs de um grafo simples, onde cada partcula
representada por uma cor, e, os vrtices que possuem essa cor so dominadas pela
partcula respectiva, como se observa na Figura 1, abaixo:
-
8/6/2019 Relatrio de Iniciao Cientfica
6/8
Figura 1: Visualizao do Modelo de Competio de Partculas
Ento, pode-se notar que existem quatro partculas no grafo, dominando os 32
vrtices existentes. O mesmo modelo atualmente pode ser aplicado facilmente com
maior nmero tanto de vrtices quanto de partculas. Entretanto, para uma melhor
visualizao futura, ser feito o agrupamento de vrtices que possuem a mesma
partcula dominadora em cada canto do grafo, tornando mais fcil a visualizao
completa.
5 - Discusso / Concluses
Esses resultados at o presente momento indicam que, pronto o Modelo de
Competio de Partculas proposto no incio do projeto e tambm a visualizao do
mesmo, pode-se ento avanar para o estudo e implementao das modificaes que
tornaro este Modelo, um mais geral, no qual se espera uma melhora na eficincia
computacional, alm de tratar redes gerais, ou seja, com pesos e/ou arestas direcionadas,
e tambm permitir que o nmero de partculas se adapte automaticamente, sem a
-
8/6/2019 Relatrio de Iniciao Cientfica
7/8
necessidade da informao prvia de quantas comunidades devero existir, por meio de
algum critrio existente no algoritmo.
At ento, notou-se algumas dificuldades em trabalhar mais com a biblioteca
Java Jung do que com o Modelo de Competio de Partculas em si, alm da interface
grfica que est sendo desenvolvida atualmente para facilitar a demonstrao do
modelo.
Apesar desses pontos, espera-se que at o final do perodo de vigncia da
Iniciao Cientfica as adaptaes requeridas no modelo estejam desenvolvidas,
melhorando o modelo atual.
6 Bibliografia
[1] Barabsi, A.-L. (2003).Linked: How Everything Is Connected to Everything
Else and What It Means. Plume.
[2] Clauset, A. (2005). Finding local community structure in networks. Physical
Review E 72, 026132(1-6).
[3] Danon, L., A. Daz-Guilera, J. Duch, and A. Arenas (2005). Comparing
community structure identification. Journal of Statistical Mechanics: Theory and
ExperimentP09008, 1-10.
[4] Flake, G. W., S. Lawrence, C. L. Giles, and F. M. Coetzee (2002). Self-
organization and identication of web communities. IEEE Computer 35 (3), 66-70.
[5] Guimer, R. and L. A. N. Amaral (2005). Functional cartography of complex
metabolic networks.Nature 433, 895-900.
[6] Guimer, R., S. Mossa, A. Turtschi, and L. A. N. Amaral (2003). The
worldwide air transportation network: Anomalous centrality, community structure, and
cities' global roles. Proceedings of the National Academy of Sciences of the USA 102
(22), 7704-7709.
-
8/6/2019 Relatrio de Iniciao Cientfica
8/8
[7] Jeong, H., B. Tombor, R. Albert, Z. N. Oltvai, and A.-L. Barabsi (2000).
The large scale organization of metabolic networks.Nature 407, 651-654.
[8] Newman, M. E. J. (2004). Detecting community structure in networks. The
European Physical Journal B 38, 321-330.
[9] Newman, M. E. J. and M. Girvan (2004). Finding and evaluating community
structure in networks. Physical Review E 69, 026113(1-15).
[10] Quiles, M. G., L. Zhao, R. L. Alonso, and R. A. F. Romero (2008). Particle
competition for complex network community detection. Chaos (Woodbury) 18, 1-10
(DOI: 10.1063/1.2956982).
[11] Ravasz, E. and A.-L. Barabasi (2003). Hierarchical organization in complex
networks. Physical Review E 67, 026112(1-7).
7 Apoio
O projeto teve o financiamento do Conselho Nacional de DesenvolvimentoCientfico e Tecnolgico (CNPq).