henrique menezes pedro lopes. introdução detecção de comunidades método proposto redes geradas...

Post on 18-Apr-2015

105 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Detecção de Comunidades

Henrique MenezesPedro Lopes

Introdução Detecção de Comunidades Método Proposto Redes Geradas por Computador Redes Reais

◦ Estrutura de Comunidade Conhecida◦ Estrutura de Comunidade Não Conhecida

Demonstração Conclusão

Roteiro

Muitos sistemas tem a forma de rede◦ Ex.: Redes sociais, redes de conhecimento, web,

cadeias alimentares, redes metabólicas, etc.

Pesquisadores têm focado em algumas propriedades que essas redes compartilham◦ Efeito mundo pequeno◦ Desvio a direita das distribuições de graus◦ Clustering ou transitividade da rede

Introdução

Outra propriedade comum a muitas redes◦ Estrutura da comunidade

Comunidade◦ Subconjuntos de vértices em que conexões

vértice-vértice são densas, mas entre os subconjuntos as conexões são menos densas.

◦ Nós da rede estão unidos em grupos coeso, entre os quais existem apenas ligações mais frouxas.

Introdução

Método para detecção de comunidades◦ Índices de centralidade para encontrar limites da

comunidade

Introdução

Aplicações práticas:◦ Redes sociais: pode indicar grupos reais◦ Redes de citação: artigos de um mesmo topico◦ Redes metabólicas: ciclos e grupos funcionais◦ Redes na Web: páginas sobre temas relacionados

Ser capaz de identificar estas comunidades poderiam nos ajudar a entender e explorar as redes de forma mais eficaz

Introdução

Método Tradicional◦ Clustering hierárquico

Baseado em pesos entre dois vértices Número de caminhos independentes de nós (node-

independent) ou arestas (edge-indepentent) Número total de caminhos entre os vértices

Agrupa os vértices, adicionando arestas de acordo com os pesos

◦ O grafo resultante pode ser representado por estrutura de árvore

Detecção de Comunidades

Árvore de clustering hierárquico (dendograma)

Detecção de Comunidades

Método Tradicional◦ Possui resultados razoáveis◦ Falha

Vértices periféricos ficam fora da comunidade a qual deveriam pertencer

Detecção de Comunidade

Caso de falha

Detecção de Comunidade

Intermediação de vértices◦ Medida de centralidade de um vértice

◦ Mede a frequência com que o nó aparece no menor caminho entre dois nós quaisquer

◦ Pontecial para conectar comunidades diferentes

◦ Eliminar nós de alta intermediação pode ter o efeito de desconectar a rede

Método Proposto

A

C

D

B

G

F E

Método Proposto

Alta Intermediação(pontos críticos para disseminação)

Algoritmo1. Calcula-se o grau de intermediação de cada

aresta da rede2. Remove-se a aresta com maior grau de

intermediação3. Calcula-se o grau de intermediação de todas as

arestas afetadas pela remoção4. Volta para o passo 2 até que não reste

nenhuma aresta

Método Proposto

Parâmetros◦ 128 vértices◦ 4 comunidades◦ 32 vértices por comunidade◦ Grau médio z igual a 16

Procedimento◦ Arestas inseridas aleatoriamente para cada par

de vértices - probabilidade de ligação com um vértice da

mesma comunidade (intracommunity) - probabilidade de ligação com um vértice de outra

comunidade (intercommunity)

Redes geradas por computador

Redes geradas por computador

Zachary’s Karate Club◦ Rede de amizade

◦ Clube que foi divido após disputa entre o administrador e instrutor

◦ Foi ignorado o grau de afinidade

Redes ReaisEstrutura de Comunidade Conhecida

Redes ReaisEstrutura de Comunidade Conhecida

Dendograma gerado a partir do Proposto

Redes ReaisEstrutura de Comunidade Conhecida

Dendograma gerado a partir do Método Tradicional

Redes ReaisEstrutura de Comunidade Conhecida

Observações◦ O algoritmo conseguiu detectar as comunidades

formadas

◦ Previsão da evolução da rede

◦ Falha: O único caso de falha foi o nó 3

Redes ReaisEstrutura de Comunidade Conhecida

College Football◦ Vértices: times de futebol americano da divisão I

da liga do ano de 2000

◦ Arestas: jogos realizados numa temporada

◦ Estrutura de comunidade Conferências formadas por 8 a 12 times

Obs: Cada time tem mais jogos com time que pertence a mesma conferência em média

Redes ReaisEstrutura de Comunidade Conhecida

Redes ReaisEstrutura de Comunidade Conhecida

Redes ReaisEstrutura de Comunidade Conhecida

Observações◦ Conferências identificadas com alta precisão

◦ Falha: A conferência Sunbelt foi separa em duas

comunidades

◦ Motivo: A estrutuda da rede não corresponde a estrutura da

comunidade Sunbelt realizou mais jogos com a conferência Western

Athletic do que a própria conferência

Redes ReaisEstrutura de Comunidade Conhecida

Rede de Colaboração◦ Vertices: 271 cientistas do Institute de Pesquisa

de Santa Fé nos anos de 1999 e 2000

◦ Arestas: co-autoria em artigos nos anos de 1999 e 2000

◦ Grau médio = 5

Redes ReaisEstrutura de Comunidade Não Conhecida

Rede de Colaboração◦ 118 vértices◦ Maior Componente

Redes ReaisEstrutura de Comunidade Não Conhecida

Rede de Colaboração◦ Observações

Identificação de áreas de pesquisa

Divisão de subáreas

Interesse de pesquisa de membro dominante

Interessante: agrupamento por metodologia

Redes ReaisEstrutura de Comunidade Não Conhecida

Teia Alimentar◦ Vértices: 33 taxa mais proeminetes de Chesapeak

Bay Espécies ou Gênero Grupos de espécies relacionadas

◦ Arestas: relação trófica entre vértices ligados

◦ Direção ignorada

Redes ReaisEstrutura de Comunidade Não Conhecida

Teia Alimentar

Redes ReaisEstrutura de Comunidade Não Conhecida

Teia Alimentar◦ Observações

Pelágicos vs Bênticos Ecossistemas razoavelmente independentes Bênticos relacionando com Pelágicos Nesse caso a divisão pode não ser apropriada

Em cada grupo vários níveis tróficos observados

◦ Problema: teias alimentares são densas ou não possuem estruturas de comunidade

Redes ReaisEstrutura de Comunidade Não Conhecida

TouchGraph

Aqui

Demonstração

Verificamos os métodos de detecção de comunidade◦ Clássico: núcleos fortementes conectados◦ Proposto: intermediação de arestas

Vimos que esses métodos são úteis na análise de redes e que o método proposto é superior ao clássico

Várias melhorias podem ser realizadas ainda para método proposto

Diversas aplicações podem ser realizadas a partir da detecção de comunidades

Conclusão

[1] M. Girvan and M. E. J. Newman Community structure in social and biological networks PNAS 2002 99 (12) 7821-7826; doi:10.1073/pnas.122653799

[2] http://www.touchgraph.com/navigator

Referência

?Dúvidas

top related