redes complexas aula 2 - ufjf.br · figueiredo – 2011 rede (ou grafo) abstração que permite...
TRANSCRIPT
Redes ComplexasAula 2
Aula passadaLogísticaRedes e GrafosExemplosRedes Complexas
Aula de hojeRedes e classesEstrutura e característicasGrau, distância, clusterização
Figueiredo – 2011
Rede (ou Grafo)Abstração que permite codificar relacionamentos entre pares de objetos
objetos
Exemplos?
vértices do grafo
arestas do graforelacionamentos
Figueiredo – 2011
Objetos e RelacionamentosSobre objetos
idênticos, diferentes tipos, possuir estado
Ex. pessoas, homens e mulheres, idade
Sobre relacionamentossimétricos, assimétricos, diferentes intensidades (pesos), diferentes significados
Ex. amizade, distância, etc
Rede depende do sistema
Figueiredo – 2011
Classe de RedesRedes sociais: relacionamento entre pessoas ou grupo de pessoas
Redes de informação (de conhecimento): codificam associação entre informação
Redes tecnológicas: construída pelo homen geralmente para distribuir commodities
Redes biológicas: codifica relacionamentos em sistemas biológicos
Classificação para referência
Twitter: rede social ou rede de informação?
Figueiredo – 2011
Descrever sua estrutura
Como Falar sobre Redes?Desenho da rede: “figura vale por mil palavras”
não funciona para redes grandes
Matriz de adjacência
Matriz n x n (n é número de vértices)
aij = 1 , se existe aresta entre
vértices i e j
aij = 0 , caso contrário
Codifica todos os relacionamentos da rede
Figueiredo – 2011
Matriz de Adjacência
Exemplo
1
3
2
4
1 2 3 41 0 1 1 02 1 0 1 03 1 1 0 14 0 0 1 0
?
Figueiredo – 2011
Matriz de AdjacênciaProblema em descrever a estrutura com matriz de adjacência?
Possui toda a informação, mas não é muito útil, pouco intuitivo
Matriz é o DNA da rede
analogia humana!
Precisamos de resumos da estrutura!
Resumos que ajudem a entender a estrutura!
Figueiredo – 2011
Características de RedesResumo da estrutura da rede
Caracterísiticas estruturais
Exemplos: Tamanho, densidade, graus, distâncias, clusterização, centralidade, etc.
Dão ideia geral da estrutura da rede
Quais características devem ser avaliadas? Quais são importantes?
Depende do que você deseja estudar, mas ningúém sabe ao certo
Como gens no DNA, estamos apenas começando a enteder seu significado
Figueiredo – 2011
Característica ImportanteO que faz uma característica ser importante?
1) Determinar comportamento geral de algum processo
independente de outras características
2) Influência sobre diferentes processos
Exemplo: distribuição de grau
determina comportamento do RW
influencia outros processos (epidemia)
Não conhecemos muitas outras características são importantes
a serem descobertas (como gens importantes)
Figueiredo – 2011
Vértices e ArestasNúmero de vértices de um grafo
n = |V| cardinalidade do conjunto
Número de arestas de um grafo
m = |E|Dado G = (V, E), qual é o maior número de arestas de G?
número de pares não ordenados em um conjunto de n = |V| objetos
n2 n n−1
2≤n2=
Densidade: fração de arestas que o grafo possui
=2m
nn−1
Figueiredo – 2011
Grau MédioGrau médio do grafo considerando todos seus vértices
Grau do vértice u
Também pode ser calculado diretamente
g=1/n∑u∈V
g u
g=2 m /n
Logo temos ∑u∈V
gu=2 m
Cada aresta tem duas pontas!
Figueiredo – 2011
Distribuição do GrauDistribuição empírica do grau dos vértices
frequência relativa do grau
pk=P[D=k ] Número de vértices com grau k
Número total de vértices=
P[Dk ]=1−∑i=0
kpk
Variável aleatória que denota grau de um vértice
CCDF empírica (Complementary Cumulative Distribution Function)
fração de vértices com grau > k
Figueiredo – 2011
Distribuição do Grau
Exemplo
2 6
4 75
1
3
98
Figueiredo – 2011
DistanciaComprimento do menor caminho entre dois vértices
Função d(u,v), onde u e v são vérticesinfinito quando não há caminho
2 6
4 75
1
3
Exemplo
d(6, 3) = ?
d(7, 1) = ?
Importante: muitos caminhos podem realizar a distância entre dois vértices
Figueiredo – 2011
Distância Média e DiâmetroDistância média do grafo
média entre todos os pares de vértices
2 6
4 75
1
3
d=∑
u ,v∈V
d u , v
n2 Se d(u,v) não definida, ignorar par (u,v)
também do denominador
Diâmetro: maior distância entre dois vértices da rede
r=maxu ,v∈V d u , v
Figueiredo – 2011
Distribuição da Distancia
Distribuição empírica da distância entre os vértices do grafo
frequência relativa das distâncias
f Dd =nd
n2Número de pares não ordenados de vértices que tem distância d
Exemplo
2 5
4
1
3
Figueiredo – 2011
ClusterizaçãoMedida a respeito de “triangulos” na rede
Comparação entre triangulos e “quase-triangulos”
quase triangulos: dois vizinhos de um mesmo vértice
Duas métricas na literaturamédia de métrica local
calculo direto na rede
2 3
5 6
1
4
Figueiredo – 2011
Clusterização – IFração de aresta entre vizinhos
probabilidade de dois vizinhos também serem vizinhos
Definida para cada vértice da rede
C i=Ei
d i
2 di : grau do vértice i
Ei : # de arestas entre
os vizinhos de i
Clusterização do grafomédia da clusterização dos vértices
C=1/ n∑v∈V
C i
C i=2 E i
d id i−1
Figueiredo – 2011
Calculando ClusterizaçãoExemplo
2 3
5 6
1
4
Quanto vale C?
Figueiredo – 2011
Clusterização – I Problemas?Não é a fração de arestas entre vizinhos do grafo (como um todo)
Favorece vértices com menos vizinhos
denominador é ~ di
2
Clusterização para grau 0 e 1?
Exemplo?3
8
42
7 9
15 6
10 11
12
Figueiredo – 2011
Clusterização – IIFração entre o número de triângulos no grafo (cliques de tamanho 3) e o número de triplas (sequência de três vértices)
3 x número de triângulos
número de triplas conectadasC' =
Tripla é não-ordenada (a,b,c == c,b,a)
Métrica global
Não é média dos vértices
Não tem problemas com vértices de grau 0 e 1
Valor pode ser muito diferente da outra definição
Mais estável, menos sujeita a anomalias do grafo
Cada triânguloconta 3 vezes
Figueiredo – 2011
Clusterização – II
6 x número de triângulos
número de caminhos de comprimento 2C' =
Definição equivalente (mesmo valor)
Número de caminhos de comprimento 2
Para cada vértice, número de vizinhos dos meus vizinhos (caminhos de comprimento 2)
Cada triânguloconta 6 vezes
Igual a métrica anterior, mas agora a tripla é ordenada: (a-b-c) != (c,b,a)
Figueiredo – 2011
Calculando ClusterizaçãoExemplo
2 3
5 6
1
4
Quanto vale C?
Quanto vale C'?