ars - análise de redes sociais - viii eri mg
DESCRIPTION
Slides do minicurso de Análise de Redes Sociais para a VIII Escola Regional de Informática de Minas Gerais - Unimontes/Montes ClarosTRANSCRIPT
ARS - Análise de Redes Sociais
Prof. Petrônio Cândido de Lima e Silva
Agenda
1. Contextualização2. Fundamentos Teóricos
a. Teoria dos Grafosb. Redes Sociaisc. Métricas e Algoritmos de ARS
3. Práticaa. Extração de Dados de Redes Sociaisb. Análise
Introdução e Contextualização
Redes Sociais“Diga-me com quem tu andas e eu te direi que és”
Pessoas e Relacionamentos
Pessoas → PessoasPessoas ← Pessoas
Redes Sociais
● Incapacidade de abstrair em toda a sua complexidade o emaranhado de relacionamentos em que estamos envolvidos○ Qual o seu impacto nos outros ?○ Qual o impacto dos outros em você ?○ Quem você conhece?○ Como você classifica quem conhece?
Redes Sociais
● TUDO está conectado○ Grande emaranhado de inter-relacionamentos de
todas as naturezas;○ Influências se propagam na rede;○ Protagonistas○ Coadjuvantes
Redes Sociais
● Complexas
● Dinâmicas
● Redundantes
● Localizadas
● Difusas
● Recursivas
● Incompletude
● Limites nebulosos
Redes Sociais
● Resistência / Resiliência ○ Tolerante à falhas○ Laços isolados entre pessoas são frágeis○ A rede em si é extremamente resistente à
desconexão:■ Quando perde pessoas■ Quando perde relacionamentos
Redes Sociais● GRANOVETTER (1973)
● Laços Fortes (Strong Ties)
○ Interligam pessoas próximas/íntimas, de um mesmo
grupo ou comunidade;
○ São pessoas basicamente parecidas;
Redes Sociais● Laços Fracos (Weak Ties)
○ Interligam conhecidos e pessoas que freqüentam
outros grupos ou comunidades;
○ Conhecidos, convivência ocasional e esporádica;
○ Elos de ligação entre grupos diferentes, garantindo
a diversidade;
Redes Sociais● Com quem é melhor procurar emprego?
Entre os amigos próximos (strong ties) ou
com os distantes (weak ties) ?
● strong ties: Possivelmente também são
seus concorrentes
● weak ties: Elo com outros mercados!
Aplicações
● Redes de Contágio Emocional
● Redes de Poder/Influência
● Redes Terroristas
● Redes Científicas
Redes de Contágio Emocional● Modelos de contágio
○ ABDO (2009)● Modelo de contágio emocional no Facebook
○ KRAMER, GUILLORY e HANCOCK (2014)○ COVIELLO et al (2014)
● #VemPraRua○ CANCIAN, FALCÃO e MALINI (2013)
● #ProtestoRJ○ CALMON, BRUNO e ANTOUN (2014)
Redes de Contágio Emocional
Redes de Poder / Influência
● NSA espiona a presidente DILMA○ GLOBO (2013)
● Redes de financiamento político○ HOROCHOVSKI et al (2014)
NSA espiona Dilma
Redes Terroristas e Criminosas● Terroristas do 11/09 e rede Al Qaeda
○ KREBS (2002)○ XU e CHEN (2005)
Redes Científicas
● VANZ (2009)● BALANCIERI et al. (2005)● ROSSONI, SILVA e JÚNIOR (2008)
Fundamentos Teóricos
Agenda
1. Grafos
2. Redes Complexas
3. Redes Sociais
4. Métricas de Redes Sociais
5. ARS versus Mineração de Grafos
Teoria dos Grafos
GrafosG = { V , E }
V = {a1, a2, a3, ... , an}
E = {(ai,ak) | ai, aj ∈ V }
n = | V |
m = | E |
Grafos
B
J
A
FC I
H
G
D
Grafos
● Simples - Arestas simétricas
( ai , ak ) = ( ak , ai )
● Direcionados (Dígrafos) - Arestas assimétricas
( ai , ak ) ≠ ( ak , ai )
Grafos
B
J
A
FC I
H
G
D
Grafos - Matriz de AdjacênciasA B C D E F G H I J
A 0 0 1 0 0 0 0 0 0 0
B 0 0 1 0 0 0 1 0 0 0
C 1 1 0 0 0 1 1 0 0 0
D 0 0 0 0 0 0 0 0 0 0
E 0 0 0 0 0 0 0 0 0 0
F 0 0 1 1 0 0 0 0 0 0
G 0 1 1 0 0 0 0 0 0 0
H 0 0 0 0 0 0 0 0 0 1
I 0 0 0 0 0 0 0 0 0 1
J 0 0 0 0 0 0 0 1 1 0
wi,j ∈
V
0, se não há aresta entre i e j
x >0, se há aresta entre i e j
Wij é conhecido como Peso ou Custo da aresta
A(G) = [wij]
Grafos - Matriz de Adjacências
● Multigrafos○ Permite mais de uma aresta entre dois vértices
● Hipergrafos
○ Uma mesma aresta pode conectar mais de dois
vértices
Grafos
● Grau - Degree
○ Número de arestas que estão conectadas à um
vértice:
d(i) = ∑j∈V wij (considerando wij binária)
Digrafos
● Grau de Entrada / Incidente (InDegree)
○ din(v) = ∑j∈V wvj
● Grau de Saída (outDegree)
○ dout(v) = ∑j∈V wjv
Grafos
● Soma dos Graus
d(G) = ∑v∈V d(v) = 2m
● Grau Médio do Grafo
d(G) = 1/n ∑v∈V d(v) = 2m/n
Digrafos● Base - Conjunto de Vertedores
○ É um subconjunto dos vértices de um dígrafo tal que:
B ⊆ V | ∀v ∈ B, din(v) = 0, dout(v) > 0
● Anti-Base - Conjunto dos Sorvedores○ É um subconjunto dos vértices de um dígrafo tal que:
AB ⊆ V | ∀v ∈ AB, din(v) > 0, dout(v) = 0
Grafos
B
H
A
EC I
G
F
D
B = {A, E, G}
AB = {D, I, F}
● cij - Caminho○ Partindo de i, uma lista de n vértices que o
interligam ao vértice j, existindo arestas entre eles.● Menor Caminho (Shortest Path)
○ Caminho de Custo Mínimo○ DIJKSTRA (1959)○ O(m log n)
Grafos
l(i,j) - Distância GeodésicaO custo (ou tamanho) do menor caminho entre i e j;
l(i,j) = ∑x,y ∈ Cij wxy
● l(G) - Distância Geodésica Média○ O tamanho médio dos caminhos dos grafo G
l(G) = 1/n ∑i,j ∈ V l(i,j)
Grafos
Grafos - Matriz de VizinhançaA B C D E F G H I J
A 0 0 1 0 0 0 0 0 0 0
B 0 0 1 0 0 0 1 0 0 0
C 1 1 0 0 0 1 1 0 0 0
D 0 0 0 0 0 0 0 0 0 0
E 0 0 0 0 0 0 0 0 0 0
F 0 0 1 1 0 0 0 0 0 0
G 0 1 1 0 0 0 0 0 0 0
H 0 0 0 0 0 0 0 0 0 1
I 0 0 0 0 0 0 0 0 0 1
J 0 0 0 0 0 0 0 1 1 0
wi,j ∈ V = l(i,j)
Wij é a distância entre i e j
A(G) = [wij]
● Conexo
○ Existe um caminho entre quaisquer dois vértices do
grafo: ∃cij ∀i,j∈ V
● Desconexo
○ ∄cij ∀i,j∈ V
Grafos
● Sub-grafos
Gs = (Vs,Es) | Vs ⊂ V, Es ⊂ E
● Componentes○ Sub grafos conexos de um grafo desconexo
Grafos
Grafos● Conjunto de Corte
○ Conjunto mínimo de vértices ou arestas que se
removidos do grafo causam sua desconexão ou
aumentam o número de componentes;
○ Ponto de Articulação / Vértice de Corte (Cut-Edge)
○ Aresta de Corte (Cut-Arc)
Grafos● Resistência
○ Capacidade de uma rede tem de perder nós e continuar
conectada;
○ Próximo ao conceito de Densidade, que será estudado
adiante.
Grafos
● Grafos Completos - Kn
Kn = [n(n-1)]/2
● Clique○ Subgrafo completo de um grafo
Grafos● Árvores
● Árvore Geradora Mínima
○ Um subgrafo em forma de árvore, de custo mínimo,
que conecte todos os vértices com o mínimo de
arestas
Redes Complexas
Redes Complexas
● Grafos de alta dimensionalidade● Propriedades comuns:
○ Aleatórios○ Distribuição de Grau○ Estruturas de comunidade
Redes Complexas
● Tipos de Redes○ Biológicas○ Sociais○ Informacionais○ Tecnológicas
Grafos Aletórios de Erdös-Rény
● ERDÖS e RÉNY (1961)● Dado um conjunto de vértices V, as arestas
entre esses vértices são calculadas por uma probabilidade k;
GERnk = (V, E) | n = |n| , k = |E|
Grafos Aletórios de Erdös-Rény
1. Inicia com os n vértices isolados ( E = ∅ )2. Para i = 0 até K
a. Selecione dois nós aleatoriamente: i e jb. E ← (i, j)
● Resultados interessantes:d(GERnk) ≈ k
l(GERnk) ≈ logkn
Grafos Aletórios de Erdös-Rény
B
H
A
E
C
I
G
FD
B
H
A
E
C
I
G
FD
B
H
A
E
C
I
G
FD
Modelo de Watts-Strogatz
● WATTS e STROGATZ (1998)● Todos os vértices se conectam aos seus
vizinhos mais próximos;● Existe uma probabilidade de reconexão da
aresta com outro vértice
Grafos Aletórios de Erdös-Rény
B
H
A
E
C
I
G
FD
B
H
A
E
C
I
G
FD
B
H
A
E
C
I
G
FD
Distribuição de Grau● Uma distribuição de grau é a distribuição de frequências de vértices (nk)
com um determinado grau (k) em relação à n
fk = nk / nFr
eq (f
k)
Grau (k)
Lei de Potência
P(x) = �x-�
● Distribuição de Cauda LongaFr
eq (f
k)
Grau (k)
Lei de Zipf
● Lei de Potência empírica● Em um texto, crie um histograma com as
frequências de cada palavra, ordenado da mais frequente para a menos frequente.
● A Lei de Zipf correlaciona a frequência de cada palavra com a sua posição no histograma
Lei de Zipf
fk = ak-b
Freq
(fk)
Grau (k)
Princípio de Pareto (20/80)
● Lei de Potência empírica
“20% das causas são responsáveis por 80% das conseqüencias”
Modelo de Barabási-Albert● BARABÁSI e ALBERT (1999)● Um grafo que tem uma distribuição de grau
que segue a Lei de Potência● Também conhecido como Modelo
Preferencial ou Rede Preferencial ou Scale Free Networks
Modelo de Barabási-Albert● A probabilidade de um vértice qualquer
conectar-se ao vértice:
P(j) = d(j) / ∑i ∈ V d(i)
Modelo de Barabási-Albert
B
G
A
EC I
H
FD
K
L
M
NO
J
Grau Freq
7 1
3 2
2 5
1 7Grau (k)
Freq
(fk)
Redes Sociais
B
GA
EC I
H
FD
K
L
M
NO
J
P
Q R
S
T
R
U
V
X
Z
W
��
��
��
��
��
Mundo Pequeno - Teoria dos Seis Graus
● MILGRAM (1967)
● Lembram do GER?
d(GERnk) ≈ k
l(GERnk) ≈ logkn
Mundo Pequeno - Teoria dos Seis Graus
● Para n bem grande:
n ≅ 7 . 109 (est. da população mundial)
k ≅ 40 (família, amigos, etc…)
l ≅ log407.109 ≅ 6
Mundo Pequeno - Teoria dos Seis Graus
● Corroborada/aceita pelos dados○ Orkut, Facebook, Twitter, etc..
● Oráculo de Bacon○ http://oracleofbacon.org/
Análise de Redes Sociais
Análise de Redes Sociais
● Utilização de TG e TR em Redes Sociais
● Alta Dimensionalidade
n > 500 e d(G) ≅ 100
● Redes com conexeões○ Preferenciais
○ Locais (geograficamente)
Análise de Redes Sociais
● Busca identificar:○ Importância dos atores e dos papéis
○ Comunidades
● Relacionamentos entre os atores○ Fluxos de informação
○ Estruturas de organização e hierarquia
Redes Sociais
● Escopo○ Redes Totais (Whole Networks)
■ TODOS os envolvidos em um contexto
○ Redes Egocêntricas (Egocentric Networks)
■ A rede de relacionamentos de uma pessoa
Técnicas de ARS
● Métricas Estruturais○ Centralidade○ Excentricidade○ Densidade○ Transitividade○ Coesão
● Detecção de Comunidades
Centralidade
● Usadas para determinar a importância de um vértice dentro da rede○ Centralidade de Grau○ Centralidade de Proximidade○ Centralidade de Intermediação○ Centralidade de Autovetor
Centralidade de Grau - Degree
● É o grau (normalizado) de um vértice
● Revela a importância/prestígio daquele
vértice dentro do grafo
c(i) = ( ∑j∈V wij ) / ( n - 1)
Centralidade de Proximidade - Closeness
● FREEMAN (1977)
● Afastamento○ Soma das distâncias para todos os outros nós
● Proximidade○ Afastamento-1
cp(v) = [ ∑j∈V l(v,j) ]-1
Centralidade de Intermediação - Betweenness
● FREEMAN (1977)● O número de vezes que um vértice participa
do caminho mais curto entre dois outros vértices.
● Teoricamente esse vértice controla a comunicação entre outros vértices
Centralidade de Intermediação - Betweenness
ci(v) = ∑a,b≠v pavb / pab
Onde:● pab = Quantidade de caminhos que entre os
vértices a e b● pavb = Quantidade de caminhos que entre os
vértices a e b que passam por v
Centralidade de Fluxo de Intermediação
● HANNEMAN e RIDDLE (2005)● Variação da Centralidade de Intermediação● Leva em consideração TODOS os caminhos
possíveis, não apenas os geodésicos● Pessoas tendem a fazer uso de todos os
caminhos possíveis, mesmo se há um caminho menor e mais eficiente;
Centralidade de Autovetor (Eigenvector)
● Relevância de um vértice a partir dos nós vizinhos
a(v) = 1/� ∑j ∈ V wvj . a(j)
Aw = �w
HITS - Hypertext Induced Topics Search
● GIBSON, KLEINBERG e RAGHAVAN (1998)
● Autoridade (Authority)○ Um vértice com informação confiável, de qualidade○ Recebe muitas ligações de hubs
● Concentrador (Hub) ○ Um vértice com ligações de alta qualidade○ Aponta para muitas autoridades
HITSa ← E ; h ← E ; c = 0; k = 20enquanto c < k
para i ← 1 até na(i) ← ∑wij = 1 h(j)
para i ← 1 até nh(i) ← ∑wij = 1 a(j)
normalizar(a) ; normalizar(h)c ← c + 1
HITSa0 = [1 1 1 1] h0 = [1 1 1 1]
a1 = [1 1 2 3] h1 = [2 2 1 2]a1 = [0 0 .5 1] h1 = [1 1 0 1]
a2 = [1 1 2 2] h2 = [1 1.5 1 .5]a2 = [0 0 1 1] h2 = [.5 1 .5 0]
a3 = [0 .5 1 2] h3 = [1 2 1 1]a3 = [0 .25 .5 1] h3 = [0 1 0 0]
A C
B D
0 1 0 1
0 0 1 1
0 0 0 1
1 0 1 0
PageRank
● BRIN e PAGE (1998)● Variação da Centralidade de Auto Vetor● A importância de um nó é medida a partir da
importância dos nós que estão conectados à ele;
PageRank
pr(v) = (1-d)/n + d . ∑j ∈ Vin pr(j) / dout(j)Onde:● d = Fator de amortecimento
○ Probabilidade de um vértice ser visitado a partir de uma aresta vinda de outro vértice, 0 ≤ d ≤ 1
○ (1-d)/n é a probabilidade do vértice ser visitado aleatoriamente
● Vin = Conjunto de entrada de v
PageRank
pr(v) = (1-d)/n + d . ∑j ∈ Vin pr(j) / dout(j)W’ = dW + (1-d)E
R = W’Ronde:● W = Matriz de adjacências● R = Vetor com os PageRanks● E = [1,...1]
PageRank
i ← 0
R0 ← E/n
enquanto |Ri-1 - Ri | < �
Ri+1 ← (1-d)E + dWRi
i ← i + 1
PageRankd = 0,85 � = 0.00R0 = [0.25 0.25 0.25 0.25]T
E= [ 1 1 1 1]T
R1 = (1-d)E + dMT R0
= + .85 MT
Final: []
A C
B D
din dout
A 1 2
B 1 2
C 2 1
D 3 2
0 1 0 1
0 0 1 1
0 0 0 1
1 0 1 0
0.14
0.14
0.25
0.46
0.15
0.15
0.15
0.15
0.25
0.25
0.25
0.25
Excentricidade
● Usadas para determinar a dispersão dos vértices dentro da rede○ Excentricidade do vértice○ Excentricidade da rede
■ Diâmetro■ Raio
Excentricidade
● A excentricidade de um vértice é o maior comprimento dentre os menores caminhos de um vértice aos outros vértices do grafo.
e(v) = max ( l(v,w) ), ∀w ∈ V
Excentricidade
● Diâmetro○ É a máxima excentricidade do grafo○ O maior dos maiores caminhos
L(G) = max∀v ∈ V ( e(v) )
● Raio○ É a mínima excentricidade do grafo
l(G) = min∀v ∈ V ( e(v) )
Excentricidade
● Vértices Centrais
○ Excentricidade = Raio
● Vértices Periféricos
○ Excentricidade = Diâmetro
Coesão
● Densidade
○ Número de arestas de G comparado ao de um Kn
com os mesmos vértices
D = 2E / n(n-1)
● Grafos Densos x Grafos Esparsos
Coesão
● Coeficiente de Clusterização do vértice○ A probabilidade de que dois vértices conectados por
um terceiro vértice sejam também conectados entre si
c(v) = 2Ev / dv(dv-1)Onde:
Ev = número de arestas entre os vizinhos de Edv = Grau de v, dv > 1 (número de vizinhos de v)
Coesão
● Coeficiente de Clusterização do vértice○ c(v) mede:
■ o quanto os vértices se agrupam na vizinhança de v
■ O quanto eles estão próximos de formar um clique
Coesão● Coeficiente de Clusterização do grafo
c(G) = 1/n ∑v∈V c(v)
Detecção de Comunidades
Detecção de comunidades● Sub grafos coesos / densos● Formados por afinidades, estreitam suas relações● Caracterizam-se por:
○ Muitas (e fortes) conexões internas (entre seus membros)
○ Poucas( e fracas) conexões externas (entre membros de outras comunidade)
● Útil para segmentação
Detecção de comunidadesUma comunidade é um subgrafo C tal que
C(Vc,Ec) ⊂ G(V,E)
Considerando O o subgrafo com todas as arestas e vértices fora do subgrafo C:
O(Vo, Eo) = G(V,E) - C(Vc, Ec)
Em que: c(C) > c(O)
Detecção de Comunidades● Problema de otimização combinatória
○ Maximizar o c(v) entre os vértices do grupo e
minimizar o c(v) fora do grupo
● Heurísticas, Metaheurísticas, ...
Detecção de Comunidades● Cliques
○ Sub grupo Kn
● N-Cliques
○ Um clique em que os elementos não precisam ser
adjacentes, vizinhos a uma distância máxima de n;
○ l(i,j) = n | ∀i,j ∈ G
Detecção de Comunidades● K-plexes
○ Um subgrafo onde cada vértice é adjacente a todos
os outros vértices, exceto a k vértices.
○ d(v) ≥ n - k | ∀v ∈ G
Detecção de Comunidades● LS Set
○ SEIDMAN (1983)
○ Um subgrafo onde cada vértice tem mais arestas
com outros membros do subgrafo do que com
qualquer outro vértice de fora
Detecção de Comunidades● NEWMAN e GIRVAN (2004)
● Estratégia Top-Down
● Utiliza a centralidade de intermediação de
arestas para definir os limites entre as
comunidades;
Detecção de Comunidades● Uma aresta com alto grau de intermediação
tem potencial de ser a ponte entre
comunidades distintas;
● Se ela for removida desconectamos o grafo
e geramos componentes conexas
Detecção de Comunidades1. Para cada a ∈ E
a. Calcule ci(a)2. enquanto
a. selecione a = max ci(a)b. remover ac. Checar componentesd. Recalcular ci(a) ∀a ∈ E
Detecção de Comunidades
● BLONDEL et al, 2008● Analiza as comunidades partindo dos
vértices individuais e calculando o ganho de modularidade em se adicionar novos vértices
● Estratégia Bottom-Up
Detecção de ComunidadesC←V ; g ← 0enquanto g > 0
para cada i ∈ Cpara cada j ∈ vizinho(i)
se m(i,j) > m(j,)g ← m(i,j) i ← j
Onde:
● g = ganho de modularidade
● C = vetor de comunidades
● m(C,j) = Função do ganho de
modularidade para adicionar o
vértice j à comunidade C, [-1, 1]
Detecção de Comunidades
m(C,i) = [ (Cin+iout)/2m - ((Ct + it)/2m)2 ]
- [ Cin / 2m - (Ct/2m)2 - (it/2m)2 ]Onde:● Cin = Soma dos pesos das arestas internas de C● Ct = Soma dos pesos das arestas ligadas a algum vértice de C● Iout = Soma dos pesos das arestas ligadas a i● it = Soma dos pesos das arestas entre i e algum vértice de C
Detecção de ComunidadesOnde:● Cin = Soma dos pesos das arestas internas de C
Cin = ∑k,j∈C wkj● Ct = Soma dos pesos das arestas ligadas a algum vértice de C
Ct = ∑k∈G,j∈C wkj● Iout = Soma dos pesos das arestas ligadas a i
iout = ∑k∈G wik● it = Soma dos pesos das arestas entre i e algum vértice de C
it = ∑k∈C wik
Detecção de Comunidades● Cria-se um grafo para representar os
relacionamentos entre as comunidades● Cada vértice representa uma comunidade, e
seu valor Cin● Uma aresta entre os vértice i e j é
acrescentada quando há arestas entre os vértices internos das comunidades i e j e o valor é a soma dos pesos dessas arestas
Prática
Agenda
1. Extração de Dados da Social Mediaa. WebCrawlersb. Netvizz
2. O Software Gephia. Importação de Dadosb. Visualizaçãoc. Métricas
DataSets● SNAP - Stanford Large Network Dataset Collection
○ https://snap.stanford.edu/data/ ● Social Computing Data Repository
○ http://socialcomputing.asu.edu/pages/datasets● MPI-SWS datasets
○ http://socialnetworks.mpi-sws.org/datasets.html
(fonte: http://www.kdnuggets.com/2014/08/interesting-social-media-datasets.html )
Social Media
Social Media
● Como extrair dos dados?● Questões legais e privacidade
○ Dados públicos?○ Necessita autorização?
Social Media API’s
● Facebook○ Graph API: ○ netvizz
● Twitter○ REST API: ○ Twitter4j: https://github.com/yusuke/twitter4j
Crawling Social Media
● Crie um aplicativo● Gere os tokens● Cuidado com os Rate Limits!!!!
○ Faça uma paginação de dados● Armazene os dados: JSON
Crawling Social Media
● Flocker○ Twitter○ http://flocker.outliers.es/ ○ GDF, PNG e SVG
● netvizz○ Facebook○ https://apps.facebook.com/netvizz/ ○ GDF
Crawling Social Media
● NodeXL○ Twitter, Facebook, Flickr, YouTube○ http://nodexl.codeplex.com/ ○ XLS
● GNIP○ Twitter, Facebook, Foursquare, Instagram,
Youtube,...○ http://gnip.com/
Software para Grafos
● neo4j● GraphMiner● NetLogo● Pajek● Gephi● yEd
Gephi - Open Graph Viz Plataform
● http://gephi.github.io/● Software para visualização e análise de
Grafos○ Gratuito e de código aberto○ Multi plataforma○ Plugins
Gephi - Open Graph Viz Plataform
● Visão Geral○ Contexto○ Partições○ Classificação○ Estatísticas (Métricas)○ Distribuição ( Layouts)○ Filtros
Gephi - Open Graph Viz Plataform
● Laboratório de Dados○ Manipulação de Nós e Arestas○ Importação/Exportação
● Visualização○ Configurações (Nós, Arestas e Rótulos)○ Exportação (SVG/PDF/PNG)
Gephi - Open Graph Viz Plataform
● Formatos de Dados - Entrada○ GDF○ GDFX
● Formatos de Dados - Saída○ CSV○ PDF○ PNG
Gephi - Open Graph Viz Plataform
Métricas
● PageRank● HITS● Densidade● Diâmetro● Modularidade
● Centr. de Grau● Centr. de Intermediação● Centr. de Proximidade● Coef. de Clustering
Gephi - Open Graph Viz Plataform
1. Estatísticas → Modularidade2. Partição
a. Nósb. Atualizarc. Modularity Classd. Aplicar
Gephi - Open Graph Viz Plataform
● Layouts○ Distribuição Aleatória○ Contração○ Expansão○ Fruchterman Reingold○ Force Atlas○ Yfan Hu
Gephi - Open Graph Viz Plataform
● Classificação○ Nós○ Cor e Tamanho/Peso○ Pagerank○ Aplicar
● Visualização○ Cor de Fundo
Conclusão
Referências
ReferênciasABDO, Alexandre Hannud. Relações entre topologia e dinâmica em processos de crescimento e contágio em redes complexas. 2009. Tese de Doutorado. University of Aberdeen.ALMEIDA, Leonardo Jesus. Detecção de comunidades em redes complexas utilizando estratégia multinível. Tese de Doutorado. Universidade de São Paulo: São Paulo, 2009.ANALYTIC BRIDGE. Network analytics: more than pretty pictures. Disponível em <http://www.analyticbridge.com/profiles/blogs/network-analytics-more-than-pretty-pictures>. Acesso em <02/11/2014>BALANCIERI, Renato et al. A análise de redes de colaboração científica sob as novas tecnologias de informação e comunicação: um estudo na Plataforma Lattes. Ciência da Informação, v. 34, n. 1, 2005.BARABÁSI, Albert-László; ALBERT, Réka. Emergence of scaling in random networks. Science, v. 286, n. 5439, p. 509-512, 1999.BASTIAN, M.; HEYMANN, S.; JACOMY, M. Gephi: an open source software for exploring and manipulating networks. International AAAI Conference on Weblogs and Social Media. Disponível em <http://www.aaai.org/ocs/index.php/ICWSM/09/paper/view/154/1009 >. Acesso em <02/11/2014>BLONDEL, V.; GUILLAUME, J. L.; LAMBIOTTE, R.; LEFEBVRE, E. Fast unfolding of communities in large networks. Journal of Statistical Mechanics: Theory and Experiment 2008 (10), P1000BORBA, Elizandro Max. Medidas de Centralidade em Grafos e Aplicações em redes de dados. Dissertação (mestrado) Universidade Federal do Rio Grande do Sul, Programa de Pós-Graduação em Matemática Aplicada, Porto Alegre, 2013.
ReferênciasBORTOLOSSI, Humberto J.;QUEIROZ, João J. D. B.; SILVA, Michele M. A Lei de Zipf e outras leis de potência em dados empíricos. Disponível em <http://klein.sbm.org.br/wp-content/uploads/2012/12/ Zipt-bortolossi-queiroz-dasilva-lpp-projeto-klein.pdf>. Acesso em <07/11/2014> BRIN, Sergey; PAGE, Lawrence. The anatomy of a large-scale hypertextual Web search engine. Computer networks and ISDN systems, v. 30, n. 1, p. 107-117, 1998.BSF. Introdução ao Gephi. Disponível em <http://bsf.org.br/2011/10/18/introducao-ao-gephi/ >. Acesso em <02/11/2014> CANCIAN, Allan; FALCÃO, Paula; MALINI, Fábio. Ciberativismo e Manifestações Sociais. O #vemprarua no Brasil. Anais do VII Simpósio Nacional da ABCiber. Novembro/2013 Curitiba, Paraná. Curitiba: UTP, 2013.CALMON, Priscila; BRUNO, Fernanda; ANTOUN, Henrique. Contágio entre redes e ruas: mapeando o #ProtestoRJ no Twitter. Disponível em <http://pt.slideshare.net/priscillacalmon/ contgio-entre-as-redes-e-as-ruas-mapeando-o-protestorj-no-twitter-1 >. Acesso em <11/11/2014>.COVIELLO, Lorenzo et al. Detecting Emotional Contagion in Massive Social Networks. PloS one, v. 9, n. 3, p. e90315, 2014.DIJKSTRA, E. W. A note on two problems in connexion with graphs. Numerische Mathematik 1, 1959. p. 269–271.ERDŐS, Paul; RÉNYI, Alfréd. On the strength of connectedness of a random graph. Acta Mathematica Hungarica, v. 12, n. 1, p. 261-267, 1961.
ReferênciasFEOFILOFF, P.; KOHAYAKAWA, Y.; WAKABAYASHI, Y. Uma Introdução Sucinta à Teoria dos Grafos. Disponível em <http://www.ime.usp.br/~pf/teoriadosgrafos/texto/TeoriaDosGrafos.pdf >. Acesso em <02/09/2014>FIGUEIREDO, Daniel R. Introdução a Redes Complexas. Em: de Souza, A.F., Jr. Meira, W. (editores), Atualizações em Informática 2011, PUC-Rio, Cap. 7, pp 303--358, 2011.FREEMAN, Linton C. A set of measures of centrality based on betweenness. Sociometry, p. 35-41, 1977.GEPHI: The Open Graph Viz Plataform. Disponível em <http://gephi.github.io/ >. Acesso em <02/11/2014>GIBSON, David; KLEINBERG, Jon; RAGHAVAN, Prabhakar. Inferring web communities from link topology. In: Proceedings of the ninth ACM conference on Hypertext and hypermedia: links, objects, time and space. ACM, 1998. p. 225-234. GRANOVETTER, Mark S. The Strenght of Weak Ties. The American Journal of Sociology, vol. 78, n. 6, p. 1360-1380, 1973.HAN, Jiawei; KAMBER,, Micheline. Graph Mining, Social Network Analysis, and Multirelational Data Mining. Em Data Mining: Concepts and Techniques 2 ed., Morgan Kaufmann, 2006.HANNEMAN, Robert A.; RIDDLE, Mark. Introduction to social network methods. Riverside, CA: University of California. 2005.
ReferênciasHOROCHOVSKI, Rodrigo Rossi et al. Redes de Financiamento Eleitoral nas Eleições de 2008 no Litoral do Paraná. Paraná Eleitoral v. 3 n. 1 p. 103-131. 2014.KRAMER, Adam DI; GUILLORY, Jamie E.; HANCOCK, Jeffrey T. Experimental evidence of massive-scale emotional contagion through social networks. Proceedings of the National Academy of Sciences, 2014.KREBS, Valdis E. Mapping networks of terrorist cells. Connections, v. 24, n. 3, p. 43-52, 2002.GLOBO. Veja os documentos ultrassecretos que comprovam espionagem a Dilma. Disponível em <http://g1.globo.com/fantastico/noticia/2013/09/veja-os-documentos-ultrassecretos-que-comprovam-espionagem-dilma.html >. Acesso em <02/11/2014>HUMANIDADES DIGITAIS. Análise e visualização de redes: O Gephi. Disponível em <http://humanidadesdigitais.org/2013/08/16/analise-e-visualizacao-de-redes-o-gephi/ >MILGRAM, Stanley. The small world problem. Psychology today, v. 2, n. 1, p. 60-67, 1967.NEWMAN, Mark EJ; GIRVAN, Michelle. Finding and evaluating community structure in networks. Physical review v. 69, n. 2, p. 026113, 2004.ROSSONI, Luciano; SILVA, Antônio João H.; JÚNIOR, Israel F.. Estrutura de relacionamento entre instituições de pesquisa do campo de ciência e tecnologia no Brasil. Revista de Administração de Empresas, v. 48, n. 4, p. 34-48, 2008.SEIDMAN, S. B. Network Structure and Minimum Degree. Social Networks, v.5, p.269-287, 1983.
ReferênciasVANZ, Samile Andrea de Souza. As redes de colaboração científica no Brasil:(2004-2006). 2009.XU, Jennifer; CHEN, Hsinchun. Criminal network analysis and visualization. Communications of the ACM, v. 48, n. 6, p. 100-107, 2005.WATTS, Duncan J.; STROGATZ, Steven H. Collective dynamics of ‘small-world’networks. Nature, v. 393, n. 6684, p. 440-442, 1998.WASHIO, Takashi; MOTODA, Hiroshi. State of the art of graph-based data mining. Acm Sigkdd Explorations Newsletter, v. 5, n. 1, p. 59-68, 2003.