trabalho de graduação em ciência da computação cin/ufpe nitai bezerra da silva...

Post on 07-Apr-2016

244 Views

Category:

Documents

18 Downloads

Preview:

Click to see full reader

TRANSCRIPT

MECANISMO DE SUGESTÃO E PROCESSO DE CARACTERIZAÇÃO DE REDES SOCIAISTrabalho de Graduação em Ciência da Computação CIn/UFPENitai Bezerra da Silva (nbs@cin.ufpe.br)Orientador: Tsang Ing Ren (tir@cin.ufpe.br)

SUMÁRIO Problema – Por quê sugerir relacionamentos? Solução – O mecanismo de sugestão Como – Análise dos padrões de relacionamento

Modelos de redes complexas Rede social – A base de dados e o framework Processo de caracterização Mecanismo de Sugestão

Filtrar e ordenar Conclusões e Trabalhos Futuros

O PROBLEMA Rede Social

Composição de usuários (nós) e relacionamentos (arestas)

Criação dos relacionamentos depende de esforço do usuário Mecanismo simplista Atividade repetitiva

SOLUÇÃO Mecanismo

inteligente de sugestão

Benefícios Particular

Crescimento rápido da rede social

Comunitário Facilita o

crescimento de todas redes

COMO Análise dos padrões de

relacionamento Verificar padrões existentes

Sugerir nós que seguem o padrão

Quais padrões?

REDES COMPLEXAS Tentativa de modelar fenômenos

naturais em estruturas de redes Cérebro, colônia de formigas, células

biológicas, internet, redes sociais, etc. Evolução dos modelos:

Randômico (50’s) por Erodos e Rényi Small world (1998) por Watts e Strogatz Scale free (1999) por Barabási e Albert

REDES COMPLEXAS Modelos caracterizados pela forma em

que são criados e pelos vários resultados estatísticos

Algumas métricas estatísticas: Grau de um nó Distribuição do grau

REDES COMPLEXAS Coeficiente de agrupamento

É a probabilidade média de que dois nós vizinhos de outro dado nó são também vizinhos entre si

Propriedade observada com valor grande no mundo real“É mais provável você conhecer um amigo

dos seus amigos do que qualquer outra pessoa aleatoriamente” Melanie Mitchell

MODELO RANDÔMICO Regra de criação: Cada par de nós está

conectado com um probabilidade p uniforme

As propriedades chaves mostraram ser totalmente diferentes das observadas no mundo real.

A distribuição do grau é aproximadamente Gaussiana

O coeficiente de agrupamento é exatamente p

MODELO SMALL WORLD

Regra de criação: Comece com um anel onde cada nó liga-se com k dos seus vizinhos

mais próximos. Para cada aresta, com pequena probabilidade p religue uma das extremidades da ligação para qualquer outro nó randomicamente escolhido.

Propriedades: Distância geodésica média pequena

Cresce, até, logaritmicamente com o tamanho da rede

Na rede randômica o crescimento é linear Coeficiente de agrupamento

Valor muitas vezes maior do que numa rede randômica com mesma quantidade de nós e arestas

MODELO SCALE FREE

Regra de criação: Inicialmente existe um pequeno número de nós. Em cada passo

adiciona-se um novo nó, e é conectado a m nós existentes, para algum m. A probabilidade de fazer uma dessas ligações para um nó i é proporcional ao grau do nó i

Ligação preferencial: “Ricos ficam mais ricos”

Propriedades: Distribuição do grau seguindo uma lei de

potência

REDE SOCIAL – A BASE DE DADOS E O FRAMEWORK

Base de dados local Web Crawlers Base de dadosremota

Social Network Orkut

Pessoa

PK Uid

numero_amigos estado

Relações

PK id

FK1 UidPessoa1FK2 UidPessoa2

Procedimentos paracaracterização da rede

Ruby + SQL Server proceduresSQL Server

Procedimentos parasistema de sugestão

- Caracterizando a rede como scale free

- Caracterizando a rede como small world

SQL Server procedures

Serviço Web

SQL Server procedures

Duas bases: Usuários

Brasileiros Usuários

Indianos

PROCESSO DE CARACTERIZAÇÃO Como Scale Free

Gráfico de distribuição do grau das duas sub redes seguem leis de potência

1 63 1251872493113734354975596216837458078699310

500

1000

1500

2000

2500

3000

1 61 1211812413013614214815416016617217818419019610

5000

10000

15000

20000

25000

30000

35000

Brasileiros Indianos

893.295 usuários 3.133.267 usuários

Grau X Frequência

PROCESSO DE CARACTERIZAÇÃO

Como Small World

Coeficiente de agrupamento expressivo e distância geodésica média pequena

Conclusão: As redes analisadas são scale free e small world

Sub Rede Coeficiente de Agrupamento

Distância geodésica média

Quantidade de nós

Brasileira 0.1830 3,1454 1.935.003

Indiana 0.3478 3,7722 3.133.267

MECANISMO DE SUGESTÃO

Processo consiste de duas etapas: Filtrar os nós candidatos

Seletiva pelos nós com maior probabilidade Ordenar os nós candidatos

Mensurar algumas propriedades (índices) Calcular pesos de forma customizada Ponderar os índices e gerar os resultados

MECANISMO DE SUGESTÃO Etapa de Filtrar

Selecionar os nós mais prováveis A rede tem clustering coefficient

expressivo! O algorítmo se resume

a selecionar os nós comdistância geodésica = 2

“É mais provável você conhecer um amigo dos seus amigos do que qualquer outra pessoa aleatoriamente” Melanie Mitchell

MECANISMO DE SUGESTÃO

Etapa de ordenar Mensurar 3 índices

medidas de relacionamento entre dois nós São calculados independentemente entre o nó

central e cada um dos nós cadidatos Calcular os pesos

De forma otimizada e customizada para o usuário

MECANISMO DE SUGESTÃO 3 índices

Cada um é uma métrica de relacionamento entre o nó central e o nó candidato

Algumas definições

,onde Mij é o elemento ij da matriz de adjacência

MECANISMO DE SUGESTÃO Índice 1

Mede a quantidade de nós adjacentes ao vértice i e ao vértice j ao mesmo tempo

A quantidades de amigos em comum entre a pessoa i e a pessoa j

MECANISMO DE SUGESTÃO Índice 2

Mede a densidade de adjacência do conjunto medido no índice 1

Quão próximas estão estas pessoas Para o exempo acima essa medida é 0,5

MECANISMO DE SUGESTÃO Índice 3

Mede a densidade de adjacência do conjunto união entre os dois sub-conjuntos

A diferença para o segundo índice é que este considera distâncias geodésicas de tamanho 3, e não somente 2

MECANISMO DE SUGESTÃO Ponderação otimizada

Utiliza os padrões existentes no conjunto de nós já relacionados ao nó central

Pequena mudança na etapa de filtrar para incluir os nós já relacionados

Utilização de uma função de otimização para calibrar os índices

MECANISMO DE SUGESTÃO Função de otimização Calcula a média da posição da

classificação dos nós já relacionados ao nó central

Quanto menor esse valor melhor os nós já relacionados estão sendo classificados

Os nós candidatos mais bem classificados seguem o mesmo padrão

MECANISMO DE SUGESTÃO Nos experimentos a calibragem foi feita

manualmente baseada na função de otimização

Resultados:Sub-rede

Peso 1

Peso 2

Peso 3

Qtd de vértices adjacentes ao vértice central

Função de otimização

Brasileira

10 3 180 461 513,60

Indiana -38 -11 100 535 272,65

CONCLUSÕES E TRABALHOS FUTUROS O mecanismo de sugestão convergiu como esperado O aprofundamento no entendimento de redes sociais

abre possibilidades para aplicações comerciais Sugestor de produtos em redes de venda pela internet Sugestor de filmes em rede de locadora, etc.

Mehorias no mecanismo: Implementação do mecanismo de calibragem automático Melhoria e criação de mais índices

Outras pesquisas: Executar mais testes com sub redes de outras regiões

geográficas Utilização do feedback do usuário como medida de ajuste

DÚVIDAS?

top related