mineração de preferências contextuais sobre dados de preferência “pairwise”
Post on 09-Jan-2016
29 Views
Preview:
DESCRIPTION
TRANSCRIPT
LIG - Université Grenoble 2011 1
Mineração de Preferências Contextuais sobre dados de preferência “pairwise”
Data Mining
AULA 19 – Parte I
Sandra de Amo
LIG - Université Grenoble 2011 2
Referências
ICTAI 2012 Sandra de Amo, Marcos L. Bueno, Guilherme Alves, Nádia F. Silva: CPrefMiner: An Algorithm for Mining User Contextual Preferences based on Bayesian Networks. In: 24th IEEE International Conference on Tools with Artificial Intelligence (ICTAI 2012), 2012, Atenas.
Journal of Information and Data Management (JIDM 2013) Sandra de Amo. ; Bueno, M.L. ; ALVES, G. ; Silva, F. N. Mining User Contextual Preferences. Journal of Information and Data Management (JIDM) , Vol. 4 (1), 2013, pages 37-46.
LIG - Université Grenoble 2011 3
Modelos de PreferênciasSéjours
Saison Cadre
Pâcques urbain
Vac-été plage
Vac-hiver montagne
Vac-hiver Historique
Noel urbain
3
4
2
5
Enfoque Quantitativo
Modelo:
Score : Tuplas N
Ordem total sobre as tuplas
1
LIG - Université Grenoble 2011 4
Outros quantitativos
Rankings <p1,p2,...,pn>
Pares (p1,p2)
Triplas (p1,p2,n), onde n = grau de preferência
LIG - Université Grenoble 2011 5
Modelos de Preferências Enfoque Qualitativo
ModeloConjunto finito de regras:
SE condição1 E Contexto1
ENTÃO Escolha1
SE condição1 E Contexto2 ENTÃO Escolha2
.... Ordem Parcial sobre
as tuplas
REGRASSE a viagem é durante as férias de verão e viajo com minha família ENTÃO prefiro ir à praia do que à uma cidade histórica.
SE a viagem é durante as férias de verão e viajo sozinho ENTÃO prefiro ir à uma cidade histórica do que à praia.
LIG - Université Grenoble 2011 6
Mineração de Preferências Contextuais
LIG - Université Grenoble 2011 7
O que queremos minerar ?
Regras de Preferências ? A = a1 > A = a2 B = b1 > B = b2 A = a ^ B = b C = c1 > C = c2 C = c2 D = d1 > D = d2
LIG - Université Grenoble 2011 8
O que queremo minerar ?
Uma rede de preferências
Um grafo de preferências Para cada vértice do grafo:
uma tabela de probabilidades condicionais de escolha dos valores do vértice com relação aos
valores de seus pais.
A B
C
D
P[ (C=c1 > C=c2) | A = a1, B = b1 ] = 0.6
P[ (D=d1 > D=d2) | C = c1 ] = 0.75
P[A = a1 > A = a2] : 0.8 P[B = b1 > B = b2] : 0.7
LIG - Université Grenoble 2011 9
Como são os dados de entrada a serem minerados ?
Pares de tuplas expressando a preferência do usuário.
(t1,t2) t1
(t1,t3) t3
(t2,t4) t2
(t4,t5) t5
....
LIG - Université Grenoble 2011 10
Como medir a qualidade de uma rede de preferências ?
(t1,t2) t1(t2,t3) t3(t2,t4) t2(t1,t3) t1(t1,t4) t1
Dados de testesConjunto de pares de tuplasclassificados pelo usuário
(t1,t2) t1(t2,t3) t2(t2,t4) t2(t1,t3) ?(t1,t4) ?
Conjunto de pares ee tuplas classificados pela rede de pref. R
Rede de Preferências
Accuracy(R) = Total de tuplas corretamente ordenadas por R = 2/5 Total de tuplas
Precision(R) = Total de tuplas corretamente ordenadas por R = 2/3 Total de tuplas ordenadas por R
LIG - Université Grenoble 2011 11
A B
C
D
P[ (C=c1 > C=c2) | A = a1, B=b1] = 0.8P[ (C=c1 > C=c2) | A = a1, B=b2] = 0.4P[ (C=c1 > C=c2) | A = a2, B=b1] = 0.6P[ (C=c1 > C=c2) | A = a2, B=b2] = 0.7
P[ (D=d1 > D=d2) | C = c1 ] = 0.75
P[A = a1 > A = a2] = 0.8 P[B = b1 > B = b2] = 0.7
Comparer le tuples
t1(a1,b1,c1,d1)t2(a2,b2,c2,d1)
Como uma rede ordena tuplas ?
Dif(t1,t2) = {A, B,C}
Inf(Dif) = {A,B}
P[A = a1 > A = a2, B = b1> B=b2] = 0.56
P[A = a1 > A = a2, B = b2> B=b1] = 0.24
P[A = a2 > A = a1, B = b1> B=b2] = 0.14
P[A = a2 > A = a1, B = b2> B=b1] = 0.06
t1 > t2 : 0.56t1 < t2 : 0.06t1 ~ t2 : 0.48 (incomparables)
LIG - Université Grenoble 2011 12
Formalisation du Problème Entrée: un echantillon de pairs de tuples
(x,y), où x est préférée à y
Sortie: un réseau bayésien de préférences (réseau probabiliste de préférences) ayant une “bonne” accuracy et une “bonne” précision.
LIG - Université Grenoble 2011 13
Duas etapas:
1. Minerar
a topologia
da rede
2. Descobrir as tabelas de probabilidades associadas a cada nó
A B
C
D
P[A = a1 > A = a2] : 0.8 P[B = b1 > B = b2] : 0.7
C=c1 > C=c2 ] = 0.6
P[ C = c1 |
D=d1 > D=d2] = 0.75
P[A = a1, B = b1 |
LIG - Université Grenoble 2011 14
Mineração da Topologia da Rede
A
B C
D E F D E F
C
A B A B
C D
E F
Dados D
Score(S1,D) = N1 Score(S2,D) = N2 Score(S3,D) = N3
LIG - Université Grenoble 2011 15
Aspectos importantes :
Estratégia de busca das estruturas Impossível de gerar todas as estruturas
possíveis Necessidade de empregar uma heurística
Como definir o score de uma estrutura ?
LIG - Université Grenoble 2011 16
Técnica utilizada para minerar a estrutura da rede a partir dos dados de preferência Algoritmo Genético Função score particular Detalhes nos seguintes artigos:
ICTAI 2012, JIDM 2013
LIG - Université Grenoble 2011 17
Resultados em dados sintéticos
Numero de atributos
LIG - Université Grenoble 2011 18
Dados Reais
Dados de avaliações de filmes do Group Lenswww.grouplens.org
Dados sobre os filmes: IMDB www.imdb.com
Dados coletados e pré-processados, disponíveis em
LIG - Université Grenoble 2011 19
Resultados em dados reais (filmes)
Tempo para construir o modelo de Mineração
top related