mineração de preferências contextuais sobre dados de preferência “pairwise”

19
LIG - Université Grenoble 201 1 1 Mineração de Preferências Contextuais sobre dados de preferência “pairwise” Data Mining AULA 19 – Parte I Sandra de Amo

Upload: theo

Post on 09-Jan-2016

29 views

Category:

Documents


6 download

DESCRIPTION

Mineração de Preferências Contextuais sobre dados de preferência “pairwise”. Data Mining AULA 19 – Parte I Sandra de Amo. Referências. ICTAI 2012 - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Mineração de Preferências Contextuais sobre dados de preferência “pairwise”

LIG - Université Grenoble 2011 1

Mineração de Preferências Contextuais sobre dados de preferência “pairwise”

Data Mining

AULA 19 – Parte I

Sandra de Amo

Page 2: Mineração de Preferências Contextuais sobre dados de preferência “pairwise”

LIG - Université Grenoble 2011 2

Referências

ICTAI 2012 Sandra de Amo, Marcos L. Bueno, Guilherme Alves, Nádia F. Silva: CPrefMiner: An Algorithm for Mining User Contextual Preferences based on Bayesian Networks. In: 24th IEEE International Conference on Tools with Artificial Intelligence (ICTAI 2012), 2012, Atenas.

Journal of Information and Data Management (JIDM 2013) Sandra de Amo. ; Bueno, M.L. ; ALVES, G. ; Silva, F. N. Mining User Contextual Preferences. Journal of Information and Data Management (JIDM) , Vol. 4 (1), 2013, pages 37-46.

Page 3: Mineração de Preferências Contextuais sobre dados de preferência “pairwise”

LIG - Université Grenoble 2011 3

Modelos de PreferênciasSéjours

Saison Cadre

Pâcques urbain

Vac-été plage

Vac-hiver montagne

Vac-hiver Historique

Noel urbain

3

4

2

5

Enfoque Quantitativo

Modelo:

Score : Tuplas N

Ordem total sobre as tuplas

1

Page 4: Mineração de Preferências Contextuais sobre dados de preferência “pairwise”

LIG - Université Grenoble 2011 4

Outros quantitativos

Rankings <p1,p2,...,pn>

Pares (p1,p2)

Triplas (p1,p2,n), onde n = grau de preferência

Page 5: Mineração de Preferências Contextuais sobre dados de preferência “pairwise”

LIG - Université Grenoble 2011 5

Modelos de Preferências Enfoque Qualitativo

ModeloConjunto finito de regras:

SE condição1 E Contexto1

ENTÃO Escolha1

SE condição1 E Contexto2 ENTÃO Escolha2

.... Ordem Parcial sobre

as tuplas

REGRASSE a viagem é durante as férias de verão e viajo com minha família ENTÃO prefiro ir à praia do que à uma cidade histórica.

SE a viagem é durante as férias de verão e viajo sozinho ENTÃO prefiro ir à uma cidade histórica do que à praia.

Page 6: Mineração de Preferências Contextuais sobre dados de preferência “pairwise”

LIG - Université Grenoble 2011 6

Mineração de Preferências Contextuais

Page 7: Mineração de Preferências Contextuais sobre dados de preferência “pairwise”

LIG - Université Grenoble 2011 7

O que queremos minerar ?

Regras de Preferências ? A = a1 > A = a2 B = b1 > B = b2 A = a ^ B = b C = c1 > C = c2 C = c2 D = d1 > D = d2

Page 8: Mineração de Preferências Contextuais sobre dados de preferência “pairwise”

LIG - Université Grenoble 2011 8

O que queremo minerar ?

Uma rede de preferências

Um grafo de preferências Para cada vértice do grafo:

uma tabela de probabilidades condicionais de escolha dos valores do vértice com relação aos

valores de seus pais.

A B

C

D

P[ (C=c1 > C=c2) | A = a1, B = b1 ] = 0.6

P[ (D=d1 > D=d2) | C = c1 ] = 0.75

P[A = a1 > A = a2] : 0.8 P[B = b1 > B = b2] : 0.7

Page 9: Mineração de Preferências Contextuais sobre dados de preferência “pairwise”

LIG - Université Grenoble 2011 9

Como são os dados de entrada a serem minerados ?

Pares de tuplas expressando a preferência do usuário.

(t1,t2) t1

(t1,t3) t3

(t2,t4) t2

(t4,t5) t5

....

Page 10: Mineração de Preferências Contextuais sobre dados de preferência “pairwise”

LIG - Université Grenoble 2011 10

Como medir a qualidade de uma rede de preferências ?

(t1,t2) t1(t2,t3) t3(t2,t4) t2(t1,t3) t1(t1,t4) t1

Dados de testesConjunto de pares de tuplasclassificados pelo usuário

(t1,t2) t1(t2,t3) t2(t2,t4) t2(t1,t3) ?(t1,t4) ?

Conjunto de pares ee tuplas classificados pela rede de pref. R

Rede de Preferências

Accuracy(R) = Total de tuplas corretamente ordenadas por R = 2/5 Total de tuplas

Precision(R) = Total de tuplas corretamente ordenadas por R = 2/3 Total de tuplas ordenadas por R

Page 11: Mineração de Preferências Contextuais sobre dados de preferência “pairwise”

LIG - Université Grenoble 2011 11

A B

C

D

P[ (C=c1 > C=c2) | A = a1, B=b1] = 0.8P[ (C=c1 > C=c2) | A = a1, B=b2] = 0.4P[ (C=c1 > C=c2) | A = a2, B=b1] = 0.6P[ (C=c1 > C=c2) | A = a2, B=b2] = 0.7

P[ (D=d1 > D=d2) | C = c1 ] = 0.75

P[A = a1 > A = a2] = 0.8 P[B = b1 > B = b2] = 0.7

Comparer le tuples

t1(a1,b1,c1,d1)t2(a2,b2,c2,d1)

Como uma rede ordena tuplas ?

Dif(t1,t2) = {A, B,C}

Inf(Dif) = {A,B}

P[A = a1 > A = a2, B = b1> B=b2] = 0.56

P[A = a1 > A = a2, B = b2> B=b1] = 0.24

P[A = a2 > A = a1, B = b1> B=b2] = 0.14

P[A = a2 > A = a1, B = b2> B=b1] = 0.06

t1 > t2 : 0.56t1 < t2 : 0.06t1 ~ t2 : 0.48 (incomparables)

Page 12: Mineração de Preferências Contextuais sobre dados de preferência “pairwise”

LIG - Université Grenoble 2011 12

Formalisation du Problème Entrée: un echantillon de pairs de tuples

(x,y), où x est préférée à y

Sortie: un réseau bayésien de préférences (réseau probabiliste de préférences) ayant une “bonne” accuracy et une “bonne” précision.

Page 13: Mineração de Preferências Contextuais sobre dados de preferência “pairwise”

LIG - Université Grenoble 2011 13

Duas etapas:

1. Minerar

a topologia

da rede

2. Descobrir as tabelas de probabilidades associadas a cada nó

A B

C

D

P[A = a1 > A = a2] : 0.8 P[B = b1 > B = b2] : 0.7

C=c1 > C=c2 ] = 0.6

P[ C = c1 |

D=d1 > D=d2] = 0.75

P[A = a1, B = b1 |

Page 14: Mineração de Preferências Contextuais sobre dados de preferência “pairwise”

LIG - Université Grenoble 2011 14

Mineração da Topologia da Rede

A

B C

D E F D E F

C

A B A B

C D

E F

Dados D

Score(S1,D) = N1 Score(S2,D) = N2 Score(S3,D) = N3

Page 15: Mineração de Preferências Contextuais sobre dados de preferência “pairwise”

LIG - Université Grenoble 2011 15

Aspectos importantes :

Estratégia de busca das estruturas Impossível de gerar todas as estruturas

possíveis Necessidade de empregar uma heurística

Como definir o score de uma estrutura ?

Page 16: Mineração de Preferências Contextuais sobre dados de preferência “pairwise”

LIG - Université Grenoble 2011 16

Técnica utilizada para minerar a estrutura da rede a partir dos dados de preferência Algoritmo Genético Função score particular Detalhes nos seguintes artigos:

ICTAI 2012, JIDM 2013

Page 17: Mineração de Preferências Contextuais sobre dados de preferência “pairwise”

LIG - Université Grenoble 2011 17

Resultados em dados sintéticos

Numero de atributos

Page 18: Mineração de Preferências Contextuais sobre dados de preferência “pairwise”

LIG - Université Grenoble 2011 18

Dados Reais

Dados de avaliações de filmes do Group Lenswww.grouplens.org

Dados sobre os filmes: IMDB www.imdb.com

Dados coletados e pré-processados, disponíveis em

Page 19: Mineração de Preferências Contextuais sobre dados de preferência “pairwise”

LIG - Université Grenoble 2011 19

Resultados em dados reais (filmes)

Tempo para construir o modelo de Mineração