ranking & ub-cfdparra.sitios.ing.uc.cl/classes/recsys-2019-2/clase1_recsysintro.pdf · ranking...

24
Ranking & UB-CF IIC3633 - Sistemas Recomendadores Denis Parra, Profesor Asistente, DCC PUC Chile Ayudantes: Manuel Cartagena y Antonio Ossa Ranking & UB-CF file:///Volumes/GoogleDrive/My Drive/PUC/IIC3633-2018-2/Website_R_2018/clase1_re... 1 of 24 8/7/18, 00:27

Upload: others

Post on 28-Jul-2020

3 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Ranking & UB-CFdparra.sitios.ing.uc.cl/classes/recsys-2019-2/clase1_recsysintro.pdf · Ranking no personalizado (Blog de Evan Miller, 2009) 1. Popularidad. 2. Score: (Ratings Positivos)

RRaannkkiinngg && UUBB--CCFFIIC3633 - Sistemas Recomendadores

Denis Parra, Profesor Asistente, DCC PUC ChileAyudantes: Manuel Cartagena y Antonio Ossa

Ranking & UB-CF file:///Volumes/GoogleDrive/My Drive/PUC/IIC3633-2018-2/Website_R_2018/clase1_re...

1 of 24 8/7/18, 00:27

Page 2: Ranking & UB-CFdparra.sitios.ing.uc.cl/classes/recsys-2019-2/clase1_recsysintro.pdf · Ranking no personalizado (Blog de Evan Miller, 2009) 1. Popularidad. 2. Score: (Ratings Positivos)

TOCEn esta clase

Actividades principales del semestre: Blog, Tarea 1, Presentacion, Proyecto Final1.

Definición y un poco de Historia2.

Ranking No Personalizado3.

User-Based Collaborative Filtering4.

Referencias5.

2/24

Ranking & UB-CF file:///Volumes/GoogleDrive/My Drive/PUC/IIC3633-2018-2/Website_R_2018/clase1_re...

2 of 24 8/7/18, 00:27

Page 3: Ranking & UB-CFdparra.sitios.ing.uc.cl/classes/recsys-2019-2/clase1_recsysintro.pdf · Ranking no personalizado (Blog de Evan Miller, 2009) 1. Popularidad. 2. Score: (Ratings Positivos)

DefiniciónRecommender Systems aim to help a user or a group of users in a systemto select items from a crowded item or information space.(MacNee et. al 2006)

R. Burke tenía su propia definición, similar a esta, pero agregaba ...in a personalized way.

3/24

Ranking & UB-CF file:///Volumes/GoogleDrive/My Drive/PUC/IIC3633-2018-2/Website_R_2018/clase1_re...

3 of 24 8/7/18, 00:27

Page 4: Ranking & UB-CFdparra.sitios.ing.uc.cl/classes/recsys-2019-2/clase1_recsysintro.pdf · Ranking no personalizado (Blog de Evan Miller, 2009) 1. Popularidad. 2. Score: (Ratings Positivos)

¿Por qué nos interesan los RecSys en estos días?Los Sistemas Recomendadores (RecSys) han ganado mucha popularidad en varios dominiosy aplicaciones donde la gente debe tomar decisiones sobre una gran cantidad deinformación.

·

4/24

Ranking & UB-CF file:///Volumes/GoogleDrive/My Drive/PUC/IIC3633-2018-2/Website_R_2018/clase1_re...

4 of 24 8/7/18, 00:27

Page 5: Ranking & UB-CFdparra.sitios.ing.uc.cl/classes/recsys-2019-2/clase1_recsysintro.pdf · Ranking no personalizado (Blog de Evan Miller, 2009) 1. Popularidad. 2. Score: (Ratings Positivos)

El problema de recomendación formalizado (Adomavicius et al. 2007)

∀c ∈ C, = arg u(c, s)s′c maxs∈S

u : C × S → R,  f uncion de utilidad

R :  conjunto recomendado de itemsC :  conjunto de usuarios

S :  conjunto de items

5/24

Ranking & UB-CF file:///Volumes/GoogleDrive/My Drive/PUC/IIC3633-2018-2/Website_R_2018/clase1_re...

5 of 24 8/7/18, 00:27

Page 6: Ranking & UB-CFdparra.sitios.ing.uc.cl/classes/recsys-2019-2/clase1_recsysintro.pdf · Ranking no personalizado (Blog de Evan Miller, 2009) 1. Popularidad. 2. Score: (Ratings Positivos)

Recomendaciones estilo Amazon.com

1. Un Poco de Historia

6/24

Ranking & UB-CF file:///Volumes/GoogleDrive/My Drive/PUC/IIC3633-2018-2/Website_R_2018/clase1_re...

6 of 24 8/7/18, 00:27

Page 7: Ranking & UB-CFdparra.sitios.ing.uc.cl/classes/recsys-2019-2/clase1_recsysintro.pdf · Ranking no personalizado (Blog de Evan Miller, 2009) 1. Popularidad. 2. Score: (Ratings Positivos)

1.1 En 1992 Xerox PARC Tapestry

Link to PDF file

7/24

Ranking & UB-CF file:///Volumes/GoogleDrive/My Drive/PUC/IIC3633-2018-2/Website_R_2018/clase1_re...

7 of 24 8/7/18, 00:27

Page 8: Ranking & UB-CFdparra.sitios.ing.uc.cl/classes/recsys-2019-2/clase1_recsysintro.pdf · Ranking no personalizado (Blog de Evan Miller, 2009) 1. Popularidad. 2. Score: (Ratings Positivos)

1.2 MovieLens

Link to Amatriain 2012

8/24

Ranking & UB-CF file:///Volumes/GoogleDrive/My Drive/PUC/IIC3633-2018-2/Website_R_2018/clase1_re...

8 of 24 8/7/18, 00:27

Page 9: Ranking & UB-CFdparra.sitios.ing.uc.cl/classes/recsys-2019-2/clase1_recsysintro.pdf · Ranking no personalizado (Blog de Evan Miller, 2009) 1. Popularidad. 2. Score: (Ratings Positivos)

NetFlix Prize (2007-2009)

9/24

Ranking & UB-CF file:///Volumes/GoogleDrive/My Drive/PUC/IIC3633-2018-2/Website_R_2018/clase1_re...

9 of 24 8/7/18, 00:27

Page 10: Ranking & UB-CFdparra.sitios.ing.uc.cl/classes/recsys-2019-2/clase1_recsysintro.pdf · Ranking no personalizado (Blog de Evan Miller, 2009) 1. Popularidad. 2. Score: (Ratings Positivos)

1.3 Netflix en 2012

Link to Amatriain 2012

10/24

Ranking & UB-CF file:///Volumes/GoogleDrive/My Drive/PUC/IIC3633-2018-2/Website_R_2018/clase1_re...

10 of 24 8/7/18, 00:27

Page 11: Ranking & UB-CFdparra.sitios.ing.uc.cl/classes/recsys-2019-2/clase1_recsysintro.pdf · Ranking no personalizado (Blog de Evan Miller, 2009) 1. Popularidad. 2. Score: (Ratings Positivos)

1.3 Netflix en 2012 (continuación)

Link to Amatriain 2012

11/24

Ranking & UB-CF file:///Volumes/GoogleDrive/My Drive/PUC/IIC3633-2018-2/Website_R_2018/clase1_re...

11 of 24 8/7/18, 00:27

Page 12: Ranking & UB-CFdparra.sitios.ing.uc.cl/classes/recsys-2019-2/clase1_recsysintro.pdf · Ranking no personalizado (Blog de Evan Miller, 2009) 1. Popularidad. 2. Score: (Ratings Positivos)

Ranking no personalizado (Blog de Evan Miller,2009)

Popularidad.1.

Score: (Ratings Positivos) - (Ratings Negativos)2.

Score: (Rating Promedio) = (Ratings Positivos)/(Total de Ratings)3.

Score: Considerando Ratings positivos y negativos, Limite inferior del Intervalo deConfianza del Wilson Score, para un parámetro Bernoulli.

4.

Donde es la proporción (estimada) de ratings positivos, es el cuantil de ladistribución normal, y el número de ratings. , también llamado nivel de significanciaestadístico, generalmente se considera 95%.

p̂ zα/2 (1 − α/2)n α

12/24

Ranking & UB-CF file:///Volumes/GoogleDrive/My Drive/PUC/IIC3633-2018-2/Website_R_2018/clase1_re...

12 of 24 8/7/18, 00:27

Page 13: Ranking & UB-CFdparra.sitios.ing.uc.cl/classes/recsys-2019-2/clase1_recsysintro.pdf · Ranking no personalizado (Blog de Evan Miller, 2009) 1. Popularidad. 2. Score: (Ratings Positivos)

Clasificacion(es)Considerando los Datos usados

Basado en Reglas (Rule-based)1.

Basado en Contenido (Content-based)2.

Filtrado Colaborativo (el usuario y sus vecinos)3.

1.

Considerando el Modelo

Memory-based (KNN)1.

Model-based (Representación latente)2.

2.

13/24

Ranking & UB-CF file:///Volumes/GoogleDrive/My Drive/PUC/IIC3633-2018-2/Website_R_2018/clase1_re...

13 of 24 8/7/18, 00:27

Page 14: Ranking & UB-CFdparra.sitios.ing.uc.cl/classes/recsys-2019-2/clase1_recsysintro.pdf · Ranking no personalizado (Blog de Evan Miller, 2009) 1. Popularidad. 2. Score: (Ratings Positivos)

Simplificación del Problema: Predicción de Ratings

14/24

Ranking & UB-CF file:///Volumes/GoogleDrive/My Drive/PUC/IIC3633-2018-2/Website_R_2018/clase1_re...

14 of 24 8/7/18, 00:27

Page 15: Ranking & UB-CFdparra.sitios.ing.uc.cl/classes/recsys-2019-2/clase1_recsysintro.pdf · Ranking no personalizado (Blog de Evan Miller, 2009) 1. Popularidad. 2. Score: (Ratings Positivos)

Filtrado Colaborativo basado en el usuarioDos tareas son necesarias:

KNN: Encontrar los K vecinos más cercanos (KNN) al usuario :

Predecir el rating que un usuario dará a un ítem :

· a

Similaridad(a, i) = w(a, i), i ∈ K

· a j

= + α w(a, i)( − )pa,j v̄a ∑i=1

n

vi,j v̄i

15/24

Ranking & UB-CF file:///Volumes/GoogleDrive/My Drive/PUC/IIC3633-2018-2/Website_R_2018/clase1_re...

15 of 24 8/7/18, 00:27

Page 16: Ranking & UB-CFdparra.sitios.ing.uc.cl/classes/recsys-2019-2/clase1_recsysintro.pdf · Ranking no personalizado (Blog de Evan Miller, 2009) 1. Popularidad. 2. Score: (Ratings Positivos)

Ejemplo: Correlación de Pearson

16/24

Ranking & UB-CF file:///Volumes/GoogleDrive/My Drive/PUC/IIC3633-2018-2/Website_R_2018/clase1_re...

16 of 24 8/7/18, 00:27

Page 17: Ranking & UB-CFdparra.sitios.ing.uc.cl/classes/recsys-2019-2/clase1_recsysintro.pdf · Ranking no personalizado (Blog de Evan Miller, 2009) 1. Popularidad. 2. Score: (Ratings Positivos)

Ejemplo: Correlación de PearsonSOLUCION

17/24

Ranking & UB-CF file:///Volumes/GoogleDrive/My Drive/PUC/IIC3633-2018-2/Website_R_2018/clase1_re...

17 of 24 8/7/18, 00:27

Page 18: Ranking & UB-CFdparra.sitios.ing.uc.cl/classes/recsys-2019-2/clase1_recsysintro.pdf · Ranking no personalizado (Blog de Evan Miller, 2009) 1. Popularidad. 2. Score: (Ratings Positivos)

Ejemplo: Correlación de Pearson

18/24

Ranking & UB-CF file:///Volumes/GoogleDrive/My Drive/PUC/IIC3633-2018-2/Website_R_2018/clase1_re...

18 of 24 8/7/18, 00:27

Page 19: Ranking & UB-CFdparra.sitios.ing.uc.cl/classes/recsys-2019-2/clase1_recsysintro.pdf · Ranking no personalizado (Blog de Evan Miller, 2009) 1. Popularidad. 2. Score: (Ratings Positivos)

Ejemplo Paso 2: Predicción del rating

19/24

Ranking & UB-CF file:///Volumes/GoogleDrive/My Drive/PUC/IIC3633-2018-2/Website_R_2018/clase1_re...

19 of 24 8/7/18, 00:27

Page 20: Ranking & UB-CFdparra.sitios.ing.uc.cl/classes/recsys-2019-2/clase1_recsysintro.pdf · Ranking no personalizado (Blog de Evan Miller, 2009) 1. Popularidad. 2. Score: (Ratings Positivos)

Ejemplo Paso 2: Predicción del ratingSOLUCION

20/24

Ranking & UB-CF file:///Volumes/GoogleDrive/My Drive/PUC/IIC3633-2018-2/Website_R_2018/clase1_re...

20 of 24 8/7/18, 00:27

Page 21: Ranking & UB-CFdparra.sitios.ing.uc.cl/classes/recsys-2019-2/clase1_recsysintro.pdf · Ranking no personalizado (Blog de Evan Miller, 2009) 1. Popularidad. 2. Score: (Ratings Positivos)

Ejemplo Paso 2: Predicción del rating

21/24

Ranking & UB-CF file:///Volumes/GoogleDrive/My Drive/PUC/IIC3633-2018-2/Website_R_2018/clase1_re...

21 of 24 8/7/18, 00:27

Page 22: Ranking & UB-CFdparra.sitios.ing.uc.cl/classes/recsys-2019-2/clase1_recsysintro.pdf · Ranking no personalizado (Blog de Evan Miller, 2009) 1. Popularidad. 2. Score: (Ratings Positivos)

¿Discusión: cuáles son los pro y cons de estemétodo?

22/24

Ranking & UB-CF file:///Volumes/GoogleDrive/My Drive/PUC/IIC3633-2018-2/Website_R_2018/clase1_re...

22 of 24 8/7/18, 00:27

Page 23: Ranking & UB-CFdparra.sitios.ing.uc.cl/classes/recsys-2019-2/clase1_recsysintro.pdf · Ranking no personalizado (Blog de Evan Miller, 2009) 1. Popularidad. 2. Score: (Ratings Positivos)

¿Discusión: cuáles son los pro y cons de estemétodo?

23/24

Ranking & UB-CF file:///Volumes/GoogleDrive/My Drive/PUC/IIC3633-2018-2/Website_R_2018/clase1_re...

23 of 24 8/7/18, 00:27

Page 24: Ranking & UB-CFdparra.sitios.ing.uc.cl/classes/recsys-2019-2/clase1_recsysintro.pdf · Ranking no personalizado (Blog de Evan Miller, 2009) 1. Popularidad. 2. Score: (Ratings Positivos)

ReferenciasAdomavicius, G., & Tuzhilin, A. (2005). Toward the next generation of recommender systems:A survey of the state-of-the-art and possible extensions. Knowledge and Data Engineering,IEEE Transactions on, 17(6), 734-749.

Amatriain, X. (2013). Mining large streams of user data for personalized recommendations.ACM SIGKDD Explorations Newsletter, 14(2), 37-48.

Miller, B. N., Albert, I., Lam, S. K., Konstan, J. A., & Riedl, J. (2003, January). MovieLensunplugged: experiences with an occasionally connected recommender system. InProceedings of the 8th international conference on Intelligent user interfaces (pp. 263-266).ACM.

Parra, D., & Sahebi, S. (2013). Recommender systems: Sources of knowledge and evaluationmetrics. In Advanced Techniques in Web Intelligence-2 (pp. 149-175). Springer BerlinHeidelberg.

·

·

·

·

24/24

Ranking & UB-CF file:///Volumes/GoogleDrive/My Drive/PUC/IIC3633-2018-2/Website_R_2018/clase1_re...

24 of 24 8/7/18, 00:27