ranking & ub-cfdparra.sitios.ing.uc.cl/classes/recsys-2019-2/clase1_recsysintro.pdf · ranking...

Post on 28-Jul-2020

3 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

RRaannkkiinngg && UUBB--CCFFIIC3633 - Sistemas Recomendadores

Denis Parra, Profesor Asistente, DCC PUC ChileAyudantes: Manuel Cartagena y Antonio Ossa

Ranking & UB-CF file:///Volumes/GoogleDrive/My Drive/PUC/IIC3633-2018-2/Website_R_2018/clase1_re...

1 of 24 8/7/18, 00:27

TOCEn esta clase

Actividades principales del semestre: Blog, Tarea 1, Presentacion, Proyecto Final1.

Definición y un poco de Historia2.

Ranking No Personalizado3.

User-Based Collaborative Filtering4.

Referencias5.

2/24

Ranking & UB-CF file:///Volumes/GoogleDrive/My Drive/PUC/IIC3633-2018-2/Website_R_2018/clase1_re...

2 of 24 8/7/18, 00:27

DefiniciónRecommender Systems aim to help a user or a group of users in a systemto select items from a crowded item or information space.(MacNee et. al 2006)

R. Burke tenía su propia definición, similar a esta, pero agregaba ...in a personalized way.

3/24

Ranking & UB-CF file:///Volumes/GoogleDrive/My Drive/PUC/IIC3633-2018-2/Website_R_2018/clase1_re...

3 of 24 8/7/18, 00:27

¿Por qué nos interesan los RecSys en estos días?Los Sistemas Recomendadores (RecSys) han ganado mucha popularidad en varios dominiosy aplicaciones donde la gente debe tomar decisiones sobre una gran cantidad deinformación.

·

4/24

Ranking & UB-CF file:///Volumes/GoogleDrive/My Drive/PUC/IIC3633-2018-2/Website_R_2018/clase1_re...

4 of 24 8/7/18, 00:27

El problema de recomendación formalizado (Adomavicius et al. 2007)

∀c ∈ C, = arg u(c, s)s′c maxs∈S

u : C × S → R,  f uncion de utilidad

R :  conjunto recomendado de itemsC :  conjunto de usuarios

S :  conjunto de items

5/24

Ranking & UB-CF file:///Volumes/GoogleDrive/My Drive/PUC/IIC3633-2018-2/Website_R_2018/clase1_re...

5 of 24 8/7/18, 00:27

Recomendaciones estilo Amazon.com

1. Un Poco de Historia

6/24

Ranking & UB-CF file:///Volumes/GoogleDrive/My Drive/PUC/IIC3633-2018-2/Website_R_2018/clase1_re...

6 of 24 8/7/18, 00:27

1.1 En 1992 Xerox PARC Tapestry

Link to PDF file

7/24

Ranking & UB-CF file:///Volumes/GoogleDrive/My Drive/PUC/IIC3633-2018-2/Website_R_2018/clase1_re...

7 of 24 8/7/18, 00:27

1.2 MovieLens

Link to Amatriain 2012

8/24

Ranking & UB-CF file:///Volumes/GoogleDrive/My Drive/PUC/IIC3633-2018-2/Website_R_2018/clase1_re...

8 of 24 8/7/18, 00:27

NetFlix Prize (2007-2009)

9/24

Ranking & UB-CF file:///Volumes/GoogleDrive/My Drive/PUC/IIC3633-2018-2/Website_R_2018/clase1_re...

9 of 24 8/7/18, 00:27

1.3 Netflix en 2012

Link to Amatriain 2012

10/24

Ranking & UB-CF file:///Volumes/GoogleDrive/My Drive/PUC/IIC3633-2018-2/Website_R_2018/clase1_re...

10 of 24 8/7/18, 00:27

1.3 Netflix en 2012 (continuación)

Link to Amatriain 2012

11/24

Ranking & UB-CF file:///Volumes/GoogleDrive/My Drive/PUC/IIC3633-2018-2/Website_R_2018/clase1_re...

11 of 24 8/7/18, 00:27

Ranking no personalizado (Blog de Evan Miller,2009)

Popularidad.1.

Score: (Ratings Positivos) - (Ratings Negativos)2.

Score: (Rating Promedio) = (Ratings Positivos)/(Total de Ratings)3.

Score: Considerando Ratings positivos y negativos, Limite inferior del Intervalo deConfianza del Wilson Score, para un parámetro Bernoulli.

4.

Donde es la proporción (estimada) de ratings positivos, es el cuantil de ladistribución normal, y el número de ratings. , también llamado nivel de significanciaestadístico, generalmente se considera 95%.

p̂ zα/2 (1 − α/2)n α

12/24

Ranking & UB-CF file:///Volumes/GoogleDrive/My Drive/PUC/IIC3633-2018-2/Website_R_2018/clase1_re...

12 of 24 8/7/18, 00:27

Clasificacion(es)Considerando los Datos usados

Basado en Reglas (Rule-based)1.

Basado en Contenido (Content-based)2.

Filtrado Colaborativo (el usuario y sus vecinos)3.

1.

Considerando el Modelo

Memory-based (KNN)1.

Model-based (Representación latente)2.

2.

13/24

Ranking & UB-CF file:///Volumes/GoogleDrive/My Drive/PUC/IIC3633-2018-2/Website_R_2018/clase1_re...

13 of 24 8/7/18, 00:27

Simplificación del Problema: Predicción de Ratings

14/24

Ranking & UB-CF file:///Volumes/GoogleDrive/My Drive/PUC/IIC3633-2018-2/Website_R_2018/clase1_re...

14 of 24 8/7/18, 00:27

Filtrado Colaborativo basado en el usuarioDos tareas son necesarias:

KNN: Encontrar los K vecinos más cercanos (KNN) al usuario :

Predecir el rating que un usuario dará a un ítem :

· a

Similaridad(a, i) = w(a, i), i ∈ K

· a j

= + α w(a, i)( − )pa,j v̄a ∑i=1

n

vi,j v̄i

15/24

Ranking & UB-CF file:///Volumes/GoogleDrive/My Drive/PUC/IIC3633-2018-2/Website_R_2018/clase1_re...

15 of 24 8/7/18, 00:27

Ejemplo: Correlación de Pearson

16/24

Ranking & UB-CF file:///Volumes/GoogleDrive/My Drive/PUC/IIC3633-2018-2/Website_R_2018/clase1_re...

16 of 24 8/7/18, 00:27

Ejemplo: Correlación de PearsonSOLUCION

17/24

Ranking & UB-CF file:///Volumes/GoogleDrive/My Drive/PUC/IIC3633-2018-2/Website_R_2018/clase1_re...

17 of 24 8/7/18, 00:27

Ejemplo: Correlación de Pearson

18/24

Ranking & UB-CF file:///Volumes/GoogleDrive/My Drive/PUC/IIC3633-2018-2/Website_R_2018/clase1_re...

18 of 24 8/7/18, 00:27

Ejemplo Paso 2: Predicción del rating

19/24

Ranking & UB-CF file:///Volumes/GoogleDrive/My Drive/PUC/IIC3633-2018-2/Website_R_2018/clase1_re...

19 of 24 8/7/18, 00:27

Ejemplo Paso 2: Predicción del ratingSOLUCION

20/24

Ranking & UB-CF file:///Volumes/GoogleDrive/My Drive/PUC/IIC3633-2018-2/Website_R_2018/clase1_re...

20 of 24 8/7/18, 00:27

Ejemplo Paso 2: Predicción del rating

21/24

Ranking & UB-CF file:///Volumes/GoogleDrive/My Drive/PUC/IIC3633-2018-2/Website_R_2018/clase1_re...

21 of 24 8/7/18, 00:27

¿Discusión: cuáles son los pro y cons de estemétodo?

22/24

Ranking & UB-CF file:///Volumes/GoogleDrive/My Drive/PUC/IIC3633-2018-2/Website_R_2018/clase1_re...

22 of 24 8/7/18, 00:27

¿Discusión: cuáles son los pro y cons de estemétodo?

23/24

Ranking & UB-CF file:///Volumes/GoogleDrive/My Drive/PUC/IIC3633-2018-2/Website_R_2018/clase1_re...

23 of 24 8/7/18, 00:27

ReferenciasAdomavicius, G., & Tuzhilin, A. (2005). Toward the next generation of recommender systems:A survey of the state-of-the-art and possible extensions. Knowledge and Data Engineering,IEEE Transactions on, 17(6), 734-749.

Amatriain, X. (2013). Mining large streams of user data for personalized recommendations.ACM SIGKDD Explorations Newsletter, 14(2), 37-48.

Miller, B. N., Albert, I., Lam, S. K., Konstan, J. A., & Riedl, J. (2003, January). MovieLensunplugged: experiences with an occasionally connected recommender system. InProceedings of the 8th international conference on Intelligent user interfaces (pp. 263-266).ACM.

Parra, D., & Sahebi, S. (2013). Recommender systems: Sources of knowledge and evaluationmetrics. In Advanced Techniques in Web Intelligence-2 (pp. 149-175). Springer BerlinHeidelberg.

·

·

·

·

24/24

Ranking & UB-CF file:///Volumes/GoogleDrive/My Drive/PUC/IIC3633-2018-2/Website_R_2018/clase1_re...

24 of 24 8/7/18, 00:27

top related