orientador: prof. msc. silvio césar cazella um protótipo de aplicação para recomendação de...

33
Orientador: Orientador: Prof. Msc. Silvio César Cazella Prof. Msc. Silvio César Cazella Um protótipo de aplicação Um protótipo de aplicação para recomendação de para recomendação de produtos baseado no produtos baseado no interesse e comportamento interesse e comportamento de consumo do usuário de consumo do usuário 01/33 Aluno: Aluno: Fábio Bressler Fábio Bressler

Upload: internet

Post on 22-Apr-2015

104 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Orientador: Prof. Msc. Silvio César Cazella Um protótipo de aplicação para recomendação de produtos baseado no interesse e comportamento de consumo do

Orientador:Orientador:

Prof. Msc. Silvio César CazellaProf. Msc. Silvio César Cazella

Um protótipo de aplicação Um protótipo de aplicação para recomendação de para recomendação de produtos baseado no produtos baseado no

interesse e comportamento interesse e comportamento de consumo do usuáriode consumo do usuário

01/33

Aluno:Aluno:

Fábio BresslerFábio Bressler

Page 2: Orientador: Prof. Msc. Silvio César Cazella Um protótipo de aplicação para recomendação de produtos baseado no interesse e comportamento de consumo do

RoteiroRoteiro Sobrecarga de InformaçãoSobrecarga de Informação Motivação e ObjetivosMotivação e Objetivos Filtragem de InformaçãoFiltragem de Informação Sistema de RecomendaçãoSistema de Recomendação Mineração de DadosMineração de Dados Metodologia AplicadaMetodologia Aplicada ProtótipoProtótipo ExperimentoExperimento ConclusãoConclusão Trabalhos FuturosTrabalhos Futuros

02/33

Page 3: Orientador: Prof. Msc. Silvio César Cazella Um protótipo de aplicação para recomendação de produtos baseado no interesse e comportamento de consumo do

SobrecargaSobrecargadede

InformaçãoInformação

03/33

Page 4: Orientador: Prof. Msc. Silvio César Cazella Um protótipo de aplicação para recomendação de produtos baseado no interesse e comportamento de consumo do

Grandes quantidades e Grandes quantidades e variedades de informações variedades de informações disponíveis na Internetdisponíveis na Internet

Dificuldade de filtrar as Dificuldade de filtrar as informações desejdasinformações desejdas

A revolução dos códigos de A revolução dos códigos de barras em supermercados e barras em supermercados e o comércio eletrônicoo comércio eletrônico

…………..………

04/33

Page 5: Orientador: Prof. Msc. Silvio César Cazella Um protótipo de aplicação para recomendação de produtos baseado no interesse e comportamento de consumo do

MotivaçãoMotivaçãoee

ObjetivosObjetivos

05/33

Page 6: Orientador: Prof. Msc. Silvio César Cazella Um protótipo de aplicação para recomendação de produtos baseado no interesse e comportamento de consumo do

A principal motivação do trabalho A principal motivação do trabalho concentra-se em criar uma forma concentra-se em criar uma forma

diferenciada para fazer diferenciada para fazer recomendações de recomendações de softwaressoftwares aos aos

usuários que utilizam sites de usuários que utilizam sites de downloadsdownloads de de softwaressoftwares

06/33

Page 7: Orientador: Prof. Msc. Silvio César Cazella Um protótipo de aplicação para recomendação de produtos baseado no interesse e comportamento de consumo do

Criar um protótipo de um sistema de Criar um protótipo de um sistema de recomendação baseado nos interesses recomendação baseado nos interesses e no comportamento dos usuáriose no comportamento dos usuários

Criar interfaces de captura de informaçõesCriar interfaces de captura de informações

Analisar as ações de Analisar as ações de downloadsdownloads dos usuários dos usuários através da produção de dados sintéticosatravés da produção de dados sintéticos

Aplicar tarefas de minerção de dados na busca de Aplicar tarefas de minerção de dados na busca de similaridades entre usuários e ações de usuáriossimilaridades entre usuários e ações de usuários

Criar agente de comunicação via tecnologia Criar agente de comunicação via tecnologia pushpush

Objetivo principalObjetivo principal::

Objetivos secundários:Objetivos secundários:

07/33

Page 8: Orientador: Prof. Msc. Silvio César Cazella Um protótipo de aplicação para recomendação de produtos baseado no interesse e comportamento de consumo do

FiltragemFiltragemdede

InformaçãoInformação

08/33

Page 9: Orientador: Prof. Msc. Silvio César Cazella Um protótipo de aplicação para recomendação de produtos baseado no interesse e comportamento de consumo do

Como encontrar Como encontrar o que interessa?o que interessa?

Esforço próprio?Esforço próprio?

Sorte?Sorte?

Recomendações de Recomendações de conhecidos?conhecidos?

Técnicas Existentes:Técnicas Existentes: Filtragem Baseada em ConteúdoFiltragem Baseada em Conteúdo Filtragem Colaborativa (Social)Filtragem Colaborativa (Social)

09/33

Page 10: Orientador: Prof. Msc. Silvio César Cazella Um protótipo de aplicação para recomendação de produtos baseado no interesse e comportamento de consumo do

Recomenda itens para o usuário baseado na Recomenda itens para o usuário baseado na correlação entre o conteúdo dos itens e as correlação entre o conteúdo dos itens e as preferências dos usuários e/ou consumos preferências dos usuários e/ou consumos

anterioresanteriores

Quais os itens que melhor atendem as minhas

necessidades de acordo com o seu conteúdo?

Filtragem Baseada em ConteúdoFiltragem Baseada em Conteúdo

Item => Caixa-BrancaItem => Caixa-Branca

10/33

Page 11: Orientador: Prof. Msc. Silvio César Cazella Um protótipo de aplicação para recomendação de produtos baseado no interesse e comportamento de consumo do

Itens são recomendados a um usuário de Itens são recomendados a um usuário de acordo com as avaliações feitas por usuários acordo com as avaliações feitas por usuários

com preferências silimarescom preferências silimares

Quais os itens que melhor atendem as minhas

necessidades de acordo com a opinião do grupo?

Filtragem Colaborativa (Social)Filtragem Colaborativa (Social)

Item => Caixa-PretaItem => Caixa-Preta

11/33

Page 12: Orientador: Prof. Msc. Silvio César Cazella Um protótipo de aplicação para recomendação de produtos baseado no interesse e comportamento de consumo do

Filtragem HíbridaFiltragem Híbrida

Baseada em Baseada em ConteúdoConteúdo

ColaborativaColaborativa

Bons resultados para usuários incomuns

Precisão independente do número de usuários

Recomendações de itens diretamente relacionado ao histórico de consumo

Descoberta de novos relacionamentos entre usuários

Recomendação de itens diretamente relacionado ao histórico de avaliações comuns

12/33

Page 13: Orientador: Prof. Msc. Silvio César Cazella Um protótipo de aplicação para recomendação de produtos baseado no interesse e comportamento de consumo do

SistemaSistemadede

RecomendaçãoRecomendação

13/33

Page 14: Orientador: Prof. Msc. Silvio César Cazella Um protótipo de aplicação para recomendação de produtos baseado no interesse e comportamento de consumo do

Podem ser baseados na:Podem ser baseados na: Identificação do perfil do usuário (FBC)Identificação do perfil do usuário (FBC) Identificação dos gostos semelhantes dos usuários Identificação dos gostos semelhantes dos usuários (FC)(FC)

Processo sistematizado para Processo sistematizado para predizer itens que devem ser predizer itens que devem ser

recomendados aos usuários, pois recomendados aos usuários, pois considera-se que estes teriam considera-se que estes teriam

interesse nos mesmosinteresse nos mesmos

14/33

Page 15: Orientador: Prof. Msc. Silvio César Cazella Um protótipo de aplicação para recomendação de produtos baseado no interesse e comportamento de consumo do

Sistemas existentes:Sistemas existentes:

Ringo Ringo (filtragem social)(filtragem social) Recomendações de músicas por e-mail.Recomendações de músicas por e-mail.

GroupLens GroupLens (filtragem social) (filtragem social) Encontrar artigos para o usuário em um sistema de Encontrar artigos para o usuário em um sistema de newsnews..

Fab Fab (filtragem híbrida)(filtragem híbrida) Recomendação de documentos encontrados na Recomendação de documentos encontrados na WebWeb..

Amazon.comAmazon.comTMTM Comércio eletrônico com recomendação de itens.Comércio eletrônico com recomendação de itens.

eBayeBayTMTM Leilões Leilões onlineonline com avaliações de parceiros de negócio. com avaliações de parceiros de negócio.

15/33

Page 16: Orientador: Prof. Msc. Silvio César Cazella Um protótipo de aplicação para recomendação de produtos baseado no interesse e comportamento de consumo do

MineraçãoMineraçãodede

DadosDados

16/33

Page 17: Orientador: Prof. Msc. Silvio César Cazella Um protótipo de aplicação para recomendação de produtos baseado no interesse e comportamento de consumo do

Os sistemas de recomendação Os sistemas de recomendação utilizam algoritmos próprios para a utilizam algoritmos próprios para a geração das recomendações, mas, geração das recomendações, mas,

devido a quantidade de dados devido a quantidade de dados gerados, pode-se aplicar a mineração gerados, pode-se aplicar a mineração

de dados em busca de padrõesde dados em busca de padrões

A mineração de dados é uma das A mineração de dados é uma das etapas do processo de Descoberta etapas do processo de Descoberta

de Conhecimento em Banco de de Conhecimento em Banco de Dados (DCBD)Dados (DCBD)

17/33

Page 18: Orientador: Prof. Msc. Silvio César Cazella Um protótipo de aplicação para recomendação de produtos baseado no interesse e comportamento de consumo do

Regras de ClassificaçãoRegras de Classificação

Descoberta de relacionamento entre Descoberta de relacionamento entre atributos preditivos e o objetivoatributos preditivos e o objetivo

Regras de AssociaçãoRegras de Associação

Padrão de relacionamento Padrão de relacionamento entre itens de dados em uma entre itens de dados em uma

base de dados (base de dados (basket analysisbasket analysis))

Tarefas de Mineração de DadosTarefas de Mineração de Dados

18/33

Page 19: Orientador: Prof. Msc. Silvio César Cazella Um protótipo de aplicação para recomendação de produtos baseado no interesse e comportamento de consumo do

MetodologiaMetodologiaAplicadaAplicada

19/33

Page 20: Orientador: Prof. Msc. Silvio César Cazella Um protótipo de aplicação para recomendação de produtos baseado no interesse e comportamento de consumo do

Para contemplar os objetivos Para contemplar os objetivos propostos as seguintes etapas propostos as seguintes etapas

metodológicas foram cumpridas:metodológicas foram cumpridas:

Criação de páginas Criação de páginas WebWeb (PHP) associados ao (PHP) associados ao banco de dados PostgreSQLbanco de dados PostgreSQL

Criação de Criação de scriptsscripts (Perl) automatizados gerando (Perl) automatizados gerando valores aleatórios para simular a realidadevalores aleatórios para simular a realidade

Utilização das ferramentas de mineração de Utilização das ferramentas de mineração de dados C4.5 e WEKA para encontrar regras de dados C4.5 e WEKA para encontrar regras de classificação e associação respectivamenteclassificação e associação respectivamente

Contrução do agente de comunicação em Contrução do agente de comunicação em linguagem Java através de linguagem Java através de socketssockets utilizando o utilizando o modelo cliente/servidormodelo cliente/servidor

20/33

Page 21: Orientador: Prof. Msc. Silvio César Cazella Um protótipo de aplicação para recomendação de produtos baseado no interesse e comportamento de consumo do

ProtótipoProtótipo

21/33

Page 22: Orientador: Prof. Msc. Silvio César Cazella Um protótipo de aplicação para recomendação de produtos baseado no interesse e comportamento de consumo do

Recomendações Macro (Categorias)Recomendações Macro (Categorias)Cadastro de UsuáriosCadastro de Usuários

Descoberta de Classificações (Categorias)Descoberta de Classificações (Categorias)

Recomendações de CategoriasRecomendações de Categorias

Recomendações Micro (Softwares)Recomendações Micro (Softwares)DownloadsDownloads de de SoftwaresSoftwares

Descoberta de Associações (Descoberta de Associações (SoftwaresSoftwares))

Recomendações de Recomendações de SoftwaresSoftwares

22/33

Page 23: Orientador: Prof. Msc. Silvio César Cazella Um protótipo de aplicação para recomendação de produtos baseado no interesse e comportamento de consumo do

Recom

en

dações

Recom

en

dações

Macro

Macro

Recom

en

dações

Recom

en

dações

Mic

roM

icro

23/33

Page 24: Orientador: Prof. Msc. Silvio César Cazella Um protótipo de aplicação para recomendação de produtos baseado no interesse e comportamento de consumo do

ExperimentoExperimento

24/33

Page 25: Orientador: Prof. Msc. Silvio César Cazella Um protótipo de aplicação para recomendação de produtos baseado no interesse e comportamento de consumo do

Os perfis dos usuários foram gerados Os perfis dos usuários foram gerados de forma proporcional em relação a de forma proporcional em relação a cada atributo, mas em relação a sua cada atributo, mas em relação a sua totalidade os usuários ficaram bem totalidade os usuários ficaram bem

diferenciadosdiferenciados

5 x 1.000 => 5.000 usuários5 x 1.000 => 5.000 usuários

Valor suficiente para uma população de Valor suficiente para uma população de 1 milhão de usuários com uma 1 milhão de usuários com uma

confiança de 99% com variação de 2% (+/-)confiança de 99% com variação de 2% (+/-)

Valores sintéticos (perfis)Valores sintéticos (perfis)

25/33

Page 26: Orientador: Prof. Msc. Silvio César Cazella Um protótipo de aplicação para recomendação de produtos baseado no interesse e comportamento de consumo do

Os perfis dos usuários sofreram a ação da Os perfis dos usuários sofreram a ação da mineração de dados para recomendar mineração de dados para recomendar

novas categorias de novas categorias de softwaressoftwares

Erro / Acerto das regras = 59% / 41%Erro / Acerto das regras = 59% / 41%

Regras = 35% => 1.399 recom.Regras = 35% => 1.399 recom. Oportunidades = 45% => 1.552 recom.Oportunidades = 45% => 1.552 recom.

Novas Recomendações => 2.951 recom.Novas Recomendações => 2.951 recom.

Utilização da ferramenta C4.5 para Utilização da ferramenta C4.5 para encontrar regras de classificaçãoencontrar regras de classificação

Recomendações MacroRecomendações Macro

26/33

Page 27: Orientador: Prof. Msc. Silvio César Cazella Um protótipo de aplicação para recomendação de produtos baseado no interesse e comportamento de consumo do

Esta enorme quantidade de Esta enorme quantidade de downloadsdownloads simulou uma grande simulou uma grande

participação dos usuários participação dos usuários cadastrados no sistema propostocadastrados no sistema proposto

1-10 x cat-usr => 56.402 downloads1-10 x cat-usr => 56.402 downloads

Valor gerado a partir da simulação onde cada Valor gerado a partir da simulação onde cada categoria macro de cada usuário pode gerar categoria macro de cada usuário pode gerar

entre 1 e 10 entre 1 e 10 downloadsdownloads

Valores sintéticos (downloads)Valores sintéticos (downloads)

27/33

Page 28: Orientador: Prof. Msc. Silvio César Cazella Um protótipo de aplicação para recomendação de produtos baseado no interesse e comportamento de consumo do

Os Os downloadsdownloads dos usuários sofreram a dos usuários sofreram a ação da mineração de dados para ação da mineração de dados para

recomendar novos recomendar novos softwaressoftwares

Suporte mínimo = 5%Suporte mínimo = 5%Confiança = 80%Confiança = 80%

=> 14.232 recomendações de => 14.232 recomendações de softwaressoftwares

Utilização da ferramenta WEKA para Utilização da ferramenta WEKA para encontrar regras de associaçãoencontrar regras de associação

Recomendações MicroRecomendações Micro

28/33

Page 29: Orientador: Prof. Msc. Silvio César Cazella Um protótipo de aplicação para recomendação de produtos baseado no interesse e comportamento de consumo do

ConclusãoConclusão

29/33

Page 30: Orientador: Prof. Msc. Silvio César Cazella Um protótipo de aplicação para recomendação de produtos baseado no interesse e comportamento de consumo do

Este trabalho proporcionou um Este trabalho proporcionou um modelo diferenciado de modelo diferenciado de

recomendar produtos baseado recomendar produtos baseado no perfil (macro) e nas no perfil (macro) e nas

colaborações (micro) através de colaborações (micro) através de um agente de comunicação um agente de comunicação

autônomoautônomo

A funcionalidade do protótipo foi A funcionalidade do protótipo foi comprovada pela sua execução comprovada pela sua execução de forma simulada com dados de forma simulada com dados

sintéticossintéticos30/33

Page 31: Orientador: Prof. Msc. Silvio César Cazella Um protótipo de aplicação para recomendação de produtos baseado no interesse e comportamento de consumo do

TrabalhosTrabalhosFuturosFuturos

31/33

Page 32: Orientador: Prof. Msc. Silvio César Cazella Um protótipo de aplicação para recomendação de produtos baseado no interesse e comportamento de consumo do

Execução do sistema com usuários reaisExecução do sistema com usuários reais

Experimentar diferentes algoritmos de Experimentar diferentes algoritmos de mineração de dadosmineração de dados

Inclusão de módulo de avaliação (rating) Inclusão de módulo de avaliação (rating) de recomendações em escala (feedback)de recomendações em escala (feedback)

Refinamento da interface de Refinamento da interface de recomendaçãorecomendação

Incluir algoritmos que permitam calcular Incluir algoritmos que permitam calcular a confiança entre usuários que recebem e a confiança entre usuários que recebem e recomendam itensrecomendam itens

Trabalhas recursos que foquem na Trabalhas recursos que foquem na explanação da recomendaçãoexplanação da recomendação

32/33

Page 33: Orientador: Prof. Msc. Silvio César Cazella Um protótipo de aplicação para recomendação de produtos baseado no interesse e comportamento de consumo do

Perguntas?Perguntas?

33/33