sistemas de recomendaÇÃo mineração de dados na web

79
SISTEMAS DE RECOMENDAÇÃO Mineração de Dados na Web

Upload: internet

Post on 18-Apr-2015

114 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: SISTEMAS DE RECOMENDAÇÃO Mineração de Dados na Web

SISTEMAS DE RECOMENDAÇÃO

Mineração de Dados na Web

Page 2: SISTEMAS DE RECOMENDAÇÃO Mineração de Dados na Web

EQUIPE

Lais Varejão (lvv)

Paulo Oliveira (phslfo)

Victor Lorena (vlfs)

Victor Acioli (vaca)

Page 3: SISTEMAS DE RECOMENDAÇÃO Mineração de Dados na Web

ROTEIRO Introdução

Coleta de Informações

Estratégias

Técnicas

Arquitetura

Passo a Passo

Aplicações

Conclusão

Page 4: SISTEMAS DE RECOMENDAÇÃO Mineração de Dados na Web

INTRODUÇÃO

Page 5: SISTEMAS DE RECOMENDAÇÃO Mineração de Dados na Web

MOTIVAÇÃO

A Era da Inteligência Coletiva

Page 6: SISTEMAS DE RECOMENDAÇÃO Mineração de Dados na Web

MOTIVAÇÃO

Sob o aspecto tecnológico, Inteligência Coletiva é o conjunto de comportamentos, preferências

e ideias de um grupo de pessoas para criar novas introspecções.

Page 7: SISTEMAS DE RECOMENDAÇÃO Mineração de Dados na Web

MOTIVAÇÃO Atualmente existe uma grande quantidade de

informação disponibilizada de forma facilitada.

Page 8: SISTEMAS DE RECOMENDAÇÃO Mineração de Dados na Web

MOTIVAÇÃO

Ao mesmo tempo...

Page 9: SISTEMAS DE RECOMENDAÇÃO Mineração de Dados na Web

MOTIVAÇÃO O usuário tem dificuldade de encontrar

informações que são relevantes para ele.

Page 10: SISTEMAS DE RECOMENDAÇÃO Mineração de Dados na Web

PROBLEMA

Como identificar quais conteúdos são

relevantes para cada usuário em meio a um mar de informação?

Page 11: SISTEMAS DE RECOMENDAÇÃO Mineração de Dados na Web

SISTEMAS DE RECOMENDAÇÃO Sistemas de recomendação realizam a filtragem

da informação para recomendar itens, que possam ser interessantes para o usuário.

Page 12: SISTEMAS DE RECOMENDAÇÃO Mineração de Dados na Web

SISTEMAS DE RECOMENDAÇÃO

Qual livro eu devo ler?

Para onde eu devo sair?

Que filme eu devo ver?

Page 13: SISTEMAS DE RECOMENDAÇÃO Mineração de Dados na Web

SISTEMAS DE RECOMENDAÇÃO

“Muitas vezes as pessoas só sabem o que querem depois que você mostra a elas.”

Steve Jobs

Page 14: SISTEMAS DE RECOMENDAÇÃO Mineração de Dados na Web

SISTEMAS DE RECOMENDAÇÃO

Existem empresas que investem em sistemas de recomendação?

Page 15: SISTEMAS DE RECOMENDAÇÃO Mineração de Dados na Web

SISTEMAS DE RECOMENDAÇÃO

Page 16: SISTEMAS DE RECOMENDAÇÃO Mineração de Dados na Web

DESAFIO NETFLIX Netflix

É uma locadora de DVDs online, com entrega a domicílio, que recomenda filmes de acordo com locações prévias dos clientes.

Dos filmes alugados, 60% vêm de recomendações.

Em 2006, ela anunciou o prêmio de 1 milhão para a primeira pessoa que melhorasse a precisão do seu sistema de recomendação em 10%.

Page 17: SISTEMAS DE RECOMENDAÇÃO Mineração de Dados na Web

QUEM FORAM OS PIONEIROS? Nos anos 90, foi desenvolvido o Tapestry.

Um sistema de email que avaliava a relevância dos documentos recebidos.

Em 1996, o My Yahoo surgiu. O primeiro website a utilizar recomendação em

grandes proporções.

A técnica customização era utilizada.

Page 18: SISTEMAS DE RECOMENDAÇÃO Mineração de Dados na Web

COLETA DE INFORMAÇÕES

Page 19: SISTEMAS DE RECOMENDAÇÃO Mineração de Dados na Web

COLETA DE INFORMAÇÕES

É indispensável conhecer quem é o usuário.

Page 20: SISTEMAS DE RECOMENDAÇÃO Mineração de Dados na Web

COLETA DE INFORMAÇÕES O usuário deve ser identificado no momento

em que ele acessa o sistema.

Identificação no servidor É necessário fazer um cadastro. Provê maior precisão.

Identificação no cliente Utiliza cookies para identificar a máquina. Menos confiável.

Page 21: SISTEMAS DE RECOMENDAÇÃO Mineração de Dados na Web

COLETA DE INFORMAÇÕES As informações podem ser coletadas de forma

explícita ou implícita.

Page 22: SISTEMAS DE RECOMENDAÇÃO Mineração de Dados na Web

COLETA DE INFORMAÇÕES Coleta Explícita

O usuário indica o que lhe interessa.

Page 23: SISTEMAS DE RECOMENDAÇÃO Mineração de Dados na Web

COLETA DE INFORMAÇÕES Coleta Implícita

A partir do comportamento do usuário, infere-se suas necessidades e preferências.

TURISMO

Page 24: SISTEMAS DE RECOMENDAÇÃO Mineração de Dados na Web

PROBLEMAS DE PRIVACIDADE Informações do usuário são coletadas e

armazenadas sem que ele perceba.

Existem empresas que vendem esses dados.

Page 25: SISTEMAS DE RECOMENDAÇÃO Mineração de Dados na Web

POLÍTICAS DE PRIVACIDADE É uma exigência legal que as políticas de

privacidade dos sites sejam disponibilizadas. Aumenta a proteção do usuário.

Page 26: SISTEMAS DE RECOMENDAÇÃO Mineração de Dados na Web

POLÍTICAS DE PRIVACIDADE Algumas organizações propõem selos que

regulam a política de privacidade de um website.

Page 27: SISTEMAS DE RECOMENDAÇÃO Mineração de Dados na Web

ESTRATÉGIAS

Page 28: SISTEMAS DE RECOMENDAÇÃO Mineração de Dados na Web

ESTRATÉGIAS

Diferentes estratégias podem ser usadas para personalizar ofertas para o usuário.

Listas de Recomendação

Avaliação de Usuários

Suas Recomendações

Produtos Similares (X Y)

Associação por Conteúdo

Page 29: SISTEMAS DE RECOMENDAÇÃO Mineração de Dados na Web

ESTRATÉGIAS Listas de Recomendação

São mantidas listas de itens organizadas por tipos de interesse.

Page 30: SISTEMAS DE RECOMENDAÇÃO Mineração de Dados na Web

ESTRATÉGIAS

Avaliação de Usuários Além de comprar, o usuário deixa sua avaliação sob

o item adquirido. É importante que haja veracidade na opinião.

Page 31: SISTEMAS DE RECOMENDAÇÃO Mineração de Dados na Web

SUAS RECOMENDAÇÕES Itens são oferecidos de acordo com o interesse

do usuário.

Page 32: SISTEMAS DE RECOMENDAÇÃO Mineração de Dados na Web

PRODUTOS SIMILARES (X Y) Indica itens similares ao que está sendo

comprado no momento.

Page 33: SISTEMAS DE RECOMENDAÇÃO Mineração de Dados na Web

ASSOCIAÇÃO POR CONTEÚDO São utilizados os dados dos próprios produtos e

não do usuário.

Exemplo: Autor Editora Tema Assunto

Page 34: SISTEMAS DE RECOMENDAÇÃO Mineração de Dados na Web

TÉCNICAS

Page 35: SISTEMAS DE RECOMENDAÇÃO Mineração de Dados na Web

FILTRAGEM DE INFORMAÇÃO

É o nome utilizado para descrever uma variedade de processos que envolvem a entrega de

informação para as pessoas que realmente necessitam delas.

Belvin and Croft - 1992

Page 36: SISTEMAS DE RECOMENDAÇÃO Mineração de Dados na Web

FILTRAGEM BASEADA EM CONTEÚDO

É a forma mais simples de recomendação

Considera que usuários sempre gostaram de coisas que gostaram no passado.

Analisa apenas os itens e o perfil do usuário.

Page 37: SISTEMAS DE RECOMENDAÇÃO Mineração de Dados na Web

FILTRAGEM BASEADA EM CONTEÚDO

Funcionamento: Usuários devem avaliar itens de acordo com seu

interesse.

O sistema correlaciona os itens em sua base de dados, considerando características de cada item.

E indica novos itens que apresentem alto grau de similaridade.

Page 38: SISTEMAS DE RECOMENDAÇÃO Mineração de Dados na Web

EXEMPLO

REC

Hangover

X-men

O exorcista

Gostei

Recomendado

sim(REC, Exoc)

Usuário Atual

Page 39: SISTEMAS DE RECOMENDAÇÃO Mineração de Dados na Web

FILTRAGEM BASEADA EM CONTEÚDO

Dificuldades:

Cálculo da similaridade

Análise dos dados restrita

Super Especialização

Efeito Portfólio

Page 40: SISTEMAS DE RECOMENDAÇÃO Mineração de Dados na Web

FILTRAGEM COLABORATIVA Fechar as lacunas que a filtragem baseada em

conteúdo não soluciona.

Não exige a extração de características dos itens.

O sistema se baseia na troca de experiências entre usuários com gostos similares.

Page 41: SISTEMAS DE RECOMENDAÇÃO Mineração de Dados na Web

FILTRAGEM COLABORATIVA Funcionamento:

Usuários devem avaliar itens de acordo com seu interesse.

O sistema descobre usuários com padrões similares de comportamento ao do usuário atual.

Processa as avaliações feitas por esse subconjunto de usuários.

E recomenda itens que o usuário atual ainda não avaliou.

Page 42: SISTEMAS DE RECOMENDAÇÃO Mineração de Dados na Web

EXEMPLO

Usuário Atual Usuário X Usuário Y

Filme 1

Filme 2

Filme 3

Filme 4

Similares

Gosta:1. Filme A2. Filme B3. Filme C

Gosta:1. Filme A2. Filme B3. Filme C

Page 43: SISTEMAS DE RECOMENDAÇÃO Mineração de Dados na Web

FILTRAGEM COLABORATIVA Dificuldades:

Necessita de vasta base de dados

Escalabilidade/estabilidade

Partida fria (Usuários e itens novos)

Popularidade

Ovelha negra

Demonstração Facebook

Page 44: SISTEMAS DE RECOMENDAÇÃO Mineração de Dados na Web

FILTRAGEM HÍBRIDA

Combina as duas técnicas, para obter um sistema mais eficiente.

Page 45: SISTEMAS DE RECOMENDAÇÃO Mineração de Dados na Web

COMPARATIVO

FBC FC FHPartida fria (Item)Partida fria (Usuário)SimilaridadeDados restritosEspecializaçãoEfeito PortfólioVasta base de dadosPopularidadeOvelha negra

Page 46: SISTEMAS DE RECOMENDAÇÃO Mineração de Dados na Web

CUIDADOS

Solicitada ou espontânea?

Rodar online ou offline?

Recomendar tudo ou filtrar?

Só itens novos?

Explicar o motivo da escolha?

Necessidade ou interesse?

Page 47: SISTEMAS DE RECOMENDAÇÃO Mineração de Dados na Web

ARQUITETURA

Page 48: SISTEMAS DE RECOMENDAÇÃO Mineração de Dados na Web

ARQUITETURA

Page 49: SISTEMAS DE RECOMENDAÇÃO Mineração de Dados na Web

Recommender Server Utilizado para dar acesso aos SessionsControllers

e às rotinas de recomendações.

EXEMPLO

Page 50: SISTEMAS DE RECOMENDAÇÃO Mineração de Dados na Web

SessionController Ao entrar no site as

informações do usuário são armazenadas sobre sua interação atual.

E comparadas com o seu histórico dentro do site.

EXEMPLO

Page 51: SISTEMAS DE RECOMENDAÇÃO Mineração de Dados na Web

StrategyList Guarda vários modelos de recomendação.

Baseado em listas armazenadas pelo sistema. Itens mais comuns

Baseado em preferências explícitas ou implícitas. Itens mais específicos

Diferentes estratégias podem ser criadas e utilizadas em paralelo em um mesmo website.

EXEMPLO

Page 52: SISTEMAS DE RECOMENDAÇÃO Mineração de Dados na Web

InterestList Mantém as preferências.

Essas preferências podem ser utilizadas em conjunto.

EXEMPLO

Page 53: SISTEMAS DE RECOMENDAÇÃO Mineração de Dados na Web

FindingList

Informações básicas sobre os usuários.

Armazena características demográficas e hábitos.

Recomendação com precisão.

EXEMPLO

Page 54: SISTEMAS DE RECOMENDAÇÃO Mineração de Dados na Web

RECOMENDAÇÃO PASSO A PASSO

Page 55: SISTEMAS DE RECOMENDAÇÃO Mineração de Dados na Web

Do que as pessoas gostam?

Preferências de produtos, serviços e interesses.

Como e onde pegar essas informações.

PASSO A PASSO

Page 56: SISTEMAS DE RECOMENDAÇÃO Mineração de Dados na Web

Como as pessoas se parecem? Grupos de pessoas com interesses em comum.

Métricas de Similaridade: Coeficiente de Pearson. Distância Euclidiana.

PASSO A PASSO

Page 57: SISTEMAS DE RECOMENDAÇÃO Mineração de Dados na Web

Recomendar itens Mostrar algum item que uma pessoa parecida

com você viu e você não viu. Tabela de Pesos.

PASSO A PASSO

Page 58: SISTEMAS DE RECOMENDAÇÃO Mineração de Dados na Web

Comparação entre itens Encontra a similaridade entre os itens. Ajuda a oferecer um item que você

provavelmente queira ver.

PASSO A PASSO

Page 59: SISTEMAS DE RECOMENDAÇÃO Mineração de Dados na Web

APLICAÇÕES

Page 60: SISTEMAS DE RECOMENDAÇÃO Mineração de Dados na Web

APLICAÇÕES Aardwark:

Sugestões de perguntas a pessoas certas. Associação por Conteúdo.

Page 61: SISTEMAS DE RECOMENDAÇÃO Mineração de Dados na Web

APLICAÇÕES

YouTube:

Sugestão de vídeos.

Lista de recomendação.

Associação de conteúdo.

Page 62: SISTEMAS DE RECOMENDAÇÃO Mineração de Dados na Web

APLICAÇÕES Facebook:

Sugestão de pessoas que o usuário possa conhecer. Usuários que se interessam por “X” também se

interessam por “Y”.

Page 63: SISTEMAS DE RECOMENDAÇÃO Mineração de Dados na Web

APLICAÇÕES Match.com:

É uma comunidade mundial de solteiros em busca de um parceiro.

Lançado em 1995, foi pioneiro em sites de relacionamentos.

Possui mais de 29 milhões de usuários.

Page 64: SISTEMAS DE RECOMENDAÇÃO Mineração de Dados na Web

APLICAÇÕES Match.com:

Sugere pessoas através do Daily 5. Suas Recomendações.

Page 65: SISTEMAS DE RECOMENDAÇÃO Mineração de Dados na Web

APLICAÇÕES Amazon:

Inicialmente, era uma livraria online. Atualmente, é a maior empresa de comércio eletrônico dos EUA.

Realiza grandes investimentos em recomendação, possuindo todas as estratégias.

Cerca de 38% de suas vendas provêm de suas sugestões.

Page 66: SISTEMAS DE RECOMENDAÇÃO Mineração de Dados na Web

APLICAÇÕES

Amazon: Sugestão de itens que o

usuário posso querer comprar.

Lista de recomendação.

Page 67: SISTEMAS DE RECOMENDAÇÃO Mineração de Dados na Web

APLICAÇÕES Amazon:

Avaliação de Usuários

Page 68: SISTEMAS DE RECOMENDAÇÃO Mineração de Dados na Web

APLICAÇÕES Amazon:

Suas Recomendações

Page 69: SISTEMAS DE RECOMENDAÇÃO Mineração de Dados na Web

APLICAÇÕES Amazon:

Usuários que se interessam por “X” também se interessam por “Y.”

Page 70: SISTEMAS DE RECOMENDAÇÃO Mineração de Dados na Web

APLICAÇÕES Amazon:

Associação por conteúdo

Page 71: SISTEMAS DE RECOMENDAÇÃO Mineração de Dados na Web

DESAFIOS E TENDÊNCIAS

Page 72: SISTEMAS DE RECOMENDAÇÃO Mineração de Dados na Web

TENDÊNCIAS

Pesquisa social Busca na web considera as

redes sociais que o usuário faz parte.

Ex: O sistema responde a uma consulta de um usuário com links relacionados às avaliações dadas por colegas do usuário.

Page 73: SISTEMAS DE RECOMENDAÇÃO Mineração de Dados na Web

TENDÊNCIAS

Google Social Search

Page 74: SISTEMAS DE RECOMENDAÇÃO Mineração de Dados na Web

DESAFIOS Melhoria nos algoritmos de recomendação:

Eficiência Qualidade do resultado.

Page 75: SISTEMAS DE RECOMENDAÇÃO Mineração de Dados na Web

CONCLUSÃO Sistemas de recomendação

podem ser usados para que se possa conhecer melhor os hábitos dos usuários.

Aplicar estrategicamente o conhecimento dos hábitos dos usuários, pode melhorar a lucratividade de uma empresa.

Page 76: SISTEMAS DE RECOMENDAÇÃO Mineração de Dados na Web

CONCLUSÃO A tendência é que todos os programas web

utilizem recomendação.

Page 77: SISTEMAS DE RECOMENDAÇÃO Mineração de Dados na Web

DÚVIDAS

Page 78: SISTEMAS DE RECOMENDAÇÃO Mineração de Dados na Web

Obrigado!

Page 79: SISTEMAS DE RECOMENDAÇÃO Mineração de Dados na Web

REFERÊNCIAS http://dsc.upe.br/~tcc/20092/TCC_final_AndersonBerg.pdf

http://en.wikipedia.org/wiki/Recommender_system

Programming Collective Inteligence - OReilly

Artigo 2 (Incluir)

Artigo 3 (Incluir)