sistema de recomendação web usando agentes niadr/publications/2013/revccomputa.pdf ·...

Download Sistema de Recomendação Web Usando Agentes niadr/PUBLICATIONS/2013/RevCComputa.pdf · palavras-chave:…

Post on 10-Nov-2018

212 views

Category:

Documents

0 download

Embed Size (px)

TRANSCRIPT

  • Revista de Cincias da Computao, 2013, n8

    23

    Sistema de Recomendao Web Usando Agentes

    A. Jorge Morais2,3,6

    , Joaquim Neto5,6

    , Eugnio Oliveira2,4

    , Alpio Mrio Jorge1,3

    1Faculdade de Cincias da Universidade do Porto

    2Faculdade de Engenharia da Universidade do Porto

    3Laboratrio de Inteligncia Artificial e Apoio Deciso (LIAAD INESC TEC, L.A.)

    4 Laboratrio de Inteligncia Artificial e Cincia de Computadores (LIACC UP)

    5Laboratrio Nacional de Engenharia Civil

    6Universidade Aberta

    Jorge.Morais@uab.pt;jaqf.neto@gmail.com;eco@fe.up.pt;amjorge@fc.up.pt

    Resumo O crescimento da Web trouxe vrios problemas aos utilizadores. A grande quantidade

    de informao existente hoje em dia em alguns stios Web torna a procura de

    informao til muito difcil. Os objetivos dos proprietrios dos stios Web e dos

    utilizadores nem sempre coincidem. O conhecimento dos padres de visitas dos

    utilizadores crucial para que os proprietrios possam transformar e adaptar o stio

    Web. Este o princpio do stio Web adaptativo: o stio Web adapta-se de forma a

    melhorar a experincia do utilizador. Alguns algoritmos foram propostos para adaptar

    um stio da Web. Neste artigo, descrevemos uma proposta de um sistema de

    recomendao Web baseado em agentes que combina dois algoritmos: regras de

    associao e filtragem colaborativa. Ambos os algoritmos so incrementais e funcionam

    com dados binrios. Os resultados mostram que, em algumas situaes, a abordagem

    multiagente melhora a capacidade preditiva quando comparada com os agentes

    individuais.

    palavras-chave: Web Mining, Sistemas de Recomendao, Sistemas Multiagente

    Abstract

    The growth of the Web has brought several problems for users. Today the vast amount

    of information on some web sites makes useful information finding very difficult. The

    objectives of the owners of the web sites and users do not always coincide. The

    knowledge of patterns of user visits is crucial to the owners to transform and adapt their

    web site. This is the adaptive website principle: the website adapts to improve the user

    experience. Some algorithms have been proposed to tailor a website. In this paper, we

    describe a proposal for a web recommendation system based on agents that combines

    two algorithms: association rules and collaborative filtering. Both algorithms are

    incremental and work with binary data. The results show that, in some situations, the

    multi-agent approach overcomes the predictive capacity of individual agents.

    keywords: web mining, recommendation systems, multi-agent systems

  • Revista de Cincias da Computao, 2013, n8

    24

    1. Introduo

    Hoje em dia, a maioria das organizaes tem um stio Web para divulgar informao

    para o pblico em geral. Quando o tamanho deste cresce, a dificuldade para os

    utilizadores encontrarem informao til tambm cresce. Isso levou as organizaes a

    lidar com o problema de organizar toda a informao de forma eficiente, de modo a

    tornar fcil encontrar todos os produtos ou informao que um utilizador procura.

    Vamos considerar, por exemplo, que um cliente est procura de um determinado

    produto com caractersticas particulares. A estrutura do stio Web pode ser organizada

    por diferentes marcas, o que significa que os clientes tero de procurar dentro de cada

    marca para comparar os modelos. Suponhamos que, a partir de visitas anteriores de

    outros utilizadores, descoberto um padro como "utilizadores que pesquisam este

    produto tambm pesquisam aqueles". Descobrir tal padro pode levar a considerar uma

    soluo, por exemplo, sugerindo produtos similares de outras marcas na mesma pgina.

    Um algoritmo que capaz de fazer este tipo de sugestes chamado um sistema de

    recomendao [Ricci et al. 2011].

    Uma das abordagens que tem sido propostas para este problema utilizar agentes

    autnomos. Sistemas Multiagente [Wooldridge 2009] uma rea de pesquisa que tem

    estado em grande desenvolvimento ao longo da ltima dcada e tem algumas

    caractersticas particulares que se encaixam neste problema. Na verdade, as abordagens

    multiagente j tm sido aplicadas na automatizao da Web [Ardissono et al. 2005],

    devido sua flexibilidade e caractersticas. Sistemas Multiagente tambm so usados

    para recuperao e atualizao automtica de informao em stios Web [Albayrak et al.

    2005]. Uma implementao de um sistema de recomendao usando esta abordagem j

    tinha sido proposto por Wei em 2005 [Wei 2005].

    Neste trabalho propomos um sistema de recomendao multiagente que combina dois

    algoritmos diferentes (regras associativas e filtragem colaborativa) e explora um

    paradigma baseado em mercado, incluindo estratgias de licitao. Ambos os

    algoritmos de recomendao so incrementais e trabalham com dados binrios.

    Este artigo comea por apresentar o trabalho anterior na rea de sistemas de

    recomendao e sistemas multiagente, seguido pela descrio da nossa abordagem. Os

    resultados dos testes com seis conjuntos de dados, as concluses e trabalho em curso e

    futuro completam o artigo.

    2. Conceitos e trabalho anterior

    Um sistema de recomendao tpico [Resnick, Varian 1997] usa, geralmente, um

    modelo construdo a partir de dados sobre as visitas ou avaliaes de utilizadores

    anteriores. Dado um utilizador ativo, um sistema de recomendao apresenta as n

    recomendaes principais que correspondem s preferncias mais provveis do

    utilizador. O modelo pode ser construdo usando informao explcita fornecida pelos

    utilizadores (gosto/no gosto, 1 a 5 estrelas, etc), ou informao implcita com base

    no comportamento do utilizador (pginas Web que o utilizador visitou, o tempo gasto

    em uma determinada pgina Web, etc). Embora a informao explcita seja,

    aparentemente, mais confivel, mais exigente para o utilizador. A informao

    implcita s nos d informao sobre o comportamento do utilizador, e no sobre o que

  • Revista de Cincias da Computao, 2013, n8

    25

    realmente este pensava sobre um determinado item. No entanto, esta informao

    relevante e pode ser utilizada para construir o modelo do sistema de recomendao. Em

    [Schafer 2006] afirmado que, em alguns domnios, a informao implcita resulta em

    modelos mais precisos do que classificaes explcitas.

    Os sistemas de recomendao so, geralmente, classificados nas seguintes categorias

    [Balabanovic, Shoham 1997] [Adomavicius, Tuzhilin 2005]: baseados em contedo,

    onde so recomendados itens com contedo semelhante aos preferidos anteriormente;

    ou colaborativos, onde so recomendados itens de que pessoas com gostos e

    preferncias semelhantes gostaram no passado.

    Os sistemas de recomendao colaborativos, em vez de se concentrarem num mesmo

    utilizador, tentam encontrar itens teis com base nas preferncias de outros. De acordo

    com [Breese, Heckerman, Kadie 1998], os algoritmos para essa abordagem podem ser

    agrupados em duas classes gerais: baseados em modelo, que usam o conjunto de

    classificaes para gerar um modelo que usado para fazer previses; baseados em

    memria, que fazem previses com base na combinao de itens armazenados,

    anteriormente classificados pelos utilizadores.

    Os algoritmos baseados em memria podem ser baseados no utilizador ou no item, de

    acordo com a forma como as semelhanas so calculadas. Em termos prticos, quando

    seguimos uma abordagem baseada no item, podemos confiar apenas nas semelhanas

    entre os itens, desconsiderando a informao da relao utilizador-item. A abordagem

    baseada no item capaz de fornecer resultados com a mesma qualidade e menos tempo

    de computao [Sarwar et al. 2001] [Linden, Smith, York 2003].

    Em [Adomavicius, Tuzhilin 2005], afirma-se que, uma vez que os sistemas

    colaborativos usam as classificaes de outros utilizadores, eles no tm alguns dos

    problemas que os sistemas baseados em contedo tm. No entanto, tambm tm as suas

    prprias limitaes, tais como o problema do novo utilizador, o problema novo item e a

    disperso. Para os dois primeiros problemas, so sugeridas abordagens hbridas,

    enquanto que para o ltimo os autores sugerem o uso de filtragem demogrfica [Pazzani

    1999] e decomposio em valores singulares [Sarwar et al. 2000] [Goldberg et al. 2001]

    [Canny 2002]. Em [Jannach et al. 2011], foi tambm sugerida a utilizao de um

    mtodo baseado em grafos, para explorar a eventual transitividade das preferncias dos

    utilizadores [Huang, Chen, Zeng 2004].

    Uma viso global sobre stios Web adaptativos com base na anlise de interao do

    utilizador dada em [Perkowitz, Etzioni 2000]. Na verdade, foram propostas

    abordagens menos ambiciosas, como a reorganizao do stio Web [Ishikawa et al.

    2002], o uso de recomendaes nas pginas [El-Ramly, Stroulia 2004], a categorizao

    automtica de aes do utilizador [Berendt 2002], ou procurar caminhos de sequncias

    de pginas Web relevantes usando modelos de Markov [Borges 2000].

    Os sistemas de recomendao existentes incluem a combinao de agrupamentos com o

    algoritmo dos vizinhos mais prximos [Mobasher et al. 2002], cadeias de Markov e

    agrupamentos [Cadez et al. 2003], regras de associao [Jorge et al. 2003], e filtragem

    colaborativa e baseada em contedo [Basilico, Hofmann 2004].

  • Revista de Cincias da Computao, 2013, n8

    26

    Algumas plataformas, como o WebWatcher, usam o conhecimento dos utilizadores

    anteriores para recomendar ligaes [A