uma anÁlise das contribuiÇÕes de dados...

83
CENTRO UNIVERSITÁRIO RITTER DOS REIS PROGRAMA DE PÓS-GRADUAÇÃO EM DESIGN LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS NA WEB NO DESENVOLVIMENTO DE PERSONAS PARA O DESIGN DE MODA PORTO ALEGRE 2018

Upload: dolien

Post on 28-Jan-2019

232 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS …biblioteca.uniritter.edu.br/imagens/035UNR89/0000F1/0000F128.pdf · LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS

CENTRO UNIVERSITÁRIO RITTER DOS REIS

PROGRAMA DE PÓS-GRADUAÇÃO EM DESIGN

LAURA FELHAUER TOLEDO

UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS NA WEB NO DESENVOLVIMENTO DE PERSONAS PARA O DESIGN DE MODA

PORTO ALEGRE

2018

Page 2: UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS …biblioteca.uniritter.edu.br/imagens/035UNR89/0000F1/0000F128.pdf · LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS

LAURA FELHAUER TOLEDO

UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS NA WEB NO DESENVOLVIMENTO DE PERSONAS PARA O DESIGN DE MODA

Dissertação apresentada ao Programa de Pós-Graduação em Design do Centro Universitário Ritter dos Reis como requisito para obtenção do título de Mestre em Design. Orientador: Prof. Dr. Wilson Pires Gavião Neto

Porto Alegre

2018

Page 3: UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS …biblioteca.uniritter.edu.br/imagens/035UNR89/0000F1/0000F128.pdf · LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS

LAURA FELHAUER TOLEDO

UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS NA WEB NO DESENVOLVIMENTO DE PERSONAS PARA O DESIGN DE MODA

Dissertação apresentada ao Programa de Pós-Graduação em Design do Centro Universitário Ritter dos Reis como requisito para a obtenção do titulo de Mestre em Design e aprovada pela banca examinadora. Porto Alegre, ___ de ________ de _____.

BANCA EXAMINADORA

______________________________________

Prof. Dr. Wilson Pires Gavião Neto (Orientador)

Centro Universitário Ritter dos Reis - UniRitter

______________________________________

Prof. Dr. Leandro Miletto Tonetto

Universidade do Vale do Rio dos Sinos – Unisinos

______________________________________

Prof. Dr. Heli Meurer

Centro Universitário Ritter dos Reis - UniRitter

Page 4: UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS …biblioteca.uniritter.edu.br/imagens/035UNR89/0000F1/0000F128.pdf · LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS

Dedico este trabalho à minha mãe, professora Rosane

Felhauer, meu maior exemplo de competência e dedicação,

pelo apoio incondicional em todos os momentos e por sempre

me incentivar a buscar no meio acadêmico minha realização

profissional e pessoal.

Page 5: UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS …biblioteca.uniritter.edu.br/imagens/035UNR89/0000F1/0000F128.pdf · LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS

AGRADECIMENTOS Agradeço aos professores do Mestrado em Design da UniRitter, em especial ao

Prof. Dr. Wilson Pires Gavião Neto, pelos ensinamentos e orientações.

Aos colegas de Mestrado, que tornaram essa experiência leve e cheia de risadas.

Às colegas Fabiana Lautert e Suelen Rizzi, pela amizade que construímos e pelo

ilimitado apoio, fundamental na conclusão deste trabalho.

À Profa. Andrea Capra, pela paciência, compreensão e generosidade durante o

estágio docente.

Ao Prof. Dr. Leandro Tonetto e Prof. Dr. Heli Meurer, que gentilmente aceitaram

formar a banca examinadora dessa dissertação.

Ao Santiago, meu parceiro de todas as horas, pela infinita paciência e por estar

sempre ao meu lado.

Ao meu Daniel, por ser muito mais que um pai e por sempre acreditar em mim.

À tia Patrícia, pelo gentil e essencial auxílio ao longo deste trabalho.

Às amigas Anne e Jéssica, por sempre estarem por perto.

Page 6: UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS …biblioteca.uniritter.edu.br/imagens/035UNR89/0000F1/0000F128.pdf · LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS

RESUMO No cenário do fast fashion e da constante evolução do e-commerce, este estudo pretende analisar a possível contribuição de dados disponíveis na web no desenvolvimento de Data-driven Personas para o Design de moda, partindo da premissa de que a ferramenta Persona é útil para o processo de criação do Design de moda e de que existem dados amplamente disponíveis na web que podem servir como insumo para o desenvolvimento de Personas. Com base na questão “como desenvolver Data-driven Personas para o Design de moda a partir de dados de usuário disponíveis na web?”, se propõe um não experimento em que são utilizados dados de avaliações de usuários sobre produtos de vestuário de um e-commerce, com o objetivo de buscar os produtos que são frequentemente bem avaliados em conjunto e, a partir disso, analisar se estes dados podem servir como insumo no desenvolvimento de Data-driven Personas para o Design de moda. Para tanto, emprega-se o método KDD para a mineração de padrões frequentes no conjunto de dados selecionado, o qual é constituído de 161.041 avaliações, 25.307 usuários e 17.729 produtos, resultando em 5766 conjuntos de itens frequentes. Foram realizadas análises exploratórias e qualitativas que apontaram, principalmente, os baixos valores de suporte dos conjuntos de itens frequentes encontrados, como também as possibilidades na associação de conjuntos relacionados a um item como forma de indicar as preferências de estilo dos usuários. É apresentada, então, uma discussão dos resultados, em que são avaliadas as implicações do estudo e suas limitações, a relação entre os resultados e estudos existentes, além de indicar se a questão de pesquisa pode ser respondida. Propõe-se um modelo para desenvolvimento de Data-driven Personas para o Design de moda, a partir da mineração de padrões frequentes de dados de avaliações de itens de vestuário em associação à abordagem Fiction-based, na qual o designer utiliza suas experiências e intuições no desenvolvimento de personas. Este modelo possibilita ao designer elaborar narrativas para as personas com base em sua própria interpretação dos dados e proporciona a rastreabilidade aos dados originais, embora as personas desenvolvidas a partir desse modelo possam apresentar maior subjetividade do que em outros métodos.

Palavras-chave: Data-driven personas. Design de Moda. Mineração de dados.

Page 7: UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS …biblioteca.uniritter.edu.br/imagens/035UNR89/0000F1/0000F128.pdf · LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS

ABSTRACT

In the fast fashion and e-commerce constant evolution context, this study intends to

analyze the possible contributions of available data on the web in the development of

Data-driven Personas for Fashion Design, starting from the premise that the Persona

tool is useful for the creation process of Fashion Design and that there are widely

available data on the web that can serve as input for the development of Personas.

Based on the question "how to develop Data-driven Personas for Fashion Design

from user data available on the web?", this study proposes a non-experiment in

which user evaluation data on clothing products of an e-commerce are used in order

to seek the products that are often well evaluated together and, from this, analyze is

this data can serve as input in the development of Data-driven Personas for Fashion

Design. To do so, the KDD method is used for the frequent pattern mining in the

selected data set, which consists of 161,041 evaluations, 25,307 users and 17,729

products, resulting in 5766 sets of frequent items. Exploratory and qualitative

analyzes were carried out, mainly pointing out the low support values of the frequent

item sets found, as well as the possibilities in the association of sets related to an

item as a way of indicating the style preferences of the users. A discussion of the

results is presented, which evaluates the implications of the study and its limitations,

the relationship between the results and existing studies, and indicate if the research

question can be answered. Then, it is proposed a model for the development of

Data-driven Personas for Fashion Design, from the mining of frequent patterns of

data of evaluations of clothing items in association with the Fiction-based approach,

in which the designer uses his experiences and intuitions on the development of

personas. This model allows the designer to elaborate narratives for the personas

based on their own interpretation of the data and provides the traceability to the

original data, although the developed personas from this model can present greater

subjectivity than in other methods.

Keywords: Data-driven personas. Fashion Design. Data Mining.

Page 8: UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS …biblioteca.uniritter.edu.br/imagens/035UNR89/0000F1/0000F128.pdf · LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS

LISTA DE FIGURAS Figura 1 – Ciclo de vida da Persona ......................................................................... 20

Figura 2 – 8 Etapas no Processo de Design ............................................................ 24

Figura 3 – Visão geral das etapas do processo KDD ............................................... 43

Figura 4 – Relação entre os conjuntos de itens frequentes de maior suporte .......... 61

Figura 5 – Relação entre conjuntos de itens frequentes........................................... 62

Figura 6 – Relação entre o item 2 e seus conjuntos de itens frequentes ................. 65

Figura 7 – Relação entre o item 2 e seus conjuntos de itens frequentes “esportivos”... 66

Figura 8 – Itens relacionados ao item 2 em um segundo nível ................................. 66

Figura 9 – Itens relacionados ao item 4 .................................................................... 67

Figura 10 – Exemplo de agrupamento em segundo nível ........................................ 68

Figura 11 – Modelo proposto de Data-driven Persona ............................................. 70

Page 9: UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS …biblioteca.uniritter.edu.br/imagens/035UNR89/0000F1/0000F128.pdf · LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS

LISTA DE QUADROS

Quadro 1 – 10 Etapas para Personas ...................................................................... 22

Quadro 2 – Pesquisa de mercado ............................................................................ 25

Quadro 3 – Pesquisa de moda ................................................................................. 26

Quadro 4 – Exemplo de regra de associação ........................................................... 45

Quadro 5 – Informações presentes nos conjuntos de dados .................................... 51

Quadro 6 – Atributos selecionados no estudo .......................................................... 51

Quadro 7 – Ranking dos 5 itens mais avaliados ....................................................... 59

Quadro 8 – Conjuntos de itens frequentes do item 1................................................ 60

Quadro 9 – Conjuntos de itens frequentes do item 4................................................ 60

Quadro 10 – Títulos dos itens apresentados na figura 7 .......................................... 62

Quadro 11 – Conjuntos de itens similares ................................................................ 63

Quadro 12 – Maior conjunto de itens frequentes encontrado ................................... 64

Quadro 13 – Alternativa do maior conjunto de itens frequentes encontrado ............ 65

Page 10: UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS …biblioteca.uniritter.edu.br/imagens/035UNR89/0000F1/0000F128.pdf · LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS

LISTA DE TABELAS

Tabela 1 – Exemplo de regras extraídas do algoritmo ............................................. 46

Tabela 2 – Parâmetros de entrada do algoritmo ...................................................... 46

Tabela 3 – Parâmetros de saída do algoritmo .......................................................... 47

Tabela 4 – Quantidade de avaliações em relação ao rating ..................................... 52

Tabela 5 – Filtragem dos dados e quantidade final .................................................. 52

Tabela 6 – Distribuição dos dados pela quantidade de itens avaliados por usuário . 53

Tabela 7 – Distribuição dos dados pelos itens avaliados por usuário....................... 53

Tabela 8 – Exemplo do ranking da quantidade de usuários por item avaliado ......... 54

Tabela 9 – Exemplo da transformação usuário/itens avaliados ................................ 54

Tabela 10 – Exemplo dos dados de entrada ............................................................ 55

Tabela 11 – Exemplo dos dados de saída: conjuntos de itens frequentes ............... 56

Tabela 12 – Exemplo dos dados de saída: regras de associação ............................ 56

Page 11: UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS …biblioteca.uniritter.edu.br/imagens/035UNR89/0000F1/0000F128.pdf · LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS

LISTA DE GRÁFICOS Gráfico 1 – Relação entre a porcentagem de usuários e a quantidade de itens avaliados . 57

Gráfico 2 – Relação entre a quantidade de itens avaliados por grupo de usuários .. 58

Gráfico 3 – Quantidade de avaliações por item ........................................................ 58

Page 12: UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS …biblioteca.uniritter.edu.br/imagens/035UNR89/0000F1/0000F128.pdf · LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS

SUMÁRIO

1 INTRODUÇÃO ...................................................................................................... 12

2 FUNDAMENTAÇÃO TEÓRICA ............................................................................ 15

2.1 PERSONAS.................................................................................................... 16

2.1.1 Abordagens para Personas ................................................................ 18

2.2 PROCESSO DE CRIAÇÃO NO DESIGN DE MODA ..................................... 23

2.3 TRABALHOS RELACIONADOS .................................................................... 30

2.3.1 Data-driven Personas ......................................................................... 31

2.3.2 Tecnologias orientadas a dados na moda ........................................ 35

2.3.3 Sistemas de recomendação para a moda ......................................... 38

3 METODOLOGIA .................................................................................................... 42

3.1 ANÁLISE DOS DADOS: APLICAÇÃO DO MÉTODO KDD ............................ 43

4 ESTUDO PROPOSTO .......................................................................................... 48

4.1 SELEÇÃO DOS DADOS ................................................................................ 50

4.2 PRÉ-PROCESSAMENTO DOS DADOS ........................................................ 52

4.3 TRANSFORMAÇÃO DOS DADOS ................................................................ 54

4.4 MINERAÇÃO DOS DADOS ........................................................................... 55

4.5 INTERPRETAÇÃO DOS DADOS ................................................................... 56

4.5.1 Análise exploratória dos dados ......................................................... 57

4.5.2 Análise qualitativa dos dados ............................................................ 61

5 DISCUSSÃO DE RESULTADOS .......................................................................... 67

6 CONSIDERAÇÕES FINAIS .................................................................................. 72

REFERÊNCIAS ........................................................................................................ 75

Page 13: UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS …biblioteca.uniritter.edu.br/imagens/035UNR89/0000F1/0000F128.pdf · LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS

12

1 INTRODUÇÃO

No contexto da globalização e da constante evolução na área da moda,

muitas empresas do setor expandiram suas capacidades de integração vertical – em

que controlam diversas etapas do design, produção, marketing e distribuição – ao

mesmo tempo em que são demandadas por produtos de alta qualidade a preços

moderados, e com maior presença de tendências de moda (BURNS; MULLET;

BRYANT, 2016). Essa cadeia de fornecimento concentrada em demanda é

conhecida como “fast fashion”, e se caracteriza, principalmente, pela distribuição

frequente de pequenas coleções (ou linhas), com o objetivo de satisfazer as

demandas dos consumidores oferecendo estilos diversificados de produtos a

quantidades limitadas (HINES; BRUCE, 2007; BURNS; MULLET; BRYANT, 2016).

Em meio a esse contexto, há também a grande expansão do comércio

eletrônico de moda que, desde a metade dos anos 1990, tem evoluído em conjunto

às novas tecnologias e a percepção dos consumidores, que já esperam uma total

convergência entre o varejo online e off-line (TREPTOW, 2013; BURNS; MULLET;

BRYANT, 2016). O comércio eletrônico, também, apresenta grande potencial como

um meio de coleta indireta de dados sobre usuários, podendo ser coletados os

comportamentos do usuário durante a navegação ou a partir da análise dos

feedbacks implícitos (como o histórico de compras) e explícitos (como avaliações de

produtos), entre outros (PECHOUX et al., 2007; HE; MCAULEY, 2016).

O “negócio da moda” tem como etapa inicial a pesquisa e merchandising, em

que são conduzidas pesquisas de tendências e de mercado a fim de se obter o

produto certo no preço adequado sendo distribuído no momento ideal nas

quantidades e locais corretos, com o objetivo principal de ser coerente com os

desejos e necessidades dos consumidores-alvo (BURNS; MULLET; BRYANT,

2016). Conforme Cobra (2007, p. 26), o mercado da moda acompanha as

tendências dos “[...] estilos de vida das pessoas, seus comportamentos e

principalmente seus desejos.”, deixando clara a relevância do consumidor durante o

processo de criação e desenvolvimento de produtos. Assim, torna-se necessário que

a equipe de projeto tenha clareza sobre o perfil do consumidor-alvo, sendo

utilizadas, para tanto, ferramentas como moodboards e “musas”, que funcionam

como representação do perfil do consumidor e como fonte de inspiração para o

designer ao longo do desenvolvimento de uma coleção (BURNS; MULLET;

Page 14: UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS …biblioteca.uniritter.edu.br/imagens/035UNR89/0000F1/0000F128.pdf · LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS

13

BRYANT, 2016; LEACH, 2012; JONES, 2013). Percebe-se que em ambas

ferramentas o designer parte de suposições ao buscar definir um perfil de

consumidor-alvo – o qual muitas vezes é considerado como o “consumidor ideal” ou

“inspiracional” –, podendo resultar em uma desvantagem em relação a outras

ferramentas que utilizam dados de usuário para tanto (RENFREW; RENFREW,

2009).

Dessa forma, a ferramenta projetual Persona – proveniente do contexto do

Design de Interação e introduzida e disseminada por Alan Cooper – pode ser uma

alternativa à equipe de Design, já que é capaz de sintetizar os resultados da

pesquisa de usuário, gerando empatia e engajamento entre a equipe, além de

possibilitar a tomada de decisões baseada em dados de usuários (PRUITT; ADLIN,

2006; COOPER, 2004; MARSHALL et al., 2015; NIELSEN, 2013).

A principal limitação quanto a utilização da ferramenta está na falta de clareza

entre as personas criadas e os dados utilizados, o que pode resultar em uma falta de

credibilidade no seu uso (PRUITT; GRUDIN, 2003; MULDER; YAAR, 2006).

Personas desenvolvidas a partir de abordagens qualitativas apresentam caráter

mais subjetivo do que as quantitativas, além de poderem não representar totalmente

os usuários típicos de um determinado público-alvo, já que os dados dos usuários

não são claramente rastreáveis (MULDER; YAAR, 2006). Entende-se, portanto, que

a relação entre as personas criadas e os dados utilizados deva ser o mais

determinável possível, possibilitando sua validade (CHAPMAN; MILHAM, 2006).

Para tanto, são propostas as chamadas Data-driven Personas, isto é, Personas

desenvolvidas com base em dados de usuários, nas quais se utilizam técnicas

quantitativas para a coleta de dados, a fim de evitar a subjetividade na interpretação

e possibilitar a rastreabilidade dos dados utilizados (MESGARI; OKOLI; GUINEA,

2015).

Há diversos estudos sobre a utilização de grandes quantidades de dados no

desenvolvimento de Personas – Data-driven Personas –, os quais abrangem

diversas formas de coleta de dados sobre usuários, e visam a menor dependência

de crenças e subjetividade ao longo do desenvolvimento (PRUITT; GRUDIN, 2003;

MCGINN; KOTAMRAJU, 2008). Por outro lado, percebe-se um limitado referencial

teórico disponível acerca da relação entre a ferramenta Persona e o Design de

moda, sendo encontrado apenas um estudo (BRALLIER, 2016) que indica esta

relação mas que, por apresentar abordagem majoritariamente qualitativa e utilizar

Page 15: UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS …biblioteca.uniritter.edu.br/imagens/035UNR89/0000F1/0000F128.pdf · LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS

14

uma amostra de dados de 52 usuários, o estudo não é considerado viável no

desenvolvimento de Data-driven Personas, já que não apresenta uma quantidade

representativa do público-alvo (MESGARI; OKOLI; GUINEA, 2015).

Este estudo delineou-se a partir de enfoque quantitativo e alcance descritivo,

sendo o desenho de pesquisa caracterizado por um não experimento de caráter

transversal descritivo (HERNÁNDEZ SAMPIERI; FERNÁNDEZ COLLADO;

BAPTISTA LUCIO, 2013). A seleção da amostra qualifica-se como não probabilística

e utiliza dados secundários, os quais foram buscados na web a partir dos requisitos:

(1) envolver a área da moda; (2) apresentar grande conjunto de dados (big data1); e

(3) conter informações acerca de usuários (HERNÁNDEZ SAMPIERI; FERNÁNDEZ

COLLADO; BAPTISTA LUCIO, 2013). Na análise dos dados emprega-se o método

de descoberta de conhecimento em bases de dados denominado de KDD

(Knowledge Discovery in Databases), o qual estrutura-se em etapas que

compreendem a seleção dos dados, pré-processamento, transformação, mineração

e interpretação dos resultados (FAYYAD; PIATETSKY-SHAPIRO; SMYTH, 1996a).

Relacionado ao problema de pesquisa deste estudo, são apresentadas duas

premissas iniciais, que são: (a) a utilidade da ferramenta Persona para o processo

de criação do Design de moda; (b) a existência de dados amplamente disponíveis na

web que podem servir como insumo para o desenvolvimento de Personas. Sendo

assim, a partir das ferramentas de representação de consumidor-alvo identificadas

no Design de moda e do limitado referencial teórico disponível acerca da relação

entre a ferramenta Persona e o Design de moda, o problema de pesquisa se

desenvolve acerca da questão: como desenvolver Data-driven Personas para o

Design de moda a partir de dados de usuário disponíveis na web?

Desse modo, este trabalho explora as oportunidades da utilização da

ferramenta Persona no Design de moda e busca analisar as possíveis contribuições

de dados amplamente disponíveis na web no desenvolvimento de Data-driven

Personas, bem como investigar o cenário do comércio eletrônico como fonte de

dados sobre usuários. Para tanto, apresenta-se os seguintes objetivos:

1 aws.amazon.com/pt/big-data/what-is-big-data/

Page 16: UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS …biblioteca.uniritter.edu.br/imagens/035UNR89/0000F1/0000F128.pdf · LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS

15

Objetivo Geral Análise a respeito da possível contribuição de dados amplamente disponíveis na

web no desenvolvimento de Data-driven Personas para o Design de moda.

Objetivos Específicos a. Conceituar a ferramenta Persona e suas diferentes abordagens;

b. Identificar em qual etapa do processo de criação do Design de moda a

ferramenta Persona pode ser inserida;

c. Apontar os métodos utilizados na coleta de dados em estudos sobre Data-

driven Personas;

d. Investigar a existência de trabalhos que relacionem as áreas de Personas e o

Design de moda;

e. Identificar os tipos de dados de usuário existentes na web;

f. Minerar e interpretar dados coletados da web.

A estrutura desta dissertação apresenta-se da seguinte forma: no capítulo 2, de

fundamentação teórica, é levantada uma revisão teórica acerca da ferramenta

Persona, das etapas do processo de criação no Design de moda, e uma busca de

trabalhos acerca de áreas relacionadas a este estudo. No capítulo 3, de

metodologia, é apresentado um delineamento formal do estudo, em que são

especificados os procedimentos metodológicos da investigação, bem como o

método de descoberta de conhecimento em bases de dados KDD. No capítulo 4, é

apresentado o estudo proposto, em que são utilizados dados de avaliações de

usuários acerca de produtos de vestuário de uma loja virtual, em que se busca

encontrar possíveis insumos que auxiliem no desenvolvimento de Data-driven

Personas para o Design de moda. Então, no capítulo 5 é apresentada uma

discussão dos resultados encontrados, em que são avaliadas as implicações do

estudo, bem como suas limitações e oportunidades. E por fim, no capítulo 6, são

apresentadas as considerações finais deste estudo.

2 FUNDAMENTAÇÃO TEÓRICA

Este capítulo consiste no desenvolvimento da perspectiva teórica que, de

acordo com Hernández Sampieri, Fernández Collado e Baptista Lucio (2013, p.

Page 17: UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS …biblioteca.uniritter.edu.br/imagens/035UNR89/0000F1/0000F128.pdf · LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS

16

75),”[...] proporciona uma visão sobre onde se situa a formulação proposta dentro do

campo de conhecimento [...]” no qual se investiga. Sendo assim, compõem a base

do desenvolvimento da perspectiva teórica deste estudo: (2.1) uma revisão teórica

acerca da ferramenta Persona, apresentando suas principais abordagens; (2.2) as

etapas do processo de criação no Design de moda; e uma busca de (2.3) trabalhos

relacionados acerca de Data-driven Personas, tecnologias orientadas a dados na

moda, e sistemas de recomendação para a moda.

2.1 PERSONAS

Para que sejam desenvolvidos produtos e/ou serviços focados no usuário, é

necessário que, primeiro, sejam consideradas suas preferências, motivações,

frustrações, etc., o que é feito a partir dos dados resultantes da pesquisa de usuário

(ADLIN; PRUITT, 2010). Muitas vezes, a equipe que executa as pesquisas de

mercado e de usuário não é a mesma que fará parte do processo projetual, podendo

acarretar em falhas e baixa eficiência (PRUITT; ADLIN, 2006). Considerando a

dificuldade que a equipe de projeto pode ter em entender o usuário, ainda existem

as diferenças de interpretação em relação às informações recebidas, além de

possíveis falhas quanto a funcionalidade das informações na tomada de decisões

projetuais (PRUITT; ADLIN, 2006).

Percebe-se, assim, a importância da Persona como ferramenta projetual

capaz de concretizar as características de um público-alvo e criar empatia e

engajamento na equipe de Design (PRUITT; ADLIN, 2006). Conforme Floyd, Jones

e Twidale (2008, p. 15), “isso funciona porque uma Persona nos dá um modelo

mental operacional de um tipo particular de usuário”.

Personas são “[...] modelos descritivos de usuários arquetípicos derivados da

pesquisa do usuário.” que sintetizam objetivos, motivações e comportamentos de um

determinado grupo de pessoas (MARSHALL et al., 2015, p. 311, tradução nossa). A

noção de Persona como um meio para descrever usuários fictícios foi introduzida e

disseminada por Alan Cooper que, no contexto do Design de Interação, publicou em

1999 o livro “The Inmates are Running the Asylum”, no qual apresenta o método

Goal-directed identificando a Persona como uma das ferramentas de Design

(COOPER, 2004; MARSHALL et al., 2015; NIELSEN, 2013). Conforme Nielsen:

Page 18: UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS …biblioteca.uniritter.edu.br/imagens/035UNR89/0000F1/0000F128.pdf · LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS

17

Persona é uma ferramenta de design eficiente devido à nossa capacidade cognitiva de usar conhecimento fragmentado e incompleto para criar uma visão completa sobre as pessoas que nos cercam. (NIELSEN, 2013, p. 15, tradução nossa).

A Persona é considerada uma ferramenta que auxilia a equipe de projeto a

obter engajamento e empatia com o usuário final, além de apresentar características

que são valorizadas pelos designers, como a facilidade de buscar informações

visualmente atrativas e de forma rápida (GRUDIN; PRUITT, 2002; MARSHALL et al.,

2015). Além disso, tem como propósito unificar o entendimento da equipe de Design

a respeito de seus usuários e contextos de uso dos produtos/serviços que se

pretende projetar, divulgando e relembrando as descrições das personas durante

todo o processo projetual (NIELSEN, 2013). Segundo Harley (2015), a partir dos

dados coletados na pesquisa de usuário, o processo de criação de Personas

consiste em: (1) identificar as características dos usuários e associá-las em clusters;

(2) agrupar as características similares ou eliminar grupos que não sejam relevantes

para o negócio/projeto; (3) identificar papeis distintos entre estas similaridades; e (4)

adicionar detalhes como nome, idade, gênero, foto, etc.

Ao adicionar detalhes à narrativa da persona criada, a equipe projetual é

capaz de ter uma visão mais realista e memorável da persona ao longo do

desenvolvimento do projeto, o que é relevante já que uma das principais funções da

ferramenta é “[...] garantir que todos os membros da equipe se lembrem dos

usuários para os quais estão construindo o produto.” (HARLEY, 2015). A

essencialidade dos detalhes, porém, deve ser avaliada, pois informações em

excesso podem sobrecarregar a narrativa e torná-la menos memorável.

Personas funcionam em conjunto com outras ferramentas e auxiliam na

comunicação de dados coletados por outros métodos de pesquisa, bem como

técnicas da área de User Centered Design (GRUDIN; PRUITT, 2002; PRUITT;

ADLIN, 2006; ADLIN; PRUITT, 2010). A ferramenta tem como base os dados

coletados pela pesquisa de usuário e, a partir disso, mapeia arquétipos de usuários

representativos de classes de usuários que objetivam e necessitam produtos e/ou

serviços. Vale ressaltar, também, que “Cada persona personifica uma classe

específica de usuários.” (JUNIOR; FILGUEIRAS, 2005, p. 278, tradução nossa).

Entende-se que “Uma Persona não é o mesmo que um arquétipo ou uma

pessoa.” (NIELSEN, 2013, p. 7, tradução nossa), sendo essa diferença destacada

Page 19: UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS …biblioteca.uniritter.edu.br/imagens/035UNR89/0000F1/0000F128.pdf · LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS

18

pela característica da ferramenta em descrever somente os comportamentos e

atitudes que são relevantes ao contexto estudado, focando a equipe de Design na

área principal do projeto. A ferramenta é capaz de sintetizar os resultados da

pesquisa de usuário tornando possível à equipe de Design tomar decisões que se

baseiam nas personas, e não em suas próprias opiniões (MULDER; YAAR, 2006). O

uso de Personas pode ser considerado uma forma de segmentação de mercado –

como no marketing –, porém, aqui, o foco está nos “[...] objetivos e comportamentos

das pessoas no contexto específico de uso de um produto.” (BARLOW-BUSCH,

2006, p. 605, tradução nossa), já no marketing, a segmentação foca na “[...] previsão

de comportamentos no contexto da compra de um produto.” (BARLOW-BUSCH,

2006, p. 605, tradução nossa).

Chapman e Milham (2006) argumentam que personas não devem ser usadas

como um meio de comunicar dados para a equipe de projeto, até que sejam

solucionadas questões metodológicas e práticas que possibilitem verificar a relação

das personas com dados reais de usuário. Alegam, também, a dificuldade em se

determinar quantos usuários são representados pelas personas, bem como a falta

de verificação das mesmas. Para tanto, são propostas as chamadas Data-driven

Personas, ou seja, personas baseadas em dados de usuários, em que são utilizadas

técnicas quantitativas para a coleta de dados, facilitando a comunicação para a

equipe de Design e a rastreabilidade dos dados (MESGARI; OKOLI; GUINEA,

2015).

Em razão das variadas opiniões acerca da abrangência da ferramenta e dos

diferentes modelos propostos (NIELSEN, 2013), são apresentadas, a seguir, as

principais abordagens acerca de Personas.

2.1.1 Abordagens para Personas

De acordo com Nielsen (2013), existem quatro diferentes abordagens em

relação à ferramenta Persona: Goal-directed, Role-based, Engaging e Fiction-based.

As três primeiras se baseiam em dados de usuários, as quais são chamadas de

Data-driven Personas. A última, no entanto, se baseia nas suposições e intuições

dos designers, e são chamadas de ad hoc Personas (NIELSEN, 2013).

A primeira abordagem surgiu a partir do trabalho de Cooper (2004) que

denomina o método de criação de Personas como “Goal-directed Design” que “[...]

Page 20: UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS …biblioteca.uniritter.edu.br/imagens/035UNR89/0000F1/0000F128.pdf · LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS

19

fornece foco através da criação de personas fictícias cujos objetivos formam a base

para a criação de cenários” (PRUITT; GRUDIN, 2003, p. 2, tradução nossa). Como o

nome já indica, o método é orientado a objetivos, ou seja, a descrição da persona se

concentra em detalhar seus objetivos como “[...] fluxo de trabalho, metas, contextos

e atitudes [...]” (NIELSEN, 2013, p. 15, tradução nossa). O ponto principal do método

de Cooper é a descrição da persona que, ao apresentar detalhes específicos, deixa

de ser uma pessoa comum para se tornar um personagem único. Outro diferencial

deste método é a escolha de uma persona para ser a principal, enquanto as demais

podem ser utilizadas pela equipe de Design como secundárias. O método de Cooper

evoluiu, desde sua introdução, incluindo entrevistas e etnografia a fim de criar

personas mais detalhadas (NIELSEN, 2013; PRUITT; GRUDIN, 2003). Grudin e

Pruitt (2003, p. 2, tradução nossa) argumentam que o método de Cooper é baseado

em “[...] anedota e em apelos para a razão, e não em dados.”, embora afirmem que

o uso de representações de usuários – originadas no campo do marketing – de

Cooper são voltadas para o Design.

A abordagem Role-based assemelha-se ao método de Cooper em relação ao

direcionamento para objetivos, porém foca principalmente no comportamento. Ela

tem como ponto de partida a crítica em relação à abordagem de Cooper como a falta

de detalhamento sobre como as personas são construídas, o uso de cenários e a

percepção de que Cooper não se baseia em dados, mas sim na intuição. A

discordância envolvendo o uso de cenários está na “[...] falta de clareza e

consistência nas descrições dos usuários.” (NIELSEN, 2013, p. 15, tradução nossa).

O entendimento desta perspectiva é de que a Persona pode ser uma base para a

criação de cenários e coleta de dados e, por isso, não há necessidade de eliminar

outros métodos. De acordo com Grudin e Pruitt (2002, p.146, tradução nossa),

“Cenários podem ser construídos em torno das personas, mas as personas vêm

primeiro. Elas não são “agentes” ou “atores” em um roteiro, são pessoas.”.

Neste método, diferentemente do anterior, há um grande esforço para que se

colete o máximo de informações tanto quantitativa quanto qualitativa sobre os

usuários, começando pela segmentação de mercado quantitativa seguida de

pesquisas de usuários, estudos de campo, grupos focais, entrevistas e pesquisas de

mercado. Outro diferencial está na relação, que deve ser explícita e clara, entre os

dados utilizados e a descrição da persona, pois é dessa forma que ela se torna

crível para a equipe de projeto (NIELSEN, 2013; GRUDIN; PRUITT, 2002).

Page 21: UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS …biblioteca.uniritter.edu.br/imagens/035UNR89/0000F1/0000F128.pdf · LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS

20

Entende-se, portanto, que a abordagem Role-based é um método de

usabilidade que deve ser utilizada em conjunto com outros métodos. Nesta

abordagem, o perfil da persona conta com informações acerca das atividades,

motivações e receios do usuário, além de dados sobre participação e influência do

mercado (PRUITT; ADLIN, 2006; NIELSEN, 2013).

Pruitt e Adlin (2006) propõem um modelo para construção de Personas

baseadas em dados, apresentando uma “[...] estrutura metafórica que parte o

processo da persona em fases similares aos de procriação e desenvolvimento

humano.” (ADLIN; PRUITT, 2010, p. 2, tradução nossa). Este modelo é denominado

de “Persona Lifecycle” (ou “ciclo de vida da persona”), e é dividido em etapas

conforme a figura abaixo:

Figura 1 – Ciclo de vida da Persona.

Fonte: Adaptado de Adlin e Pruitt (2010, p. 8, tradução nossa).

A primeira etapa consiste no “planejamento familiar”, em que são

determinados quais os problemas que se espera resolver e quais são as fontes de

dados já disponíveis para uso (PRUITT; ADLIN, 2006; ADLIN; PRUITT, 2010). A

segunda etapa é a “concepção e gestação”, na qual são organizadas as suposições

acerca das personas a serem desenvolvidas, e são transformados os dados brutos e

conhecimentos inerentes da equipe de projeto em um conjunto de personas

completas (PRUITT; ADLIN, 2006; ADLIN; PRUITT, 2010). Parte-se, então, para o

“nascimento e maturação” que é o momento de apresentar aos demais uma

“campanha da persona”, isto é, divulgar os detalhes das personas àqueles que não

estão envolvidos no projeto, garantindo que as personas desenvolvidas sejam fáceis

de entender e que serão utilizadas (PRUITT; ADLIN, 2006; ADLIN; PRUITT, 2010).

Planejamento familiar

Concepção & Gestação

Nascimento & Maturação

Idade adulta

Realizações & Aposentadoria

Page 22: UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS …biblioteca.uniritter.edu.br/imagens/035UNR89/0000F1/0000F128.pdf · LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS

21

A etapa da “idade adulta” se caracteriza pela eficácia das personas: é a utilização

das personas desenvolvidas durante todo o processo de desenvolvimento de um

produto, assegurando que se obtenha um impacto significativo para a equipe

(PRUITT; ADLIN, 2006; ADLIN; PRUITT, 2010). A última etapa são as “realizações e

aposentadoria”, em que são medidos os sucessos das personas e desenvolvidos

planos a fim de reutilizá-las ou “aposentá-las” (PRUITT; ADLIN, 2006; ADLIN;

PRUITT, 2010).

Este método funciona para organizações que já incorporam métodos de

Design centrados no usuário ao longo do processo de desenvolvimento de produtos

(PRUITT; ADLIN, 2006; ADLIN; PRUITT, 2010). Ao incorporar o “ciclo de vida da

Persona” no desenvolvimento de produtos, a equipe de projeto consegue “estruturar

o pensamento centrado no usuário em qualquer processo de Design e

desenvolvimento” implantado (ADLIN; PRUITT, 2010, p. 8, tradução nossa).

Já na abordagem Engaging, o foco é o envolvimento proporcionado pelas

histórias, tornando possível “uma descrição vívida e realista de pessoas fictícias”

(NIELSEN, 2013, p. 15, tradução nossa). O principal objetivo desta abordagem

consiste no desenvolvimento de empatia entre o usuário e a equipe de projeto sendo

que, para isso, torna-se necessária a coleta de dados a respeito do usuário

(NIELSEN, 2013). Nesta abordagem, a descrição da persona deve conter

informações a respeito das “[...] origens dos usuários, suas características

psicológicas, e sua relação emocional com a área do projeto.” (NIELSEN, 2013, p.

16, tradução nossa). No quadro 1, apresenta-se o modelo de desenvolvimento de

Personas proposto por Nielsen (2013):

Page 23: UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS …biblioteca.uniritter.edu.br/imagens/035UNR89/0000F1/0000F128.pdf · LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS

22

Quadro 1 – 10 Etapas para Personas.

Fonte: Adaptado de Nielsen (2013, p. 3, tradução nossa).

O modelo apresentado (quadro 1) constitui-se, essencialmente, de quatro

partes: coleta e análise dos dados (etapas 1 e 2); descrições da Persona (etapas 4 e

5); cenários para análise de situações/problemas e desenvolvimento de ideias

(etapas 6 e 9); e a aceitação da organização e envolvimento da equipe (etapas 3, 7,

8 e 10) (NIELSEN, 2013). Pode-se perceber que a abordagem Engaging objetiva

analisar o “todo” do usuário, em contraste com outras abordagens que, segundo o

entendimento de Nielsen (2013, p. 16, tradução nossa), “são criticadas por criar um

risco para descrições estereotipadas [...]”, já que quando o foco está somente no

comportamento do usuário, pode-se limitar a extensão de características relevantes

para a persona.

Perguntas Métodos Usados Documentos Produzidos

1. Encontrando os usuários

• Quem são os usuários? • Quantos usuários existem? • O que os usuários fazem no sistema?

Coleta de dados quantitativos

Relatórios

2. Construindo uma hipótese

• Quais são as diferenças entre os usuários?

• Análise do material; • Agrupamento dos

usuários; • Identificar e nomear os

grupos;

Descrição preliminar dos grupos-alvo

3. Verificações

Dados para personas: • Preferências - necessidades internas -

valores; Dados para situações: • Área de trabalho - condições de trabalho; Dados para cenários: • Estratégias de trabalho e objetivos; • Estratégias de informação e objetivos.

Coleta de dados qualitativos

Relatórios

4. Encontrando padrões

• O agrupamento inicial é válido? • Existem outros grupos a serem

considerados? • São todos igualmente importantes?

Categorização Descrição de categorias

5. Construindo personas

• Corpo - nome, idade, foto; • Psique - extrovertido/introvertido; • Background - ocupação; • Emoções e atitudes - a respeito da

tecnologia, empresa, informação; • Traços pessoais.

Categorização Descrição de categorias

6. Definindo situações• Quais são as necessidades dessa

persona? • Quais são as situações?

Análise de dados para situações e

necessidades

Catálogo de necessidades e situações

7. Validação e buy-in • Você conhece alguém assim?

Pessoas que conhecem as personas lêem e

comentam as descrições das personas

-

8. Disseminação do conhecimento

• Como podemos compartilhar as personas com a organização?

Posters, reuniões, e-mails, campanhas,

eventos-

9. Criando cenários• Em uma dada situação, com um

determinado objetivo, o que acontece quando a persona usa a tecnologia?

O cenário narrativo - usando personas,

descrições e situações para formar cenários

Cenários, casos de uso, requisitos, especificações

10. Desenvolvimento em andamento • Novas informações alteram as pessoas?

Testes de usabilidade, nova coleta de dados,

feedbacks sobre usuários de todos aqueles que interagem com eles

Documento de fundação

Page 24: UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS …biblioteca.uniritter.edu.br/imagens/035UNR89/0000F1/0000F128.pdf · LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS

23

A abordagem Fiction-based não é baseada em dados para descrever a

persona, mas sim nas experiências e intuição do designer (NORMAN, 2004). É

também utilizada para desenvolver empatia no processo de Design, bem como para

ajudar a equipe a discutir o projeto e obter novas ideias no campo (FLOYD; JONES;

TWIDALE, 2008). Segundo Norman (2004), Personas nem sempre precisam ter

embasamento em dados de usuários, a fim de possibilitar ao designer utilizar suas

experiências de vida para resolver o problema projetual. Por outro lado, Nielsen

(2013, p. 64) entende a relação entre dados e ficção como uma forma de apoio na

comunicação das personas para a equipe, mas não em seu desenvolvimento.

Também há o método de personagens extremos proposto por Djajadiningrat, Gaver

e Frens (2000), que busca sair da abordagem tradicional e pretende expor os traços

mais “indesejáveis” dos usuários – que podem ser considerados incorretos ou

embaraçosos – a fim de gerar ideias inovadoras e impactantes.

A fim de averiguar a premissa exposta na introdução deste trabalho – a

utilidade da ferramenta Persona para o processo de criação do Design de moda – é

apresentada a seguir uma revisão de literatura acerca das etapas do processo de

criação no Design de moda.

2.2 PROCESSO DE CRIAÇÃO NO DESIGN DE MODA

O processo de criação no Design de moda “[...] envolve a coleta e análise de

informações sobre tendências de moda, mercados e vendas anteriores [...]”

(PECHOUX, et al., 2007, p. 188, tradução nossa), além de ideias para novas

combinações de tecidos, estilos e preço, que é resultado da criatividade do designer.

Geralmente, todas as etapas são envolvidas durante o processo de Design, desde a

geração de ideias até o desenvolvimento de protótipos do produto final, sendo as

informações acerca do mercado, público-alvo e vendas particularmente importantes

no início do processo. Nas etapas seguintes, os conhecimentos de Design, materiais

e processos são fundamentais para que sejam criados novos produtos (BURNS;

MULLET; BRYANT, 2011).

As coleções de vestuário desenvolvidas por designers de moda têm como

intuito satisfazer uma demanda e/ou desejo de um público-alvo (BURNS; MULLET;

BRYANT, 2011). A forma de prever essas demandas se dá a partir de pesquisas de

mercado e usuário, e análise de vendas passadas, bem como por meio de

Page 25: UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS …biblioteca.uniritter.edu.br/imagens/035UNR89/0000F1/0000F128.pdf · LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS

24

contribuições de varejistas experientes, fabricantes e compradores (PECHOUX et

al., 2007; BURNS; MULLET; BRYANT, 2011). Para Burns, Mullet e Bryant (2011),

existem 8 etapas no processo de Design de moda, conforme abaixo:

Figura 2 – 8 Etapas no Processo de Design.

Fonte: Adaptado de Burns, Mullet e Bryant (2011, p. 166, tradução nossa).

Entende-se que o processo de criação conceitual, em que são necessárias

pesquisas e inspirações, compreende as etapas 1 e 2 e, por isso, se constituem

como foco desta revisão. A seguir, serão detalhadas as etapas mencionadas, com

destaque na elucidação dos conceitos acerca das pesquisas de mercado e de moda.

Segundo Mete (2006, p. 289, tradução nossa) “Todo designer na indústria da

moda deve estar envolvido com pesquisas e análises.”, percebendo o consumidor

ao entender seu estilo de vida e suas necessidades e desejos no futuro previsível.

Etapa 1 - Pesquisa e Merchandising

Etapa 3 - Desenvolvimento de Design e Seleção de Estilo

Etapa 2 - Design

Pesquisa de mercado:

• Pesquisa de consumidor

• Pesquisa de produto

• Análise de mercado

• Perfil de consumidor alvo

Pesquisa de moda:

• Pesquisa de tendências de moda

• Pesquisa de cor

• Pesquisa de tecido e acabamentos

Planejamento sazonal e de linha

• Inspiração de design

• Planeje a linha

• Desenhe esboços e obtenha amostras de fornecedores

• Selecione ou desenvolva tecidos e acabamentos

• Revise e selecione estilos para desenvolvimento de linha

• Escreva a folha de especificações de vestuário e custo rápido

• Faça o primeiro padrão

• Corte e costure o protótipo

• Aprove o fit do protótipo, revise o estilo, ou largue o estilo

• Estime o custo (estimativa inicial de custo)

• Apresente e revise a linha

• Selecione estilos para linha final (adoção de linha)

• Determine o custo final

• Encomende tecido, acabamentos, e resultados para amostras de vendas

• Encomende amostras de vendas cortadas e costuradas

Etapa 4 - Marketing da Linha de Vestuário

Etapa 5 - Pré-produção

Etapa 6 - Sourcing

Etapa 7 - Processos de Produção de Vestuário, Gerenciamento de Materiais e Garantia de Qualidade

Etapa 8 - Distribuição e Varejo

Page 26: UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS …biblioteca.uniritter.edu.br/imagens/035UNR89/0000F1/0000F128.pdf · LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS

25

Para tanto, é necessário estudar as condições do mercado e o quanto o “[...]

consumidor é influenciado pela sociedade, economia, tecnologia e meio ambiente”

(METE, 2006, p. 289, tradução nossa), bem como analisar as estatísticas de venda,

a fim de estabelecer tendências. O processo de criação do Design de moda,

conforme apresentado na figura 2, inicia-se pelas pesquisas de mercado e de moda,

sendo que a pesquisa de mercado se divide em pesquisa de consumidor, pesquisa

de produto, análise de mercado e perfil de consumidor alvo, como apresentado

abaixo:

Quadro 2 – Pesquisa de mercado.

Fonte: Burns, Mullet e Bryant (2011).

Percebe-se a importância do consumidor no Design de moda, tanto ao buscar

compreender seu estilo de vida, comportamentos, motivações etc., quanto pela

demanda de feedbacks dos usuários a respeito dos produtos que são oferecidos.

Para Burns, Mullet e Bryant (2016), a equipe de Design deve ter, durante todo o

processo de desenvolvimento e criação, clareza sobre o perfil do consumidor-alvo.

Sendo assim, a constante atualização e revisão deste perfil é fundamental para que

a coleção/linha tenha êxito, ou seja, que os produtos desenvolvidos pela equipe de

Design sejam capazes de atrair os clientes (BURNS; MULLET; BRYANT, 2011).

Para isso, torna-se necessário buscar regularmente dados sobre os consumidores,

de forma que o designer possa traçar um perfil realista do consumidor-alvo.

Pesquisa de Consumidor Pesquisa de Produto Análise de Mercado Perfil de Consumidor Alvo

Objetivos

Compreender as características e

comportamento do público-alvo

Determinar as preferências dos

consumidores acerca dos produtos

Buscar a analisar as tendências gerais do mercado

Definir claramente o perfil do consumidor alvo da empresa

Dados

• Informações demográficas - idade, gênero, profissão, renda etc.;

• Informações psicográficas - comportamento de compra, valores, motivações, preferências, personalidade etc.

• Questionários online ou offline;

• Envio de amostras para consumidores em troca de feedback;

• Feedbacks de vendedores e representantes de vendas;

• Redes sociais como canal de comunicação direto com o consumidor final.

• Previsão de curto alcance: - tendências de mercado

de 1 ano ou menos; - determinação da

porcentagem de crescimento da empresa;

- análise da concorrência;

• Previsão de longo alcance:

- tendências de mercado entre 1 a 5 anos;

- tendências econômicas relacionadas aos padrões de consumo

- inclui tendências sociológicas, psicológicas, políticas e globais.

• Características demográficas e psicográficas da maioria dos consumidores;

• Elaboração de um perfil de consumidor "típico" para auxiliar:

- na identificação das tendências de mercado relacionadas ao consumidor;

- no desenvolvimento de um primeiro direcionamento da coleção/linha;

- no desenvolvimento de esboços de estilos e conceitos de cor.

Page 27: UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS …biblioteca.uniritter.edu.br/imagens/035UNR89/0000F1/0000F128.pdf · LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS

26

A Internet apresenta-se como um meio significativo para a coleta de dados

sobre os consumidores, ao permitir que designers/varejistas obtenham um canal de

comunicação com os clientes, enquanto monitoram e analisam as informações

disponibilizadas por cada usuário. A Internet possibilita, também, a captação de

novos clientes para o e-commerce, já que se caracteriza como um mercado global

que atinge diversos tipos de pessoas. Para Pechoux et al. (2007), as informações

disponibilizadas por clientes na Internet é mais uma forma de coleta de dados sobre

consumidores, além dos métodos tradicionais provenientes do marketing.

Na área da moda, uma forma de representar os conceitos do perfil do

consumidor se dá a partir da utilização de “musas”. Historicamente, elas eram as

inspirações para os grandes designers de moda, como Audrey Hepburn para

Givenchy, Catherine Deneuve para Yves Saint Laurent, Inès de la Fressange e

Amanda Harlech para Chanel e Isabella Blow para McQueen. Ao utilizar uma

“musa”, espera-se que o designer imagine uma cliente ideal que sirva como fonte de

inspiração para o desenvolvimento da coleção. Atualmente, porém, com o culto às

celebridades, o papel da “musa” pode tornar-se confuso, uma vez que cantoras,

atrizes e modelos apresentam-se como ícones de estilo para variadas marcas e

designers (LEACH, 2012; JONES, 2013).

Outra etapa do processo de criação é a pesquisa de moda, que tem como

foco buscar as “[...] tendências de silhueta, detalhes de design, cores, tecidos e

acabamentos.” (BURNS; MULLET; BRYANT, 2011, p. 185). Divide-se em pesquisa

de tendências, cor, e tecidos e acabamentos, conforme abaixo:

Quadro 3 – Pesquisa de moda.

Fonte: Burns, Mullet e Bryant (2011).

Pesquisa de Tendências Pesquisa de Cor Pesquisa de tecidos e acabamentos

• Publicações específicas sobre tendências de moda;

• Revistas populares de moda; • Desfiles de moda; • Feiras de tendências de tecidos e

vestuário; • Softwares desenvolvidos para

analisar as tendências de consumo dos consumidores - o que estão comprando, onde, quando etc.;

• Compras em outras lojas de vestuário;

• Análise de consumidores "na rua" ou em locais determinados pelo foco da coleção.

• Uma ou mais cores básicas são incluídas em cada nova coleção/linha;

• Cores de moda aparecem com menos frequência do que as básicas;

• Cores de moda seguem ciclos, reaparecendo com tonalidades diferentes a cada estação;

• Serviços de previsão de cores podem ser utilizados;

• Designers e comerciantes selecionam uma paleta de cores para o tema da coleção/linha.

• Publicações específicas sobre tendências de moda;

• Publicações sobre o mercado têxtil;

• Novidades do setor são apresentadas por representantes do mercado e/ou fabricantes;

• Feiras do setor;

Page 28: UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS …biblioteca.uniritter.edu.br/imagens/035UNR89/0000F1/0000F128.pdf · LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS

27

Essa etapa é desenvolvida a partir de influências observadas na indústria do

vestuário, indústrias relacionadas – como têxtil, calçados, acessórios, mobiliário, etc.

–, setores como entretenimento, esporte, música e automóveis, bem como de

movimentos culturais, sociais, tecnológicos, econômicos, etc. A partir de todos esses

elementos, constatados pela pesquisa de moda, são determinados conceitos e

temas para a próxima coleção/linha (HINES; BRUCE, 2007). Segundo Treptow

(2013), as pesquisas que devem ser realizadas pelo designer de moda são:

a) pesquisa de comportamento – hábitos de consumo do público-alvo e

seus interesses;

b) pesquisa comparativa de mercado – análise da concorrência atual e

futura;

c) pesquisa tecnológica – tendências da indústria têxtil, como

lançamentos de maquinários e softwares de modelagem;

d) pesquisa de vocações regionais – disponibilidade de insumos ou mão

de obra diferenciada por localidade;

e) pesquisa de tendências – temas de inspiração de outros designers,

paleta de cores, tecidos e aviamentos;

f) pesquisa de tema de coleção – busca de informações acerca da

inspiração da coleção que serão usadas no seu desenvolvimento.

Parte-se, então, para a segunda etapa do processo em que será desenvolvido

o design para a coleção/linha. Essa etapa tem como intuito a criação de um tema

para a coleção, fruto de inspirações do designer até o momento. A inspiração no

Design de moda pode ser resultado das pesquisas de mercado e de moda, assim

como surgir ao longo do processo de pesquisa. A inspiração pode surgir a partir de

determinadas cores, fatos históricos, culturas, natureza, tecidos e texturas, e do

próprio zeitgeist2 (BURNS; MULLET; BRYANT, 2011; TREPTOW, 2013).

Ao final da etapa 1 e início da etapa 2, são criados os moodboards – ou

painéis imagéticos – que contém as propostas de cores, tecidos, acabamentos e

estilos para a coleção. São usados como ponto de partida para o desenvolvimento

da coleção/linha, funcionando como uma ferramenta para o designer ao longo do

2 Espírito social dos tempos (BURNS; MULLET; BRYANT, 2011, p. 210, tradução nossa).

Page 29: UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS …biblioteca.uniritter.edu.br/imagens/035UNR89/0000F1/0000F128.pdf · LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS

28

processo de criação. É também uma forma de comunicar para a equipe de projeto

os temas, conceitos, tecidos, acabamentos e paleta de cores que serão utilizados

para o desenvolvimento da coleção/linha (METE, 2006; FRINGS, 2008; SORGER;

UDALE, 2009; TREPTOW, 2013). Além dos moodboards, os temas e storyboards

também funcionam como uma síntese da pesquisa. Podem ser utilizados como

forma de identificar o estilo de vida e características de um cliente potencial, a partir

de colagens e palavras-chave (SORGER; UDALE, 2009).

A etapa 2, de “inspiração de design”, deve envolver decisões a respeito do

consumidor-alvo, tema, cores, tecidos e considerações de estilo para a coleção

(BURNS; MULLET; BRYANT, 2016). Um detalhamento do perfil do consumidor-alvo

– apresentado por meio de fotografias e estudos sobre os estilos de vida – é

essencial a fim de auxiliar os demais envolvidos na coleção, como a equipe de

vendas e desenvolvedores de produtos, a visualizar o potencial cliente da linha.

Esse perfil é utilizado pela equipe de design para identificar tendências de mercado,

direcionar a coleção e desenvolver os primeiros esboços de conceitos e cores

(BURNS; MULLET; BRYANT, 2016).

Assim que o tema é criado, inicia-se a fase de desenvolvimento em que a

coleção é planejada. São analisados o volume de vendas e sucesso de coleções

passadas, custos de produção dos produtos a serem desenvolvidos, produtos a

serem continuados – por apresentarem bom desempenho em coleções passadas –,

e a existência de produtos já desenvolvidos por outras marcas de vestuário que

poderão ser reproduzidos. Além disso, outras características da coleção são

determinadas nessa etapa, como a relação entre a quantidade de peças como

blusas e camisetas para a quantidade de calças e shorts, a variedade de estilos, os

valores de venda das peças, bem como o equilíbrio de cores, tecidos e estilos na

coleção (BURNS; MULLET; BRYANT, 2011).

O designer de moda, então, começa a transformar as ideias originadas nas

etapas anteriores em esboços, desenvolvendo os conceitos em peças de vestuário.

Quando finalizados, os esboços são apresentados à equipe – constituída,

normalmente, pela equipe de vendas e desenvolvedores de produtos –, assim como

amostras de tecidos, moodboards, painel de temas, entre outros. Essa etapa

consiste em uma pré-aprovação da coleção pela equipe, que irão verificar se os

estilos dos produtos coordenam entre si e identificar os perfis de consumidores-alvo

nos estilos propostos. Essa etapa pode ser desgastante para o designer, já que

Page 30: UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS …biblioteca.uniritter.edu.br/imagens/035UNR89/0000F1/0000F128.pdf · LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS

29

podem ser requisitados pelos desenvolvedores de produtos a escolher apenas

novos estilos que sejam similares aos anteriores (pela facilidade de

desenvolvimento), e pela equipe de vendas que deseja uma coleção a preços

baixos, mas de alta qualidade. Além disso, essa é uma etapa que exige

desprendimento do designer em relação a suas ideias iniciais já que, conforme

Burns, Mullet e Bryant (2016, p. 164, tradução nossa), “das 60 ideias de design

apresentadas para revisão, talvez apenas 30 ou 40 esboços sejam selecionados

para continuar no estágio de desenvolvimento do design.”, o que pode gerar muita

frustração logo ao início do projeto:

Essa atmosfera pode explicar por que algumas empresas chamam a sala de conferências, onde são conduzidas aprovações de design de sala de guerra. Durante a revisão, os designers devem ser prolíficos com ideias de design e desenvolver uma atitude impessoal sobre os projetos que precisam ser modificados ou descartados da linha (BURNS; MULLET; BRYANT, 2016, p. 166, tradução nossa, grifo do autor).

A partir da revisão das propostas da coleção, são solicitadas amostras aos

fornecedores, que recebem fichas técnicas produzidas pelo designer contendo

informações sobre modelagem, estilo, tipo de tecido, acabamentos, etc. Quando as

amostras são produzidas e enviadas, o designer – em conjunto com a equipe de

vendas – pode filtrar quais peças e estilos irão para a apresentação final da

coleção/linha (BURNS; MULLET; BRYANT, 2011).

Ao fim desta revisão de literatura sobre o processo de criação no Design de

moda, identifica-se que a ferramenta Persona poderia ser incluída ao fim da etapa 1

(conforme figura 2), já que a ferramenta pode ser considerada uma síntese dos

resultados da pesquisa de usuário (PRUITT; ADLIN, 2006; COOPER, 2004;

MARSHALL et al., 2015; NIELSEN, 2013), porém, no contexto da moda, funcionaria

também como uma síntese do processo de pesquisa e merchandising, em que são

feitas as pesquisas de mercado e de moda já que, para Mete (2006, p. 279, tradução

nossa), “A qualidade dos designs depende não só dos talentos dos designers, mas

também da qualidade de sua pesquisa de design.”. Percebe-se, assim, pela

importância das pesquisas de mercado e de moda ao longo do processo de criação

de moda, que a ferramenta Persona ao ser incluída nesse processo pode auxiliar

tanto na etapa de inspiração de design quanto para diminuir o retrabalho na fase de

revisão e apresentação da coleção à equipe (BURNS; MULLET; BRYANT, 2016).

Page 31: UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS …biblioteca.uniritter.edu.br/imagens/035UNR89/0000F1/0000F128.pdf · LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS

30

Sendo assim, a premissa apresentada na introdução desse trabalho – a

utilidade da ferramenta Persona para o processo de criação do Design de moda –

pode ser confirmada com base nas revisões sobre personas e o processo de moda,

que indicam as vantagens na inserção da ferramenta, principalmente, na segunda

etapa do processo de criação, com o objetivo de: (a) facilitar a comunicação entre os

designers e o restante da equipe envolvida na coleção; (b) diminuir o retrabalho na

revisão da coleção e durante a geração de conceitos iniciais; e (c) munir os

designers de argumentos a favor de seus designs, já que personas baseadas em

dados podem ser facilmente rastreadas novamente aos seus dados originais.

2.3 TRABALHOS RELACIONADOS

Em continuidade ao desenvolvimento da perspectiva teórica, este subcapítulo

consiste em uma busca de trabalhos acerca de áreas relacionadas a este trabalho,

com o objetivo de situar o presente trabalho em relação às pesquisas que o

envolvem. A busca foi realizada por meio das plataformas Google Acadêmico3,

ScienceDirect4 e Portal de Periódicos da Capes5, com o intuito de rastrear os

estudos que mais se aproximam do objetivo deste trabalho. Para isso, foram

estipulados três tópicos centrais para a realização da busca: (1) Data-driven

Personas; (2) Tecnologias orientadas a dados para o mercado da moda; e (3)

Sistemas de recomendação para a moda. O primeiro tem como principal objetivo

identificar e analisar os estudos que utilizam grandes quantidades de dados de

usuários como base para o desenvolvimento de Personas, além de identificar as

formas de coleta de dados dos modelos propostos. O segundo apresenta um

panorama geral de tecnologias que envolvem a moda e que focam em dados de

usuários e busca, também, identificar estudos que indiquem a relação entre as áreas

de Personas e o Design de moda. E no terceiro, busca-se analisar os tipos de dados

coletados em estudos sobre sistemas de recomendação para a moda, com o intuito

de identificar as variedades de dados disponíveis na web sobre usuários.

3 scholar.google.com.br 4 www.sciencedirect.com 5 www.periodicos.capes.gov.br

Page 32: UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS …biblioteca.uniritter.edu.br/imagens/035UNR89/0000F1/0000F128.pdf · LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS

31

2.3.1 Data-driven Personas

Um dos obstáculos na utilização de Personas é a falta de clareza entre os

dados e as personas criadas, podendo resultar em personas que não transmitam

credibilidade (PRUITT; GRUDIN, 2003; MULDER; YAAR, 2006). Quando se utilizam

abordagens qualitativas no desenvolvimento de Personas, além de apresentarem

caráter mais subjetivo do que nas abordagens quantitativas, corre-se o risco de que

as personas criadas não representem os usuários típicos de um determinado

público-alvo, já que os dados dos usuários não são claramente rastreáveis

(MULDER; YAAR, 2006). Chapman e Milham (2006) apontam que é provável que

Personas não tenham relação determinável com dados, mas sim que reflitam dados

empíricos sobre usuários, o que torna impossível verificar sua validade.

Para tanto, existem estudos propondo Data-driven Personas, ou seja,

personas criadas com base em dados de usuários (PRUITT; GRUDIN, 2003;

MCGINN; KOTAMRAJU, 2008). Mulder e Yaar (2006) recomendam que sejam

utilizadas técnicas quantitativas no processo de criação de Personas para que se

evitem vieses humanos.

O método proposto por McGinn e Kotamraju (2008) altera a ordem das

atividades da criação de Persona tradicional, na pesquisa, no desenvolvimento e no

processo de validação. Envolvem a equipe do cliente desde o início para definir os

atributos mais significativos e desenvolver as questões que precisam ser

respondidas com a persona. A coleta dos dados acontece por meio de questionário

enviado para pessoas representativas do mercado-alvo e, a partir das respostas, é

feita uma análise fatorial para agrupar os tipos de personas. Além disso, são feitas

entrevistas com pessoas de cada grupo para refinar os grupos. O diferencial do

método é a agilidade da análise e coleta dos dados em comparação com outras

abordagens, que levam mais tempo (PRUITT; GRUDIN, 2003; NIETERS; IVATURI;

AHMED, 2007) ou que não utilizam dados de usuários.

Há uma proposta de metodologia para identificação e criação de Personas

utilizando Análise Semântica Latente (ASL) – técnica utilizada “[...] para representar

a semelhança de significado de termos e documentos através da análise de uma

grande quantidade de texto.” (MIASKIEWICZ; SUMNER; KOZAR, 2008, p. 1503,

tradução nossa). Os dados textuais são coletados via entrevistas e transcritos, para

então serem calculadas as semelhanças das respostas utilizando a técnica ASL. A

Page 33: UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS …biblioteca.uniritter.edu.br/imagens/035UNR89/0000F1/0000F128.pdf · LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS

32

seguir, é feita uma análise de cluster, sendo o pesquisador “[...] responsável por

escolher uma abordagem apropriada de agrupamento.” (MIASKIEWICZ; SUMNER;

KOZAR, 2008, p. 1504, tradução nossa), de modo que os grupos gerados sejam

similares internamente, e o quanto diferente possível dos demais. Como resultado

da análise de cluster, surgem os grupos de personas e suas narrativas são escritas,

de modo que são agregados nomes, imagens e detalhes pessoais. O passo final é a

verificação, em que podem ser feitas entrevistas adicionais, com o intuito de apurar

se existem novas necessidades para as personas criadas. Esse método ajuda o

processo a ser “[...] menos subjetivo, mais eficiente e menos dependente de

habilidades especializadas.” (MIASKIEWICZ; SUMNER; KOZAR, 2008, p. 1504,

tradução nossa).

Percebe-se o caráter qualitativo em ambos estudos, devido às escolhas dos

entrevistados, ainda que apresentem pouco viés humano. O estudo de Miaskiewicz,

Sumner e Kozar (2008) conta com 21 entrevistas que, embora pareça ser um

número pequeno, apresenta resultados positivos pela qualidade das respostas. Já

no estudo de McGinn e Kota (2008), há um número mais significativo, obtendo mais

de 1300 respostas via pesquisa survey e, após o processo de agrupamento, 26

participantes – sendo um de cada grupo – foram entrevistados com perguntas de

livre resposta. Ambos estudos escolheram participantes representativos do

mercado-alvo, sendo o primeiro escolhido pelos autores, e o segundo pelos

stakeholders do projeto. O estudo de Miaskiewicz, Sumner e Kozar (2008) utiliza a

metodologia de Análise Semântica Latente (ASL), que proporciona maior

objetividade, porém não dispensa completamente o julgamento humano pois é

necessário que se escreva uma narrativa para a persona criada, o que é decidido e

desenvolvido pela equipe projetual, dependendo de suas capacidades cognitivas

(MESGARI; OKOLI; GUINEA, 2015). Assim, entende-se que métodos qualitativos,

como entrevistas, revelam problemas como a subjetividade das personas criadas e a

falta de replicabilidade (TU et al., 2010).

Assim como Miaskiewicz, Sumner e Kozar (2008), outra proposta de

mineração de texto é o estudo de Rahimi e Cleland-Huang (2014), que utiliza os

dados textuais a partir de solicitações de recursos em fóruns abertos na web.

Utilizam “[...] regras de agrupamento, classificação e associação de tópicos [...]”

(RAHIMI; CLELAND-HUANG, 2014, p. 479, tradução nossa) a fim de identificar

grupos significativos de solicitações de recursos, os quais são baseados em

Page 34: UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS …biblioteca.uniritter.edu.br/imagens/035UNR89/0000F1/0000F128.pdf · LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS

33

interesses de usuários reais, para orientar a construção de personas. Além disso,

detecta tópicos semelhantes aprendendo suas associações e identifica

preocupações transversais para recomendar personas aos usuários. Como os

fóruns abertos podem ser difíceis de gerenciar, as personas funcionam como um

meio de “[...] domar o caos [...]” (RAHIMI; CLELAND-HUANG, 2014, p. 484, tradução

nossa) que esses ambientes podem gerar.

Os trabalhos de Miaskiewicz, Sumner e Kozar (2008) e Rahimi e Cleland-

Huang (2014) utilizam dados textuais, sendo o primeiro a partir de entrevistas, e o

segundo, de solicitações de recursos em fóruns abertos na web. Entende-se que no

trabalho de Rahimi e Cleland-Huang (2014), os dados são provenientes de

demandas/necessidades de usuários, caracterizando-se como informações

relevantes para a criação de personas (ZHANG; BROWN; SHANKAR, 2016).

Zhang, Brown e Shankar (2016), propõem uma abordagem para a construção

de personas utilizando a telemetria para medir os comportamentos dos usuários a

partir dos cliques feitos durante a navegação em websites. São coletados os

comportamentos de 2400 usuários, resultando em 3,5 milhões de cliques, agrupados

em 39000 “clickstreams” (ou sequência de cliques). A partir daí, são estruturados em

“[...] 10 fluxos de trabalho através de cluster hierárquico” (ZHANG; BROWN;

SHANKAR, 2016, p. 5350, tradução nossa) para, então, estabelecerem-se cinco

personas representativas. Uma das vantagens desta abordagem é a rentabilidade

da coleta de dados, já que ocorre de forma automática. Além disso, é um modelo

quantitativo, sendo facilmente replicável à diferentes demandas. Um ponto que pode

ser considerado negativo é o fato de ser necessário haver personas pré-

estabelecidas, sendo validadas pelo modelo ao término do processo.

Outra proposta é o chamado ID3P, elaborado para aplicações práticas de

desenvolvimento de Data-driven Personas em serviços reais. Os processos de

desenvolvimento e avaliação de Data-driven Personas foram integrados ao

“GQM+Strategies”, um método orientado a metas para medir os objetivos dos

negócios. Dessa forma, o modelo propicia uma análise quantitativa das

características da persona, tornando mais fácil o processo de desenvolvimento de

estratégia do negócio. Utilizam como dados métricas de características do usuário,

que “[...] devem ser refletidas nas ações ou características de cada usuário

[...]”(WATANABE et al., 2017, p. 50, tradução nossa), como os cliques em um

website ou a quantidade de logins, por exemplo. As personas, então, são

Page 35: UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS …biblioteca.uniritter.edu.br/imagens/035UNR89/0000F1/0000F128.pdf · LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS

34

construídas com base nas métricas de características do usuário, entendendo que

os comportamentos dos usuários são derivados de tais métricas (WATANABE et al.,

2017).

Os dados apresentados nos estudos de Zhang, Brown e Shankar (2016) e

Watanabe et al. (2017) refletem o comportamento dos usuários, analisando seus

cliques e/ou a quantidade de logins ao navegar em um website. Abordagens como

estas são características de estudos quantitativos, em que personas são

desenvolvidas com base em um grande número de usuários que sejam

representativos de um público-alvo. Dessa forma, “personas quantitativas”, por

estarem bem fundamentadas nos dados dos usuários, apresentam a vantagem de

facilitar a comunicação entre elas e a equipe projetual, já que os dados dos usuários

podem ser facilmente rastreados transmitindo, assim, credibilidade (MESGARI;

OKOLI; GUINEA, 2015).

Marshall et al. (2015) apresentam um estudo que explora a contribuição de

Personas e conjuntos de dados de usuários existentes no contexto do Design

Inclusivo, bem como uma abordagem através da ferramenta de software HADRIAN

– base de dados que “[...] consiste em dados físicos e comportamentais de 100

indivíduos, com idade entre 18 e 89 anos.” (MARSHALL et al., 2015, p. 314,

tradução nossa) – que aplica os benefícios de ambos métodos. Demonstra-se que

as Personas têm grande importância nas fases iniciais do processo de Design,

aproximando os requisitos dos usuários – quando não há contato contínuo com os

mesmos – à equipe projetual. Com a utilização do HADRIAN foi possível verificar

uma abordagem empática com base nos requisitos e dados técnicos, de forma a

sustentar o Design Inclusivo no desenvolvimento do projeto. Entende-se que a

aplicação associada das Personas e os conjuntos de dados de usuários apresenta

grande potencial para projetos de Design inclusivo.

Diante do exposto, percebe-se que os estudos citados abrangem diferentes

formas de se coletarem dados sobre usuários, sendo por meio de entrevistas

(MCGINN; KOTAMRAJU, 2008; MIASKIEWICZ; SUMNER; KOZAR, 2008), dados

textuais (RAHIMI; CLELAND-HUANG, 2014; MIASKIEWICZ; SUMNER; KOZAR,

2008), comportamento de usuário (ZHANG; BROWN; SHANKAR, 2016;

WATANABE et al., 2017) e bases de dados já existentes (MARSHALL et al., 2015).

Zhang, Brown e Shankar (2016, p. 5350, tradução nossa) descrevem que

“Uma persona compreende os comportamentos, metas, desejos, necessidades e

Page 36: UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS …biblioteca.uniritter.edu.br/imagens/035UNR89/0000F1/0000F128.pdf · LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS

35

frustrações [...]” de um grupo de usuários ao utilizar um produto e/ou serviço.

Percebe-se, assim, que os dados utilizados nos estudos não contam com todos os

itens apresentados nesta definição, entretanto estabelecem foco em determinados

tipos de dados e utilizam diferentes meios de os obterem. Vale lembrar que os

estudos apresentados objetivam utilizar dados de usuários e que, embora não

alcancem todas as características que definem uma persona, apresentam sucesso

nos tipos de dados que utilizam. Sendo assim, é válido destacar a importância de

estudos focados em Data-driven Personas e a existência de diversos meios de se

obterem dados de usuários, a fim de que o desenvolvimento de Personas dependa,

cada vez menos, do viés humano e que sejam críveis para a equipe projetual.

2.3.2 Tecnologias orientadas a dados na moda

Um dos aspectos mais importantes no início da criação de uma coleção de

moda é uma boa pesquisa de mercado. Já que a indústria da moda pode ser

considerada um mercado orientado ao consumidor, buscar entender os perfis de

clientes e seus estilos de vida torna-se fundamental ao designer, a fim de que sejam

oferecidas as melhores opções de vestuário para um determinado público-alvo

(BURNS; MULLET; BRYANT, 2011). Sendo assim, a pesquisa na área da moda tem

auxiliado a indústria, varejistas e designers, a buscar novas formas de compreender

os estilos pessoais dos usuários, bem como suas necessidades e desejos (METE,

2006; BURNS; MULLET; BRYANT, 2011).

Kumar e Vaccaro (2017, p. 389, tradução nossa) propõem um “[...]

mecanismo de experimentação de interfaces de moda [...]” utilizando plataformas de

redes sociais a fim de realizar testes de projeto multivariados com os usuários.

Apresentam quais as atividades de moda que são os maiores problemas para o

consumidor, as intervenções que precisam ser realizadas para melhorar estes

problemas e os modelos computacionais que as permitem. Como as plataformas

sociais já sustentam comunidades de entusiastas de moda, expõem agentes

programáveis (ou chatbots6) que “[...] podem ser usados para prototipar rapidamente

interfaces de design orientadas por dados.” (KUMAR; VACCARO, 2017, p. 389,

6 Programa de computador que conduz uma conversa por meio de método auditivo ou textual (TECH TARGET, 2017).

Page 37: UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS …biblioteca.uniritter.edu.br/imagens/035UNR89/0000F1/0000F128.pdf · LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS

36

tradução nossa). A partir da mensuração do número de seguidores e o envolvimento

dos usuários entre os protótipos, pretende-se indicar o design de futuros sistemas de

moda autônomos. Apresentam os resultados preliminares do mecanismo, onde as

fontes de dados (produtos, outfits7, conteúdo social e editorial) e modelos

(compatibilidade de outfits, análise de imagem, estilos e tendências) são usados

para criar bate-papos que suportam atividades e intervenções como sugestões de

outfits para um evento, recomendações para uma determinada estação do ano,

produtos similares mais baratos ou feedbacks sobre um outfit (KUMAR; VACCARO,

2017).

Lin e Wang (2017, [p. 1], tradução nossa) escolheram a rede social

Lookbook.nu “[...] para estudar a moda fora da perspectiva de marcas, itens e

cores.”. O propósito do estudo é demonstrar que é possível promover a informação

gerada pelos usuários em redes sociais para auxiliar as pessoas a se vestirem

melhor. A rede social funciona como um blog, em que os usuários (chamados de

estilistas) postam fotos pessoais dos seus looks e recebem curtidas e comentários.

Foram coletados dados de 707 estilistas com suas 120 mil postagens de looks e,

então, foram estudados utilizando modelagem de tópicos a fim de aprender os

tópicos subjacentes de marcas, itens e cores. Os tópicos aprendidos foram

analisados para entender como se correlacionam com os looks dos estilistas. Ao fim

do estudo, conclui-se que é possível identificar os tópicos de marcas, itens e cores,

bem como prever componentes em looks não vistos a partir dos looks postados.

Kiapour et al. (2014, p. 472, tradução nossa) apresentam um jogo de

classificação de estilo online chamado “Hipster Wars”, que tem como intuito “[...]

coletar um novo conjunto de dados de vestuário com classificações de estilo

associadas a 5 categorias [...]” – hipster, bohemian, pinup, preppy e goth – sendo os

dados formados por imagens de estilos avaliados pelos usuários do jogo. A proposta

do estudo é analisar questões relacionadas ao quanto o vestuário reflete o estilo

pessoal do usuário. Para isso, foram treinados “[...] modelos para a classificação de

estilos entre classes e dentro da classe” (KIAPOUR et al., 2014, p. 472, tradução

nossa) e explorados métodos capazes de identificar elementos de vestuário que se

7 Define-se outfit como um “conjunto de roupas e acessórios geralmente combinados ou harmoniosos usados em conjunto” (DICTIONARY.COM, 2017).

Page 38: UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS …biblioteca.uniritter.edu.br/imagens/035UNR89/0000F1/0000F128.pdf · LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS

37

relacionam a um determinado estilo. Os resultados apontam que é possível

determinar o estilo de um usuário e os motivos para tanto.

Al-Halah, Stiefelhagen e Grauman (2017) propõem uma abordagem baseada

em dados para prever a popularidade futura de estilos, utilizando conjuntos de dados

com 80 mil produtos de vestuário vendidos ao longo de seis anos na Amazon. Como

resultado, torna-se possível descobrir combinações de estilos que serão populares,

dinâmicas entre estilos e atributos visuais chave. Além disso, pode prever “[...] a

popularidade futura dos estilos e revela seu ciclo de vida e status (por exemplo,

dentro ou fora da moda)” (AL-HALAH; STIEFELHAGEN; GRAUMAN, 2017, p. 10,

tradução nossa).

Lin, Zhou e Xu (2015) apresentam um método de detecção, rastreamento da

influência da moda e construção de uma rede de influências de moda. O objetivo do

estudo é examinar empiricamente as influências do Design na indústria da moda, ao

comparar as semelhanças na adoção de símbolos de moda entre designers. A

coleta de dados teve como foco as avaliações de desfiles de moda postadas no

website Style.com entre os anos 2000 e 2014, atingindo o número de 6.180

avaliações neste período. Foram construídos links de influência escondidos e uma

rede de influências de moda a partir dos dados e, então, foram comparados a 11

listas de “melhores designers de moda”. Pode-se destacar a contribuição do estudo

para a indústria da moda ao mostrar uma rede de influências de símbolos de moda,

indicando as marcas de designers com maior poder de influência, resultando em

benefícios para todas as partes.

Brallier (2016) propõe a inserção da ferramenta personas na fase de pesquisa

do Design de moda a fim de auxiliar o processo de criação. O estudo apresenta

dados estatísticos e narrativas de participantes da comunidade BMX, com o intuito

de desenvolver personas precisas e validar os itens de vestuário adequados para o

esporte. O resultado do estudo mostra que a aplicação de personas na fase de

pesquisa auxilia e melhora o processo de design de vestuário, ao desenvolver

roupas funcionais e estéticas ao público-alvo em questão.

A metodologia do estudo é considerada mista, porém a autora cita apenas a

análise estatística (realizada a partir de dados coletados via questionário online)

como uma abordagem quantitativa. Contudo, contando com 52 respondentes, a

coleta de dados sobre os usuários de BMX é aplicada utilizando uma abordagem

qualitativa, bem como a análise dos dados observacionais e narrativos (BRALLIER,

Page 39: UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS …biblioteca.uniritter.edu.br/imagens/035UNR89/0000F1/0000F128.pdf · LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS

38

2016). Entende-se, portanto, que personas criadas a partir de uma abordagem

qualitativa se baseiam em um pequeno número de usuários com a pretensão de “[...]

ver padrões que se aplicam a todos os usuários.” (MULDER; YAAR, 2006, p. 43-44,

tradução nossa).

A partir do exposto, percebe-se a relevância das redes sociais como forma de

busca de dados para a pesquisa em moda, partindo de avaliações, interesses e

demais informações originárias dos usuários (KUMAR; VACCARO, 2017; LIN;

WANG, 2017). Há, também, demanda por maiores entendimentos acerca dos estilos

pessoais dos usuários (KIAPOUR et al., 2014) e dos estilos de peças de vestuário

(AL-HALAH; STIEFELHAGEN; GRAUMAN, 2017; BRALLIER, 2016), bem como das

redes de influência entre designers de moda (LIN; ZHOU; XU, 2015).

As bases de coleta de dados dos estudos apresentados, deixam clara a

importância dos usuários para a moda, já que são utilizadas as informações

postadas por eles nas redes sociais e em websites de moda (KUMAR; VACCARO,

2017; LIN; WANG, 2017; LIN; ZHOU; XU, 2015), suas opiniões de estilo (KIAPOUR

et al., 2014; BRALLIER, 2016), e suas opções de compra (AL-HALAH;

STIEFELHAGEN; GRAUMAN, 2017; BRALLIER, 2016). Dessa forma, pode-se

afirmar que a busca por meios de melhor compreender os consumidores é

indispensável para o Design de moda, a fim de que melhores produtos sejam

desenvolvidos, ao levar em consideração as necessidades, desejos e frustrações

dos usuários.

Além disso, apesar do estudo de Brallier (2016) apresentar relação entre

moda e Personas, considera-se que a amostra utilizada para a construção das

Personas é inviável quando o objetivo é desenvolver Personas baseadas em dados

– ou seja, Data-driven Personas –, já que um dos principais objetivos da ferramenta

está em comunicar dados de usuários para a equipe de Design (MULDER; YAAR,

2006; MARSHALL et al., 2015). Há de se mencionar que, além do estudo de Brallier

(2016), não foram encontrados outros trabalhos que vinculem explicitamente a

ferramenta Persona e o Design de moda.

2.3.3 Sistemas de recomendação para a moda

Direcionados para a área da moda, existem diversos estudos acerca de

métodos e dispositivos que abordam, principalmente, maneiras de melhor

Page 40: UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS …biblioteca.uniritter.edu.br/imagens/035UNR89/0000F1/0000F128.pdf · LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS

39

compreender os consumidores e suas preferências, utilizando dados de usuários

provenientes da web para tanto. Tais métodos são conhecidos como sistemas de

recomendação e que, no contexto da moda, cumprem a função de auxiliar os

usuários na busca de itens de vestuários que os agradem, entre grandes

quantidades de produtos, de acordo com seus interesses pessoais e preferências de

estilo (RESNICK; VARIAN, 1997; KANG, 2017).

Devido a grande quantidade de produtos de moda disponíveis no mercado

online e off-line – que são continuamente introduzidos – surge a demanda por

serviços de recomendação de moda mais eficientes. Dessa forma, entender as

preferências de estilo dos usuários e ser capaz de recomendar produtos de forma

mais personalizada apresentam-se como tarefas de grande importância,

principalmente, para o cenário do comércio eletrônico de moda (HE; MCAULEY,

2016; LEE; LEE, 2015; DATE; GANESAN; OATES, 2017).

Para se construir um sistema de recomendação bem-sucedido é necessário

que se compreenda tanto as preferências dos usuários quanto suas dinâmicas. No

domínio da moda, especialmente, entender tais preferências pode ser muito difícil,

devido às suas características estéticas e temporais, como a aparência visual dos

produtos e a evolução ao longo do tempo, bem como sua semântica (HE;

MCAULEY, 2016; KANG, 2017). Para Nguyen et al. (2014, p. 51, tradução nossa), o

domínio da moda apresenta comportamento diferente da maioria dos outros

domínios, e se caracteriza pelas “[...] roupas, popularidade, tempo e agrupamento

cultural”.

Sistemas para recomendação de produtos utilizam dados de diferentes

naturezas e variados mecanismos de coleta de dados sobre usuários como, por

exemplo, a análise de comportamento de usuários durante a navegação em

websites, que proporciona uma forma fácil e rápida de coletar dados, além de

possibilitar registros de “[...] quais sites são visitados, quantas pessoas gostaram de

algumas fotos, quais itens são comprados [...]” (SANCHEZ-RIERA et al., 2017, p.

664, tradução nossa), entre outros (NGUYEN et al., 2014).

Outra maneira de se apresentar recomendações úteis é analisar e aprender

com os feedbacks dos usuários. Alguns estudos guiam-se pelos feedbacks

explícitos, como em comentários, e outros preferem utilizar os feedbacks implícitos,

que podem ser encontrados no histórico de compras (NGUYEN et al., 2014). He e

McAuley (2016) apresentam um modelo com base nos feedbacks implícitos dos

Page 41: UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS …biblioteca.uniritter.edu.br/imagens/035UNR89/0000F1/0000F128.pdf · LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS

40

usuários. O interesse dos autores está em aprender a “[...] dinâmica temporal visual

a partir de conjuntos de dados de feedbacks implícitos [...]” (HE; MCAULEY, 2016,

[p. 2], tradução nossa). Utilizam esse tipo de informação a partir do entendimento de

que as escolhas de compra representam melhor os estilos de moda do que as

classificações, ou seja, os feedbacks explícitos. Também propõem em outro estudo

(HE; LIN; MCAULEY, 2016), um sistema de consulta baseado em imagem que

utiliza os feedbacks implícitos, pelos históricos de compra, para recomendar

produtos aos usuários. Da mesma forma, Kang (2017) propõe um sistema de

recomendação de moda utilizando o conteúdo da imagem relativa ao feedback

implícito do usuário. Jia et al. (2016), apresentam um estudo que pretende

compreender os efeitos estéticos das imagens de roupas de forma automática,

utilizando, também, feedbacks e imagens dos produtos relacionados. Nguyen et al.

(2014) propõem um sistema de recomendação relacionado a um portal de moda

online da Europa, em que são utilizados os feedbacks implícitos do usuário, e

também seu histórico de navegação, a fim de se obter a classificação de preferência

de um item.

Analisar as imagens dos usuários em redes sociais também pode ser útil para

a recomendação de produtos no comércio eletrônico. Sanchez-Riera et al. (2017)

propõem um sistema chamado “i-Stylist” que recomenda produtos baseado nas

imagens pessoais dos usuários em suas redes sociais. Esse meio, porém, pode

apresentar dificuldades devido a questões de privacidade, não sendo possível

acessar as informações dos usuários (SANCHEZ-RIERA et al., 2017). Vartak e

Madden (2013) apresentam o “CHIC”, um sistema de recomendação que utiliza

conjuntos de dados com base na colaboração coletiva e na web para calcular a

qualidade de combinações em looks. O sistema interage com o usuário ao permitir

que fotos de itens de vestuário sejam enviadas para que sejam sugeridas

combinações. Há também sistemas que promovem o gerenciamento de itens de

vestuário, como o “Smart Closet Application”, em que o usuário pode armazenar

imagens de roupas e acessórios pessoais e combiná-las pelo aplicativo de

smartphone. Além disso, o sistema aprende quais itens são mais utilizados e sugere

estilos e o vestuário adequado para ocasiões especiais e de acordo com a condição

climática do momento (LIMAKSORNKUL et al., 2014). Há, também, estudos que destacam as características do vestuário como

dados para propor sistemas de recomendação. Hanbit Lee e Sang-goo Lee (2015)

Page 42: UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS …biblioteca.uniritter.edu.br/imagens/035UNR89/0000F1/0000F128.pdf · LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS

41

apresentam um método de recomendação de itens de moda capaz de descobrir a

forma como os itens de moda são combinados utilizando um grande conjunto de

dados proveniente de um e-commerce. Os dados são constituídos de imagens de

vestuário e, com base em suas descrições, são classificados em material, categoria,

padrão e cor. Outra proposta é um aplicativo que permite o usuário enviar uma foto

de um item de interesse, resultando em uma “[...] lista de itens semelhantes usando

técnicas de recuperação de imagens.” (HSU; PAZ; SHEN, 2011, p. 1). O sistema é

desenvolvido baseado na textura, contorno, característica e cor das roupas, sendo

considerados como as principais características. Vaccaro et al. (2016) apresentam

um modelo que aprende as relações entre elementos do design de moda, como cor

e material, e estilos de moda, mais precisamente, características esperadas de um

“look”, como “exótico” e “colorido”. O modelo utiliza um conjunto de mais de meio

milhão de peças de vestuário coletados da rede social de moda Polyvore8, além das

descrições das roupas feitas pelos usuários e os rótulos dos itens. Ele funciona

como um estilista pessoal automatizado, recomendando peças de vestuário a partir

de necessidades diárias do usuário.

Pode-se perceber, portanto, que os estudos apresentados refletem a

heterogeneidade de dados de usuário presentes na web que, neste contexto, são

utilizados na recomendação de produtos de vestuário a partir de feedbacks (HE;

MCAULEY, 2016; HE; LIN; MCAULEY, 2016; KANG, 2017; JIA et al., 2016;

NGUYEN et al., 2014), dados de comportamento (NGUYEN et al., 2014), imagens

pessoais dos usuários (SANCHEZ-RIERA et al., 2017; VARTAK; MADDEN, 2013;

LIMAKSORNKUL et al., 2014) e características do vestuário (LEE; LEE, 2015; HSU;

PAZ; SHEN, 2011; VACCARO et al., 2016). Observa-se a maneira indireta na qual

os dados são coletados, tornando desnecessária a busca por informações de forma

qualitativa, como em entrevistas ou grupos focais. Compreende-se, assim, que

dados já disponíveis na web podem ser úteis na busca por informações acerca dos

usuários e suas preferências.

A partir do levantamento proposto nesta subseção, percebe-se como

oportunidades: (1) a busca por dados de usuários que contemplem um maior

número de características necessárias ao desenvolvimento de personas; (2) estudos

que apresentem mais discussões acerca da utilização da ferramenta Persona no

8 www.polyvore.com

Page 43: UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS …biblioteca.uniritter.edu.br/imagens/035UNR89/0000F1/0000F128.pdf · LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS

42

Design de moda; e (3) a utilização de feedbacks explícitos sobre produtos como

meio de descobrir características em comum entre usuários.

3 METODOLOGIA

Esta seção tem como objetivo apresentar a metodologia escolhida para esta

pesquisa, que considera os conceitos a partir de Hernández Sampieri, Fernández

Collado e Baptista Lucio (2013). A etapa de análise de dados, entretanto, tem como

base os conceitos apresentados por Fayyad, Piatetsky-Shapiro e Smyth (1996b),

mais especificamente, o método conhecido como KDD (Knowledge Discovery in

Databases).

A pesquisa apresenta enfoque quantitativo de alcance descritivo, o qual busca

“[...] especificar as propriedades, as características e os perfis de pessoas, grupos,

comunidades, processos, objetos ou qualquer outro fenômeno que se submeta a

uma análise.” (HERNÁNDEZ SAMPIERI; FERNÁNDEZ COLLADO; BAPTISTA

LUCIO, 2013, p. 102), e apresenta como desenho de pesquisa um não experimento

de caráter transversal descritivo (HERNÁNDEZ SAMPIERI; FERNÁNDEZ

COLLADO; BAPTISTA LUCIO, 2013), em que se visa a descrição e análise da

incidência e inter-relação das variáveis em um momento determinado. Caracteriza-

se como um não experimento (HERNÁNDEZ SAMPIERI; FERNÁNDEZ COLLADO;

BAPTISTA LUCIO, 2013, p. 168) por não haver manipulação deliberada de

variáveis, mas sim a observação de “[...] fenômenos da maneira como ocorrem em

seu contexto natural [...]”.

A seleção da amostra qualifica-se como não probabilística, já que se

caracteriza como uma “[...] cuidadosa e controlada escolha de casos com certas

características especificadas previamente na formulação do problema.”

(HERNÁNDEZ SAMPIERI; FERNÁNDEZ COLLADO; BAPTISTA LUCIO, 2013, p.

208). Para tanto, foram buscados na web conjuntos de dados que contemplassem

os requisitos: envolver a área da moda, apresentar grande conjunto de dados (big

data9) e informações acerca de usuários. A coleta de dados, portanto, pode ser

enquadrada na categoria de dados secundários, já que são coletados por outros

9 aws.amazon.com/pt/big-data/what-is-big-data/

Page 44: UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS …biblioteca.uniritter.edu.br/imagens/035UNR89/0000F1/0000F128.pdf · LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS

43

pesquisadores (HERNÁNDEZ SAMPIERI; FERNÁNDEZ COLLADO; BAPTISTA

LUCIO, 2013).

Assim, foram encontrados conjuntos de dados coletados por He e McAuley

(2016), entre os anos de 1996 e 2014, que apresentam dados provenientes da loja

virtual Amazon10, contendo avaliações de usuários acerca dos produtos oferecidos.

Dos diversos conjuntos de dados disponibilizados, foram escolhidos os conjuntos

“Clothing, Shoes and Jewelry”11 e “Metadata”12, sendo o primeiro focado em

avaliações de usuários acerca de roupas, calçados e acessórios, e o segundo com

foco em informações gerais sobre os produtos.

3.1 ANÁLISE DOS DADOS: APLICAÇÃO DO MÉTODO KDD

Na etapa de análise dos dados, empregou-se o método de descoberta de

conhecimento em bases de dados denominado de KDD (Knowledge Discovery in

Databases), que se refere “[...] ao processo geral de descoberta de conhecimento

útil a partir de dados.” (FAYYAD; PIATETSKY-SHAPIRO; SMYTH, 1996b, p. 28,

tradução nossa), sendo sua estrutura dividida em etapas, conforme apresentado na

figura 3. A partir destas etapas – seleção, pré-processamento, transformação,

mineração e interpretação – é possível garantir que conhecimento seja derivado dos

dados.

Figura 3 – Visão geral das etapas do processo KDD.

Fonte: Fayyad, Piatetsky-Shapiro e Smyth (1996b, p. 29, tradução nossa).

As três primeiras etapas do processo KDD (seleção, pré-processamento e

transformação) cumprem a função de preparar os dados para serem submetidos a

um tipo de algoritmo de mineração de dados (FACELI et al., 2011). No estudo

proposto, a preparação dos dados inicia pelas etapas de seleção dos dados – que

10 www.amazon.com 11 snap.stanford.edu/data/amazon/productGraph/categoryFiles/reviews_Clothing_Shoes_and_Jewelry_5.json.gz 12 snap.stanford.edu/data/amazon/productGraph/metadata.json.gz

Page 45: UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS …biblioteca.uniritter.edu.br/imagens/035UNR89/0000F1/0000F128.pdf · LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS

44

se refere à criação de um conjunto de dados de destino, ou de um subconjunto de

variáveis ou amostras de dados – e pré-processamento (FAYYAD; PIATETSKY-

SHAPIRO; SMYTH, 1996b). No pré-processamento são realizadas revisões acerca

dos dados selecionados com o propósito de torná-los mais adequados ao estudo,

além de minimizar ou eliminar problemas detectados nos conjuntos de dados

selecionados. Podem ser utilizadas operações como limpeza e integração dos

dados, técnicas de amostragem, tratamentos para dados desbalanceados e

modificações para adequação dos tipos de atributo (FACELI et al., 2011). Já a etapa

de transformação tem como intuito modificar os dados originais para o formato

adequado que o algoritmo a ser utilizado necessita (FACELI et al., 2011).

Após a preparação dos dados, dá-se início à mineração de padrões

frequentes (ou “frequent pattern mining”), que é um subcampo da área de mineração

de dados que tem como objetivo buscar as relações frequentes em um determinado

conjunto de dados (HAN; KAMBER; PEI, 2011). É utilizada para descobrir “[...]

associações interessantes e correlações entre conjuntos de itens em bancos de

dados [...]” (HAN; KAMBER; PEI, 2011, p. 244, tradução nossa), podendo ser

aplicada a sistemas de recomendação, em que são recomendados itens a usuários

com base em padrões similares. A tarefa da mineração de padrões frequentes

consiste em “[...] descobrir todos os conjuntos de itens frequentes em uma

determinada base de dados de transações.” (FOURNIER-VIGER et al., 2017, p. 5,

tradução nossa) e utiliza, para tanto, um algoritmo de aprendizado de máquina13.

A chamada “análise da cesta de compras” é um dos exemplos típicos da

mineração de padrões frequentes, na qual dados transacionais de compras são

minerados a fim de descrever padrões de compra de clientes. Neste tipo de análise

é possível descobrir os grupos de produtos que são frequentemente comprados em

conjunto, para que sejam sugeridos novos produtos aos clientes com base em

transações anteriores. A descoberta das correlações entre grandes quantidades de

dados transacionais pode ser útil na tomada de decisões em negócios como o e-

commerce de moda, no marketing e, principalmente, na análise do comportamento

de compra dos consumidores (FACELI et al., 2011; HAN; KAMBER; PEI, 2011).

13 O aprendizado da máquina investiga como os computadores podem aprender (ou melhorar seu desempenho) com base em dados (HAN; KAMBER; PEI, 2011, p. 24).

Page 46: UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS …biblioteca.uniritter.edu.br/imagens/035UNR89/0000F1/0000F128.pdf · LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS

45

As correlações encontradas podem ser representadas sob a forma de regras

de associação, as quais apresentam duas medidas – suporte e confiança – que, de

acordo com Han, Kamber e Pei (2011, p. 245, tradução nossa), “[...] são duas

medidas de interesse das regras. Elas refletem, respectivamente, a utilidade e a

certeza das regras descobertas.”

Quadro 4 – Exemplo de regra de associação.

Fonte: Han, Kamber e Pei (2011).

Sendo assim, a regra de associação do quadro 4, apresenta a informação de

que os clientes que compram vestidos tendem a comprar também camisetas. Com

um suporte de 2%, pode-se afirmar que, de todas as transações analisadas, 2%

delas indicam que vestidos e camisetas foram comprados juntos, ou seja, 2% é a

frequência na qual a regra (vestido ⇒ camiseta) é aplicável ao conjunto de dados

analisados. Já a medida de confiança, indica que 60% dos clientes que compraram

vestido também compraram camiseta, que significa a frequência na qual os itens em

Y (camiseta) aparecem em transações que contenham X (vestido) (CIOS et al.,

2007; HAN; KAMBER; PEI, 2011). Geralmente, limites mínimos são estabelecidos

quanto aos valores de suporte e confiança, sendo estes definidos pelo utilizador

(pesquisador) a partir de critérios relacionados aos propósitos de pesquisa (HAN;

KAMBER; PEI, 2011).

No estudo proposto é utilizado o algoritmo FP-Growth14 (Han et al., 2004) – ou

“Frequent Pattern Growth” – para a mineração de padrões frequentes, com o

objetivo de encontrar os conjuntos de itens que ocorrem de forma frequente nos

conjuntos de dados de avaliações de usuários. O algoritmo, além de buscar os

conjuntos de itens frequentes, também extrai regras de associação (tabela 1) a fim

de buscar as possíveis combinações e seus níveis de interesse (FACELI et al.,

2011; TAN; STEINBACH; KUMAR, 2005).

14 http://www.philippe-fournier-viger.com/spmf/index.php?link=algorithms.php

X Y

vestido camiseta

⇒⇒

[suporte, confiança]

[suporte = 2%, confiança = 60%]

Page 47: UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS …biblioteca.uniritter.edu.br/imagens/035UNR89/0000F1/0000F128.pdf · LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS

46

Tabela 1 – Exemplo de regras extraídas do algoritmo.

Fonte: Faceli et al. (2011).

Os parâmetros de entrada do algoritmo são constituídos de valores mínimos

de suporte e confiança – estabelecidos pelo utilizador –, e uma base de dados de

transações (FOURNIER-VIGER et al., 2017), exemplificada na tabela 2:

Tabela 2 – Parâmetros de entrada do algoritmo.

Fonte: Fournier-Viger et al. (2017).

Considerando que “Uma base de dados de transações [...] é um conjunto de

transações de modo que cada transação [...] é um conjunto de itens distintos”

(FOURNIER-VIGER et al., 2017, p. 4, tradução nossa), entende-se, conforme a

tabela 2, que para cada linha (ou seja, para cada transação) há um conjunto de itens

distintos.

Os dados de saída são constituídos pelos conjuntos de itens frequentes e

suportes correspondentes. Um conjunto de itens frequentes é aquele que aparece

em pelo menos s transações na base de dados de transações, sendo s o parâmetro

de suporte mínimo [Fournier-Viger ([200-?]]. Como saída também são produzidas

regras de associação, como ilustrado na Tabela 1. A partir da base de dados da

tabela 2, se o suporte mínimo estabelecido fosse 40% (2 transações), o algoritmo

produziria o resultado mostrado na Tabela 3.

X Y

vestido camiseta

⇒⇒

[suporte, confiança]

[suporte = 2%, confiança = 60%]

Regra Confiança Suporte do itemset

{x} ⇒ {y} 100% 30%

{x, z} ⇒ {w} 100% 40%

{y, z} ⇒ {x} 85% 60%

{x} ⇒ {z} 80% 40%

Usuário Item Suporte do itemset

Regras Suporte Confiança

{x} ⇒ {y} 30% 100%

{x, z} ⇒ {w} 40% 100%

{y, z} ⇒ {x} 60% 85%

{x} ⇒ {z} 40% 80%

TID Transaçãot1 {a, c, d}t2 {b, c, e}t3 {a, b, c, e}t4 {b, e}t5 {a, b, c, e}

Page 48: UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS …biblioteca.uniritter.edu.br/imagens/035UNR89/0000F1/0000F128.pdf · LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS

47

Tabela 3 – Parâmetros de saída do algoritmo.

Fonte: Fournier-Viger et al. (2017).

Da tabela 3, por exemplo, o conjunto de itens “{b, c, e}” possui suporte de 3

pois aparece nas transações “t2”, “t3” e “t5” da tabela 2 e, por isso, é um conjunto de

itens frequentes pelo seu suporte ser maior ou igual ao valor mínimo estabelecido

(FOURNIER-VIGER, [200-?]).

A etapa de interpretação dos dados é caracterizada pela análise dos “[...]

padrões descobertos e o possível retorno a qualquer uma das etapas anteriores [...]”

(FAYYAD; PIATETSKY-SHAPIRO; SMYTH, 1996b, p. 31, tradução nossa).

Caracteriza-se, também, pela remoção de padrões redundantes ou irrelevantes, e a

elucidação dos padrões úteis de modo a torná-los compreensíveis aos usuários

(FAYYAD; PIATETSKY-SHAPIRO; SMYTH, 1996b). De acordo com Han, Kamber e

Pei (2011), a etapa de interpretação é dividida em duas etapas – avaliação de

padrões e apresentação do conhecimento.

Na avaliação de padrões busca-se “[...] identificar os padrões

verdadeiramente interessantes que representam o conhecimento com base em

medidas de interesse” (HAN; KAMBER; PEI, 2011, p. 8, tradução nossa), sendo

considerado interessante um padrão que (HAN; KAMBER; PEI, 2011): (1) seja

facilmente compreensível; (2) apresente validade em dados novos ou de teste com

algum grau de certeza; (3) seja potencialmente útil; (4) seja original/novo; e (5)

valide uma hipótese que se procura confirmar. Ao término da avaliação de padrões,

são utilizadas técnicas de representação e visualização de modo a apresentar o

TID Transaçãot1 {a, c, d}t2 {b, c, e}t3 {a, b, c, e}t4 {b, e}t5 {a, b, c, e}

a= 1 b= 2 c= 3 d= 4 e= 5

Conjuntos Suporte

{a} 3

{b} 4

{c} 4

{e} 4

{a, b} 2

{a, c} 3

{a, e} 2

{b, c} 3

{b, e} 4

{c, e} 3

{a, b, c} 2

{a, b, e} 2

{a, c, e} 2

{b, c, e} 3

{a, b, c, e} 2

Page 49: UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS …biblioteca.uniritter.edu.br/imagens/035UNR89/0000F1/0000F128.pdf · LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS

48

conhecimento minerado, sendo enquadrada, conforme os autores, como

apresentação do conhecimento (HAN; KAMBER; PEI, 2011).

No estudo proposto, a etapa de interpretação dos dados é dividida em análise

exploratória e análise qualitativa, sendo que na primeira se exibe uma visão geral

dos dados a partir de representações visuais bem como as oportunidades a serem

exploradas e, na segunda, são analisados os resultados da mineração em que se

visa buscar as possíveis similaridades entre os conjuntos de itens frequentes. No

capítulo de discussão de resultados são apresentadas as interpretações dos

resultados encontrados, e tem como objetivo avaliar as implicações e limitações do

estudo, as relações com estudos existentes e se a questão de pesquisa foi

respondida.

4 ESTUDO PROPOSTO

Na pesquisa comportamental pode-se obter muitas informações a respeito

dos usuários ao analisar seus comportamentos de compra, que podem ser

identificados nos registros de vendas, bancos de dados de clientes etc. Para Kotler e

Keller (2012, p. 107), “As compras realizadas refletem preferências e costumam ser

mais confiáveis do que declarações feitas a pesquisadores de mercado.”. Essas

informações estão disponíveis a administradores e designers de organizações, e

“[...] podem ser cruzadas com informações sobre os produtos e a força de vendas

para fornecer visões ainda mais profundas.” (KOTLER; KELLER, 2012, p. 73).

Na área da moda, as decisões de compra se baseiam em diversos aspectos –

como considerações psicológicas, sociais, financeiras, etc. –, dos quais os

consumidores muitas vezes não têm consciência. Sendo assim, conduzir pesquisas

de comportamento de consumo diretamente com os clientes pode ser um desafio, já

que “[...] resultados de pesquisas de mercado indicam que os consumidores

geralmente não compram o que eles indicam que comprarão quando perguntado

antecipadamente.” (BURNS; MULLET; BRYANT, 2011, p. 176, tradução nossa).

Para tanto, o comércio eletrônico apresenta-se como um meio de contribuir na coleta

de dados acerca dos consumidores, podendo indicar, por exemplo, produtos

comprados, melhor/pior avaliados, produtos que foram vistos, entre outros.

O e-commerce tem expandido de forma consistente desde o ano 2000

alcançando, em 2009, 155 bilhões de dólares em vendas nos Estados Unidos,

Page 50: UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS …biblioteca.uniritter.edu.br/imagens/035UNR89/0000F1/0000F128.pdf · LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS

49

sendo que a categoria de vestuário, acessórios e calçados representou 27 bilhões

desta quantia (BURNS; MULLET; BRYANT, 2011). Muitos varejistas de vestuário

passaram a incluir o comércio eletrônico em suas estratégias de distribuição,

oferecendo produtos unicamente pela Internet ou como complemento de suas lojas

físicas. Para a indústria da moda – varejistas, designers, fabricantes –, o e-

commerce proporciona um acesso aprimorado a novos consumidores e possibilita a

coleta de uma série de dados sobre o comportamento dos clientes ao acessar uma

loja virtual (BURNS; MULLET; BRYANT, 2011).

Percebe-se as diversas possibilidades que o cenário do comércio eletrônico

de moda pode oferecer na viabilização da coleta de dados acerca do consumidor.

Desse modo, o estudo proposto visa utilizar dados de avaliações de produtos feitas

por usuários de uma loja virtual, com o objetivo de buscar possíveis insumos que

possam ser úteis no desenvolvimento de Data-driven Personas para o Design de

moda.

Dados de avaliações de usuários podem servir como insumo para a criação

de Personas à medida em que sejam encontradas características em comum entre

eles, resultando em grupos de usuários que apresentem preferências similares.

Segundo Harley (2015), ao iniciar o processo de criação de Personas, deve-se

identificar as características dos usuários e agrupá-las em clusters, para que

comecem a se formar personagens claros. A partir das similaridades entre os

clusters de características, eles são agrupados e analisados, a fim de que sejam

encontrados papéis distintos para futuras personas. Então, são adicionados detalhes

– como nome, foto, profissão, etc. – a fim de tornar as personas realistas, credíveis e

memoráveis. Também, de acordo com Miaskiewicz, Sumner e Kozar:

Com a exceção do nome, rosto e detalhes específicos que tornam a persona mais credível, personas devem ser desenvolvidas com base nos resultados da pesquisa do usuário. Os métodos comumente usados para a identificação e criação de personas da pesquisa de usuário exigem que os indivíduos analisem manualmente uma quantidade extensa de dados (geralmente qualitativos). Os indivíduos que analisam os dados buscam encontrar características em comum compartilhadas por múltiplos usuários - esses grupos de usuários similares constituem as personas resultantes. No entanto, esses métodos "manuais" podem ser problemáticos porque podem ser percebidos como subjetivos, requerem o compromisso de recursos substanciais e dependem de habilidades especializadas. (MIASKIEWICZ; SUMNER; KOZAR, 2008, p. 1501, tradução nossa).

Page 51: UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS …biblioteca.uniritter.edu.br/imagens/035UNR89/0000F1/0000F128.pdf · LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS

50

Conforme a citação acima, uma das principais dificuldades no

desenvolvimento de Personas está na análise dos dados de usuários que, na

pesquisa de usuário, são geralmente qualitativos e podem apresentar grande

subjetividade (MIASKIEWICZ; SUMNER; KOZAR, 2008). Este estudo tem como

intuito buscar formas de auxiliar a coleta e análise de dados de usuários por meio de

procedimentos menos trabalhosos e mais automatizados, bem como de utilizar

dados que, aparentemente, podem ser considerados infrutíferos e que não são

comumente utilizados para este fim. Sendo assim, já que “Uma persona é um

modelo de usuário detalhado que representa usuários arquetípicos.” (TU, 2010, p. 1,

tradução nossa), e que apresenta as características de um grupo de usuários

similares, este estudo propõe – a partir da base de dados de avaliações de produtos

coletadas por He e McAuley (2016) – buscar os conjuntos de produtos avaliados

pelos mesmos grupos de usuários com o objetivo de identificar padrões de

características e preferências de estilo. Pretende-se analisar, a partir dos padrões

encontrados, as possibilidades desses tipos de dados no desenvolvimento de Data-

driven Personas para o Design de moda. A seguir, são descritos os procedimentos

realizados neste estudo, apresentando como etapa inicial a seleção dos dados.

4.1 SELEÇÃO DOS DADOS

A preparação dos dados a serem submetidos a um algoritmo de mineração

tem início pela etapa de seleção dos dados. Essa etapa refere-se à criação de um

conjunto de dados de destino, ou de um subconjunto de variáveis ou amostras de

dados (FAYYAD; PIATETSKY-SHAPIRO; SMYTH, 1996b).

Conforme mencionado anteriormente, foram utilizados neste estudo os

conjuntos de dados “Clothing, Shoes and Jewelry” e “Metadata”, coletados por He e

McAuley (2016), que apresentam dados provenientes da loja virtual Amazon. Os

conjuntos contêm avaliações de usuários acerca de itens de vestuário, calçados e

acessórios, bem como informações gerais dos produtos. Os dados presentes são

mostrados abaixo:

Page 52: UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS …biblioteca.uniritter.edu.br/imagens/035UNR89/0000F1/0000F128.pdf · LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS

51

Quadro 5 – Informações presentes nos conjuntos de dados.

Fonte: He e McAuley (2016).

A seleção dos dados se deu a partir da eliminação de atributos considerados

dispensáveis ao estudo, sendo eles: reviewerName, helpful, reviewText, summary,

unixReviewTime/reviewTime, price, related, salesRank, brand e categories. Além da

eliminação de atributos, os dados dos conjuntos (Clothing, Shoes and Jewelry e

Metadata) foram integrados, sendo combinados os atributos em comum. Assim,

foram selecionados os atributos apresentados abaixo:

Quadro 6 – Atributos selecionados no estudo.

Fonte: He e McAuley (2016).

Conforme apresentado no quadro 6, o atributo “overall” se refere à nota (ou

rating) do produto avaliado pelo usuário. Para este estudo, foram selecionadas as

avaliações com rating superior a 3, que indicam a experiência positiva dos

avaliadores em relação aos produtos. Além da escolha por avaliações positivas, os

ratings 4 e 5 foram selecionados por apresentarem o maior número de avaliações,

representando 79,5% do total, conforme abaixo:

Conjunto de dados Conteúdo Dados Informações

Clothing, Shoes and Jewelry

Avaliações de produtos feitas por

usuários

reviewerID Código referente ao usuário que fez a avaliaçãoasin Código do produto

reviewerName Nome do usuário que fez a avaliação

helpfulNota dada por outros usuários acerca da utilidade da avaliação

reviewText Texto escrito pelo avaliador

overall Nota do produtosummary Versão resumida do texto da avaliação

unixReviewTime/reviewTime

Horário e data da avaliação

MetadataInformações sobre

os produtos

asin Código do produtotitle Nome do produto

price Preço do produto em dólaresimUrl Link da imagem do produto

relatedProdutos relacionados (também comprado, também visto, comprado junto, comprado depois de visto)

salesRank Classificação geral de vendas do produto

brand Nome da marca do produtocategories Lista de categorias que o produto pertence

Conjunto de dados Dados Informações

Clothing, Shoes and Jewelry

reviewerID Código referente ao usuário que fez a avaliação

asin Código do produto

overall Nota do produto

Metadata

asin Código do produtotitle Nome do produto

imUrl Link da imagem do produto

brand Nome da marca do produto

categories Lista de categorias que o produto pertence

Conjunto de dados Dados Informações

Clothing, Shoes and Jewelry e

Metadata

reviewerID Código referente ao usuário que fez a avaliação

asin Código do produto

overall Nota do produto

title Nome do produto

imUrl Link da imagem do produto

Page 53: UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS …biblioteca.uniritter.edu.br/imagens/035UNR89/0000F1/0000F128.pdf · LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS

52

Tabela 4 – Quantidade de avaliações em relação ao rating.

Fonte: Elaborado pela autora.

A partir do total de 221.597 avaliações com ratings 4 e 5, foram filtrados os

dados com menos de 5 avaliações por produto, já que valores abaixo desse número

não foram considerados representativos em relação ao objetivo do estudo. Pode-se

analisar, na tabela 5, o processo de seleção e filtragem a partir dos dados originais –

coletados por He e McAuley (2016)15 –, e com os filtros em relação ao rating e ao

número de avaliações por produto.

Tabela 5 – Filtragem dos dados e quantidade final.

Fonte: Elaborado pela autora.

Sendo assim, ao fim da etapa de seleção dos dados, a quantidade resultante

é de 161.041 avaliações, 25.307 usuários e 17.729 produtos.

4.2 PRÉ-PROCESSAMENTO DOS DADOS

A etapa de pré-processamento tem o propósito de tornar os dados mais

adequados ao estudo, minimizando ou eliminando problemas detectados nos

conjuntos de dados (FACELI et al., 2011). Assim, a partir da seleção dos dados,

inicia-se o pré-processamento que, neste estudo, se configura pela adequação e

organização dos atributos presentes nos conjuntos de dados.

15 http://jmcauley.ucsd.edu/data/amazon/links.html

Rating Frequência Porcentagem

1 11.192 4%2 15.463 5,5%3 30.425 10,9%4 58.357 20,9%5 163.240 58,6%

278.677

Dados Avaliações Usuários Produtos

Original 278.677 39.387 23.033

Rating >3 221.597 39.241 23.014

Rating >3 Mínimo 5

161.041 25.307 17.729

1 11.192 4%2 15.463 5,5%3 30.425 10,9%4 58.357 20,9%5 163.240 58,6%

278.677

23.014

no "5CoreUserRating>3" eu apenas filtrei os usuários com nota maior que 3

175.426

Page 54: UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS …biblioteca.uniritter.edu.br/imagens/035UNR89/0000F1/0000F128.pdf · LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS

53

Os dados resultantes da etapa de seleção dos dados são reorganizados e

distribuídos conforme: (a) a quantidade de itens avaliados por usuário; (b) quais

itens são avaliados por usuário; e (c) a quantidade de usuários para cada item

avaliado. Na tabela abaixo, é apresentado um exemplo dos dados distribuídos pela

quantidade de itens avaliados por usuário:

Tabela 6 – Distribuição dos dados pela quantidade de itens avaliados por usuário.

Fonte: Elaborado pela autora.

Nos “itens avaliados por usuário”, são agrupados sequencialmente os itens

avaliados pelo mesmo usuário a fim de facilitar a visualização e análise, conforme

tabela 7:

Tabela 7 – Distribuição dos dados pelos itens avaliados por usuário.

Fonte: Elaborado pela autora.

Na “quantidade de usuários para cada item avaliado” é composto um ranking

– denominado como “Ranking Avaliadores Distintos” – em que são alterados os

códigos indicativos dos itens para números – a partir do item com maior quantidade

de avaliações de usuários distintos –, a fim de auxiliar a visualização dos dados,

conforme tabela 8:

Usuário Quantidade de ItensA2J4XMWKR8PPD0 136A2KBV88FL48CFS 63AENH50GW3OKDA 63A2UO040HWOP0C2 56A2V5R832QCSOMX 53

Usuário ItemA001114613O3F18Q5NVR6 B004AZXO1IA001114613O3F18Q5NVR6 B004QJWKLSA001114613O3F18Q5NVR6 B005BXP7R2A001114613O3F18Q5NVR6 B0093STGGOA001114613O3F18Q5NVR6 B000J6ZYL0A001114613O3F18Q5NVR6 B0016JNS44

Page 55: UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS …biblioteca.uniritter.edu.br/imagens/035UNR89/0000F1/0000F128.pdf · LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS

54

Tabela 8 – Exemplo do ranking da quantidade de usuários por item avaliado.

Fonte: Elaborado pela autora.

Dessa forma, ao fim da mineração dos dados, os conjuntos de itens a serem

encontrados podem ser facilmente localizados e ordenados conforme seus números

correspondentes.

4.3 TRANSFORMAÇÃO DOS DADOS

Em continuidade à preparação dos dados, a etapa de transformação tem

como intuito modificar os dados originais para o formato adequado que o algoritmo a

ser utilizado necessita (FACELI et al., 2011). Para tanto, foi realizada uma

transformação nos dados referentes aos itens avaliados por usuário que, conforme

tabela 7, eram agrupados sequencialmente a partir dos usuários e os itens

correspondentes.

A transformação ocorre ao alterar o formato dos dados de modo que cada

linha corresponda a um usuário e suas avaliações, conforme exemplo na tabela 9:

Tabela 9 – Exemplo da transformação usuário/itens avaliados.

Fonte: Elaborado pela autora.

Como demonstrado na tabela 9, a sequência de itens avaliados pelo usuário

“A001114613O3F18Q5NVR6” é combinada em uma mesma linha, de modo a

transformar todas suas avaliações em uma mesma “transação” – já que o algoritmo

entende os conjuntos de dados como transações (Han et al., 2004). Os itens,

Item QtdeUsers RankingAvaliadoresDistintos

B005LERHD8 361 1 B005GYGD7O 223 2 B0058XIMMM 216 3 B008WYDP1C 205 4 B00CKGB85I 171 5

Usuário Item

A001114613O3F18Q5NVR6 3534A001114613O3F18Q5NVR6 6035A001114613O3F18Q5NVR6 8171A001114613O3F18Q5NVR6 2681A001114613O3F18Q5NVR6 45A001114613O3F18Q5NVR6 2307

1 3534 6035 8171 2681 45 2307

Page 56: UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS …biblioteca.uniritter.edu.br/imagens/035UNR89/0000F1/0000F128.pdf · LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS

55

demonstrados nesta transação, estão representados de acordo com o ranking

estabelecido na etapa de pré-processamento (tabela 8), de forma a auxiliar na

transformação dos dados, uma vez que já é possível analisar, por exemplo, quais

itens desta transação foram mais avaliados por outros usuários.

Dessa forma, a transformação configura-se em tornar o conjunto dos dados

selecionado em uma base de dados de transações, “resumindo” em uma linha – que

é a representação de cada usuário – todas as avaliações feitas por um determinado

usuário, em que cada número corresponde a um item (produto avaliado).

4.4 MINERAÇÃO DOS DADOS

Neste estudo, a aplicação da mineração de padrões frequentes tem como

objetivo buscar os conjuntos de itens (produtos) frequentes sobre as avaliações de

usuários. Para este estudo, os valores mínimos estabelecidos de suporte e

confiança são, respectivamente: 0,01% e 80%.

A partir da transformação apresentada na tabela 9, em que o conjunto de

dados de avaliações foi alterado para o formato de uma base de dados

transacionais, e após estabelecidos os valores mínimos de suporte e confiança, se

constitui o formato de entrada do algoritmo, conforme tabela 10:

Tabela 10 – Exemplo dos dados de entrada.

Fonte: Elaborado pela autora.

Os dados de saída são constituídos pelos conjuntos de itens e os suportes

correspondentes, bem como pelas regras de associação extraídas a partir dos

conjuntos de itens frequentes (FOURNIER-VIGER et al., 2017). Na tabela 11, é

mostrado um exemplo dos dados de saída, em que são demonstrados cinco

conjuntos de itens frequentes processados a partir do conjunto de dados

selecionado:

TID Transação1 3534 6035 8171 2681 2 1749 46173 533 56 1698 2052 4 17356 6172 150125 723 4069 1328 13549

Page 57: UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS …biblioteca.uniritter.edu.br/imagens/035UNR89/0000F1/0000F128.pdf · LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS

56

Tabela 11 – Exemplo dos dados de saída: conjuntos de itens frequentes.

Fonte: Elaborado pela autora.

Na tabela 12, também, um exemplo das regras de associação extraídas a

partir dos conjuntos de itens frequentes:

Tabela 12 – Exemplo dos dados de saída: regras de associação.

Fonte: Elaborado pela autora.

Após a mineração dos dados, que resultou em 5766 conjuntos de itens

frequentes, dá-se início à etapa de interpretação dos dados, dividida neste estudo

em análise exploratória e análise qualitativa.

4.5 INTERPRETAÇÃO DOS DADOS

A etapa de interpretação dos dados do método KDD é caracterizada pela

análise dos padrões descobertos, podendo ocorrer a remoção de padrões

considerados redundantes ou irrelevantes, e a elucidação dos considerados úteis

(FAYYAD; PIATETSKY-SHAPIRO; SMYTH, 1996b). Essa etapa é dividida, neste

estudo, em análise exploratória e análise qualitativa, sendo que na primeira se exibe

uma visão geral dos dados a partir de representações visuais, e as oportunidades a

serem exploradas. Na segunda, são analisados os resultados da mineração, em que

se visa buscar as possíveis similaridades entre os conjuntos de itens frequentes.

4053 5251 5267 5268 5997 104053 5251 5267 5268 5995 104053 5251 5267 5268 5995 5997 95251 5267 5268 5995 5997 94053 5267 5268 5995 5997 9

Conjuntos Suporte

4053 5251 5267 5268 5997 104053 5251 5267 5268 5995 104053 5251 5267 5268 5995 5997 95251 5267 5268 5995 5997 94053 5267 5268 5995 5997 9

Regras Suporte Confiança

4053 5251 5267 5268 5997 ==> 5995 9 0,9

4053 5251 5267 5268 5995 ==> 5997 9 0,9

5251 5267 5268 5997 ==> 4053 5995 9 0,9

5251 5267 5268 5995 ==> 4053 5997 9 0,9

4053 5267 5268 5997 ==> 5251 5995 9 0,9

Page 58: UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS …biblioteca.uniritter.edu.br/imagens/035UNR89/0000F1/0000F128.pdf · LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS

57

4.5.1 Análise exploratória dos dados

A partir desta análise são explorados os dados minerados a fim de

proporcionar uma visão geral dos conjuntos de dados e descobrir oportunidades

para maiores investigações. São expostas, a seguir, representações visuais de

alguns aspectos desta análise que foram considerados mais interessantes para este

estudo.

Baseado na tabela 6 (pré-processamento dos dados), o gráfico abaixo

apresenta a relação entre a porcentagem de usuários e a quantidade de itens

avaliados, sendo que destes o valor mais representativo é o de 5 itens avaliados,

isto é, 41,5% dos usuários avaliariam até 5 itens. Pode-se destacar, também, o

quanto a porcentagem de usuários diminui a partir de 8 itens avaliados,

apresentando valor de 11,8%.

Gráfico 1 – Relação entre a porcentagem de usuários e a quantidade de itens

avaliados.

Fonte: Elaborado pela autora.

A partir da análise do gráfico 1, pode-se perceber que 76% dos usuários avaliaram entre 5 e 7 itens, ou seja, somente 24% dos usuários avaliou mais de 7 itens. Isso pode significar que os conjuntos de itens frequentes com mais de 7 itens apresentem valor de suporte baixo (considerando suporte = quantidade de usuários).

No gráfico 2, pode-se ver a relação entre a quantidade de itens avaliados pela quantidade de usuários (avaliações) por item. No eixo “quantidade de usuários por

0%

5%

10%

15%

20%

25%

30%

35%

40%

45%

5 6-7 8-9 10-11 12-13 14-15 16-17 18-19

% de

usu

ário

s

Quantidade de itens avaliados

Page 59: UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS …biblioteca.uniritter.edu.br/imagens/035UNR89/0000F1/0000F128.pdf · LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS

58

item” foram agrupados os itens a partir da quantidade de avaliações, isto é, no valor “5” significa que apenas 5 usuários avaliaram a quantidade de itens correspondente.

Gráfico 2 – Relação entre a quantidade de itens avaliados por grupo de usuários.

Fonte: Elaborado pela autora.

Sendo assim, percebe-se que 4643 itens são avaliados por apenas 6 ou 7

usuários. Assim, grupos de 5, 6 ou 7 usuários representam 49% do total de itens

avaliados, e os demais grupos apresentam 9014 itens representando 51% do total.

Seguindo a mesma lógica do gráfico anterior, entende-se, a partir da análise

do gráfico abaixo, que 69% dos itens foram avaliados por grupos contendo até 10

usuários, o que representa 12168 itens. Nota-se, também, que o grupo de 11 a 15

usuários (2538 itens) apresenta um valor considerável, se comparado ao grupo de 5

usuários.

Gráfico 3 – Quantidade de avaliações por item.

Fonte: Elaborado pela autora.

Page 60: UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS …biblioteca.uniritter.edu.br/imagens/035UNR89/0000F1/0000F128.pdf · LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS

59

Com base no “Ranking Avaliadores Distintos” estabelecido na etapa de pré-

processamento (tabela 8), é apresentado, no quadro 7, um ranking dos cinco itens

mais avaliados, contendo a imagem e título do produto, e a quantidade de usuários

(avaliadores) correspondente.

Quadro 7 – Ranking dos 5 itens mais avaliados.

Fonte: Elaborado pela autora.

Os itens apresentados no quadro 7 pertencem à categoria de acessórios,

vestuário e calçados, sendo três destes de vestuário, um de acessórios e um de

calçados. Observa-se que, apesar do item número 1 pertencer à categoria de

acessórios, ele gerou 361 avaliações positivas de usuários distintos, um valor

significativamente maior que o número 2, com 223 avaliações. Nota-se, também,

que destes itens apresentados, apenas o item número 1 apresenta um título

descritivo, enquanto os demais, aparentemente, apresentam o nome da marca do

produto, o que pode representar dificuldades em uma análise mais detalhada. Além

disso, o item 1 está presente em 120 conjuntos de itens frequentes, seguido do item

4 apresentando 34 conjuntos, do item 2 com 17 e do item 5 com 8. No quadro 8 são

apresentados, a partir dos 120 conjuntos de itens frequentes que incluem o item 1,

os conjuntos com maior e menor suporte.

Ranking usuários distintos

1 2 3 4 5

Quantidade de usuários

361 223 216 205 171

Título do item

Vintage, Retro Colorful Crystal

Owl Pendant and Long Chain

Necklace with Antiqued Bronze/

Brass Finish

Spalding Women

Skechers Women

Allegra K Women

Azules Women

Page 61: UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS …biblioteca.uniritter.edu.br/imagens/035UNR89/0000F1/0000F128.pdf · LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS

60

Quadro 8 – Conjuntos de itens frequentes do item 1.

Fonte: Elaborado pela autora.

Nota-se que nos 34 conjuntos do item 4 – conforme quadro 9 –, a quantidade

de itens por grupo não varia, apresentando em todos apenas 2 itens, diferentemente

do item 1 que, ao apresentar grupos maiores, pode possibilitar maiores percepções

a respeito das preferências dos usuários.

Quadro 9 – Conjuntos de itens frequentes do item 4.

Fonte: Elaborado pela autora.

A partir da análise apresentada no quadro 9, pode-se perceber que o conjunto

de dados selecionado para este estudo, possivelmente, não apresentará grandes

conjuntos de itens, já que o item 4 (que é um dos 5 itens mais avaliados) apresenta

conjuntos de 2 itens nos 34 que ele integra.

Esta análise exploratória aponta, principalmente, que os conjuntos de itens

frequentes encontrados não apresentam suportes altos, se comparados com a

quantidade de usuários inicial (25.307 usuários), como apresentado no gráfico 3,

que indica que 69% dos itens foram avaliados por grupos de até 10 usuários. Com

essas conclusões, parte-se então para a análise qualitativa dos dados.

Page 62: UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS …biblioteca.uniritter.edu.br/imagens/035UNR89/0000F1/0000F128.pdf · LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS

61

4.5.2 Análise qualitativa dos dados

Com base nesta análise, analisa-se os resultados da mineração dos dados

buscando similaridades e diferenças a partir dos conjuntos de itens frequentes

encontrados. São apresentadas, a seguir, representações visuais dos conjuntos

considerados mais pertinentes para esta análise sendo que, ao todo, foram

encontrados 5766 conjuntos de itens frequentes a partir dos dados selecionados.

Na figura 4, é apresentado um esquema organizado a partir dos cinco

conjuntos de itens frequentes que apresentaram o maior suporte, ou seja, a maior

quantidade de avaliações de usuários distintos.

Figura 4 – Relação entre os conjuntos de itens frequentes de maior suporte.

Fonte: Elaborado pela autora.

Conforme ilustrado, o conjunto de itens frequentes 1 e 38 (representados ao

lado das imagens) apresenta um suporte de 50, isto é, 50 usuários avaliaram os dois

itens. O item 14 apresenta um suporte de 38 estando no mesmo conjunto do item 1,

e suporte de 24 com o item 38. O item 11, com 160 usuários distintos, apresenta

suporte de 36 em conjunto com o item 1, e suporte de 27 com o item 20. Vale

lembrar que a partir dos números dos itens, já é possível analisar individualmente o

quanto foram bem avaliados.

Percebe-se que este grupo de itens apresenta similaridades em relação à

categoria (acessórios) e subcategoria (colar) a que pertencem, bem como ao estilo

Page 63: UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS …biblioteca.uniritter.edu.br/imagens/035UNR89/0000F1/0000F128.pdf · LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS

62

que, conforme a descrição dos títulos no quadro abaixo, se caracteriza por

representações de animais e pelos estilos “vintage” e “retro”.

Quadro 10 – Títulos dos itens apresentados na figura 7.

Fonte: Elaborado pela autora.

Outro ponto a ser notado é a relação entre um conjunto de itens frequentes e

seus itens adjacentes, conforme ilustrado na figura 5. O item 10 é integrante de 4

conjuntos com os itens 13, 300, 15 e 83. Pode-se perceber que conforme o valor de

suporte diminui, as semelhanças entre os itens diminuem também: item 13 possui

estampa semelhante à do item 10; item 300 pode ser utilizado em conjunto; item 15

e item 4 apresentam a mesma categoria do item 10.

Figura 5 – Relação entre conjuntos de itens frequentes.

Fonte: Elaborado pela autora.

Page 64: UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS …biblioteca.uniritter.edu.br/imagens/035UNR89/0000F1/0000F128.pdf · LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS

63

Da mesma forma, os itens adjacentes aos itens 13 e 15 também expõem essa

característica, isto é, o conjunto de itens com maior suporte apresenta maiores

semelhanças do que os conjuntos com menor suporte. Vale notar que, apesar dos

valores de suporte dos itens mostrados na figura 8 serem relativamente baixos,

quando adicionados os itens adjacentes – neste caso dos itens 13 e 15 – são

agregadas mais características de estilo destes usuários, o que pode ser vantajoso

ao buscar definir suas preferências.

Uma das principais limitações encontradas são os conjuntos de itens que,

visivelmente, não apresentam diferenças contrastantes entre eles. No quadro abaixo

são mostrados dois exemplos que apresentam tal característica. Além do caráter

visual, os itens apresentam a mesma descrição de título, dificultando ainda mais

encontrar alguma distinção entre eles.

Quadro 11 – Conjuntos de itens similares.

Fonte: Elaborado pela autora.

Outro exemplo é o conjunto encontrado que apresenta a maior quantidade de

itens em um mesmo conjunto, contendo 12 itens com um suporte de 4. Apesar do

suporte ser baixo, nota-se que os produtos são praticamente os mesmos, variando

em tamanhos e cor, o que pode significar que, ao combiná-los, obtenha-se um

suporte maior.

Page 65: UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS …biblioteca.uniritter.edu.br/imagens/035UNR89/0000F1/0000F128.pdf · LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS

64

Quadro 12 – Maior conjunto de itens frequentes encontrado.

Fonte: Elaborado pela autora.

Sendo assim, ao considerar que busca-se aqui, principalmente, uma

avaliação quanto às preferências dos usuários, o exemplo do quadro acima indica

que os 4 usuários que avaliaram estes 12 itens, poderiam ser enquadrados em uma

mesma persona já que, em relação ao estilo destes produtos, todos se propõem a

reduzir medidas (de acordo com as descrições dos títulos e análise das imagens), e

que ao analisar os motivos pelos quais um usuário avaliaria bem estes produtos, se

percebe que existe a mesma necessidade a ser sanada na busca por itens como

estes.

Analisando os títulos mais detalhadamente e eliminando as variações de

tamanho e cor, são identificadas duas finalidades centrais destes itens, que são:

redutor de medidas e pós-parto. Dessa forma, ao combiná-los, as quantidades de

avaliações do item “redutor de medidas” seria de 72, e do item “pós-parto” de 30.

Sendo assim, ao invés de um conjunto de 12 itens avaliados por 4 usuários,

haveriam 2 conjuntos de itens avaliados por um total de 102 usuários, como

ilustrado no quadro abaixo:

Ranking Qtd Usuários Título Imagem

5251 11 Wink Flats Belly Compression Short Length Girdle, Large, Beige

5995 10 Wink Flats Belly Compression Short Length Girdle, Medium, Black

12142 6 Wink Flats Belly Compression Short Length Girdle, Xxl, Black

12146 6 Wink Flats Belly Compression Short Length Girdle, Medium, Beige

5997 10 Wink Flats Belly Compression Knee Length Girdle, Medium, Black

12145 6 Wink Flats Belly Compression Knee Length Girdle, Small, Black

12147 6 Wink Flats Belly Compression Knee Length Girdle, Medium, Beige

12148 6 Wink Flats Belly Compression Knee Length Girdle, Xl, Black

4053 13Wink Flats Post-pregnancy Belly Compression Postpartum

Girdle, Medium, Beige

5267 11 Wink Ultimate Body 2x Blaster - Small

5268 11Wink Flats Belly Blaster Compression Postpartum C Section,

Medium, Beige

12061 6 Wink Belly Bands Post-Pregnancy Compression Full Body Style

Page 66: UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS …biblioteca.uniritter.edu.br/imagens/035UNR89/0000F1/0000F128.pdf · LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS

65

Quadro 13 – Alternativa do maior conjunto de itens frequentes encontrado.

Fonte: Elaborado pela autora.

No quadro acima o processo de combinação dos itens foi realizado de forma

manual, porém – conforme exposto na seção 2.3 – existem modelos de classificação

de estilo e métodos capazes de identificar elementos de vestuário (KIAPOUR et al.,

2014; VEIT et al., 2015; MCAULEY et al., 2015), além de algoritmos de mineração

de texto (GHANI et al., 2006), que poderiam ser utilizados de forma a automatizar

esse processo. A combinação de itens similares e suas variações (como tamanhos e

cores), se executada em todos os 17.729 itens, daria maior dimensão aos resultados

da mineração de itens frequentes já que, possivelmente, os conjuntos de itens

frequentes encontrados teriam mais itens e maior suporte.

Mesmo assim, ao analisar a figura 6 em que são ilustrados todos os itens que

fazem conjunto com o item 2 (apresentado no quadro 7) – sendo o item 2 integrante

de 17 conjuntos –, percebe-se uma clara caracterização de estilo, tanto pelas

categorias de produtos e suas finalidades, quanto pelas cores apresentadas.

Figura 6 – Relação entre o item 2 e seus conjuntos de itens frequentes.

Fonte: Elaborado pela autora.

Page 67: UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS …biblioteca.uniritter.edu.br/imagens/035UNR89/0000F1/0000F128.pdf · LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS

66

Ao considerar que no âmbito do item 2 existem 17 outros itens relacionados a

ele, mesmo que não estejam em um mesmo conjunto de itens frequentes, ainda

assim é possível assimilar as preferências de estilo destes usuários. Nesse caso,

103 avaliações foram feitas relacionadas ao item 2, e se forem considerados apenas

os itens considerados “esportivos”, por exemplo, ainda seriam 81 avaliações,

conforme ilustrado na figura 7.

Figura 7 – Relação entre o item 2 e seus conjuntos de itens frequentes “esportivos”.

Fonte: Elaborado pela autora.

Na análise do item 2 considerou-se apenas os itens diretamente relacionados

a ele, porém se considerados os itens relacionados em um segundo nível (ilustrado

na figura 8), o escopo de interpretação das preferências dos usuários fica ainda mais

amplo.

Figura 8 – Itens relacionados ao item 2 em um segundo nível.

Fonte: Elaborado pela autora.

Page 68: UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS …biblioteca.uniritter.edu.br/imagens/035UNR89/0000F1/0000F128.pdf · LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS

67

Sendo assim, ao fim desta análise, pode-se perceber que apesar dos

conjuntos encontrados não possuírem valor de suporte alto, ao combinar os

conjuntos relacionados de um mesmo item, torna-se possível – a partir da

interpretação das imagens dos produtos – indicar preferências de estilo de usuários.

A seguir é apresentada a discussão dos resultados deste estudo.

5 DISCUSSÃO DE RESULTADOS

Neste capítulo são apresentadas as interpretações dos resultados

encontrados a partir das análises realizadas e a discussão destes resultados,

visando avaliar: (1) as implicações do estudo; (2) as limitações da pesquisa; (3) a

relação entre os resultados e estudos existentes; e (4) se a questão de pesquisa foi

respondida.

Conforme as conclusões apresentadas ao fim da análise qualitativa, percebe-

se como potencialidade o agrupamento de itens relacionados na interpretação de

estilo e preferências de usuários. A fim de verificar essa potencialidade, foram

agrupados os itens relacionados ao item 4 que é associado a 34 conjuntos de itens

frequentes – o dobro de conjuntos do item 2, apresentado nas figuras 6,7 e 8 – com

2 itens por conjunto, como apresentado na figura 9:

Figura 9 – Itens relacionados ao item 4.

Fonte: Elaborado pela autora.

Page 69: UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS …biblioteca.uniritter.edu.br/imagens/035UNR89/0000F1/0000F128.pdf · LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS

68

Os indicativos numéricos da figura representam os valores de suporte dos

conjuntos relacionados ao item 4 (ao centro), sendo agrupados os itens com mesmo

valor de suporte a fim de facilitar a visualização. Observa-se que, apesar dos valores

de suporte não serem considerados altos (em relação à quantidade de usuários

inicial), ao serem agrupados todas as imagens dos conjuntos de itens frequentes do

item 4 torna-se possível identificar padrões a partir da modelagem dos produtos,

cores, estampas e acessórios. Pode-se perceber estampas contendo

representações de animais, caveiras, padrões geométricos e, principalmente, o

predomínio de tons escuros. Percebe-se, também, a grande variedade de itens

como blusas e camisetas, as quais apresentam, na sua maioria, o estilo oversized

(peça de vestuário propositalmente grande).

Ampliando o escopo desta análise, foram agrupados também os itens

relacionados de determinados itens da figura 9, os quais podem ser observados na

figura 10:

Figura 10 – Exemplo de agrupamento em segundo nível.

Fonte: Elaborado pela autora.

Page 70: UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS …biblioteca.uniritter.edu.br/imagens/035UNR89/0000F1/0000F128.pdf · LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS

69

Observa-se a existência de itens duplicados do primeiro nível para o segundo,

reforçando a ideia de que os usuários que avaliaram estes produtos apresentam um

padrão semelhante de preferência de estilo. Constata-se, também, que à medida em

que o valor de suporte diminui, as semelhanças entre os produtos também

diminuem. Vale ressaltar que a figura 10 contempla apenas 4 itens em destaque e

seus itens relacionados sendo que, no âmbito de 5766 conjuntos de itens frequentes

resultantes da mineração dos dados, poderiam ser agregados diversos outros itens

a essa análise.

Ao analisar essa potencialidade, – o agrupamento de itens relacionados –

propõe-se um modelo de apoio ao desenvolvimento de Personas que se estabelece

pela mineração de padrões frequentes em bases de dados de avaliações de

produtos de vestuário em associação à abordagem Fiction-based (NIELSEN, 2013)

na qual o designer utiliza suas experiências e intuições como forma de descrever a

persona, mas que não utiliza dados para tanto. Para Norman (2004), o

desenvolvimento de Personas não exige a aplicação de dados de usuários, sendo

este entendimento justificado pela prerrogativa de que o designer pode usufruir de

suas próprias experiências de vida na resolução de questões projetuais. No entanto,

Nielsen (2013) percebe a utilidade da ficção como suporte à comunicação das

personas para a equipe, porém não em seu desenvolvimento.

Ainda que o Design de moda pertença a uma área criativa, considera-se,

neste estudo, que o emprego de dados de usuários é indispensável no processo de

desenvolvimento de Personas, bem como no desenvolvimento de produtos de

vestuário competitivos no mercado e que, principalmente, atendam às demandas

dos consumidores. Desse modo, propõe-se uma forma de utilizar dados de usuários

sem suprimir o processo criativo do designer no desenvolvimento de Data-driven

Personas, propiciando a ele um meio de formular narrativas e descrições de

personas com base na própria interpretação dos dados, assim como por suas

experiências e intuições. Apresenta-se, na figura 11, o modelo proposto:

Page 71: UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS …biblioteca.uniritter.edu.br/imagens/035UNR89/0000F1/0000F128.pdf · LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS

70

Figura 11 – Modelo proposto de Data-driven Persona.

Fonte: Elaborado pela autora.

Neste modelo, destaca-se o uso de atributos visuais como forma de

comunicar dados de usuários a designers, os quais valorizam informações de

Design rápidas, fáceis, “[...] visualmente estimulantes, flexíveis, abertas e

relacionadas de forma clara e concreta [...]” (MARSHALL et al., 2015, p. 312,

tradução nossa), que ao serem agregados ao desenvolvimento de Personas,

viabilizam um maior engajamento e empatia entre a equipe de projeto.

Configura-se, também, como atributo deste modelo a rastreabilidade dos

dados (PRUITT; GRUDIN, 2003; MULDER; YAAR, 2006; CHAPMAN; MILHAM,

2006) que, conforme entendimento de Chapman e Milham (2006), é uma questão a

ser solucionada no âmbito do uso da ferramenta Persona como forma de comunicar

dados de usuários, além da dificuldade em estabelecer o número de usuários

representados por ela. No entanto, a partir da visualização dos itens que compõem a

interpretação dos dados deste modelo, podem ser identificados e rastreados os

dados que formam a narrativa e descrição da persona desenvolvida, assim como o

número de avaliadores (usuários) de cada item e conjunto.

Posto que, no entendimento de Marshall et al. (2015, p. 317, tradução nossa),

Personas são utilizadas “[...] para definir o que os usuários querem obter ao utilizar

um produto ou serviço.”, e como uma ferramenta na comunicação destas

necessidades/desejos aos envolvidos no projeto, percebe-se o modelo proposto

consonante a tal perspectiva, na medida em que auxilia a visualização e

comunicação das preferências dos usuários a partir da interpretação dos dados pelo

designer. Por outro lado, o modelo permite inferir claramente apenas as preferências

relacionadas a itens de vestuário de usuários, contemplando características

indicativas de uma persona, como “[...] comportamentos, metas, desejos,

Page 72: UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS …biblioteca.uniritter.edu.br/imagens/035UNR89/0000F1/0000F128.pdf · LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS

71

necessidades e frustrações [...]” (ZHANG; BROWN; SHANKAR, 2016, p. 5350,

tradução nossa), enquanto meras interpretações a partir destas preferências.

Ressalta-se que, neste estudo, a pesquisa de usuário é considerada a base

para o desenvolvimento de Personas (MIASKIEWICZ; SUMNER; KOZAR, 2008) e,

por essa razão, os resultados encontrados e o modelo proposto são apontados

como uma forma de suporte ao processo, e não como substitutos. Sendo assim,

entende-se que o modelo proposto possa ser incluído em qualquer das abordagens

para Personas que envolvam dados – ou seja, Goal-directed, Role-based e

Engaging –, atuando como apoio aos métodos utilizados nestas abordagens e,

principalmente, como uma ferramenta visual. Ainda assim, mesmo aplicado sem a

utilização de outros métodos/abordagens, percebe-se que é possível desenvolver

Data-driven Personas a partir do modelo proposto, porém as mesmas podem ser

tendenciosas e não replicáveis (TU et al., 2010), uma vez que são formadas como

consequência às interpretações e intuições do designer em relação aos dados.

O modelo proposto, ainda, apresenta características similares a outros

estudos sobre Data-driven Personas, tais como:

1) a quantidade extensa de dados de usuário disponíveis (ZHANG;

BROWN; SHANKAR, 2016; WATANABE et al., 2017; RAHIMI;

CLELAND-HUANG, 2014);

2) a facilidade e agilidade na coleta de dados (ZHANG; BROWN;

SHANKAR, 2016);

3) a rastreabilidade dos dados (MIASKIEWICZ; SUMNER; KOZAR, 2008;

WATANABE et al., 2017; MCGINN; KOTAMRAJU, 2008; RAHIMI;

CLELAND-HUANG, 2014; MARSHALL et al., 2015; ZHANG; BROWN;

SHANKAR, 2016);

4) a utilização de algoritmos de aprendizado de máquina (MIASKIEWICZ;

SUMNER; KOZAR, 2008; RAHIMI; CLELAND-HUANG, 2014; ZHANG;

BROWN; SHANKAR, 2016; WATANABE et al., 2017);

5) o caráter quantitativo em relação à coleta de dados (RAHIMI;

CLELAND-HUANG, 2014; ZHANG; BROWN; SHANKAR, 2016;

WATANABE et al., 2017);

6) a criação de narrativas para as personas desenvolvidas

(MIASKIEWICZ; SUMNER; KOZAR, 2008; WATANABE et al., 2017;

Page 73: UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS …biblioteca.uniritter.edu.br/imagens/035UNR89/0000F1/0000F128.pdf · LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS

72

RAHIMI; CLELAND-HUANG, 2014; MCGINN; KOTAMRAJU, 2008;

MARSHALL et al., 2015);

7) o uso de dados amplamente disponíveis na web (RAHIMI; CLELAND-

HUANG, 2014).

Relacionado a este último (7), nos trabalhos de Zhang, Brown e Shankar

(2016) e Watanabe et al. (2017) são empregados dados provenientes da web,

porém não se configuram como “amplamente disponíveis”, uma vez que são

utilizados dados de cliques de usuários realizados em páginas da web (ZHANG;

BROWN; SHANKAR, 2016; WATANABE et al., 2017) e de quantidades de logins de

usuários (WATANABE et al., 2017), os quais se caracterizam como informações

restritas a donos/desenvolvedores de websites.

Quanto às características contrastantes entre o modelo proposto e os

trabalhos apresentados, destacam-se: (1) a baixa subjetividade no desenvolvimento

de Personas (MIASKIEWICZ; SUMNER; KOZAR, 2008; RAHIMI; CLELAND-

HUANG, 2014; MCGINN; KOTAMRAJU, 2008; WATANABE et al., 2017); e (2) a

existência de processos de validação das personas criadas (RAHIMI; CLELAND-

HUANG, 2014; ZHANG; BROWN; SHANKAR, 2016; WATANABE et al., 2017).

Apesar das limitações apresentadas, entende-se que a questão de pesquisa

“como desenvolver Data-driven Personas para o Design de moda a partir de dados

de usuário disponíveis na web?” é respondida à medida em que é formada uma

proposta de modelo para o desenvolvimento de Data-driven Personas utilizando a

mineração de padrões frequentes em dados de avaliações de produtos de vestuário

– os quais são amplamente disponíveis a qualquer usuário – associados à

abordagem Fiction-based (NIELSEN, 2013), na qual se utilizam as experiências e

intuições do designer na elaboração da narrativa da persona.

6 CONSIDERAÇÕES FINAIS

Em meio ao contexto do fast fashion e do e-commerce, o presente estudo

teve como objetivo analisar as possíveis contribuições de dados amplamente

disponíveis na web no desenvolvimento de Data-driven Personas para o Design de

moda, por meio de um não experimento transversal descritivo (HERNÁNDEZ

SAMPIERI; FERNÁNDEZ COLLADO; BAPTISTA LUCIO, 2013) que utiliza dados de

Page 74: UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS …biblioteca.uniritter.edu.br/imagens/035UNR89/0000F1/0000F128.pdf · LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS

73

avalições de usuários acerca de produtos de vestuário provenientes da loja virtual

Amazon16 – coletados por He e McAuley (2016) – com o objetivo de identificar

padrões de preferências de estilo. Na análise dos dados empregou-se o método

KDD (FAYYAD; PIATETSKY-SHAPIRO; SMYTH, 1996b) – que contempla as etapas

de seleção, pré-processamento, transformação, mineração e interpretação dos

dados – sendo considerada, neste estudo, a etapa de mineração de dados como

mineração de padrões frequentes (HAN; KAMBER; PEI, 2011), na qual se utiliza o

algoritmo FP-Growth17 (Han et al., 2004) a fim de buscar os conjuntos de itens que

são avaliados de forma frequente pelos mesmos usuários no conjunto de dados

selecionado. A partir da etapa de mineração dos dados, que resultou em 5766

conjuntos de itens frequentes, foram realizadas as análises exploratória e qualitativa,

as quais apontaram, principalmente, os baixos valores de suporte dos conjuntos de

itens frequentes encontrados, bem como as possibilidades na associação dos

conjuntos relacionados a um item como uma forma de indicar as preferências de

estilo dos usuários.

Foram necessárias, para tanto, revisões de literatura acerca da ferramenta

Persona e das etapas que envolvem o processo de criação no Design de moda,

além da investigação de trabalhos relacionados a este estudo – classificados aqui

como Data-driven Personas, tecnologias orientadas a dados na moda e sistemas de

recomendação para a moda –, a partir dos quais foram percebidas oportunidades

como a demanda por dados de usuários que apresentem maior número de

características necessárias ao desenvolvimento de personas, a necessidade de

maiores discussões acerca da utilização da ferramenta Persona no Design de moda,

e a perspectiva da utilização de feedbacks explícitos como meio de descobrir

características em comum entre usuários. Ao fim das revisões de literatura sobre

Personas e o processo de criação no Design de moda foi possível confirmar a

premissa acerca da utilidade da ferramenta Persona para o Design de moda, ao

indicar que a inserção da ferramenta, principalmente, na segunda etapa do processo

de criação apresenta vantagens como facilitar a comunicação entre a equipe,

diminuir o retrabalho na revisão da coleção e durante a geração de conceitos iniciais

16 www.amazon.com 17 http://www.philippe-fournier-viger.com/spmf/index.php?link=algorithms.php

Page 75: UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS …biblioteca.uniritter.edu.br/imagens/035UNR89/0000F1/0000F128.pdf · LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS

74

e munir os designers com argumentos a favor de seus designs – ao possibilitar a

visualização dos dados que originaram as personas desenvolvidas.

Ao início deste estudo, foi levantada a questão acerca do limitado referencial

teórico disponível a respeito da utilização da ferramenta Persona no processo de

criação do Design de moda e, ao longo desta investigação, foi possível demonstrar

que esta questão é válida, já que apenas um estudo (BRALLIER, 2016) foi

identificado abordando a relação entre o Design de moda e a ferramenta. Ainda

assim, o estudo apresenta caráter majoritariamente qualitativo, utilizando uma

amostra de dados de 52 usuários que, em comparação aos conjuntos de dados

apresentados no estudo proposto e em estudos sobre Data-driven Personas

(ZHANG; BROWN; SHANKAR, 2016; WATANABE et al., 2017; RAHIMI; CLELAND-

HUANG, 2014), é considerado inviável na construção de Data-driven Personas.

Relacionado à premissa de existirem dados amplamente disponíveis na web,

ao longo da análise dos trabalhos relacionados acerca de sistemas de

recomendação para a moda, percebe-se a utilidade e capacidade da web como

fonte de informações acerca de usuários. Além disso, no estudo proposto são

apresentados os conjuntos de dados secundários de avaliações que foram coletados

por He e McAuley (2016), os quais após o processo de seleção dos dados, ainda

resultaram em grandes quantidades, representando 161.041 avaliações a partir de

25.307 usuários sobre 17.729 itens. Ainda que considerados como dados

secundários neste estudo proposto, os dados originalmente foram coletados pelos

autores a partir do website da loja virtual, contando com o acesso disponível a todos

usuários, o que reafirma a premissa inicial.

Em estudos futuros, pretende-se analisar os itens pior avaliados deste mesmo

conjunto de dados, a fim de buscar as “frustrações” dos usuários, já que neste

estudo proposto foram analisados somente os itens bem avaliados. Pretende-se,

também, utilizar modelos de classificação de estilo e mineração de texto a fim de

combinar automaticamente os itens a partir de similaridades visuais, permitindo

resultados mais precisos em relação às quantidades de avaliações por item, além de

proporcionar uma maior quantidade de itens presentes nos conjuntos de itens

frequentes.

Page 76: UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS …biblioteca.uniritter.edu.br/imagens/035UNR89/0000F1/0000F128.pdf · LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS

75

REFERÊNCIAS ADLIN, Tamara; PRUITT, John. The essential persona lifecycle: your guide to building and using personas. San Francisco: Morgan Kaufmann Publishers Inc., 2010. AL-HALAH, Ziad; STIEFELHAGEN, Rainer; GRAUMAN, Kristen. Fashion forward: forecasting visual style in fashion. Proceedings of the International Conference on Computer Vision, Venice, p. 1-12, 2017. Disponível em: <www.cs.utexas.edu/~grauman/papers/fashion-forward-iccv2017.pdf>. Acesso em: 8 ago. 2017. BARLOW-BUSCH, Robert. Marketing versus design personas. In: PRUITT, John; ADLIN, Tamara. The persona lifecycle: keeping people in mind throughout product design. 1. ed. San Francisco: Morgan Kaufmann Publishers Inc., 2006. p. 602-641. BRALLIER, Lauren. A point of tension: using personas to improve the apparel design process. 2016. 105 f. Dissertação (Mestrado em Artes) – College of the Arts, School of Art, Kent State University, Kent, Ohio, 2006. Disponível em: <etd.ohiolink.edu/pg_10?0::NO:10:P10_ETD_SUBID:117050>. Acesso em: 16 nov. 2017. BROOKS, Christopher; GREER, Jim. Explaining predictive models to learning specialists using personas. Proceedings of the Fourth International Conference on Learning Analytics and Knowledge, Indianapolis, p. 26-30, 2014. Disponível em: <dl.acm.org/citation.cfm?id=2567612>. Acesso em: 8 ago. 2017. BURNS, Leslie Davis; MULLET, Kathy K.; BRYANT, Nancy O. The business of fashion: designing, manufacturing, and marketing. 4. ed. New York: Fairchild Books, 2011. BURNS, Leslie Davis; MULLET, Kathy K.; BRYANT, Nancy O. The business of fashion: designing, manufacturing, and marketing. 5. ed. New York: Fairchild Books, 2016. CHAPMAN, Christopher; MILHAM, Russel. The personas' new clothes: methodological and practical arguments against a popular method. Proceedings of the Human Factors and Ergonomics Society 50th Annual Meeting, San Francisco, p. 634-636, 2006. Disponível em: <cnchapman.files.wordpress.com/2007/03/chapman-milham-personas-hfes2006-0139-0330.pdf>. Acesso em: 8 ago. 2017. CIOS, Krzysztof et al. Data mining: a knowledge discovery approach. 1. ed. United States: Springer, 2007. COBRA, Marcos. Marketing & moda. 1. ed. São Paulo: Senac, 2007. COOPER, Alan. The inmates are running the asylum: why high-tech products drive us crazy and how to restore the sanity. 2. ed. United States: Pearson Higher Education, 2004.

Page 77: UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS …biblioteca.uniritter.edu.br/imagens/035UNR89/0000F1/0000F128.pdf · LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS

76

CRESWELL, John W. Educational research: planning, conducting and evaluating quantitative and qualitative research. 4. ed. Boston: Pearson, 2012. DATE, Prutha; GANESAN, Ashwinkumar; OATES, Tim. Fashioning with networks: neural style transfer to design clothes. In: ACM SIGKDD Conference on Knowledge Discovery and Data Mining, 23., 2017, Nova Scotia, Poster Proceedings of the Workshop Machine Learning Meets Fashion, 2017, p. [1-7]. Disponível em: <kddfashion2017.mybluemix.net/final_submissions/ML4Fashion_paper_19.pdf>. Acesso em: 20 set. 2017. DJAJADININGRAT, J. P.; GAVER, W. W.; FRENS, J. W. Interaction relabelling and extreme characters: methods for exploring aesthetic interactions. Proceedings of the 3rd Conference on Designing Interactive Systems: processes, practices, methods, and techniques, New York, p. 66-71, 2000. Disponível em: <www.paulos.net/teaching/2011/AO/readings/00DjajDISInte.pdf>. Acesso em: 20 set. 2017. DICTIONARY.COM. Outfit. Disponível em: <www.dictionary.com/browse/outfit?s=t>. Acesso em: 20 set. 2017. FACELI, Katti et al. Inteligência artificial: uma abordagem de aprendizagem de máquina. 1. ed. Rio de Janeiro: LTC, 2011. FAYYAD, Usama; PIATETSKY-SHAPIRO, Gregory; SMYTH, Padhraic. From data mining to knowledge discovery in databases. AI Magazine, v. 17, n. 3, p. 37-54, 1996a. Disponível em: <www.aaai.org/ojs/index.php/aimagazine/article/viewFile/1230/1131>. Acesso em: 10 ago. 2017. FAYYAD, Usama; PIATETSKY-SHAPIRO, Gregory; SMYTH, Padhraic. The KDD process for extracting useful knowledge from volumes of data. Communications of the ACM, v. 39, n. 11, p. 27-34, 1996b. Disponível em: <dl.acm.org/citation.cfm?id=240464>. Acesso em: 10 ago. 2017. FERGUSON, Renee Boucher. How analytics is giving fashion a makeover. Massachusetts, 24 set. 2013. Texto postado no site MIT Sloan Management Review. Disponível em: <sloanreview.mit.edu/article/how-analytics-is-giving-fashion-a-makeover/>. Acesso em: 20 out. 2017. FLOYD, Ingbert; JONES, Cameron; TWIDALE, Michael. Resolving incommensurable debates: a preliminary identification of persona kinds, attributes, and characteristics. Artifact Journal, Copenhagen, v. 2, n. 1, p. 12-26, 2008. Disponível em: <scholarworks.iu.edu/journals/index.php/artifact/article/view/3912>. Acesso em: 10 jul. 2017. FOURNIER-VIGER, Philippe. Mining frequent itemsets using the fp-growth algorithm. [200-?]. Disponível em: <www.philippe-fournier-viger.com/spmf/FPGrowth.php>. Acesso em: 10 jan. 2018.

Page 78: UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS …biblioteca.uniritter.edu.br/imagens/035UNR89/0000F1/0000F128.pdf · LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS

77

FOURNIER-VIGER, Philippe et al. A survey of itemset mining. Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery, v. 7, n. 4, p. 1-41, 2017. Disponível em: <www.philippe-fournier-viger.com/Survey_Itemset_Mining.pdf>. Acesso em: 10 jan. 2018. FRINGS, Gini. Fashion: from concept to consumer. 9. ed. Upper Saddle River: Pearson Prentice Hall, 2008. GASKILL, LuAnn Ricketts. Toward a model of retail product development: a case study analysis. Clothing and Textiles Research Journal, v. 10, n. 4, p. 17-24, 1992. Disponível em: <journals.sagepub.com/doi/abs/10.1177/0887302X9201000403>. Acesso em: 10 abr. 2017. GHANI, Rayid et al. Text mining for product attribute extraction. ACM SIGKDD Explorations Newsletter, v. 8, n. 1, p. 41-48, 2006. Disponível em: <https://dl.acm.org/citation.cfm?id=1147241>. Acesso em: 8 ago. 2017. GRUDIN, Jonathan; PRUITT, John. Personas, participatory design and product development: an infrastructure for engagement. Proceedings of Participation and Design Conference, Malmo, p. 144-161, 2002. Disponível em: <ojs.ruc.dk/index.php/pdc/article/viewFile/249/241>. Acesso em: 10 abr. 2017. GUAN, Congying et al. Apparel recommendation system evolution: an empirical review. International Journal of Clothing Science and Technology, v. 28, n. 6, p. 854-879, 2016. Disponível em: <www.emeraldinsight.com/doi/abs/10.1108/IJCST-09-2015-0100>. Acesso em: 10 abr. 2017. HAN, Jiawei et al. Mining frequent patterns without candidate generation: a frequent-pattern tree approach. Data Mining and Knowledge Discovery Journal, v. 8, n. 1, p. 53-87, 2004. Disponível em: <hanj.cs.illinois.edu/pdf/dami04_fptree.pdf>. Acesso em: 10 abr. 2017. HAN, Jiawei et al. Frequent pattern mining: current status and future directions. Data Mining and Knowledge Discovery Journal, v. 15, n. 1, p. 55-86, 2007. Disponível em: <www.it.uu.se/edu/course/homepage/infoutv2/vt13/assignment_data/Han-fim-review.pdf>. Acesso em: 10 jan. 2018. HAN, Jiawei; KAMBER, Micheline; PEI, Jian. Data mining: concepts and techniques. 3. ed. Massachusetts: Morgan Kaufmann, 2011. HARLEY, Aurora. Personas make users memorable for product team member. Fremont, 16 fev. 2015. Texto postado no portal Nielsen Norman Group. Disponível em: <www.nngroup.com/articles/persona/?lm=personas&pt=course>. Acesso em: 20 out. 2017. HE, Ruining; CHUNBIN, Lin; MCAULEY, Julian. Fashionista: a fashion-aware graphical system for exploring visually similar items. Proceedings of the 25th International Conference Companion on World Wide Web, Montréal, p. 199-202,

Page 79: UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS …biblioteca.uniritter.edu.br/imagens/035UNR89/0000F1/0000F128.pdf · LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS

78

2016. Disponível em: <dl.acm.org/citation.cfm?id=2872518.2890534>. Acesso em 10 abr. 2017. HE, Ruining; MCAULEY, Julian. Ups and downs: modeling the visual evolution of fashion trends with one-class collaborative filtering. Proceedings of the 25th International Conference on World Wide Web, Montréal, p. 507-517, 2016. Disponível em: <dl.acm.org/citation.cfm?id=2883037>. Acesso em: 10 abr. 2017. HERNÁNDEZ SAMPIERI, Roberto; FERNÁNDEZ COLLADO, Carlos; BAPTISTA LUCIO, Pilar. Metodologia de pesquisa. 23. ed. Porto Alegre: Penso, 2013. HINES, Tony; BRUCE, Margaret. Fashion marketing: contemporary issues. 2. ed. United Kingdom: Butterworth-Heinemann, 2007. HSU, Esther; PAZ, Christie; SHEN, Shizhe. Clothing image retrieval for smarter shopping. California, p. 1-6, 2011. Disponível em: <pdfs.semanticscholar.org/f32c/8589ce00158a8b96ecbf9badef8afb0cf3cd.pdf>. Acesso em: 8 ago. 2017. JIA, Jia et al. Learning to appreciate the aesthetic effects of clothing. Proceedings of the Thirtieth AAAI Conference on Artificial Intelligence, Phoenix, p. 1216-1222, 2016. Disponível em: <dl.acm.org/citation.cfm?id=3015992>. Acesso em: 10 abr. 2017. JONES, Sue Jenkyn. Diseño de moda. 1. ed. Barcelona: Art Blume, 2013. JUNIOR, Plinio Thomaz Aquino; FILGUEIRAS, Lucia Vilela Leite. User modeling with personas. Proceedings of the 2005 Latin American Conference on Human-Computer Interaction, Cuernavaca, p. 277-282, 2005. Disponível em: <dl.acm.org/citation.cfm?id=1111388>. Acesso em: 10 ago. 2017. KANG, Wang-Cheng. Deep visually-aware fashion recommendation. Documento elaborado para disciplina CSE 258 Assignment 2, University of California, San Diego, 2017. Disponível em: <cseweb.ucsd.edu/classes/wi17/cse258-a/reports/a034.pdf>. Acesso em: 10 ago. 2017. KIAPOUR, M. Hadi et al. Hipster wars: discovering elements of fashion styles. Proceedings of the 13th European Conference, Zurich, pt. 1, p. 472-488, 2014. Disponível em: <link.springer.com/chapter/10.1007/978-3-319-10590-1_31>. Acesso em: 8 ago. 2017. KOTLER, Philip; KELLER, Kevin Lane. Administração de marketing. 14. ed. São Paulo: Pearson Education do Brasil, 2012. KUMAR, Ranjitha; VACCARO, Kristen. An experimentation engine for data-driven fashion systems. Proceedings of the 2017 AAAI Spring Symposium Series, Stanford, p. 389-394, 2017. Disponível em: <aaai.org/ocs/index.php/SSS/SSS17/paper/viewFile/15380/14572>. Acesso em: 20 set. 2017.

Page 80: UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS …biblioteca.uniritter.edu.br/imagens/035UNR89/0000F1/0000F128.pdf · LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS

79

LEACH, Robert. The fashion resource book: research for design. 1. ed. London: Thames & Hudson, 2012. LEE, Hanbit; LEE, Sang-goo. Style recommendation for fashion items using heterogeneous information network. Poster Proceedings of the 9th ACM Conference on Recommender Systems, Vienna, 2015. Disponível em: <ceur-ws.org/Vol-1441/recsys2015_poster20.pdf>. Acesso em: 10 abr. 2017. LIMAKSORNKUL, Chantima et al. Smart closet: statistical-based apparel recommendation system. Proceedings of the 2014 Third ICT International Senior Project Conference, Thailand, p. 155-158, 2014. Disponível em: <ieeexplore.ieee.org/abstract/document/6923240>. Acesso em: 8 ago. 2017. LIN, Yusan; WANG, Tawei. Dress up like a stylist: learning from a user-generated fashion network. In: ACM SIGKDD Conference on Knowledge Discovery and Data Mining, 23., 2017, Nova Scotia, Poster Proceedings of the Workshop Machine Learning Meets Fashion, 2017, p. [1-6]. Disponível em: <kddfashion2017.mybluemix.net/final_submissions/ML4Fashion_paper_16.pdf>. Acesso em: 20 set. 2017. LIN, Yusan; ZHOU, Yilu; XU, Heng. Text-generated fashion influence model: an empirical study on Style.com. Proceedings of the 2015 48th Hawaii International Conference on System Sciences, Hawaii, p. 3642-3650, 2015. Disponível em: <dl.acm.org/citation.cfm?id=2761691>. Acesso em: 8 ago. 2017. MARSHALL, Russel et al. Design and evaluation: end users, user datasets and personas. Applied Ergonomics, Guildford, v. 46, pt. B, p. 311-317, jan. 2015. Disponível em: <www.sciencedirect.com/science/article/pii/S0003687013000471?via%3Dihub>. Acesso em: 10 abr. 2017. MCAULEY, Julian et al. Image-based recommendations on styles and substitutes. Proceedings of the 38th International ACM SIGIR Conference on Research and Development in Information Retrieval, Santiago, p. 43-52, 2015. Disponível em: <https://dl.acm.org/citation.cfm?id=2767755>. Acesso em: 10 ago. 2017. MCGINN, Jennifer; KOTAMRAJU, Nalini. Data-driven persona development. Proceedings of the SIGCHI Conference on Human Factors in Computing Systems, Florence, p. 1521-1524, 2008. Disponível em: <dl.acm.org/citation.cfm?id=1357292>. Acesso em: 8 ago. 2017. MESGARI, Mostafa; OKOLI, Chitu; GUINEA, Ana Ortiz de. Affordance-based user personas: a mixed- method approach to persona development. Proceedings of the 21th Americas Conference on Information Systems, Puerto Rico, p. 1-17, 2015. Disponível em: <citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.1010.835&rep=rep1&type=pdf>. Acesso em: 8 ago. 2017. METE, Fatma. The creative role of sources of inspiration in clothing design. International Journal of Clothing Science and Technology, vol. 18, ed. 4, p. 278-

Page 81: UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS …biblioteca.uniritter.edu.br/imagens/035UNR89/0000F1/0000F128.pdf · LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS

80

293, 2006. Disponível em: <www.emeraldinsight.com/doi/abs/10.1108/09556220610668509?journalCode=ijcst>. Acesso em: 8 ago. 2017. MIASKIEWICZ, Tomasz; SUMNER, Tamara; KOZAR, Kenneth. A latent semantic analysis methodology for the identification and creation of personas. Proceedings of the SIGCHI Conference on Human Factors in Computing Systems, Florence, p. 1501-1510, 2008. Disponível em: <dl.acm.org/citation.cfm?id=1357290>. Acesso em: 8 ago. 2017. MULDER, Steve; YAAR, Ziv. The user is always right: a practical guide to creating and using personas for the web. California: New Riders Publishing Thousand Oaks, 2006. NGUYEN, Hai Thanh et al. Learning to rank for personalised fashion recommender systems via implicit feedback. Proceedings of the Second International Conference on Mining Intelligence and Knowledge Exploration, Cork, p. 51-61, 2014. Disponível em: <link.springer.com/chapter/10.1007/978-3-319-13817-6_6>. Acesso em: 10 abr. 2017. NIELSEN, Lene. Personas: user focused design. 1. ed. London: Springer-Verlag London, 2013. NIETERS, James; IVATURI, Subbarao; AHMED, Iftikhar. Making personas memorable. Proceedings of CHI’07 Extended Abstracts on Human Factors in Computing Systems, San Jose, p. 1817-1824, 2007. Disponível em: <dl.acm.org/citation.cfm?id=1240905&dl=ACM&coll=DL&CFID=986829255&CFTOKEN=16512520>. Acesso em: 10 abr. 2017. NORMAN, Donald. Ad-Hoc personas & empathetic focus. 16 nov. 2004. Disponível em: <www.jnd.org/dn.mss/personas_empath.html>. Acesso em: 3 jan. 2017. PECHOUX, Beatrice et al. Innovation management in creating new fashions. In: HINES, Tony; BRUCE, Margaret. Fashion Marketing: contemporary issues. 2. ed. United Kingdom: Butterworth-Heinemann, 2007. p. 188-241. PEREZ, Sarah. “Pandora for e-commerce” styleseek raises $750k more in seed funding. San Francisco, 13 ago. 2013. Texto postado no portal TechCrunch. Disponível em: <techcrunch.com/2013/08/13/pandora-for-e-commerce-styleseek-raises-750k-more-in-seed-funding/>. Acesso em: 20 out. 2017. PRUITT, John; ADLIN, Tamara. The persona lifecycle: keeping people in mind throughout product design. 1. ed. San Francisco: Morgan Kaufmann Publishers Inc., 2006. PRUITT, John; GRUDIN, Jonathan. Personas: practice and theory. Proceedings of the 2003 conference on Designing for user experiences, San Francisco, p. 01-15, jun. 2003. Disponível em: <www.microsoft.com/en-us/research/wp-

Page 82: UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS …biblioteca.uniritter.edu.br/imagens/035UNR89/0000F1/0000F128.pdf · LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS

81

content/uploads/2017/01/personas-practice-and-theory.pdf>. Acesso em: 10 abr. 2017. RAHIMI, Mona; CLELAND-HUANG, Jane. Personas in the middle: automated support for creating personas as focal points in feature gathering forums. Proceedings of the 29th ACM/IEEE international conference on Automated software engineering, Vasteras, p. 479-484, 2014. Disponível em: <dl.acm.org/citation.cfm?id=2642958&dl=ACM&coll=DL>. Acesso em: 10 abr. 2017. RENFREW, Elinor; RENFREW, Colin. Basics fashion design 04: developing a collection. 1. ed. Switzerland: AVA Publishing SA, 2009. RESNICK, Paul; VARIAN, Hal R. Recommender systems. Communications of the ACM, New York, v. 40, n. 3, p. 56-58, 1997. SANCHEZ-RIERA, Jordi et al. I-Stylist: finding the right dress through your social networks. Proceedings of the 23rd International Conference on Multimedia Modeling, Iceland, pt. 1, p. 662-673, 2017. Disponível em: <link.springer.com/chapter/10.1007/978-3-319-51811-4_54>. Acesso em: 8 ago. 2017. SORGER, Richard; UDALE, Jenny. Fundamentos de design de moda. 1. ed. Porto Alegre: Bookman, 2009. TAN, Pang-Ning; STEINBACH, Michael; KUMAR, Vipin. Introduction to data mining. 1. ed. Boston: Addison-Wesley Longman Publishing Co., 2005. TECH TARGET. What is chatterbot (chatbot). Disponível em: <searchmicroservices.techtarget.com/definition/chatterbot-chatbot>. Acesso em: 20 set. 2017. TREPTOW, Doris. Inventando moda: planejamento de coleção. 5. ed. São Paulo: Doris Elisa Treptow, 2013. TU, Nan et al. Using cluster analysis in persona development. Proceedings of the 8th International Conference on Supply Chain Management and Information, Hong Kong, p. 1-5, 2010. Disponível em: <ieeexplore.ieee.org/document/5681684/>. Acesso em: 8 ago. 2017. VACCARO, Kristen et al. The elements of fashion style. Proceedings of the 29th Annual Symposium on User Interface Software and Technology, Tokyo, p. 777-785, 2016. Disponível em: <dl.acm.org/citation.cfm?id=2984573>. Acesso em: 8 ago. 2017. VARTAK, Manasi; MADDEN, Samuel. CHIC: a combination-based recommendation system. Proceedings of the 2013 ACM SIGMOD International Conference on Management of Data, New York, p. 981-984, 2013. Disponível em: <dl.acm.org/citation.cfm?id=2465270>. Acesso em: 8 ago. 2017.

Page 83: UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS …biblioteca.uniritter.edu.br/imagens/035UNR89/0000F1/0000F128.pdf · LAURA FELHAUER TOLEDO UMA ANÁLISE DAS CONTRIBUIÇÕES DE DADOS DISPONÍVEIS

82

VEIT, Andreas et al. Learning visual clothing style with heterogeneous dyadic co-occurrences. Proceedings of the 2015 ICCV International Conference on Computer Vision, Santiago, p. 4642-4650, 2015. Disponível em: <https://www.cv-foundation.org/openaccess/content_iccv_2015/papers/Veit_Learning_Visual_Clothing_ICCV_2015_paper.pdf>. Acesso em: 8 ago. 2017. WATANABE, Yasuhiro et al. ID3P: iterative data-driven development of persona based on quantitative evaluation and revision. Proceedings of the 10th International Workshop on Cooperative and Human Aspects of Software Engineering, Buenos Aires, p. 49-55, 2017. Disponível em: <dl.acm.org/citation.cfm?id=3100326&dl=ACM&coll=DL&CFID=985061311&CFTOKEN=14862474>. Acesso em: 10 set. 2017. ZHANG, Xiang; BROWN, Hans-Frederick; SHANKAR, Anil. Data-driven personas: constructing archetypal users with clickstreams and user telemetry. Proceedings of the 2016 CHI Conference on Human Factors in Computing Systems, San Jose, p. 5350-5359, 2016. Disponível em: <dl.acm.org/citation.cfm?id=2858523>. Acesso em: 8 ago. 2017.