dissertação de thiago prado de campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · dados...

130
UNIVERSIDADE ESTADUAL DE MARINGÁ CENTRO DE TECNOLOGIA DEPARTAMENTO DE INFORMÁTICA PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO THIAGO PRADO DE CAMPOS Uma ferramenta para apoiar a pesquisa exploratória na Web Maringá 2013

Upload: others

Post on 07-Oct-2020

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

UNIVERSIDADE ESTADUAL DE MARINGÁ CENTRO DE TECNOLOGIA

DEPARTAMENTO DE INFORMÁTICA PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO

THIAGO PRADO DE CAMPOS

Uma ferramenta para apoiar a pesquisa exploratória na Web

Maringá 2013

Page 2: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

THIAGO PRADO DE CAMPOS

Uma ferramenta para apoiar a pesquisa exploratória na Web

Dissertação apresentada ao Programa de Pós-Graduação em Ciência da Computação do Departamento de Informática, Centro de Tecnologia da Universidade Estadual de Maringá, como requisito parcial para obtenção do título de Mestre em Ciência da Computação Orientador: Prof. Dr. Sérgio Roberto P. da Silva

Maringá 2013

Page 3: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá – PR., Brasil)

Campos, Thiago Prado C198f Uma ferramenta para apoiar a pesquisa exploratória na Web

/ Thiago Prado Campos. -- Maringá: [s.n.], 2013. 130 f. : il. color., tabs. Orientador : Prof. Dr. Sérgio Roberto Pereira da Silva. Dissertação (mestrado) - Universidade Estadual de

Maringá. Programa de Pós-graduação em Ciência da Computação. Departamento de Informática, 2013.

1.Recuperação da informação - Pesquisa Exploratória. 2.

Pesquisa Exploratória - Ferramentas Web. 3. Framework - Ferramenta de apoio. 4. Interação humano - Computador. I. Universidade Estadual de Maringá. Programa de Pós-graduação em Ciência da Computação. Departamento de Informática. II. Silva, Sérgio Roberto Pereira da. III. Título.

CDD 23.ed. 006.333

Page 4: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá
Page 5: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

DEDICATÓRIA(S)

Em memória de Sebastião Ribeiro de Campos e José Joaquim de Maria.

Page 6: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

AGRADECIMENTO(S)

Deus é o autor da vida e agradeço a ele não só pelo dom da vida, mas pelas oportunidades que a

vida me deu para estudar, trabalhar e conhecer pessoas maravilhosas que me fizeram chegar até

aqui, são elas: meus pais, Cristina e Lourenço, que pacientemente e amorosamente me educaram e

me proporcionaram condições e incentivo para estudar; minha esposa, Cristina, que compreendeu

minha necessidade de me ausentar para participar das aulas, realizar os trabalhos e atividades do

programa de mestrado e me apoiou durante todo o percurso; aos colegas de curso que iniciaram

comigo a jornada de aulas e que alguns infelizmente não puderam concluir, mas contribuíram com

esta minha nova experiência de vida; aos colegas do Grupo de Sistemas Interativos Inteligentes

(GSII), pelas discussões, opiniões, dicas de experiência e comunhão de objetivos; e ao meu

orientador, prof. Dr. Sérgio Roberto P. da Silva, pela oportunidade de ter participado da sua

disciplina de IHC como aluno não regular e que nos proporcionou uma caminhada de mútuo

trabalho e dedicação para chegar até aqui. Agradeço também aos demais professores do programa

e funcionários do Departamento de Informática da UEM, que atuaram na condução das atividades

e faço votos de muito sucesso. Também agradeço ao meu diretor, prof. Marcos Imamura e demais

colegas da UTFPR, que me incentivaram durante todo o percurso das atividades do mestrado.

Finalmente, agradeço também às pessoas que de forma identificada, ou anônima, responderam

nossos questionários, contribuindo para a coleta de informações da pesquisa e aos testadores

voluntários da nossa ferramenta.

Page 7: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

Uma ferramenta para apoiar a pesquisa exploratória na Web

RESUMO

Este trabalho contextualiza a Pesquisa Exploratória, um tipo de busca de informação que tem

foco em tarefas de aprendizado e investigação. Neste tipo de pesquisa, o pesquisador não

domina o espaço de informação no qual está situado o problema que, em geral, se apresenta a

ele de maneira mal estruturada. Inúmeras ferramentas de apoio vêm sendo desenvolvidas para

conduzir o pesquisador ao sucesso na realização de pesquisas exploratórias, envolvendo as

áreas de interação humano-computador e recuperação da informação. Estas ferramentas,

porém, ainda não atingiram a plenitude de cobertura das necessidades dos pesquisadores

envolvidos nas tarefas de pesquisa exploratória. Uma destas necessidades, por exemplo, é o

apoio às atividades de revisitação de longo e muito longo prazo de documentos. As pesquisas

exploratórias percorrem múltiplas sessões e podem ultrapassar meses de execução, precisando

de um apoio adequado de histórico de pesquisa para proporcionar suporte à recuperação de

documentos importantes outrora visitados. Neste trabalho identificamos as principais

dimensões que podem potencializar o sucesso de uma pesquisa exploratória e propusemos

uma ferramenta que integra o histórico de pesquisa com estas dimensões. Esta ferramenta

utiliza-se de uma abordagem visual da apresentação do histórico combinado com fatores de

personalização e organização do conteúdo que é registrado durante as atividades de busca de

informação. Os resultados obtidos em uma série de experimentos indicaram que vários dos

componentes inseridos no sistema foram úteis para os pesquisadores, sendo este um motivo

para concluirmos que este é um caminho promissor para apoiar a pesquisa exploratória.

Palavras-chave: Pesquisa Exploratória, histórico de busca, busca de informação

Page 8: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

A tool for support the exploratory search on the Web

ABSTRACT

This work contextualizes the exploratory search; a kind of information seeking that has a

focus on learning and investigative tasks. In this type of search, the researcher does not

dominate the information space in which the problem is situated that, generally, is brought to

it poorly structured. To drive the user to the success in conducting exploratory research,

numerous specific support tools have been designed and created, with involvement of areas of

HCI and Information Retrieval. These tools, however, have not yet reached the full coverage

of the needs of the researchers involved in exploratory research tasks. One of these needs, for

example, is a better support for activities of long and very-long term revisitation. As

exploratory searches run multiple sessions and can overcome months of implementation, they

need adequate support of the search history to provide support for the recall of important

documents once visited. In this work, we identify the main dimensions that can enhance the

success of an exploratory search, and proposed a tool to integrate the search history with these

dimensions. This tool uses a visual approach to the presentation of the search history

combined with factors of customization and organization of content, which is recorded during

the research activities of the user. The results of a series of experiments indicated that most

components inserted in the system were useful to the researchers and this is a reason for us to

conclude that this is a promising way to support exploratory research.

Keywords: Exploratory search, search history, information seeking.

Page 9: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

LISTA DE FIGURAS

Figura 1 - Um rascunho de um pesquisador engajado no modelo berry-picking. Extraído de (HEARST, 2009). ..................................................................................................................... 20 

Figura 2 – Atividades de Information Seeking. Adaptado de (MARCHIONINI, 2006) ......... 22 

Figura 3 - Posicionando Pesquisa Exploratória. Adaptado de (WHITE e ROTH, 2009). ....... 27 

Figura 4 - Tela do VSE, extraída do documento VSE_Shots, disponível em http://sites.google.com/site/alhenshiri/Home/downloads ......................................................... 32 

Figura 5 - tela do MyWish extraída de (ANGELACCIO, BUTTARAZZI e PATRIGNANELLI, 2007). ...................................................................................................... 33 

Figura 6 - Clusterização de nós proposto por (SALLABERRY, et al., 2010). ........................ 34 

Figura 7 - Tela do TheHotMap.com, disponível online em http://www.thehotmap.com ........ 35 

Figura 8 – Tela do VisGets, obtida em http://pages.cpsc.ucalgary.ca/~mdoerk/view/explore 36 

Figura 9 - Tela do WebSearchViz extraída de http://home.engineering.iastate.edu/~tien/WebSearchViz/tool.html ........................................ 37 

Figura 10 - Tela de resultados do Tianamo, após pesquisa por “flamengo”. ........................... 37 

Figura 11 - Tela da Search Bar (MORRIS, MORRIS e VENOLIA, 2008) ............................. 38 

Figura 12 - Ferramenta Search History Tree acoplada ao Factic (ŠIMKO, TVAROZEK e BIELIKOVA, 2010) ................................................................................................................. 39 

Figura 13 - Tela do YouPivot. Extraído de (HAILPERN, et al., 2011). .................................. 40 

Figura 14 - Interface do sistema Querium 1.0. Extraído de (GOLOVCHINSKY, DIRIYE e DUNNIGAN, 2012) ................................................................................................................. 41 

Figura 15 – Interface do sistema Querium 2.0. Extraído de (GOLOVCHINSKY, DIRIYE e DUNNIGAN, 2012). ................................................................................................................ 42 

Figura 16 – Tela do ActionShot, extraído de (LI, et al., 2010). ............................................... 44 

Figura 17 – Tela do Context Web History, extraída de (WON, JIN e HONG, 2009) ............. 45 

Figura 18 - Exemplos de rich snippets. Extraído de http://support.google.com/webmasters/bin/answer.py?hl=pt-BR&answer=99170 .................. 49 

Figura 19 – Resultado da Busca no Google por “Titãs”........................................................... 53 

Figura 20 - Mapa conceitual para os elementos da solução ..................................................... 60 

Figura 21 – Tela de criação de um novo projeto, com objetivos.............................................. 61 

Figura 22 - Diagrama Estendido de Entidade-Relacionamento para base de dados da aplicação servidora. .................................................................................................................................. 64 

Figura 23 – Exemplos de recursos de interface do navegador que pode ser utilizado por extensões. Extraído de http://www.jefvlamings.com/blog/chrome-extensions-for-dummies/ 66 

Figura 24 – Recursos de Background e Content Script executam sem que o pesquisador perceba. Extraído de http://developer.chrome.com/extensions/overview.html ........................ 66 

Figura 25 – Extensão indicando informações de documento já visitado pelo pesquisador ..... 68 

Figura 26 – Exemplo de notificação de atividade já realizada ................................................. 69 

Page 10: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

Figura 27 - Componente popup aberto no contexto de navegação. ......................................... 70 

Figura 28 – Tela de Histórico do Projeto ................................................................................. 71 

Figura 29 - Tela de detalhes de uma navegação ....................................................................... 73 

Figura 30 – Detalhes sobre uma atividade de pesquisa ............................................................ 74 

Figura 31 – Área de opções e filtro. Acima exibido de maneira completo e embaixo, com zoom, para melhor compreensão. ............................................................................................. 74 

Figura 32 - Miniatura da linha do tempo, para facilitar a navegação em estruturas mais extensas. .................................................................................................................................... 76 

Figura 33 - Tela de Preferências do Usuário ............................................................................ 76 

Page 11: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

LISTA DE TABELAS

Tabela 1 – Comparação entre extensões de apoio ao histórico de pesquisa (1. Nossa solução, 2. e-history , 3. New History, 4. history 2, 5. enhanced history, 6. better history, 7. History Trends, 8. Visual History e 9. YouPivot & Timemarks (Beta). ............................................... 78 

Tabela 2 – Dimensões cobertas por nossa solução. .................................................................. 79 

Tabela 3 – Resultados das tarefas dos testes de usabilidade. As notas indicam o grau de satisfação sobre como a tarefa está projetada para ser realizada pelo pesquisador, em uma escala de 0 a 10. ........................................................................................................................ 84 

Tabela 4 – Frequência de uso da extensão ............................................................................... 85 

Tabela 5 – Frequência de uso de recursos da extensão ............................................................ 86 

Tabela 6 – Utilidade dos recursos do sistema .......................................................................... 87 

Tabela 7 – Opinião dos pesquisadores sobre substituir o histórico tradicional pela solução apresentada. .............................................................................................................................. 89 

Tabela 8 – Objetivos escolhidos para o projeto do teste de usabilidade .................................. 91 

Page 12: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

LISTA DE ABREVIATURAS E SIGLAS

API Application Programming Interface

CSS Cascade Style Sheet

DAO Document Access Object

ESS Exploratory Search Systems

HCI Human Computer Interaction

HCIR Human Computer Interaction and Information Retrieval

HTML Hypertext Mark-up Language

IHC Interação Humano-Computador

IR Information Retrieval

ISP Information Seeking Proccess

JSON JavaScript Object Notation

SERP Search Engine Results Page

URL Uniform Resource Location

Page 13: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

SUMÁRIO

Introdução ............................................................................................................................... 15 

Information Seeking e Pesquisa Exploratória ...................................................................... 19 

2.1.  Definindo a Pesquisa Exploratória ........................................................................... 22 

2.2.  Histórico de Pesquisa e Revisitação .......................................................................... 27 

2.3.  O estado da arte em ferramentas de Pesquisa Exploratória .................................. 30 

2.3.1.  Ferramentas que fazem uso de Técnicas de Visualização da Informação ..... 31 

2.3.2.  Ferramentas baseadas no Histórico de Pesquisa/Navegação........................... 38 

2.4.  Considerações Finais .................................................................................................. 45 

Um Framework para Ferramentas de Apoio ....................................................................... 47 

3.1.  A Qualidade dos Documentos .................................................................................... 47 

3.2.  A Apresentação dos Documentos .............................................................................. 49 

3.3.  O Tempo da Pesquisa ................................................................................................. 51 

3.4.  Cognição e a Aquisição de Conhecimento ................................................................ 52 

3.5.  A Personalização da Pesquisa e de seus Resultados ................................................ 53 

3.6.  A Colaboração entre Pesquisadores ......................................................................... 55 

3.7.  Considerações Finais .................................................................................................. 56 

Uma Ferramenta de Apoio a Pesquisa Exploratória na Web ............................................. 57 

4.1.  Hábitos de pesquisa e decisões iniciais ...................................................................... 57 

4.2.  Modelo Conceitual do Sistema Proposto .................................................................. 59 

4.3.  Aspectos de Implementação da Aplicação Servidora .............................................. 62 

4.4.  A Extensão e Aspectos de Implementação ............................................................... 65 

4.4.1.  Analisador de Conteúdo ....................................................................................... 67 

4.4.2.  Controlador de Operações .................................................................................... 68 

4.4.3.  Interface do Usuário ............................................................................................. 69 

4.5.  A Interface de Histórico do Projeto .......................................................................... 71 

4.5.1.  Linhas do Tempo .................................................................................................. 71 

4.5.2.  Opções e Filtros .................................................................................................... 74 

4.5.3.  Miniatura .............................................................................................................. 75 

4.6.  Preferências do Pesquisador ...................................................................................... 75 

4.7.  Considerações sobre tecnologias envolvidas ............................................................ 77 

4.8.  Outras extensões semelhantes e comparações com a nossa solução ...................... 78 

4.9.  Considerações Finais .................................................................................................. 79 

Page 14: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

Experimentos e Resultados .................................................................................................... 80 

5.1.  Avaliação de sistemas de apoio à Pesquisa Exploratória ........................................ 80 

5.2.  Definição de Experimentos e Grupo de Testes ........................................................ 82 

5.3.  Resultados ................................................................................................................... 84 

5.4.  Considerações Finais .................................................................................................. 91 

Conclusões e Trabalhos Futuros ........................................................................................... 92 

6.1.  Trabalhos Futuros ...................................................................................................... 94 

Referências ........................................................................................................................... 96 

Apêndice A Protocolo de Revisão Sistemática ......................................................... 100 

Apêndice B Questionário sobre Hábitos de Pesquisa Exploratória .................... 103 

Apêndice C Tabulação das Respostas do Questionário sobre Hábitos de

Pesquisa Exploratória ...................................................................................................... 109 

Apêndice D Formulário de Identificação de Participante em Testes .................. 119 

Apêndice E Checklist de Funcionalidades ................................................................. 121 

Apêndice F Roteiro de Testes de Usabilidade ........................................................... 124 

Apêndice G Questionário Final de Avaliação ............................................................ 128 

Page 15: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

15

Introdução

Suponha um pesquisador da área de Ciência da Computação, membro de um laboratório de

pesquisa em uma empresa privada. Esta empresa desenvolve websites para Internet e

vislumbra que em um futuro próximo parte da navegação na Web será feita por meio dos

televisores. Este pesquisador fica então encarregado de pesquisar e trazer ao gerente de

produtos da empresa oportunidades e soluções destinadas ao uso neste tipo de aparelho. Para

realizar esta tarefa, ele poderá ter de aprender um pouco sobre este ambiente como, por

exemplo, quais: os equipamentos disponíveis e em desenvolvimento, os padrões de interação,

as tecnologias para codificação e programação, as interfaces de usuário para televisores, as

interfaces de programação com sistemas dos fabricantes, os tipos de conteúdo que podem ser

oferecidos e de interesse dos usuários, as similaridades e diferenças entre computadores

desktops, móveis e televisores, dentre outros assuntos. Para entender tudo isto e trazer

algumas soluções o pesquisador, provavelmente, utilizará a própria Internet para realizar suas

pesquisas e consultas.

Todo este trabalho poderá demorar semanas, ou meses, e por diversas vezes o

pesquisador poderá modificar a ordem de pesquisa e a visitação de páginas conforme for

descobrindo, ou compreendendo, parte do contexto e do ambiente do problema. Durante a

execução da pesquisa ele, possivelmente, sentirá a necessidade de anotar pontos interessantes,

definir perguntas a serem respondidas, metas a serem atingidas, revisitar páginas, relembrar

conceitos ou rever as anotações e as descobertas que fez.

1 Capítulo

Page 16: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

16

O cenário anterior descreve o contexto de uma pesquisa exploratória, a qual em

geral é conduzida sem que o pesquisador conheça ou tenha forte domínio sobre o que está

pesquisando (WHITE e ROTH, 2009). Existe um objetivo mais ou menos definido, mas não

se sabe exatamente a forma da resposta. A pesquisa exploratória é uma especialização da

busca de informação (information seeking), um processo que descreve a atividade de tentar

obter informações por meio de uma combinação de pesquisas e navegação (WHITE e ROTH,

2009). Ela é diferente de quando se procura pelo telefone de uma empresa, pelo valor de um

produto ou pelos nomes dos jogadores que fazem parte de um time de futebol. Nestes tipos de

pesquisas bastará passar os olhos, ou visitar os primeiros resultados retornados pelas

ferramentas de buscas mais populares, para que a resposta seja encontrada, pois já existe um

padrão de resposta esperado pelo pesquisador e, por isso, não é preciso aprender, ou

investigar, basta procurar a informação que já tem uma forma definida na sua mente.

Nos últimos anos, pesquisadores das áreas de recuperação da informação, design de

interface do usuário, visualização da informação e biblioteconomia têm trabalhado para

desenvolver ferramentas de suporte a pesquisa exploratória (WHITE, KULES e BEDERSON,

2005). Parte desse esforço foi apresentada em workshops e simpósios recentes que exploram a

intersecção das áreas de Interação Humano-Computador (Human-Computer Interaction -

HCI) e a Recuperação de Informação (Information Retrieval – IR), denominados HCIR. O

termo HCIR parece ter sido proposto por Gary Marchionini quando, em 2004, fez uma

apresentação1 ressaltando que embora HCI e IR sejam áreas bastante tradicionais elas se

relacionam e esse relacionamento tem-se potencializado quando a Web ganhou foco. Isso se

deu porque até então a recuperação de informação em documentos era tratada principalmente

pela correspondência de consultas, isto é, um documento é retornado nos resultados se ele

contém o texto digitado na consulta de pesquisa, ou uma propriedade com o valor

correspondente à consulta. Com a introdução da estrutura de hiperlinks dada pela World Wide

Web (WWW), outros pontos como a ligação entre as páginas e unidades de medida que possam

indicar similaridade, ou relevância dos links, foram introduzidos no processo de recuperação

de informação. Esta estrutura de hiperlinks é ponto importante no processo de execução da

pesquisa exploratória, pois é por meio da navegação que o pesquisador tentará adquirir

conhecimento e informação adicional para clarear seus objetivos e, portanto, resolver seu

problema, que em geral está mal estruturado ou em um espaço de informação pouco

conhecido por ele. A solução para seu problema poderá ser construída da informação

1 Apresentação disponível em PDF e vídeo, respectivamente nas URLs http://ils.unc.edu/~march/HCIR_MIT.pdf e http://www.youtube.com/watch?v=noMQjrACHxQ

Page 17: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

17

encontrada e do conhecimento adquirido durante sessões de pesquisa, ou análise, de

documentos relevantes e irrelevantes (WHITE e ROTH, 2009), sendo que até mesmo a

navegação ao acaso pode estimular analogias de pensamentos.

A pesquisa exploratória apresenta necessidades distintas em relação às métricas de

recuperação (recall) e precisão (comumente empregadas na IR) durante sua execução. No seu

início, uma alta recuperação é mais útil, pois o objetivo é maximizar o número de documentos

relevantes que foram visitados pelo pesquisador; porém, no final, uma alta precisão é mais

interessante, pois o pesquisador já terá uma ideia clara sobre o assunto de seu interesse e irá

requerer que os documentos apresentados sejam focados neste assunto. Neste ponto os

buscadores tradicionais falham, pois eles têm o foco fixo na precisão, deixando em segundo

plano a recuperação, sendo, portanto, mais úteis somente na fase final. Além disso, devido à

sua característica exploratória, este tipo de pesquisa torna-se mais interativa, no sentido de

que o pesquisador tem de interagir em maior grau com os documentos retornados pelos

sistemas de busca para atingir seu objetivo.

Deste modo, o escopo geral deste trabalho é o estudo e compreensão do fenômeno da

pesquisa exploratória, visando propor algumas soluções para os problemas encontrados na sua

execução. Em um primeiro momento, procuramos entender o fenômeno investigando

trabalhos que propunham melhorar a experiência de execução da pesquisa exploratória por

meio do uso de técnicas de visualização da informação. Neste sentido encontram-se os

projetos MyWish de Angelaccio, Buttarazi e Patrignanelli (2007), LED (Lookup Explore

Discover) de Mirizzi e Noia (2010), TheHotMap.com (http://www.thehotmap.com) de

Hoeber, Schroeder e Brooks (2009), Visual Search Engine (VSE) de Alhenshiri et al. (2010) e

a WebSearchWiz de Nguyen e Zhang (2006) entre outros. Analisando inicialmente estes

trabalhos e posteriormente outros por eles referenciados, conseguimos extrair um conjunto de

dimensões que formam um framework útil no desenvolvimento de ferramentas para o apoio à

pesquisa exploratória. As dimensões identificadas foram: Qualidade dos Documentos,

Apresentação, Cognição e Aquisição de Conhecimento, Tempo, Personalização e

Colaboração, as quais serão discutidas em maiores detalhes no capítulo 3.

Da análise anterior observamos ainda que para algumas das dimensões, como a de

“Apresentação” e de “Qualidade dos Documentos” já existem significativas pesquisas

realizadas e boas ferramentas desenvolvidas (embora ainda seja possível explorar problemas

nestas dimensões). Entretanto, para uma dimensão em particular, a “Temporal”, poucos

trabalhos foram realizados com ênfase em pesquisa exploratória. Neste contexto, encontramos

o projeto SearchBar de Morris, Morris e Venolia (2008) que realiza um esforço para

Page 18: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

18

identificar as tarefas do pesquisador durante as sessões de uso de um navegador na Web, mas

esta ferramenta não chegou a ser disponibilizada e não evoluiu. Também encontramos o

Semantic History Map, apresentado por Simko, Tvarozek e Bieliková (2010) presente dentro

de uma ferramenta já existente de pesquisa exploratória em repositório de imagens. Este

projeto apresenta uma forma visual de apresentar um histórico, mas, ela foca o registro de

filtros selecionados dentro de um sistema de pesquisa multifacetado. Uma das soluções mais

atraentes que encontramos foi o sistema YouPivot e TimeMarks (Hailpern, et al., 2011) que

associa pistas conceituais aos registros de atividades de navegação e algumas melhorias de

visualização do histórico. Entretanto, nenhuma delas permite ao pesquisador interagir com o

histórico para organizar suas atividades de tal forma que elas possam se encaixar dentro de

um contexto de pesquisa, com objetivos e particularidades definidas pelo próprio pesquisador.

A união das três ideias anteriores nos levou ao objetivo específico deste trabalho que

é o de prover um esquema visual para representar o histórico da pesquisa, fazendo distinção

entre atividades de navegação e de busca, procurando, assim, melhorar as ferramentas de

histórico dentro do contexto de pesquisa exploratória. Para isto procuramos criar relações

entre a dimensão temporal e as demais dimensões envolvidas na pesquisa exploratória para

apresentar uma ferramenta de histórico que pudesse ser mais útil que as tradicionais.

Preocupamo-nos em atender à necessidade de registrar e oferecer possibilidades para

recuperar o caminho percorrido durante todo o tempo de pesquisa, possibilitando ao

pesquisador relembrar o que ele já fez e quais direções ele já tomou para tentar responder suas

perguntas. Mais do que registrar o caminho percorrido, entendemos ser necessário oferecer

maneiras de filtrar e organizar os registros, procurando evitar que a sobrecarga de informação

se torne um empecilho na interpretação do histórico do projeto de pesquisa.

Esta dissertação está organizada da seguinte forma: este capítulo fez uma introdução

sobre o trabalho, apresentando seu contexto, motivações, objetivos e organização. O Capítulo

2 apresenta uma revisão bibliográfica, incluindo a definição de Pesquisa Exploratória e de

outros modelos de busca de informações defendidos por diversos autores e mostrando o

estado da arte de trabalhos que procuram investigar a pesquisa exploratória. O Capítulo 3

apresenta um framework para o desenvolvimento de ferramenta de pesquisa exploratória

empregado neste trabalho. O Capítulo 4 descreve um sistema desenvolvido para tratar a

dimensão temporal. O Capítulo 5 descreve o processo de testes e experimentos realizados sob

o sistema desenvolvido e apresenta os resultados obtidos. O Capítulo 6 discute as conclusões

obtidas ao longo do trabalho e faz sugestões de trabalhos futuros.

Page 19: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

19

Information Seeking e Pesquisa Exploratória

Hearst (2009) reuniu diversas tentativas de descrever um modelo para o processo cognitivo de

busca de informações (Information Seeking) e as estratégias utilizadas durante as etapas desse

processo. Ela cita que o modelo padrão de information seeking foi descrito por Marchionini

(1989) como “um caso especial de resolução de problemas”, que “inclui reconhecer e

interpretar o problema de informação, estabelecer um plano de pesquisa, realizar a pesquisa,

avaliar os resultados e, se necessário, interagir com o processo de novo”. Hearst (2009)

também afirma que esta definição parece ser senso comum para outros autores e outros

modelos apresentam definição semelhante.

Baseado nesta definição podemos concluir que o processo de busca é basicamente um

ciclo de passos que procura refinar a consulta até que a informação desejada seja recuperada.

Entretanto, diversos autores, como Bates (1989), defendem que um pesquisador pode mudar

de direção após aprender sobre determinado tema com os resultados obtidos. Observando o

comportamento destes pesquisadores, ela concluiu que eles costumam formular questões

diferentes após cada iteração, as quais podem levá-los inclusive a direções diferentes da meta

original. Entretanto, ao final de várias interações, este processo faz com que o pesquisador

atinja a meta original, uma vez que as respostas vão sendo parcialmente recuperadas ao longo

das iterações. Este modelo ficou conhecido como berry-picking (colheita de frutos), sendo

ilustrado na Figura 1. Nesta mesma ótica, Hearst ainda diz que o valor principal da pesquisa

encontra-se no aprendizado acumulado e nas informações adquiridas durante o processo de

pesquisa, ao invés, simplesmente, do último conjunto de resultados do processo.

2 Capítulo

Page 20: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

20

Uma explicação cognitiva para esse modelo padrão pode ser derivada do modelo de

golfos de execução e de avaliação, proposto por Norman (1986). Hearst (2009) compara o

processo de busca de informação com a teoria de Norman da seguinte forma: 1) a dificuldade

do pesquisador em identificar sua necessidade de informação e representá-la como palavras-

chave de uma consulta, correspondem ao golfo de execução a ser atravessado e; 2) o processo

de avaliar os resultados obtidos e analisar se eles satisfazem a sua necessidade ou se será

necessário reformular a consulta, correspondem ao golfo de avaliação.

Kuhlthau (1991) definiu seis estágios no que ela chamou de Information Seeking

Process (ISP):

1. Iniciação – reconhece-se de que existe uma informação necessária, mas

desconhecida por parte do pesquisador. Desta forma, tem-se um problema.

2. Seleção – seleciona-se o tema geral, ou abordagem, que deverá ser seguida para

tentar obter-se a informação desejada.

3. Exploração – investiga-se o tema geral, para aprofundar o entendimento a seu

respeito. Nesta etapa o pesquisador pode não conseguir formular consultas

relevantes, justamente por ainda não compreender o tema de forma satisfatória.

Por esta razão ele pode sentir a necessidade de procurar outras informações que

são pré-condições para a compreensão do tema.

Figura 1 - Um rascunho de um pesquisador engajado no modelo berry-picking. Extraído de (HEARST, 2009).

Page 21: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

21

4. Formulação – define-se um foco de pesquisa. Depois de um tempo, o pesquisador

consegue enxergar e compreender melhor o tema, e as respostas encontradas até o

momento vão se encaixando, o que lhe possibilita uma melhor formulação de

consultas.

5. Coleção – reúnem-se as informações relacionadas ao tema focado e a pesquisa

volta-se para informações que definem, ampliam e apoiam o foco.

6. Apresentação – realiza as últimas pesquisas. O pesquisador percebe que começa a

encontrar informações já vistas antes, o que acaba levando-o a concluir que

conseguiu explorar com eficácia o tema desejado.

A teoria de Information Foraging apresentada por Peter Pirolli (2007) introduz o

conceito de “cheiro” de informação (information scent) para tentar explicar o comportamento

dos pesquisadores em busca de informação. Segundo este modelo, os pesquisadores procuram

nos websites pistas relacionadas ao seu objetivo e, quando encontram, calculam a

possibilidade de realmente encontrar o que desejam. Se previr sucesso o pesquisador continua

a navegar por aquele website, do contrário ele o abandona. O modelo é baseado na observação

de animais a procura de comida/caça. Enquanto houver traços/pistas de que é lucrativo

procurar naquela região o animal/predador continuará a procura/ perseguição. Esta teoria tem

sido aplicada em projetos de avaliação de usabilidade de websites por meio do mecanismo de

eye tracking (BUSCHER, CUTRELL e MORRIS, 2009).

E por fim, outra forma de compreender a busca de informação é por meio dos estudos

de Sense-Making, o qual é definido como o processo de buscar por uma representação e

codificar dados nesta representação, para responder a perguntas de tarefas específicas

(RUSSELL, et al., 1993). Aplicando o sense-making à interpretação do processo de busca

temos, à medida que o pesquisador vai adquirindo conhecimento a cerca de um tema ele vai

construindo um mapa mental para compreensão daquele tema. Isto lhe dará informação

suficiente para realizar tomadas de decisão, como reforçam White e Roth (2009, p. 31,

tradução nossa1): “sense-making é a criação de consciência situacional e compreensão em

situações de alta complexidade ou incerteza, a fim de tomar decisões”.

“O sense-making geralmente envolve os seguintes passos [...]: 1) reconhecer uma

lacuna de conhecimento; 2) gerar uma estrutura inicial, ou modelo de conhecimento

necessária para completar a tarefa (conceitos, relacionamentos e hipóteses); 3) buscar

informações; 4) analisar e sintetizar a informação para criar compreensão e percepção;

1 “Sense-making is the creation of situational awareness and understanding in situations of high complexity or uncertainty in order to make decisions” (WHITE e ROTH, 2009, p. 31)

Page 22: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

22

5) criar um produto de conhecimento, ou ação direta, baseado na percepção e

concepção obtida (WHITE e ROTH, 2009, p. 31, tradução nossa2).

Estas e outras definições de information seeking são objetos de investigação da

Ciência da Informação. Nosso objetivo até aqui não foi o de exaurir estas definições, mas

apresentar algumas que se aproximam da definição de pesquisa exploratória que daremos a

seguir, iniciando com uma classificação das atividades de information seeking dada por Gary

Marchionini e da qual se origina o termo pesquisa exploratória.

2.1. Definindo a Pesquisa Exploratória

Gary Marchionini classificou três tipos de atividades de Information Seeking (Figura

2), cada uma possuindo adequadas técnicas e táticas que podem ser apoiadas por ferramentas

computacionais: a procura (lookup), o aprendizado (learn) e a investigação (investigate). Ele

destaca que uma pesquisa exploratória envolve atividades de aprendizado e investigação,

sendo que estas atividades às vezes se sobrepõem, pois os pesquisadores podem realizar

tarefas paralelas. Ele diz que os pesquisadores entendem que buscas Lookup podem ser

subtarefas de Learn ou Investigate (MARCHIONINI, 2006).

2 “Sense-making generally involves the following steps […]: (1) knowledge gap recognition; (2) generation of an initial structure or model of the knowledge needed to complete the task—concepts, relationships, and hypotheses; (3) search for information; (4) analysis and synthesis of information to create insight and understanding; and (5) creation of a knowledge product or direct action based on the insight or understanding.” (WHITE e ROTH, 2009, p. 31)

Figura 2 – Atividades de Information Seeking. Adaptado de (MARCHIONINI, 2006)

Page 23: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

23

Procura - Dos três tipos de information seeking considerados por Marchionini, este é

o mais básico e tem sido foco das áreas de banco de dados e desenvolvimento de sistemas de

gestão já há muito tempo. Em geral, as atividades de procura (ou recuperação) retornam dados

discretos e bem estruturados como números, nomes, frases ou arquivos de texto. Elas

normalmente respondem a perguntas como quem, quando e onde, sendo adequadas para

responder a perguntas bem especificadas, cujos resultados serão precisos o suficiente ao ponto

de exigir o mínimo de análise e comparação entre cada um dos itens retornados. Esta é uma

área na qual os motores de busca da Web se mostram eficientes, fruto da herança dos

algoritmos e arquiteturas desenvolvidas nos sistemas de gestão de banco de dados da era pré-

Web.

Aprendizado - O termo aprendizado é usado no sentido de obter um novo

conhecimento e inclui auto aprendizado ao longo da vida ou experiência profissional, bem

como os conhecimentos direcionados adquiridos de maneira conduzida durante a fase escolar.

Marchionini usa terminologia da taxonomia dos objetivos educacionais (Bloom3) e diz que as

pesquisas que visam apoiar o aprendizado devem alcançar: a aquisição de conhecimentos,

compreensão de conceitos ou habilidades, a interpretação de ideias, e as comparações e

agregações de dados e conceitos, que são as habilidades definidas no nível mais superficial

para o domínio cognitivo.

Por causa da enorme quantidade de recursos (documentos) disponíveis para consulta e

sua popularidade a Web tornou-se também uma ferramenta para as pesquisas de aprendizado e

investigação. Porém, a pesquisa de aprendizagem (como defende Marchionini), envolve

várias iterações e cada iteração devolve um conjunto de objetos que exige processamento

cognitivo e interpretação. Esses objetos podem ser representados de diferentes maneiras

(mapas, gráficos, textos, vídeos, etc.) e exigem do pesquisador um esforço de tempo de leitura

ou visualização, comparação e tomada de decisões qualitativas.

Investigação – Este tipo de pesquisa pode exigir múltiplas iterações durante elevado

período de tempo. Além disso, é comum que os resultados obtidos sejam avaliados antes de

serem incorporados como um novo conhecimento (MARCHIONINI, 2006). Pesquisas de

investigação costumam atingir os níveis mais profundos da hierarquia de Bloom, conhecidos

como análise (identificação das partes e suas relações), síntese (combinação de partes para

formar um todo) e avaliação (julgamento do valor do conhecimento). A pesquisa de

3 Benjamin Bloom liderou um grupo formado pela American Psychological Association para criar uma "classificação de objetivos de processos educacionais" cujas conclusões foram publicadas em 1956 no trabalho Taxonomy of Educational Objectives: The Classification of Educational Goals.

Page 24: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

24

investigação além de proporcionar aquisição de novo conhecimento, permite identificar

lacunas que impedem a completa compreensão de um determinado tema.

Estabelecendo a pesquisa exploratória como a combinação de tarefas de aprendizado e

investigação, estudos começaram a ser feitos para entender como as pessoas aprendem e

investigam durante o processo de busca de informação. White e Roth (2009) identificaram

uma série de atributos que caracterizam estas atividades, diferenciando-as, principalmente,

das atividades de procura:

1. A duração de uma pesquisa exploratória pode levar dias, ou meses, e por isso

estende-se por diversas sessões de pesquisa.

2. A motivação para realizar a pesquisa é algo em aberto, porque o pesquisador

revela incerteza sobre a informação disponível, ou possui informação incompleta

sobre o tema. Muitas vezes ele não sabe se existe de fato uma resposta para o

problema que tenta resolver. A curiosidade e a persistência são o combustível para

condução da pesquisa.

3. A meta da pesquisa não é simplesmente achar uma informação, mas, conduzir o

pesquisador para compreender um tópico a fim de tomar melhores decisões com as

informações encontradas e com o aprendizado acumulado durante a tarefa de

busca de informação. As pesquisas exploratórias têm ênfase em ampliar

conhecimento, ou proporcionar desenvolvimento pessoal.

4. O comportamento durante a pesquisa combina navegação e busca focada, com

maior ênfase na primeira para diminuir as dúvidas que possam surgir quando uma

nova informação é encontrada.

5. A pesquisa exploratória pode envolver colaboração de outras pessoas interessadas

no resultado do trabalho ou assistentes na realização das tarefas.

6. As ferramentas de suporte devem ser avaliadas em termos de sua capacidade em

ajudar o pesquisador a obter novos conhecimentos e oferecer subsídios para

tomada de decisão.

Kules e Capra (2009) também listaram algumas características comuns às tarefas de

pesquisas exploratórias quando criaram um procedimento de concepção de tarefas

exploratórias para utilização em avaliações de interfaces que se propõe a apoiá-las. Para eles,

uma tarefa exploratória:

Indica incerteza, necessidade de informação ou necessidade de descoberta;

Sugere aquisição de conhecimento, comparação ou tarefa de descoberta;

Page 25: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

25

Oferece baixo nível de especificidade sobre: a informação necessária e como

encontrar esta informação;

Diriye et al. (2010) apresentam elementos que estão envolvidos nas tarefas de

pesquisa exploratória, citando:

Objetivo – “informar uma decisão ou produzir algum novo conhecimento”.

Atividades de Pesquisa – envolvem um elemento de investigação, aprendizagem

e descoberta;

Complexidade conceitual – as etapas da pesquisa e informações de destino

podem ser vagas;

Complexidade processual – a tarefa de pesquisa deve envolver uma série de

ações de pesquisa;

Segundo definição de Diriye et al (2010), se algum destes critérios não é atendido

pode ocorrer uma mudança na natureza da tarefa de pesquisa, podendo afetar a categoria de

tarefes a qual ela pertence. No entanto, eles reforçam que os critérios mais importantes são os

de “objetivo” e “atividades de pesquisa”. Se uma atividade é menos complexa em termos

conceituais ou processuais que outra, isto não quer dizer que ela não é uma tarefa de pesquisa

exploratória. Finalmente, à medida que o pesquisador possui amplo domínio de conhecimento

sobre o espaço de informação no qual está inserido o problema de pesquisa, será menor sua

necessidade de aprender e a complexidade conceitual da tarefa de pesquisa torna-se pequena.

Desta forma, a tarefa para este pesquisador, pode ser rebaixada para uma tarefa de lookup. Por

outro lado, a mesma tarefa para um pesquisador pouco familiar ao espaço de informação será

de pesquisa exploratória, pois haverá grande necessidade de aprendizado e investigação além

de aumentar a complexidade conceitual da tarefa.

Wildemuth e Freund (2012) descrevem como projetar tarefas exploratórias e

consideram que as tarefas de busca exploratória:

“[…] focam em objetivos de pesquisa sobre aprendizado e investigação, os quais são

gerais, abertos, e muitas vezes têm como alvo vários itens/documentos; envolvem

incertezas e são motivadas por problemas mal definidos ou mal estruturados; são

dinâmicas e evoluem ao longo do tempo; são multifacetadas e podem ser

processualmente complexas; são frequentemente acompanhadas de outras

informações, ou comportamentos cognitivos, tais como sense-making”

(WILDEMUTH e FREUND, 2012, p. 1, tradução nossa4)

4 “[…] focus on learning and investigative search goals; they are general (rather than specific), open-ended, and often target multiple items/documents; they involve uncertainty and are motivated by ill-defined or ill-

Page 26: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

26

Em resumo, a pesquisa exploratória pode ser compreendida como um tipo de

information seeking com fortes características em aprendizado e investigação, no qual o

processo de execução da pesquisa pode incluir comportamentos citados nos modelos ISP, de

berry-picking, information foraging e sense-making, servindo como um guarda-chuva para

este conjunto de conceitos, conforme pode ser ilustrado pela Figura 3.

O modelo de berry-picking é importante porque explica a mudança de direção da

pesquisa, principalmente, quando o pesquisador se depara com conceitos por ele

desconhecidos, o que torna necessário um desvio do seu processo natural de busca de

informação para preencher esta lacuna de conhecimento. O modelo de information foraging

ilustra, principalmente, a atividade de exploração, a qual é realizada para aprofundar o

conhecimento básico adquirido sobre os conceitos inicialmente desconhecidos e também para

investigar situações e informações que podem estar relacionadas com o tema da pesquisa,

proporcionando descobertas. Quanto melhor o faro e instinto do pesquisador, maior serão as

chances de sucesso da sua investigação. As etapas descritas no Information Seeking Process

incorpora os modelos de berry-picking e information foraging na etapa de exploração,

considerando também a etapa de formulação. O ISP também traz a visão do comportamento

envolvendo navegação e busca focada, característica da pesquisa exploratória indicadas por

White e Roth. Esta diferenciação do comportamento entre atividade de navegação e pesquisa

será aproveitada no nosso modelo conceitual de ferramenta de apoio. Ainda das características

citadas por White e Roth, é importante também a identificação do longo tempo de execução

da pesquisa exploratória. Tempo este que será necessário e suficiente para produção de novo

conhecimento por meio da execução de tarefas complexas (característica lembrada por Kules

e Capra, Wilson et al. e Wildemund e Freund), as quais envolvem a criação de uma coleção

de documentos/informações, análise, comparação e sínteses, para que todo o conhecimento

adquirido possa fazer sentido e orientar as tomadas de decisões (sense-making). Ferramentas

de apoio com suporte a coleta, lembrança dos documentos visitados para análise e

comparação futura e, facilitadoras de descobertas e geração de sínteses, podem aprimorar a

execução de pesquisas exploratórias.

structured problems; they are dynamic and evolve over time; they are multi-faceted and may be procedurally complex; and they are often accompanied by other information or cognitive behaviors, such as sensemaking.” (WILDEMUTH e FREUND, 2012, p. 1)

Page 27: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

27

Figura 3 - Posicionando Pesquisa Exploratória. Adaptado de (WHITE e ROTH, 2009).

2.2. Histórico de Pesquisa e Revisitação

Um estudo apresentado por Komlodi, Marchionini e Soergel (2007) afirma que a busca de

informação é uma atividade construída com processamento e armazenamento sobre a

memória humana, ressaltando o aspecto temporal deste tipo de busca. Este aspecto valoriza as

funções de atenção, aprendizado, recuperação e reconhecimento da informação que, segundo

estes autores, são cruciais para que um pesquisador se mova pelas fases da busca de

informação. Por isso, quanto melhor puderem ser apoiadas estas tarefas, melhor será o

desempenho do pesquisador no processo de busca. No contexto de busca de informação os

autores acreditam que as ferramentas de históricos são úteis e podem ser utilizadas tanto pelos

pesquisadores (para recuperar o que já fizeram) quanto pelo sistema (para prover

personalização). Prover acesso fácil à informação que foi vista anteriormente e incorporar

Sense‐making

Information foraging

Comportamento Exploratório

Recuperação de Informação

Visualização da  Informação

Berry‐picking

Pesquisa Exploratória

Page 28: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

28

dados históricos à visualização da informação são boas práticas a serem seguidas em projetos

de sistemas de pesquisa (KOMLODI, SOERGEL e MARCHIONINI, 2006).

Analisando o uso de históricos em interfaces de usuário em diferentes domínios de

problemas (edição de vídeo, sistemas colaborativos e navegação na Web), eles concluem que

os principais recursos e funcionalidades fornecidas costumam ser: a apresentação de uma

linha do tempo de ações realizadas ou eventos ocorridos; os mecanismos de desfazer e refazer

uma operação; a seleção de histórico manualmente por meio de lista de favoritos ou

oferecimento de recursos com menus contextuais e; a análise do histórico registrado para

predição de comportamento futuro.

Revisita a páginas dentro de uma mesma sessão de pesquisa na Web, ou até mesmo em

sessões paralelas, é comum, ocorrendo com maior frequência durante pesquisas exploratórias.

Os pesquisadores decidem continuar uma sessão interrompida, querem refazer uma pesquisa

ou precisam reencontrar algum conteúdo que viram há um longo período de tempo. Neste

sentido, Mayer (2009) fez um levantamento para classificar os tipos de revisitas e ferramentas

existentes para apoiar o pesquisador quando desta necessidade. Segundo ele, “boas

ferramentas de apoio podem fazer com que o pesquisador economize tempo valioso, libere

capacidades cognitivas e aumente a satisfação de uma maneira geral” (MAYER, 2009, p.

177). Ele classifica os tipos de revisitas por meio de quatro dimensões, sendo três pertinentes

de se citar:

1. Revisitas conforme a dimensão temporal – classifica as revisitas em termos do

intervalo de tempo transcorrido entre o penúltimo acesso e a atual visita a uma

determinada página:

Short-term: em menos de uma hora;

Medium-term: de uma a 24 horas;

Long-term: acima de 24 horas;

Very long-term: acima de uma semana

2. Revisitas conforme a dimensão de objetivo – classifica as revisitas conforme o

interesse do pesquisador:

Content: quando é desejado rever o mesmo conteúdo já visto antes ou verificar

modificações no conteúdo anteriormente visto;

Navigation: para proporcionar o acesso à outra página com conteúdo desejado;

Tool: reutilização de um sistema, como webmail, por exemplo.

Non-intentional: sem intenção de visitar.

Page 29: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

29

3. Revisitas conforme a dimensão de contexto – classifica as revisitas conforme a

sessão em que ocorreu o penúltimo acesso e a última visita à página e as relaciona

com a continuidade da tarefa (objetivo).

Intra-session: visitas dentro da mesma sessão, com mesmo objetivo;

Intra-task but inter-session: visitas no contexto da tarefa, mas realizadas em

sessões diferentes;

Inter-task: visitas realizadas em contexto de tarefas diferentes.

Mayer aprofundou seu estudo comparando os tipos de revisitas com as principais

ferramentas disponíveis. Com isto e observando o comportamento dos pesquisadores, ele

concluiu:

As revisitas classificadas como short-term têm frequentemente o objetivo de

backtracking, isto é, quando o pesquisador está voltando para uma página que

contém links de outras páginas de seu interesse, sendo comum em páginas iniciais

ou de listagens. Por esta natureza, esta revisita costuma ocorrer dentro de uma

mesma sessão. Para realizar estas revisitas o pesquisador costuma recorrer ao

botão de voltar, presente nos navegadores.

As revisitas de medium e long-term costumam ter como objetivos: retomar sessões

iniciadas mais cedo, reutilizar uma ferramenta ou ainda, monitorar o conteúdo

previamente visitado. Estas revisitas costumam ser apoiadas pelo recurso de auto

completar da barra de endereços do navegador, lista de histórico de navegação e

bookmarks.

As revisitas de long-term e very long-term são classificadas como re-pesquisa, e

ocorrem quando o pesquisador deseja reencontrar, ou redescobrir, conteúdo

específico de alta importância. Os navegadores têm como apoio neste objetivo os

recursos de bookmarks e lista de histórico, mas, além destes recursos, as

ferramentas de busca na Web são muito utilizadas.

Esta tendência de ações para revisitas de long-term e very long-term foi confirmada

por nosso trabalho nos resultados do “Questionário de Hábitos de Pesquisa Exploratória”

(Apêndice C) aplicado a um conjunto de pesquisadores locais. Da amostra pesquisada, 70% e

65% dos pesquisadores respectivamente procuram em seus favoritos ou acessam o histórico,

pra relembrar um documento anteriormente visitado. Também descobrimos que 50% dos

pesquisadores tentam refazer a pesquisa que lembram ter originado aquele resultado (nesse

Page 30: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

30

caso lembram-se das palavras-chaves) e que 42% tentam pesquisar pelo conteúdo que

lembram conter no documento.

Observamos também que o recurso de favoritos (bookmarks) pode ser inútil quando o

pesquisador se esquece de salvar o documento. Além disso, a listagem de histórico nativa do

navegador também não é apropriada para revisitas de very long-term, pois costuma excluir

registros após um período de dias ou estes se perdem em reinstalações/mudança de

navegador. Outro problema dos históricos tradicionais é que eles apresentam todo o conteúdo

de URLs (Uniform Resource Locations) requisitadas pelo navegador em servidores Web

durante o tempo, o que inclui, por exemplo, páginas de redirecionamento (encurtadores de

URL, exibição de publicidade ou de finalidade estatística) e uso do navegador em atividades

não relacionadas à pesquisa do pesquisador. Neste sentido, 42,9% dos entrevistados

afirmaram que o fato de registrar todo esse conteúdo dificulta extrair informação útil do

histórico.

Com base na consideração destes últimos autores e nas respostas que obtivemos por

meio de nossa investigação, resolvemos desenvolver uma ferramenta de apoio à pesquisa

exploratória que contivesse um recurso de histórico de pesquisa. Neste histórico, objetivamos

identificar melhor o comportamento de navegação e busca, realizada pelo pesquisador,

procurando aprimorar a apresentação visual das atividades a fim, também, de diferenciá-las

nas dimensões tempo, objetivo e contexto indicados por Mayer. Deste modo, esperamos

facilitar a lembrança e comparação entre os recursos visitados, integrando o histórico com

outros aspectos relacionados a uma pesquisa exploratória, dos quais falaremos no Capítulo 3.

2.3. O estado da arte em ferramentas de Pesquisa

Exploratória

Uma vez tendo compreendido e delimitado a definição sobre Pesquisa Exploratória, partimos

para levantar o estado da arte em trabalhos relacionados a este tema. Para isto, estabelecemos

um protocolo de revisão sistemática (Apêndice A). Nesta revisão encontramos trabalhos sobre

vários aspectos do suporte à pesquisa exploratória, dentre os quais ressaltamos: a aplicação de

técnicas de visualização da informação para apresentação dos resultados de pesquisa e as

tentativas de registrar e exibir o histórico da pesquisa para permitir ao pesquisador

compreensão dos passos realizados e continuidade em caso de necessidade de interrupções.

Page 31: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

31

2.3.1. Ferramentas que usam técnicas de Visualização da

Informação

Existem diversas definições para Visualização da Informação. A maioria delas sugere uma

representação visual para dados abstratos que proporcionem reforço cognitivo de forma a

facilitar a aquisição de conhecimento de quem vê tal representação. Alhenshiri et al. (2010)

argumentam que técnicas de visualização da informação podem ser incorporadas no processo

de busca em dois importantes estágios: na reformulação da consulta (query) feita pelo

pesquisador e na apresentação dos resultados. Deste modo, procuramos trabalhos que

aplicassem tais técnicas nas Search Engine Results Pages (SERPs).

Uso de grafos para exibir resultados de pesquisa - Uma das grandes apostas em

técnicas de visualização da informação para exibir resultados de buscas é a utilização de

grafos. O protótipo de Alhenshiri et al (2010), Visual Search Engine (VSE) é uma interface de

pesquisa (Figura 4) no qual os resultados são obtidos da união dos itens retornados por

ferramentas populares. Termos de pesquisa alternativos são apresentados ao pesquisador

baseados em palavras extraídas da WordNet5. A visualização dos resultados da pesquisa é

proporcionada por um grafo no qual os nós exibem o título do documento e uma miniatura

com o conteúdo do recurso. Ao clique sobre um nó é possível abrir o documento no browser

ou ampliar a imagem. Arestas indicam similaridades de documentos. Um painel lateral

permite exibir algumas meta-informações, como tamanho, data da última modificação,

pagerank e descrição do documento.

5 Uma base de dados léxicais para o idioma inglês, provendo sinônimos e conjunto de palavras e relacionamentos entre eles. http://wordnet.princeton.edu/

Page 32: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

32

Angelaccio, Buttarazi e Patrignanelli (2007) apresentam a versão 3.0 de uma

ferramenta chamada MyWish (Figura 5), que se integra com o TouchGraph6. Nela, os

resultados da pesquisa são apresentados na forma de um grafo a partir da query utilizada, que

é considerada o nó central. Os primeiros filhos são os domínios que contêm documentos

relevantes e os nós seguintes são pastas e subpastas do domínio até as folhas, que são os

documentos.

6 Projeto criado por Alexander Shapiro que a partir de um XML estruturado desenha grafos para finalidades diversas - http://www.touchgraph.com/navigator

Figura 4 - Tela do VSE, extraída do documento VSE_Shots, disponível em http://sites.google.com/site/alhenshiri/Home/downloads

Page 33: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

33

Outro bom exemplo de aplicação de grafos é o trabalho de Sallaberry et al. (2010).

Eles realizaram um aprimoramento na geração dos grafos, por meio da remoção de nós para

encontrar pontes e clusters de informação. Esta abordagem torna o grafo menos “poluído” e

convida o pesquisador a interagir com ele (Figura 6). Um clique sobre um nó que representa

um cluster de informação expande o grafo e permite enxergar as keywords que servem de

ponte entre os clusters e recursos. O sistema utilizou a API da engine Exalead

(http://www.exalead.com/).

Apesar de bem projetadas, essas soluções possuem algumas limitações. O VSE é

limitado quanto à extração ou inferência de semântica na visualização dos resultados da

pesquisa, pois apenas apresenta o título e uma miniatura do documento no nó do grafo e

quatro campos de meta-informação quando um nó é selecionado (tamanho, data de

modificação, pagerank e resumo do documento). O MyWish 3.0, apesar de integrar-se com

uma excelente biblioteca de manipulação de grafos, apresenta uma hierarquia de nós e folhas

que acreditamos ser pouco intuitiva aos pesquisadores no processo de pesquisa exploratória.

Isto porque, nem sempre a hierarquia de pastas, subpastas e documentos reflete em uma boa

organização taxonômica que de fato traga entendimento da importância do documento no

contexto do domínio no qual ele está hospedado. A solução de Sallaberry, et. al. (2010) é a

que melhor explora o uso dos grafos, sendo que seu foco foi aprimorar a maneira de

clusterizar os nós dos grafo. Este trabalho provavelmente poderá servir como base para outras

abordagens com esta mesma estrutura de dados (grafo).

Figura 5 - tela do MyWish extraída de (ANGELACCIO, BUTTARAZZI e PATRIGNANELLI, 2007).

Page 34: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

34

Uso de nuvens de texto, Wordbars e Mapas - O projeto LED (Lookup Explore

Discover)7 de Mirizzi e Noia (2010) utiliza nuvem de texto para sugerir o uso, ou remoção, de

palavras-chave à string de busca. Uma versão do conhecido website de busca Yahoo®

(http://www.yahoo.com/) com uma interface baseada em nuvem de texto foi proposto por

Lunardi, Monat e Castro (2008). Segundo eles “as nuvens atendem ao objetivo de aumentar a

compreensão, comunicando informações contextuais por meio de variações na forma como os

dados são visualizados e proporcionando a visualização de dimensões adicionais da

informação de forma a tornar o contexto explícito”. Já é possível ver uma aplicação prática

desta modelagem no website Quintura (http://www.quintura.com/). O uso de nuvem de texto é

uma boa maneira para auxílio na formação das querys da pesquisa, mas estes projetos não

incluem nenhuma melhoria na visualização dos resultados da pesquisa.

Hoeber, Schroeder e Brooks (2009) nos apresentam o TheHotMap.com

(http://www.thehotmap.com), um website no qual os resultados da pesquisa são exibidos com

três ferramentas visuais: um histograma com termos mais frequentes nos documentos que

sugerem filtros para os resultados da pesquisa, denominado wordbar; uma etiqueta de cor

para cada termo da pesquisa, no qual a tonalidade da cor representa a frequência do termo no

documento (quanto mais escuro, mais frequente) e; um hotmap, que apresenta em miniatura

toda a listagem de resultados e respectivas etiquetas de cores, possibilitando ao pesquisador

7 Disponível em http://sisinflab.poliba.it/led/ e também na forma de complemento para o navegador Firefox

Figura 6 - Clusterização de nós proposto por (SALLABERRY, et al., 2010).

Page 35: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

35

avançar diretamente sobre algum ponto da listagem que tiver interesse, conforme mostra a

Figura 7. O conceito de representar a frequência de termos da pesquisa no documento com

etiqueta de cores é um ponto positivo do TheHotMap.com, incluindo sua wordbar e hotmap.

Mas sentimos falta da indicação de relações entre os documentos.

O VisGets (DÖRK, et al., 2008), Figura 8, é um projeto que reúne nuvens de tags e

mapas. Segundo os autores, a união destas duas técnicas de apresentação proporciona uma

melhor compreensão de domínio do conceito e da distribuição espacial dos recursos. A meta

principal deste grupo era expandir as possibilidades de geração de queries por meio da

interação do usuário com a visualização de algumas características dos documentos. A

interface apresenta basicamente três opções: Time VisGet, que permite visualizar e definir

uma faixa temporal referente a publicação dos recursos; Location VisGet, que exibe pontos

demonstrando a quantidade de documentos presentes em regiões geográficas e; Tag VisGet,

que é uma nuvem de tags com termos frequentes nos documentos encontrados. Os resultados

são apresentados em uma listagem de caixas com o título dos documentos. Mover o mouse

sobre um item do resultado exibe um resumo do documento (uma descrição com imagem

extraída do documento). Esta parece ser uma boa ferramenta para pesquisa que têm

significativa relação com tempo ou distribuição geográfica da informação. Fora deste

contexto os recursos Location VisGet e TimeVisGet serão pouco úteis ao pesquisador,

Figura 7 - Tela do TheHotMap.com, disponível online em http://www.thehotmap.com

Page 36: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

36

restando apenas a exibição da nuvem de tags como forma de sugerir ao usuário continuidade

na pesquisa exploratória. Recentemente o projeto foi disponibilizado para fins de

demonstração em http://pages.cpsc.ucalgary.ca/~mdoerk/view/explore.

Outras abordagens de visualização - fugindo dos paradigmas de visualização até aqui

apresentados, encontramos o trabalho de Nguyen e Zhang (2006) que gerou o aplicativo

WebSearchViz (Figura 9) no qual os itens da página de resultado da busca são desenhados em

uma visualização que lembra o sistema solar, na qual a query inicial é o Sol, centro da

visualização e os itens são distribuídos na área circular conforme proximidade com os

assuntos determinados pelo usuário. Ainda pudemos encontrar outra abordagem como o

Tianamo (http://search.tianamo.com) referenciado por Treharne e Powers (2009), uma

ferramenta que exibe os resultados da pesquisa na forma de uma superfície, como um mapa

geográfico em relevo (Figura 10). Montanhas são como clusters de informações e indicam

informações mais relevantes. O trabalho tem méritos pela originalidade do tipo de

visualização, sendo a exibição de montanhas de informação uma boa analogia para clusters. O

problema que achamos nesta abordagem é não permitir indicar outros tipos de relacionamento

entre os documentos, ou mesmo emergir deles mais informações semânticas. Além da

superfície, a ferramenta exibe na lateral uma listagem simples de título e descrição de cada

um dos recursos retornados.

Figura 8 – Tela do VisGets, obtida em http://pages.cpsc.ucalgary.ca/~mdoerk/view/explore

Page 37: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

37

Figura 9 - Tela do WebSearchViz extraída de http://home.engineering.iastate.edu/~tien/WebSearchViz/tool.html

Figura 10 - Tela de resultados do Tianamo, após pesquisa por “flamengo”.

Page 38: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

38

2.3.2. Ferramentas baseadas no Histórico de Pesquisa/Navegação

No contexto de soluções que procuram dar apoio ao registro do histórico de uma

pesquisa e permitir retomada de uma busca interrompida destacamos o trabalho de Morris,

Morris e Venolia (2008). Eles desenvolveram a SearchBar, para capturar, armazenar e

apresentar anotações integrado com o sistema de pesquisa do navegador. Trata-se de um plug-

in para o navegador Microsoft Internet Explorer (Figura 11). Ele monitora toda a navegação

do pesquisador e ao identificar um padrão de URL de uma ferramenta de busca começa a

registrar as queries utilizadas pelo pesquisador. A SearchBar inclui uma lista hierárquica do

histórico de pesquisas recentes, consultas e resultados visitados pelos pesquisadores, além de

anotações sobre o tópico corrente. Não encontramos este plug-in disponível para instalação e

testes, mas um vídeo8 disponibilizado pelos autores demonstra o funcionamento do sistema.

8 http://research.microsoft.com/en-us/um/people/dan/searchbar/

Figura 11 - Tela da Search Bar (MORRIS, MORRIS e VENOLIA, 2008)

Page 39: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

39

O Factic (Tvarozek E Bielikova, 2009), um navegador para busca exploratória de

imagens baseado em ontologias e facetas, recentemente teve acrescido uma solução

denominada History Map (ŠIMKO, TVAROZEK e BIELIKOVA, 2010). A nova ferramenta

baseia-se na análise dos logs de pesquisa identificando sessões e organizando a navegação em

um único grafo de termos e recursos, permitindo ao pesquisador apoio para revisitar as

páginas anteriormente visitadas. Visualmente a ferramenta oferece uma árvore do histórico de

navegação (Figura 12). Os autores pretendem que a ferramenta gere também um mapa de

histórico semântico, que além dos termos pesquisados deverá apresentar conceitos emergidos

da folksonomia do Delicious (http://www.delicious.com).

Uma solução inovadora para tratar o histórico de vem do sistema YouPivot e

TimeMarks (Hailpern, et al., 2011), o qual trouxe como novidade a associação de pistas

contextuais às atividades realizadas pelo pesquisador no navegador. Hailpern et al trouxeram

teorias cognitivas para explicar, por exemplo, que às vezes é mais fácil se lembrar de um

documento anteriormente visto por meio da lembrança de uma música que estava tocando no

momento da leitura. Assim, eles definiram como pista contextual um elemento, ou objeto, que

tem relação temporal a um objetivo de pesquisa. O YouPivot é uma espécie de aplicação que

registra, sem intervenção do pesquisador, pistas contextuais baseadas em elementos de

atividades que são executadas pelo pesquisador no navegador, ou em outros aplicativos do

sistema (tocadores de música, comunicadores ou editores de texto, por exemplo). O

Figura 12 - Ferramenta Search History Tree acoplada ao Factic (ŠIMKO, TVAROZEK e BIELIKOVA, 2010)

Page 40: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

40

TimeMarks permite que o pesquisador marque um momento que ele considera importante na

pesquisa. Quando acionado, o TimeMarks cria uma “fotografia” das atividades em execução,

possibilitando ao pesquisador rotulá-la para futura consulta. O sistema é completado com uma

visualização de histórico, na qual as informações registradas pelo YouPivot são combinadas

com as do TimeMarks, permitindo buscas com filtros pelo pesquisador (Figura 13). Para usar

o recurso YouPivot é necessário instalar uma aplicação servidora no sistema, a qual, até o

momento deste trabalho, só havia disponível versão para MacOS. Sem ela é possível usar

apenas uma versão mais simples do sistema, oferecida como extensão para o navegador

Google Chrome. Nela está disponível o recurso TimeMarks limitado a ‘fotografar’ somente as

informações das abas de pesquisas abertas e a geolocalização do pesquisador. A visualização

do histórico de navegação ganha uma apresentação aprimorada em relação à oferecida

tradicionalmente pelo navegador, mostrando ícones dos websites mais visitados, filtro por

título de página e URL, e uma lista das palavras de maior frequência nestes títulos.

Figura 13 - Tela do YouPivot. Extraído de (HAILPERN, et al., 2011).

Page 41: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

41

Golovchinsky, Diriye e Dunningan (2012) apresentam o Querium, um sistema

projetado para registrar o histórico de consultas realizadas em um sistema de repositório de

artigos científicos de modo que o pesquisador pudesse verificar a equivalência entre as

consultas feitas por ele, ou por colegas, e também informar ao sistema quais documentos

foram úteis na sua pesquisa. A interface proposta na primeira versão da ferramenta (Figura

14) possuía uma série de opções e recursos, incluindo um campo de busca, uma área de

resultados, botões de ordenação, filtros, lista de consultas recentes e a pré-visualização do

documento. Nas primeiras avaliações realizadas com testes informais os pesquisadores

notaram alguns problemas e redesenharam a interface para a versão atual, Querium 2.0

(Figura 15). Um destaque que podemos fazer deste sistema é um elemento de histograma que

aparece ao lado de cada documento apresentado como resultado da busca. Este histograma

indica ao pesquisador a frequência com que aquele documento tem aparecido nos seus

resultados de consultas com o passar do tempo. Com isto ele pode identificar documentos

consistentes, presentes em várias consultas, recentemente encontrados e documentos vistos

previamente com pouca frequência e agora com mais frequência (ou vice-versa). Um dos

problemas encontrados neste projeto (que também foi identificado e tratado pelos seus

desenvolvedores) foi o excesso de recursos oferecidos ao pesquisador. Wilson e Schraefel

Figura 14 - Interface do sistema Querium 1.0. Extraído de (GOLOVCHINSKY, DIRIYE e DUNNIGAN, 2012)

Page 42: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

42

(2008) lembraram o paradoxo da escolha, de Schwartz, o qual diz que os pesquisadores

quando apresentados com um grande número de opções podem fazer escolhas pobres, ou até

mesmo não fazê-las (SCHWARTZ, 2005). Este é um problema comum nas interfaces de

pesquisa exploratória, pois, ao mesmo tempo em que precisam ser ricas em funcionalidades,

elas devem apresentar clareza no design.

Analisando as ferramentas apresentadas acima, podemos observar que a ferramenta

SearchBar se mostra interessante ao nosso objetivo por realizar um esforço em identificar as

tarefas de pesquisa do usuário durante sessões de uso de um navegador na Web. Além disso, o

History Map mostra uma forma visual de apresentar um histórico, embora não focado em

histórico de documentos navegados, mas em filtros aplicados dentro de uma interface. Estas

duas ideias nos mostram que prover um esquema visual para representar o histórico do

pesquisador, fazendo distinção entre atividades de navegação e de pesquisa pode ser um bom

caminho para apoiar a pesquisa exploratória. Deste modo, propomos a criação de relações

entre a dimensão temporal e as demais dimensões envolvidas na pesquisa exploratória, pois

ficou claro, pelo exemplo do YouPivot e TimeMark, que quanto mais pistas cognitivas possam

ser associadas aos documentos, mais facilmente eles poderão ser recuperados depois.

O projeto Querium mostrou que algumas decisões de projeto tomadas em nossa

Figura 15 – Interface do sistema Querium 2.0. Extraído de (GOLOVCHINSKY, DIRIYE e DUNNIGAN, 2012).

Page 43: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

43

proposta estão no caminho certo, como identificar os documentos já visitados pelo

pesquisador após realizar uma consulta e proporcionar a ele uma maneira de indicar a

relevância do documento para seu projeto de pesquisa. Nossa ferramenta se difere,

principalmente no desafio de oferecer uma solução para a pesquisa aberta na Web, sem fechar

em um domínio específico de documentos e sem a necessidade do pesquisador ter de utilizar

uma interface substituta do seu mecanismo de pesquisa preferido.

Com relação a estes projetos, além de agregar algumas das características presentes

nas ferramentas citadas, ainda provemos um mecanismo de filtragem das atividades em tempo

de execução, visando reduzir a quantidade de informações que são apresentadas ao

pesquisador na visualização do histórico. A gravação de todo o contexto de atividades, como

faz o YouPivot, e a apresentação desta informação de uma só vez pode atrapalhar os

pesquisadores na busca de informação. Além disso, incorporamos definições de “projetos” e

de “sessões de pesquisa”, que permitem ao pesquisador organizar de maneira ativa o conteúdo

registrado no histórico.

Durante a fase de desenvolvimento e testes da nossa ferramenta encontramos algumas

extensões desenvolvidas para o navegador Google Chrome, das quais teceremos comparações

e comentários também no capítulo 4. Nesse mesmo capítulo discorreremos um pouco mais

sobre as percepções e as decisões de projeto que elas nos levaram a tomar.

Finalmente, é importante ressaltar que existem outros trabalhos que se propõem a

resolver problemas de histórico de navegadores, mas nem todos dentro do contexto de atender

as características de uma pesquisa exploratória, ou com caraterísticas similares aos

apresentados acima. Contudo resolvemos citar abaixo alguns deles para que fique registrado

suas principais características e contribuições.

O Memento é um trabalho que procura identificar contextos de navegação

(KULKARNI, RAJU e UDUPA, 2010). Baseado no conteúdo da página corrente e das

páginas imediatamente antes e depois desta, ele extrai frases tópico e, baseado em algoritmos

de frequência, elege o termo que melhor representa um contexto de sessão. Enquanto estiver

gerando os mesmos termos ele considera que o pesquisador está em uma mesma sessão de

pesquisa. O trabalho não apresenta formas visuais de ilustrar estes contextos ao pesquisador e

se limitou a confirmar com os participantes se os termos gerados correspondiam ao seu

objetivo de navegação.

Page 44: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

44

O ActionShot (LI, et al., 2010), Figura 16, é uma extensão para o navegador Firefox

que tem o propósito de registrar todas as ações realizadas pelo pesquisador em páginas Web

(como cliques em botões e entradas de formulário), permitindo-lhe executá-las novamente

depois. Ele introduziu como recurso interessante o conceito de iniciar e pausar o registro das

atividades. Pelo que compreendemos, seu objetivo principal é registrar interações em algumas

páginas que o pesquisador teria interesse em reexecutar depois. Ele também possui recurso de

apresentação de screenshots das páginas (que são essenciais para registrar as interações que

acontecem nela). Este, porém, não é um recurso novo, no Contextual Web history (Figura 17)

ele também já aparece para facilitar a recordação do conteúdo da página (WON, JIN e

HONG, 2009).

Figura 16 – Tela do ActionShot, extraído de (LI, et al., 2010).

Page 45: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

45

2.4. Considerações Finais

Nosso estudo para compreender a Pesquisa Exploratória trata-se de um exemplo de pesquisa

exploratória. Nós conhecemos o termo inicialmente quando descobrimos alguns artigos dos

workshops e simpósios de HCIR. Nos primeiros esforços vimos que era necessário investigar

outros conceitos, como Information Seeking, Information Foraging e Sense-Making e

percebemos que há relações destes com a Pesquisa Exploratória. Encontramos algumas

dúvidas e procuramos por trabalhos realizados dentro dessa temática para tentar esclarecê-las.

Neste processo fomos identificando e amadurecendo um framework de dimensões de apoio à

pesquisa exploratória (o qual será apresentado no próximo capítulo). Olhando para este

modelo criado com o aprendizado e investigação, mudamos ligeiramente o destino da nossa

pesquisa focando em um ponto especial, considerado por nós interessante de ser pesquisado.

Voltamos a refazer o processo de aprendizado e investigação para entender os casos de

revisitas e encontrar informações a cerca da necessidade e maneiras de se apoiar a pesquisa

exploratória com o uso de uma ferramenta de histórico. Enfim, conseguimos encontrar

algumas evidências de que este era um ponto interessante de ser investigado com mais

Figura 17 – Tela do Context Web History, extraída de (WON, JIN e HONG, 2009)

Page 46: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

46

profundidade e então decidimos projetar uma solução que pudesse ser experimentada e

testada a fim de trazer benefícios aos pesquisadores.

Portanto, como resultado de nossa pesquisa bibliográfica tivemos a definição de um

framework de dimensões de apoio à Pesquisa Exploratória (apresentado a seguir) e o projeto

de uma proposta de solução que proporciona apoio a uma destas dimensões, dando ao

pesquisador uma nova forma de interagir com seu histórico de pesquisa, a qual será

apresentada no Capítulo 4.

Page 47: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

47

Um Framework para Ferramentas de Apoio

Uma vez compreendido o que é a Pesquisa Exploratória e analisado o estado da arte das

ferramentas desenvolvidas para este tipo de pesquisa, propomos a seguir um conjunto de

dimensões necessárias de serem consideradas quando da construção de ferramentas para

apoiar a pesquisa exploratória realizada por meio da Web.

Durante nossos estudos identificamos um framework composto de seis dimensões que

devem ser apreciadas quando se pretende desenvolver uma ferramenta de apoio à pesquisa

exploratória, são elas: a Qualidade, a Apresentação, o Tempo, a Cognição e Aquisição de

Conhecimento, a Personalização e a Colaboração. Nos tópicos a seguir explicamos como cada

um destes aspectos impacta na experiência de realização deste tipo de pesquisa e destacamos

como estas dimensões se inter-relacionam e devem ser atendidas em ferramentas de apoio.

Consideramos que quanto mais destas dimensões forem cobertas por uma ferramenta, melhor

será a eficiência da pesquisa. Estas dimensões são percepções resultantes do nosso trabalho,

mas, embora elas tenham sido bastante discutidas e delimitadas na literatura, acreditamos que

outras dimensões possam vir a ser consideradas por outros autores.

3.1. A Qualidade dos Documentos

Os resultados de uma pesquisa na Web são documentos existentes nos mais diversos domínios

físicos (servidores da Internet) e conceituais (áreas de interesse), contendo arquivos em

diversos formatos (e.g. texto, hipertexto, imagem, áudio, vídeo, dentre outros). Saber

reconhecer o formato de documento adequado à consulta de um pesquisador e escolher dentre

3 Capítulo

Page 48: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

48

os documentos aquele que estão no domínio conceitual mais relevante ao preenchimento do

seu gap de informação é uma maneira de melhorar a qualidade dos resultados da busca.

Deste modo, a dimensão de “qualidade” é a responsável por garantir a entrega de

recursos ao pesquisador que, provavelmente, satisfarão suas necessidades de informação. Ela

coordena a seleção e a classificação dos documentos que serão apresentados como resultado

de uma consulta, sendo primordial atingir um bom equilíbrio entre a cobertura (i.e. recall) e a

precisão dos documentos recuperados. Esta dimensão é tratada nos buscadores atuais por

meio dos diversos algoritmos de ranking e relevância empregados. Porém, estes algoritmos

são otimizados para buscas do tipo lookup, não sendo bem ajustados para a pesquisa

exploratória, visto que as necessidades desta variam com a fase da pesquisa. No início de uma

pesquisa exploratória é necessário que a máquina de busca trabalhe com o foco voltado para a

cobertura (i.e. recall), pois o pesquisador não detém muito conhecimento da área sendo

pesquisada e, portanto, ainda não consegue formular queries focadas. Uma maior cobertura

fornece ao pesquisador a possibilidade de aprender mais sobre o tema da pesquisa e, assim,

melhorar a qualidade de sua query. Ao aproximar-se da fase final, a pesquisa exploratória

deve mudar seu foco para a precisão, pois o pesquisador já adquiriu o conhecimento sobre a

área e agora quer saber sobre pontos específicos do assunto.

Assim, outras abordagens têm sido exploradas para melhorar a qualidade dos

resultados apresentados ao pesquisador em relação à cobertura dos tópicos pesquisados. A

extração de semântica por meio da análise do conteúdo dos documentos indexados, por

exemplo, combinada à consulta em repositórios, ou interpretação de esquemas semânticos,

podendo proporcionar ganho significativo de entendimento acerca da área do conhecimento

que envolve a pesquisa realizada. Tvarozek e Bieliková (2010) apresentam uma ferramenta de

exploração facetada para pesquisa de imagens com apoio de ontologias, na qual foi possível

fornecer, além da oportunidade de desambiguação, informações diretas sobre um assunto

pesquisado. A extração semântica pode ser feita em estruturas complexas como ontologias, ou

em estruturas mais simples como marcações existentes em páginas de Web, esquemas de

microdados, atributos RDF, tags e metatags de documentos HTML. Algumas ferramentas de

busca já se aproveitam de linguagens da Web Semântica para aprimorar os resultados de

pesquisa. Podemos citar como exemplo as ferramentas Hakia (hakia.com), Yebol (yebol.com),

Evri (evri.com), Cognition (cognition.com), SenseBot (sensebot.net), Empora (empora.com),

PubGene (pubgene.org), DayLife (daylife.com) e DeepDyve (deepdyve.com).

Outras abordagens para prover melhor qualidade nos documentos envolvem a ideia de

busca interativa, na qual o pesquisador indica se os resultados são bons, ou não, para sua

Page 49: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

49

consulta. É possível, também, tentar interpretar melhor as palavras-chaves fornecidas na

consulta a fim de determinar quando elas se referem a um domínio específico de informação.

A ferramenta de Busca do Google, por exemplo, detecta quando a consulta está relacionada à

conversão de moeda, cálculo aritmético, previsão do tempo, resultados de eventos esportivos,

filmes no cinema, locais, dentre outros, procurando retornar uma resposta direta ao

pesquisador. Embora isto se pareça com necessidades de pesquisa do tipo lookup, elas podem

ser consideradas subtarefas de learn e investigate, como citado na Seção 2.1.

3.2. A Apresentação dos Documentos

Os buscadores atualmente listam poucas informações sobre os documentos resultantes de uma

busca, como título, URL e snippets. Os snippets são pequenas linhas de texto que aparecem

embaixo de todo resultado de pesquisa e foram desenvolvidos para dar aos pesquisadores uma

noção sobre o conteúdo da página e porque ela é relevante para a consulta. Eles costumam

apresentar a frase na qual as palavras-chaves providas na consulta aparecem no documento. A

apresentação de mais detalhes sobre o documento entre os snnipets já garantem benefícios ao

scanning visual e a aquisição de conhecimento por parte do pesquisador. Por exemplo,

baseado em esquemas de microdados (www.schema.org) a máquina de busca do Google já

vem entregando o que chamam de rich snippets, pedaço de informações sobre o documento

com apelo visual. Atualmente é possível visualizar rich snippets sobre músicas, receitas,

pessoas, produtos, eventos e resenhas (Figura 18).

Figura 18 - Exemplos de rich snippets. Extraído de http://support.google.com/webmasters/bin/answer.py?hl=pt-BR&answer=99170

Page 50: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

50

Entretanto, somente a exibição de títulos e snippets dos documentos não propiciam a

descoberta, ou proporcionam o aprendizado e a investigação, requeridos pela pesquisa

exploratória. Isto porque, além da maioria dos títulos e snippets serem muito parecidos, a

listagem textual não mostra para o pesquisador as diferenças e os relacionamentos entre os

recursos, ou o domínio físico e conceitual a que pertence cada recurso.

Deste modo, esta dimensão é responsável pela forma como os resultados serão

visualizados pelo pesquisador. Um ponto é permitir ao pesquisador identificar as relações

entre os documentos recuperados que possam auxiliá-lo a criar um modelo mental adequado

do espaço de informação que ele está explorando. O modelo de listagem textual das páginas

de resultados das ferramentas de buscas (SERP), comuns nos buscadores atuais, é bem

adequado para as pesquisas lookup, porque estimula o scanning visual para localizar padrões

de informações, mas não apresenta um bom mecanismo visual para que o pesquisador

identifique e compreenda a relação entre os documentos e conceitos envolvidos nos

documentos.

As técnicas de visualização da informação (WIKI, 2013) produzem uma representação

visual de dados abstratos, o que pode proporcionar reforço cognitivo, facilitando a aquisição

de conhecimento de quem vê tal representação. Por isto algumas ferramentas para pesquisas

exploratórias trocam as tradicionais listagens textuais das SERP por uma visualização

estruturada do conjunto de documentos retornados. No capítulo anterior destacamos alguns

projetos que utilizam abordagens visuais para apresentar os resultados da pesquisa por meio

de grafos (SALLABERRY, et al., 2010), superfície (TREHARNE e POWERS, 2009), nuvem

de tags associada a mapas (DÖRK, et al., 2008), hotmaps (HOEBER, SCHROEDER e

BROOKS, 2009) e gráfico de proximidade (ALHENSHIRI, et al., 2010). Não encontramos

mecanismos de busca populares utilizando alguma destas abordagens, talvez porque ainda é

necessário mais esforço de pesquisa para entender os benefícios e as melhores maneiras de

explorar a apresentação e interagir com páginas de resultados visuais. Além disso, este novo

tipo de proposta é uma grande quebra de paradigma para o pesquisador.

A dimensão de apresentação é ortogonal às demais, servindo de apoio a elas como, por

exemplo, potencializando com sinalizadores o impacto da extração semântica na dimensão da

qualidade, ressaltando recursos de colaboradores da pesquisa, apresentando de maneira visual

o histórico da pesquisa, ou representando o conhecimento conquistado pelo pesquisador

durante a execução da pesquisa.

Page 51: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

51

3.3. O Tempo da Pesquisa

Em uma pesquisa exploratória, o pesquisador aprende ao longo do tempo, alterando seus

objetivos na pesquisa e seu foco, conforme citado no modelo de berry-picking.

Consequentemente, a pesquisa exploratória pode transcender múltiplas iterações sobre

consultas e diversas sessões, prolongando-se por dias, semanas ou meses dependendo da

natureza da pesquisa, conforme característica também citada por White e Roth (2009). Esta

característica força o pesquisador a ter que recorrer à sua memória, para identificar o que já

foi visitado e descartar documentos com informações menos relevantes, pois as ferramentas

de busca tratam cada consulta de maneira isolada, sem levar em conta o que já foi apresentado

para o pesquisador, ou o que ele já aprendeu do resultado anterior. Mostramos detalhes desta

necessidade de revisitação e importância de uma ferramenta de histórico da pesquisa por meio

dos trabalhos de Mayer (2009) e Komlodi, Marchionini e Soergel (2006) (2007), no Capítulo

2.2. Deste modo, esta dimensão deve tratar o problema de sobrecarga cognitiva causada pela

necessidade de relembrar uma grande quantidade de informação que foi acessada em

momentos diferentes e por curtos espaços de tempo.

Uma forma comum de tratar este problema é fornecendo mecanismos de descarga

cognitiva, como as anotações externas, como preconizado pela teoria da cognição distribuída,

(HUTCHINS, 1995) os quais com o auxílio de mecanismos de identificação de padrões

podem ampliar a capacidade de memória do pesquisador. Estes mecanismos também podem

auxiliar o pesquisador nos casos em que ele inicia uma sessão com um objetivo e o muda em

função de recursos descobertos ao acaso. A navegação ao acaso estimula o raciocínio

analógico, e os pesquisadores podem relacionar suas experiências a outras situações

comparáveis. Assim, a “pesquisa exploratória pode estar mais preocupada com a recordação

(i.e., maximizar o número de objetos possivelmente relevantes que são recuperados) do que

de precisão (minimizando o número de objetos possivelmente irrelevantes que são

recuperados)” (WHITE e ROTH, 2009, p. 15). Uma boa ferramenta de histórico de pesquisa e

navegação pode ajudar na recordação de documentos relevantes que foram encontrados

durante a pesquisa.

Boas ferramentas de apoio a esta dimensão devem incluir recursos de memória de

sessão que armazenem consultas recentes e navegações de longo prazo, retendo informação

sobre as preferências do pesquisador e pesquisas realizadas em muitas sessões (WHITE e

ROTH, 2009). As ferramentas devem sinalizar estas mudanças ao longo do tempo, indicando,

por exemplo: o nível de entendimento, ou aprendizado, acumulado pelo pesquisador ao longo

Page 52: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

52

da pesquisa; o nível de qualidade de documentos procurados; os objetivos de pesquisa; os

colaboradores com a pesquisa, etc.

As ferramentas para apoio a esta dimensão deveriam capturar um momento dentro de

um projeto de pesquisa, permitindo enxergar, para cada uma das dimensões, os parâmetros de

configuração e necessidades que são variáveis. Por exemplo, no início da pesquisa, o

pesquisador pode estar satisfeito com documentos que lhe retornem definições básicas sobre

os conceitos que ele está aprendendo. À medida que o tempo avança, ele passa e exigir uma

qualidade diferente dos documentos, porque seu modelo mental acerca do espaço de

informação está mudando. O mesmo ocorre com os objetivos que, como no modelo de berry-

picking, podem estar em direções opostas em tempos diferentes da pesquisa, ou pode haver

vários objetivos, cada um em um estado diferente de evolução. Um deles, por exemplo, pode

já ter sido alcançado, enquanto outros ainda permanecem incertos, ou em plena atividade de

investigação, e alguns ainda serão definidos pelo pesquisador.

3.4. Cognição e a Aquisição de Conhecimento

Do ponto de vista da pesquisa exploratória esta dimensão é a responsável pela absorção e

operacionalização de novos conhecimentos pelo pesquisador, isto é, pelo seu ganho real de

informação como resultado da pesquisa. Este é o objetivo primordial da pesquisa exploratória.

Este componente é um dos mais difíceis de ser tratado pelas ferramentas de apoio à

pesquisa exploratória, pois não é trivial determinar quanto e quando o pesquisador aprende ao

navegar, visitar e explorar o conteúdo das páginas na Web. As ferramentas atuais não

costumam saber quando os pesquisadores estão satisfeitos, ou com conhecimento suficiente,

sobre o tema da pesquisa. Na verdade, os pesquisadores simplesmente abandonam a

ferramenta, ou a pesquisa, quando acham que já sabem o suficiente ou quando encontram

conteúdos repetidos nos resultados.

Para oferecer apoio a esta dimensão é necessário construir de um modelo conceitual

do campo semântico que está sendo pesquisado. As ferramentas atuais não apresentam um

mecanismo para o pesquisador registrar as relações entre os conceitos apreendidos de forma

explícita, sendo auxiliado, ou não, pela ferramenta. Uma forma explícita, e editável, de

registrar o modelo mental do pesquisador pode auxiliá-lo a determinar quando o modelo está

completo o suficiente, detectando, por exemplo, que o modelo não sofreu alteração nas

últimas n sessões, ou que não de identificou recursos novos nas últimas m sessões. Uma

forma mais simples de auxiliar o pesquisador é possibilitar o controle de seus objetivos e

Page 53: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

53

metas na pesquisa. Neste caso, convém também permitir que o pesquisador indique quais

recursos e consultas o ajudaram a alcançar cada um dos objetivos, pois estas informações

podem ser úteis às ferramentas que apoiam as dimensões de personalização e colaboração.

Esta dimensão também se relaciona fortemente com as dimensões de “qualidade” e

“apresentação”. Ao realizamos uma pesquisa por “Titãs” na máquina de busca do Google, por

exemplo, como mostra a Figura 19, um “quadro de conhecimento” é apresentado ao lado dos

recursos retornados pela busca, o qual é um quadro com informações oriundas de recursos da

Web Semântica e que são exibidos para potencializar o ganho de conhecimento sobre o tema

da pesquisa. Neste exemplo, o pesquisador pode facilmente utilizar o quadro para descobrir

que a banda Titãs iniciou sua carreira na cidade de São Paulo e já passou por quatro

gravadoras diferentes. Além disso, ele pode percorrer outros caminhos por meio dos links de

informações sobre os integrantes, as gravadoras, os álbuns ou as bandas relacionadas.

3.5. A Personalização da Pesquisa e de seus Resultados

Um desafio para os projetistas de ferramentas de apoio é oferecer maneiras diferentes para

que os pesquisadores realizem as mesmas tarefas, porque cada pessoa tem suas preferências

Figura 19 – Resultado da Busca no Google por “Titãs”

Page 54: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

54

na forma de realizar suas atividades de pesquisa e de avaliar os resultados desta pesquisa.

Tratar o pesquisador de maneira personalizada melhora sua experiência de pesquisa. Deste

modo, esta dimensão está preocupada com o ajuste dos sistemas de pesquisa às características

individuais de cada pesquisador, ou grupo de pesquisadores, procurando também usar as

informações do caminho percorrido na pesquisa e de seus resultados atuais para fornecer

pistas e indicações de melhores caminhos futuros.

Atualmente, os mecanismos de pesquisa estão preocupados em personalizar os

resultados das consultas com foco na precisão, tentando retornar resultados que já foram

visualizados em situações semelhantes pelos pesquisadores, ou que estão mais aderentes ao

seu histórico de palavras-chave fornecidas. Entretanto, este comportamento não favorece a

descoberta, ou mesmo ajuda os pesquisadores a completar lacunas em suas estruturas de

conhecimento em formação. Seria interessante que as ferramentas de busca pudessem

compreender a necessidade do pesquisador ajudando-o a mover-se adiante no processo de

pesquisa criando uma ponte com a dimensão cognitiva.

Recursos interessantes de personalização foram oferecidos nas ferramentas YouPivot

(Hailpern, et al., 2011) e Querium (Golovchinsky, Diriye e Dunnigan, 2012), apresentadas no

capítulo anterior. A primeira ferramenta modelou e criou uma forma de oferecer pistas

contextuais, isto é, dicas de como estava o ambiente do pesquisador no momento da execução

de uma tarefa, para que ele pudesse, em outra ocasião, relembrar destas atividades. A segunda

criou o conceito de histograma para indicar ao pesquisador os documentos que ele pudesse já

ter visto antes na sua lista de resultados. Em ambos os exemplos, foi criada uma ponte com a

dimensão temporal.

Outras abordagens para personalizar o processo, e os resultados, de uma pesquisa

incluem a determinação da localização geográfica do pesquisador e do tipo de dispositivo

utilizado para pesquisa. Uma ferramenta integrada de apoio poderia detectar que o

pesquisador não está na sua localidade habitual e que está realizando a pesquisa por meio de

um tablet e, desta forma, ao entregar os resultados da pesquisa, sugerir que ele marque

aqueles documentos para uma consulta, ou leitura, futura.

Fornecer recursos para anotações, ou classificações, também pode ser uma maneira

de apoiar o pesquisador que deste modo pode diferenciar pela sua ótica um documento

visitado. Além disso, configurações de uso da ferramenta como idioma, filtros e quantidade

de resultados desejados são também maneiras de se personalizar o processo de pesquisa. No

contexto de uma concorrência acirrada entre os motores de busca e tecnologias, a

Page 55: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

55

personalização é frequentemente considerada como uma das tecnologias que podem

proporcionar também uma vantagem competitiva (AHN, et al., 2008).

3.6. A Colaboração entre Pesquisadores

Grande parte das pesquisas atuais são realizadas por grupos de pesquisadores, ou é a

continuação de pesquisas anteriores, ou mesmo baseiam-se em uma ou uma série de pesquisas

realizadas anteriormente por outras pessoas. Este fenômeno ocorre tanto no meio acadêmico

quanto fora dele. Por exemplo, um estudo citado por Hearst (2009) indica que mais de um

quarto das pessoas fazem buscas colaborativas quando a atividade envolve o planejamento de

viagens. Deste modo, esta dimensão procura explorar o aspecto social da realização de uma

pesquisa exploratória por meio do compartilhamento de sucessos e fracassos, os quais quando

analisados ajudam os pesquisadores a percorrer um caminho mais simples e seguro na

pesquisa.

Uma forma simples de colaboração aparece, por exemplo, na ferramenta Google®

quando esta faz a exibição de quantos e quais dos amigos do pesquisador marcaram um

recurso que aparece na página de resultado de sua pesquisa baseado em um perfil de uma

determinada rede social. Esta técnica também é conhecida como social ranking (HEARST,

2009). Outra abordagem colaborativa é a criação de sistemas baseados em tagging, nos quais

os pesquisadores etiquetam seus recursos com palavras-chave que julgam transmitir o

conteúdo do mesmo como, por exemplo, o website Delicious®. Quando estas tags são

disponibilizadas de maneira social, gerando uma folksonomia, os pesquisadores podem

adquirir conhecimento acerca de um documento ou domínio. Pesquisas têm argumentado que

os sistemas de marcação sociais podem melhorar efetivamente a exploração do conhecimento

e atividades de sense-making (WAI-TAT FU, 2012). Isso se dá por assimilação, ou

acomodação, isto é, quando o pesquisador busca por recursos baseados no modelo conceitual

que tem sobre um tema, ou quando ele refaz seu modelo conceitual sobre um tema baseado

nas experiências de novos recursos encontrados e vistos.

A recomendação de resultados via relacionamentos em redes sociais, ou a aquisição de

conhecimento por assimilação/acomodação em sistemas de tagging, são boas maneiras de

proporcionar descoberta de conhecimento com a colaboração de terceiros, mas de maneira

passiva. Interfaces mais ativas de colaboração em pesquisas na Web procuram promover a

cooperação direta na atividade de pesquisa como, por exemplo, os projetos SearchTogether

(MORRIS e HORVITZ, 2007) e SearchTeam (www.searchteam.com). O primeiro é um

Page 56: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

56

plugin para o navegador Internet Explorer® no qual o pesquisador pode realizar pesquisas

junto com um grupo de outros pesquisadores, visualizar o histórico das palavras chaves

utilizadas por eles em consultas e compartilhar recursos com comentários e avaliações. O

segundo é um website no qual o pesquisador cria espaços de pesquisa sobre um tema

específico e dentro dele cria pastas com as quais organiza os recursos, os quais são itens de

resultados de consultas realizadas na ferramenta de pesquisa. Este espaço de pesquisa pode

ser compartilhado com outros pesquisadores que podem realizar suas próprias consultas e

salvar nas mesmas pastas outros recursos, os quais serão visto por todos os colaboradores,

contribuindo, assim, para a pesquisa como um todo.

3.7. Considerações Finais

As dimensões que identificamos para apoiar a pesquisa exploratória podem ser enxergadas

como uma rede na qual os pontos podem se comunicar para potencializar o suporte ao

pesquisador em determinadas tarefas.

Podemos combinar as dimensões de “Qualidade” e “Apresentação” para oferecer

páginas de resultados de pesquisa com pistas visuais sobre a informação contida nos

documentos, ou a relação que existe entre eles; combinando a “Personalização”, a

“Colaboração” e a “Apresentação”, podemos apresentar os documentos que colegas de

pesquisa consideraram relevantes ao projeto que é compartilhado, ou que já foi executado por

outra pessoa anteriormente; as dimensões de “Tempo”, “Cognição” e “Apresentação” podem

se comunicar para melhorar a recordação de documentos importantes por meio da

visualização de histórico de pesquisa, ou em apresentação de representações conceituais de

um espaço de informação. Estes são apenas alguns exemplos de como combinar estas

dimensões. Por meio destes exemplos, percebemos que a dimensão de “Apresentação” é

ortogonal às demais, por estar ligada à função de transmissão de informação.

Este framework também serviu para estruturar nossas pesquisas sobre o tema da

pesquisa exploratória e definir quais as dimensões, ou intersecções entre elas serão exploradas

por parte do grupo de pesquisa no qual está inserido este trabalho.

Page 57: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

57

Uma Ferramenta de Apoio a Pesquisa

Exploratória na Web

Neste capítulo apresentamos o projeto e a implementação de uma ferramenta de apoio à

pesquisa exploratória na Web, incluindo as escolhas tecnológicas, ou conceituais, que

envolveram seu design. Na Seção 4.1 mostramos um levantamento realizado para investigar

os hábitos dos pesquisadores quando executam pesquisas exploratórias. Na Seção 4.2

descrevemos a arquitetura do sistema proposto e o modelo que criamos para representar uma

pesquisa exploratória e suas dimensões. Nas Seções 4.3 e 4.4 descrevemos os aspectos de

implementação da aplicação servidora e da extensão. Na Seção 4.5 fazemos algumas

considerações sobre as tecnologias envolvidas nas soluções. Na Seção 4.6 apresentamos a

interface de histórico de pesquisa e na Seção 4.7 realizamos uma comparação com algumas

extensões já existentes.

4.1. Hábitos de pesquisa e decisões iniciais

Antes de começar qualquer projeto de software é importante compreender o seu futuro

usuário, investigando seus hábitos e preferências em relação ao domínio de aplicação. Desta

forma, para compreender os hábitos dos pesquisadores em relação à pesquisa exploratória

elaboramos um questionário (apresentado no Apêndice B) que foi distribuído por meio digital

pela divulgação do link de preenchimento na rede social Facebook (www.facebook.com),

4 Capítulo

Page 58: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

58

possibilitando, assim, o compartilhamento do link, o que proporcionou um maior alcance e

diversidade para a amostra de pesquisadores.

Foram coletadas 161 respostas, dadas por pessoas entre 16 e 63 anos de idade, com

média de 30 anos (desvio padrão: 8,5). A área de atuação profissional, ou de estudos, dos

respondentes tem a seguinte distribuição: 41,6% são da Computação/Informática, 23% da

Administração/Marketing/Comunicação, e 35,4% de outras áreas. Destes, 32,9% está

cursando, ou possuem apenas, a graduação e 61,5% já a cursou, ou está cursando, pós-

graduação. Isto mostra que quase todos já realizaram alguma pesquisa do tipo exploratória,

como é comum na maioria dos trabalhos de conclusão de curso e outras atividades

acadêmicas. Em média 80,22% dos respondentes utilizam algumas vezes, ou muito, a Web

para pesquisas de características exploratórias. Estas pessoas utilizam 63,5% das vezes o

navegador Chrome e 64% delas estão familiarizados com a instalação e o uso de extensões de

navegador. Dos recursos nativos oferecidos pelo navegador 53,4% dos respondentes disseram

utilizar a marcação de favoritos e 38,5% fazem consultas ao histórico de navegação.

Baseado nestes dados, resolvemos desenvolver uma ferramenta de registro e

apresentação do histórico de uma pesquisa exploratória na forma de uma extensão para o

navegador Chrome. Escolhemos trabalhar sobre o histórico porque é uma ferramenta

conhecida de 95% os pesquisadores e apenas 1,2% acham difícil de usar. Entretanto, 38,5%

dos respondentes sinalizaram que esta ferramenta precisa ser melhorada para apoiar a

pesquisa exploratória, ou apontaram problemas, tais como: o fato de o histórico listar todo o

conteúdo navegado dificultar a extração de informação útil (42,9%) e o fato de a forma de

apresentação não ser prática (30,4%). Em geral, 38,5% afirmam que o histórico precisa de

melhorias para apoiar melhor a pesquisa exploratória. Além destes números, nos comentários

abertos, diversas pessoas1 relataram o desejo de que o histórico de navegação fosse

aprimorado, ou que existisse uma ferramenta melhor para isto. Deste modo, os primeiros

objetivos traçados para a nova ferramenta foram: filtrar o conteúdo visitado e propor uma

melhor maneira de apresentar o histórico, visando facilitar a extração de informação útil e

tornando mais prático o uso deste recurso.

Quase a totalidade dos pesquisadores (98,7%) indicou que utiliza a ferramenta de

busca Google® para realizar suas pesquisas. Dentro do universo de pesquisadores do

navegador Chrome na amostra, este índice alcança 100%. Por isso, decidimos que a

ferramenta de histórico observaria a atividade do pesquisador ao interagir com a máquina de

1 Respostas identificadas com números 8, 14, 19, 21, 23, 28, 48, 61 e 62 do Apêndice C.

Page 59: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

59

busca do Google e capturaria informações que pudessem ser úteis para a apresentação do

histórico destas atividades como, por exemplo, as palavras-chave utilizadas na busca, os

recursos (URLs) obtidos como resultados da consulta, quais os recursos que já foram visitados

pelo pesquisador e quais restaram para serem explorados.

Algumas outras funcionalidades foram incluídas nesta solução baseando-se nos

resultados do questionário aplicado como, por exemplo:

Anotação de texto sobre recursos ou consultas realizadas, em virtude de que

68,3% dos respondentes informaram realizar anotações em papel durante as

pesquisas.

Indicação de acesso a conteúdo já visitado ou consulta já realizada, uma vez

que 58,4% dos respondentes indicaram encerrar a pesquisa quando começam a

encontrar conteúdos repetidos, já visualizados em sessões de pesquisa anteriores.

Sinalização de aprendizado por meio de lista de objetivos, porque 72,7% dos

respondentes disseram encerrar a pesquisa quando sentem ter aprendido o

suficiente sobre o assunto de interesse e já tem confiança para realizar a tarefa

pretendida.

Destaque e organização dos recursos e consultas com grades de valores de

relevância e tags definidas pelo próprio pesquisador. Este recurso busca

atender o anseio por organização e classificação dos itens visitados que algumas

pessoas revelaram.

Algumas outras funcionalidades foram levantadas, mas devido a limitações de foco e

cronograma não foram incluídas na primeira versão desta proposta. Estas possíveis

funcionalidades serão descritas mais adiante como sugestão para trabalhos futuros.

4.2. Modelo Conceitual do Sistema Proposto

O sistema proposto é composto por uma aplicação servidora, hospedada no domínio

exploratorysearch.com, e uma ferramenta do tipo extensão de navegador, a qual registra as

atividades realizadas pelos pesquisadores e oferece uma interface para interagir com estes

registros.

Por questões de popularidade entre os pesquisadores optamos em desenvolver uma

extensão para o navegador Google Chrome e capturar os resultados de pesquisas da máquina

de busca do Google. A arquitetura do sistema não inviabiliza, e inclusive permite, o

Page 60: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

60

desenvolvimento futuro de extensões para outros navegadores e a captura de resultados de

outras máquinas de busca online.

A aplicação servidora permite o registro de usuários, os quais terão uma conta de uso

na qual podem criar e administrar seus projetos de pesquisa e preferências de uso do sistema.

A seguir explicamos alguns dos elementos (Figura 20) e terminologias que compõem o

sistema.

Figura 20 - Mapa conceitual para os elementos da solução

Page 61: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

61

Projetos de pesquisa - são contextos de pesquisa que podem possuir objetivos

relacionados. Por exemplo, um trabalho de conclusão de curso, ou o planejamento de uma

viagem, podem ser um projeto. As atividades realizadas durante uma sessão de pesquisa são

vinculadas a um projeto.

Objetivos - são grandes metas a serem alcançadas durante a execução de um projeto.

Eles são opcionais e podem ser criados a qualquer momento. Os objetivos servem para que o

pesquisador sinalize avanços na construção do conhecimento, ou etapas do seu projeto de

pesquisa. Também é possível que o pesquisador associe atividades relacionadas a um

objetivo. Com isto ele poderá depois visualizar no seu histórico de pesquisa quais atividades o

ajudou a alcançar determinados objetivos. A evolução dos objetivos pode ser medida, ou

sinalizada, pelo pesquisador em etapas (não iniciado, em andamento ou concluído), ou em

porcentagem (0 a 100%). Na Figura 21 exibimos um exemplo de projeto e seus objetivos.

Histórico de Pesquisa - é toda a história de atividades realizadas durante a execução

de um projeto, delimitado por um período de tempo. Neste sistema, em particular,

apresentamos um novo conceito de histórico com algumas inovações que envolvem a

Figura 21 – Tela de criação de um novo projeto, com objetivos.

Page 62: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

62

ocultação de atividades consideradas ‘inúteis’ para o projeto de pesquisa, a visualização

diferenciada das atividades de navegação com sinalizadores das suas características e

ferramentas de filtros de atividades. Os detalhes da interface do histórico de pesquisa serão

apresentados na seção 4.5.

Sessões de Pesquisa – são períodos de tempo nos quais ocorreram atividades de

pesquisa. Quando detectado um intervalo substancial de tempo de ociosidade entre uma

atividade de pesquisa e outra classificamos que houve o encerramento de uma sessão e início

de outra. Este tempo pode ser controlado pelo próprio pesquisador.

Atividades - são as principais ações realizadas pelo pesquisador no navegador quando

executando uma busca de informação. Pode ser uma visita a um documento (i.e. uma

navegação), ou realização de uma pesquisa por palavras-chave em um mecanismo de busca.

As atividades podem possuir uma anotação que servirá para consulta futura e também podem

ser classificados em grau de importância dentro do projeto, para isto usamos uma notação

simbólica de uma a cinco estrelas.

Navegação – é uma atividade na qual o pesquisador visita um documento, seja a partir

do clique em um link da página de resultados da pesquisa, ou por digitação da URL na barra

de endereços do navegador. Quando o pesquisador visita um domínio (endereço de um

servidor físico na Internet), as visitações seguintes em documentos do mesmo domínio são

consideradas como parte da mesma atividade de navegação.

Pesquisa/Consulta – é uma atividade na qual o pesquisador vai até uma ferramenta de

busca e por meio de uma, ou várias, palavras-chave realiza uma query que deve lhe retornar

um conjunto de resultados. Estes resultados são recursos/documentos que ele pode visitar para

continuar aprendendo ou investigando. As queries podem ser classificadas pelo pesquisador,

por meio de um mecanismo de rating, quanto a sua qualidade.

Documentos – qualquer recurso disponível na Web apontado por uma URL, seja

página, ou arquivo, indicado para o pesquisador nas páginas de resultado das consultas, ou

visitado por ele durante atividades de navegação. Para facilitar a lembrança, ou destacar, um

documento sobre os demais é permitido associar tags (rótulos) que façam referência ao

conteúdo do documento.

4.3. Aspectos de Implementação da Aplicação Servidora

A maioria das ferramentas de apoio ao histórico de navegação utilizam as informações que

foram coletadas e armazenadas pelos próprios navegadores. Acontece que estas informações

Page 63: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

63

podem ser perdidas quando o pesquisador troca de equipamento, desinstala o navegador, ou

quando são excluídas pelo pesquisador, ou pelo próprio navegador, por limitações de espaço

em disco. Em projetos de pesquisa de longa duração isto pode ser um problema. Por esta

razão decidimos elaborar uma aplicação servidora que permita persistir essas informações e

potencializar o processamento que pode ser realizado sobre elas.

O objetivo principal da aplicação servidora é servir de repositório das informações de

atividades de pesquisa coletadas pela extensão e, em um segundo momento, fornecer

interfaces para consulta a estas informações. Esta aplicação foi desenvolvida na linguagem de

programação PHP, usando o banco de dados MySQL e hospedada sob o domínio

exploratorysearch.com. A escolha da linguagem de programação e o servidor de banco de

dados levaram em conta a experiência do autor como desenvolvedor, para facilitar a execução

do projeto dentro do cronograma disponível, não sendo um limitador caso se optasse pelo uso

de outras tecnologias de implementação.

O modelo de base de dados da aplicação servidora é quase uma tradução direta do

mapa conceitual do sistema, como mostra a Figura 22. O mesmo ocorre para as classes

criadas para refletirem essa estrutura, as quais replicam seus atributos com métodos get/set.

Também foram criadas classes de regras de acesso a dados (DAO) para cada uma das classes

que representam persistência de dados e foi usado o padrão de projeto Singleton para a classe

que serve de conexão com o banco de dados.

A aplicação possui dois diretórios de acesso externo:

/extension/ - que contém os scripts de comunicação com a extensão. A

comunicação se dá por transporte de informação em formato JSON.

/app/ - que contém as páginas que servem de telas de autenticação, registro,

criação e edição de projetos, preferências do pesquisador e visualização de

histórico.

Page 64: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

64

Nossa ferramenta foi desenvolvida com interfaces em inglês e português para facilitar

a participação dos testadores iniciais e permitir uma abrangência de uso maior ao ser liberada

para uso público. Isto foi possível com a criação arquivos de dicionário de termos e frases que

podem ser aplicados à interface conforme a preferência do pesquisador. É possível criar

quantos dicionários forem desejados, para cobrir outros idiomas.

Figura 22 - Diagrama Estendido de Entidade-Relacionamento para base de dados da aplicação servidora.

Page 65: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

65

4.4. A Extensão e Aspectos de Implementação

Uma extensão (extension) de navegador é um recurso adicional que opcionalmente pode ser

instalado no navegador, sendo armazenada em espaço de configuração do usuário do

navegador. Elas têm arquitetura conforme esquema estabelecido pelo navegador e podem

interagir com recursos disponibilizados por eles por meio de APIs. Diferem-se dos plug-ins,

que são componentes binários localizados externamente ao espaço do navegador e não

interage com seus recursos. As extensões são chamadas também de complementos ou add-

nos dependendo do navegador. Uma extensão para o navegador Google Chrome pode

interagir de diversas maneiras com o pesquisador e utilizar diversos recursos de interface

oferecidos pelo navegador (Figura 23). Os principais recursos de interface do navegador que

podem ser utilizados por extensões são:

Browser Actions/Popups – é um botão adicionado à barra de ferramentas do

Chrome, o qual ao ser clicado carrega uma janela popup que pode conter conteúdo

HTML, CSS e Javascript. O código carregado pela janela popup tem seu próprio

contexto de execução;

Page Actions – é um ícone adicionado dentro da barra de endereços, que permite

executar scripts, ou exibir uma janela popup ao clica-lo.

Desktop Notifications – corresponde a exibição de janelas de notificação na área

de trabalho do pesquisador.

Omnibox – permite a interação com a barra de endereços do navegador,

interpretando o conteúdo digitado pelo pesquisador e modificando os resultados ali

apresentados.

Context Menus – permite a adição de itens ao menu de contexto do navegador.

Options Page e Override Pages – Options page permite a criação de uma página

com opções da extensão e Override Pages permite a substituição de algum dos

recursos padrão oferecidos pelo navegador, como “Gerenciador de Favoritos”,

“Histórico” e “Nova Aba”.

Page 66: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

66

Figura 23 – Exemplos de recursos de interface do navegador que pode ser utilizado por extensões. Extraído de http://www.jefvlamings.com/blog/chrome-extensions-for-dummies/

Existem outros recursos que podem ser usados por extensões, mas que não aparecem

para o pesquisador (Figura 24). São eles:

Background – é uma página HTML carregada em plano de fundo que pode conter

código na linguagem Javascript que é executado durante todo o tempo em que o

navegador permanecer em execução no sistema. O código carregado pela página

em background tem seu próprio contexto de execução.

Content Scripts – permite a execução de um código na linguagem Javascript em

cada conteúdo que é carregado em qualquer aba do navegador; este código é

executado no contexto do documento carregado.

Além destes recursos de interface, o navegador oferece uma API para acesso e

controle a um conjunto de métodos e funções dos seus principais componentes: Janelas, Abas,

Histórico, Favoritos, Cookies, Eventos, Tráfego de Rede, Debug, Gerenciamento,

Armazenamento, Internacionalização, Acessibilidade, dentre outros.

Figura 24 – Recursos de Background e Content Script executam sem que o pesquisador perceba. Extraído de http://developer.chrome.com/extensions/overview.html

Page 67: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

67

Escolhemos para nossa ferramenta utilizar inicialmente os recursos de Browser Action,

Background, Content Scripts e Desktop Notifications. Com eles vamos interagir com as APIs

de Histórico, Janelas, Abas, Armazenamento e Internacionalização. Por meio da API de

internacionalização conseguimos oferecer interfaces adaptadas a pesquisadores com

navegadores no idioma inglês ou português. Novos idiomas podem ser acrescentados criando-

se apenas novos arquivos de dicionário de termos e frases.

A extensão desenvolvida possui três componentes principais: o Analisador de

Conteúdo, o Controlador de Operações e a Interface do Usuário.

4.4.1. Analisador de Conteúdo

Este componente analisa cada página visitada podendo atuar diretamente no conteúdo da

página. Sua principal função é identificar se a página carregada é uma página da ferramenta

de busca do Google e, neste caso, capturar as consultas e os resultados que são feitos por meio

da ferramenta. A máquina de busca do Google é bastante complexa e entrega resultados ao

usuário com base em uma série de formas de interação. Uma das formas, chamada de Google

Instant, ocorre quando o pesquisador refaz a digitação dos termos de pesquisa no campo

apropriado e não envia o formulário ao servidor de forma explícita (digitando enter ou

clicando no botão de pesquisa, por exemplo). Nesta forma de interação, a ferramenta de busca

entrega os resultados para o termo reescrito sem submeter novamente a página ao servidor,

não causando uma atualização total do viewport, mas apenas da região de resultados da

consulta. Para conseguir este efeito a ferramenta utiliza-se do componente XMLHttpRequest

do navegador baseado no conceito de Ajax. Este componente da extensão tem o dever de

identificar estas entregas e analisá-las corretamente.

Para cada consulta realizada na máquina de busca do Google, tanto na maneira

“instant” quanto na convencional, o componente captura os termos pesquisados e a lista de

resultados entregues pelo buscador. Em seguida, monta um pacote com estas informações e

repassa ao Controlador de Operações.

Outra função deste componente é varrer os resultados da busca e procurar no projeto

do pesquisador se eles já foram visitados e analisados pelo pesquisador. Se o documento já foi

visitado, ele aplica uma sinalização ao ladoesquerdo para indicar ao pesquisador que este

documento já foi visitado. Se além de visitado o documento possuir anotações, classificação,

tags ou objetivos associados o componente irá embutir estas informações na página de

resultados de maneira recolhida, para ser apresentada com detalhes ao pesquisador quando

Page 68: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

68

este passar o mouse por cima desta sinalização. Este comportamento é ilustrado na Figura 25.

O objetivo deste recurso é trazer à página de resultados mais informações históricas de

documentos importantes para o projeto de pesquisa em execução.

4.4.2. Controlador de Operações

Este componente entra em execução a partir do carregamento do navegador e permanece em

execução durante todo o tempo em que o navegador estiver aberto. Ele possui diversas

funções, como tratar o conteúdo recebido do Analisador de Conteúdo, monitorar o objeto de

histórico do navegador, enviar informação para a aplicação servidora, consultar e carregar

alterações das preferências e projetos do pesquisador na área de armazenamento do

navegador, dentre outras.

Ao receber do Analisador de Conteúdo um pacote com informações de consulta, ele

analisa o pacote e adiciona-o em uma fila para posterior envio ao servidor da aplicação, na

próxima execução do envio agendado.

O componente também monitora o objeto chrome.history do navegador. Este objeto

mantém uma coleção de URLs que são visitadas pelo pesquisador conforme ele utiliza o

navegador. A cada visita é adicionado um item à coleção. Este item é analisado pelo

Figura 25 – Extensão indicando informações de documento já visitado pelo pesquisador

Page 69: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

69

componente que verificará se é uma URL de pesquisa (da ferramenta de busca do Google) ou

outro recurso qualquer da Web. Se for uma URL de pesquisa o componente irá ignorá-la, pois

esta será tratada pelo componente Content Script da extensão. Caso seja outro recurso da

Web, o componente tentará obter o título do documento visitado e verificar junto às

preferências do pesquisador se este documento, ou URL, deve ser filtrado, isto é, se ele deve

ser oculto das atividades de pesquisa do usuário, conforme citado na Seção 2.3.2. Em seguida,

toda informação é empacotada e enfileirada para posterior envio ao servidor da aplicação.

Existem algumas tarefas agendadas para execução contínua em intervalos de tempo

pré-determinados. Estas tarefas envolvem o envio de informações capturadas do pesquisador

para o servidor da aplicação e a contínua consulta a este servidor para obter mudanças em

preferências e configurações do pesquisador, que podem ter sido realizadas por meio de

acesso à aplicação servidora ou de outros componentes da extensão no decorrer do tempo.

A cada pesquisa realizada pelo pesquisador, ou visita feita a um documento na Web, o

background encarrega-se também de realizar consultas ao servidor de aplicação e acionar,

caso seja da preferência do pesquisador, janelas de notificações que mostram alertas ao

pesquisador de que aquela atividade é igual outra já realizada por ele naquele projeto (Figura

26). Estes alertas ocorrem por meio do componente Desktop Notifications do navegador.

Como o Controlador de Operações é inicializado junto com o navegador, ele é

responsável por carregar as informações do pesquisador e do projeto vigente, que foram

salvas no armazenamento local do navegador, e preparar a exibição do ícone da extensão na

barra de ferramentas do navegador.

4.4.3. Interface do Usuário

Diferente dos componentes anteriores, os quais não têm nenhuma interface para o

Figura 26 – Exemplo de notificação de atividade já realizada

Page 70: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

70

pesquisador, este componente oferece a principal interface para que o pesquisador possa

interagir com a extensão. É por meio de uma janela flutuante que o usuário poderá realizar

operações sobre o documento visitado, consultar e registrar mais detalhes sobre seu projeto de

pesquisa, conforme apresentado na Figura 27. O pesquisador tem acesso à esta janela por

meio do clique no botão apropriado na barra de ferramentas do navegador.

As principais finalidades desta interface são:

Permitir a autenticação do pesquisador e seleção de projeto de pesquisa a se

trabalhar;

Pausar ou retomar o registro das atividades do pesquisador;

Consultar e registrar informações sobre o documento visível como estatísticas de

visita, grau de importância/relevância dentro do projeto, tags relacionadas,

anotações particulares e objetivos do projeto alcançados neste documento;

Remover registro da atividade corrente, ou de todas as atividades à mesma URL,

ou domínio;

Acessar páginas da aplicação como preferências do pesquisador, página de gestão

do projeto e página de histórico de pesquisa.

Figura 27 - Componente popup aberto no contexto de navegação.

Page 71: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

71

4.5. A Interface de Histórico do Projeto

A interface desenhada para exibir o histórico do projeto consiste basicamente de três áreas de

tela: Linhas do Tempo, Opções e Filtros e Miniatura.

4.5.1. Linhas do Tempo

Na área de apresentação do histórico mostramos as atividades do pesquisador dentro de um

período delimitado de tempo, organizando-a em sessões de atividades de pesquisa e

desenhando-as como uma linha do tempo horizontal. As sessões são exibidas em ordem

cronológica decrescente, isto é, a mais recente aparece primeira, conforme pode ser visto na

Figura 28, e as atividades estão registradas em ordem cronológica da esquerda para a direita.

Um aspecto visual difere atividades de consulta em mecanismo de pesquisa das

atividades de navegação. As consultas são representadas por retângulos e a navegação por

círculos e ambos possuem um ícone que indica a natureza da atividade. Dentro das atividades

de navegação é exibido o nome do domínio e logo abaixo um ícone que identifica o website

visitado.

Para diminuir a poluição visual que poderia atrapalhar a recuperação de informação,

ou tornar as linhas do tempo demasiadamente extensas, utilizamos algumas estratégias:

Figura 28 – Tela de Histórico do Projeto

Page 72: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

72

1. As atividades de navegação são agrupadas por domínios. Assim, visitas a vários

documentos em um mesmo domínio são representados por um único círculo

seguido de um contador indicando quantos documentos foram visitados naquele

domínio. Para oferecer diferenciação entre as atividades com quantidade diferente

de documentos visitados nós desenhamos círculos de tamanhos diferentes na linha

do tempo. Quanto maior o circulo, significa que mais documentos foram visitados

naquele domínio.

2. As pesquisas cujos resultados não geraram nenhuma navegação dentro do projeto

também não aparecem na linha do tempo. Consideramos que o pesquisador

desprezou o resultado desta pesquisa. Entretanto, se no futuro outra consulta

apresentar algum documento desta mesma coleção e este for visitado pelo

pesquisador, a primeira consulta passará a aparecer na linha do tempo,

considerando que se um dos resultados foi válido no decorrer da pesquisa, pode ser

que outros também sejam de interesse do pesquisador.

3. Também não são exibidas nas linhas do tempo as atividades ocorridas enquanto a

extensão estava pausada, ou as que foram ignoradas por configurações das

preferências do pesquisador.

As atividades de consulta acompanham também um contador que indica quantos dos

resultados retornados pela consulta foram visitados pelo pesquisador no projeto, após a

realização da consulta. A representação de uma atividade pode vir acompanhada de

sinalizadores visuais que indicam que existem anotações, classificações, ou tags, associadas a

ela ou a um dos documentos (no caso de uma atividade de navegação em domínio).

Cada sessão possui uma etiqueta no canto esquerdo que indica o número da sessão, a

data e hora de início, fim e a duração daquela sessão de atividades de pesquisa.

A representação do histórico de atividades não é estática. Existem algumas opções de

interação que podem enriquecer a experiência de uso. Passar o mouse sobre as atividades de

navegação amplia sua representação visual, permitindo ao pesquisador visualizar melhor as

informações sobre o domínio visitado. Passar o mouse sobre as atividades de pesquisa amplia

sua representação e destaca as atividades de navegação cujos documentos estão presentes no

resultado daquela consulta.

Page 73: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

73

Um clique sobre uma atividade faz aparecer um quadro de “Detalhes da Atividade”.

Para as atividades de navegação, o quadro mostra uma tabela com todos os documentos

visitados naquele domínio, a hora em que foi feita a visita e quais possuem anotações,

classificações e tags associadas (Figura 29). O pesquisador pode então rever esta anotação, ou

reclassificar o documento, ou ainda remover ou associar novas tags para cada um deles, caso

não o tenha feito em tempo de execução. Isso lhe ajuda a manter suas atividades organizadas.

Se desejar, ele também pode: ocultar a navegação do projeto; ocultar qualquer navegação feita

no projeto para aquele domínio e adicioná-lo às suas preferências de lista de exclusão; ou

mover esta navegação para outro projeto seu. Estas opções permitem simplificar ainda mais a

visualização do histórico e corroboram com aqueles pesquisadores que trabalham em mais de

uma pesquisa em paralelo. Para atividades de consulta, são listados os resultados que foram

trazidos pela consulta e se eles já foram visitados, ou não, pelo pesquisador, além de também

trazer opções para ocultação da atividade, ou a possibilidade de movê-la para outro projeto de

pesquisa (Figura 30).

Figura 29 - Tela de detalhes de uma navegação

Page 74: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

74

4.5.2. Opções e Filtros

O quadro de opções e filtros, que é apresentado originalmente de maneira recolhida, tem

como objetivo redesenhar as sessões e linhas do tempo conforme as preferências escolhidas

para visualização. Como opção, o pesquisador pode estabelecer um período de tempo com

data de início e fim para recuperação das atividades que serão exibidas e qual é o tempo

ocioso a ser levado em consideração para estabelecer intervalos de sessão, conforme mostrado

na Figura 31. Quanto maior a definição deste tempo, menos sessões existirão e maior será o

tamanho horizontal das linhas do tempo.

Figura 31 – Área de opções e filtro. Acima exibido de maneira completo e embaixo, com zoom, para melhor compreensão.

O pesquisador tem a seu dispor uma série de filtros que impactam sobre todas as

atividades, ou somente as de navegação ou consulta, são eles:

1. Exibir apenas atividades que possuem documentos, ou consultas, com

classificações com um valor mínimo de estrelas;

Figura 30 – Detalhes sobre uma atividade de pesquisa

Page 75: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

75

2. Exibir apenas atividades que contêm anotações;

3. Exibir apenas atividades que foram associadas com um objetivo em específico do

projeto;

4. Exibir navegações para domínios que possuem um determinado nome, ou uma

determinada string no nome;

5. Exibir navegações cujo número de documentos visitados seja maior que um valor

desejado pelo pesquisador;

6. Exibir navegações que correspondam a uma, ou várias, tags determinadas pelo

pesquisador;

7. Ocultar todas as atividades de navegação;

8. Exibir apenas pesquisas que possuírem uma determinada string no conjunto de

palavras-chave de consulta;

9. Exibir apenas pesquisa cujos resultados tenham tido um número mínimo de

visitação posterior;

10. Ocultar todas as atividades de pesquisa;

Todos os filtros têm aplicação imediata e não realizam recarregamento da página para

redesenho das sessões e linhas do tempo.

4.5.3. Miniatura

Na lateral esquerda da tela existe uma representação parcialmente escondida em miniatura de

todas as sessões e linhas do tempo. Ao aproximar o mouse ela é exibida para o pesquisador

(Figura 32). Ela foi utilizada para facilitar a navegação pela linha do tempo, quando esta se

torna muito extensa. Um clique sobre um ponto na miniatura posiciona a visualização da

página para aquele ponto da linha do tempo em tamanho real.

4.6. Preferências do Pesquisador

O sistema possui também uma área de preferências (Figura 33), por meio da qual o

pesquisador pode: configurar opções da interface, como idioma e notificações de atividades

repetidas; definir intervalo padrão de ociosidade entre seções; indicar atividades de navegação

cujo registro não deve ser feito (por nome de domínios, protocolos ou extensão de arquivos,

por exemplo) e; associar uma conta do Delicious, para personalizar a recomendação de tags

conforme sua personomia. Estas personalizações ficam gravadas na aplicação servidora.

Page 76: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

76

Figura 32 - Miniatura da linha do tempo, para facilitar a navegação em estruturas mais extensas.

Figura 33 - Tela de Preferências do Usuário

Page 77: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

77

4.7. Considerações sobre tecnologias envolvidas

Grande parte das soluções apresentadas no capítulo 2.3 utilizavam tecnologias proprietárias

ou fechadas para resolução do problema. Neste trabalho tivemos a preocupação de utilizar

padrões e tecnologias abertas para compor a solução. Desta forma, é justo ressaltar alguns dos

recursos que proporcionaram a criação deste sistema.

A solução cliente (a extensão) por estar inserida dentro de um navegador específico

pôde utilizar os mais recentes recursos da linguagem HTML 5, atualmente candidata à

recomendação e já suportada pelo navegador Google Chrome. Um deles foi fundamental para

viabilização de algumas funcionalidades do sistema:

Web Storage (http://www.w3.org/TR/webstorage/) – uma tecnologia correlata à

HTML5 atualmente candidata à recomendação, trata-se de uma API para prover

armazenamento e recuperação de dados no navegador, preservando contexto de sessão e de

domínio de execução. Ela foi utilizada para armazenar configurações do pesquisador e

informações sobre a navegação e pesquisa para posterior registro na aplicação servidora.

Na interface de histórico de pesquisa as principais tecnologias aplicadas foram:

Atributos data-* (http://www.w3.org/TR/html5/dom.html) - novo atributo da

linguagem HTML o qual permite que o autor da página crie atributos para finalidades

genéricas. Neste caso foi criado, por exemplo, data-idActivities, data-domain, data-query e

outros atributos que permitiram embutir informações do banco de dados que facilitassem a

interpretação e manipulação da interface pelos scripts do navegador.

Novas propriedades da CSS 3 – utilizamos propriedades como opacidade (opacity) e

cantos arredondados (border-radius) para melhorar a apresentação dos elementos e criar

formas arredondadas para representar a navegação e propriedades de transformação

(transform) e transição (transition) para criar efeitos de animação na interação do pesquisador

com os elementos da interface.

Para controlar o comportamento da interface e fazer requisições ao servidor foi

utilizada a linguagem Ecmascript (http://www.ecmascript.org/, popularmente conhecida como

Javascript), em sua forma nativa, ou com apoio de bibliotecas tais como jQuery (jquery.com),

moment.js (momentjs.com), ambas distribuídas sobre licença MIT

(http://en.wikipedia.org/wiki/MIT_License).

Page 78: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

78

4.8. Outras extensões semelhantes e comparações com a

nossa solução

O processo de desenvolvimento de extensões para o navegador Chrome é bastante popular e,

por esta razão, extensões são produzidas e publicadas a todo instante. Listamos algumas

extensões que no período de desenvolvimento deste trabalho pudessem suscitar discussão e

comparação com nossa ferramenta. Na sequência fazemos uma comparação entre as soluções

que tratam do histórico de pesquisa: e-history2, New History3, history 24, enhanced history5,

better history6, History Trends7, Visual History8 e YouPivot & Timemarks (Beta)9.

Como podemos observar pela Tabela 1, algumas destas extensões se propõem apenas

a exibir algumas estatísticas em relação à navegação como, por exemplo, os domínios mais

visitados, os períodos do dia e dias de maior atividade de uso do navegador. Outras trazem

uma apresentação um pouco mais trabalhada em relação à listagem do recurso nativo para o

navegador, mas sem propor uma visualização totalmente nova. A ferramenta com mais

recursos semelhantes à nossa seria a YouPivot, mas ela ainda assim não tem como foco

representar atividades de pesquisa exploratória, não fazendo, por exemplo, distinção entre as

atividades de navegação e pesquisa.

Tabela 1 – Comparação entre extensões de apoio ao histórico de pesquisa (1. Nossa solução, 2. e-history , 3. New History, 4. history 2, 5. enhanced history, 6. better history, 7. History

Trends, 8. Visual History e 9. YouPivot & Timemarks (Beta).

Extensão Recursos

1 2 3 4 5 6 7 8 9

Agrupa o relatório em sessões X - - - - - - - - Agrupa a visitação em domínios X - - X - X - - XFaz distinção entre pesquisa e navegação X - - - - - - - - Permite ao pesquisador pausar o registro de atividades X - - - - - - - - Visualização gráfica das atividades registradas X - - - - - - - XTem filtros dinâmicos na visualização do histórico X X - - - - - - XPermite pesquisar no histórico por strings X X X X X X - - XTem estatísticas de navegação X - X X - - X X - Mostra gráfico para estatísticas de navegação - - X - - - X X - Permite personalização com filtros de exclusão de atividades X - - - - - - - - Usa serviço externo para persistir informações X - - - - - - - X

2 https://chrome.google.com/webstore/detail/ehistory/hiiknjobjfknoghbeelhfilaaikffopb 3 https://chrome.google.com/webstore/detail/new-history/bnfnhbibpdljadikilnahdmgdcaldnnd 4 https://chrome.google.com/webstore/detail/history-2/cahejgbbfgmlmjgdjlibphdjeldhagkp 5 https://chrome.google.com/webstore/detail/enhanced-history/ocfblifjfffcokdoocoopcnaooljncbh 6 https://chrome.google.com/webstore/detail/better-history/obciceimmggglbmelaidpjlmodcebijb 7 https://chrome.google.com/webstore/detail/history-trends/nangghhladpnhlllolmdbdgeggionole 8 https://chrome.google.com/webstore/detail/visual-history/adnkedffgiojlohglncfnkjkkgdonhng 9 https://chrome.google.com/webstore/detail/youpivot-timemarks-beta/bhojlafenkipmbhpfhoojcflnplpohoo

Page 79: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

79

4.9. Considerações Finais

A ferramenta proposta tem como objetivo principal atacar o problema referente ao fato de

que: “a duração de uma pesquisa exploratória pode levar dias, ou meses, e por isso estende-se

por diversas sessões de pesquisa”. Para isso, observamos o comportamento dos pesquisadores

nas tarefas de gestão do tempo de pesquisa e revisitação dos documentos e sua satisfação

sobre o uso do histórico de navegação. Para aprimorar este recurso tentamos estabelecer

relações entre ele e os demais aspectos que consideramos importantes dentro da pesquisa

exploratória. Na tabela abaixo explicitamos como as dimensões discutidas na Seção 3 são

cobertas nesta proposta.

Tabela 2 – Dimensões cobertas por nossa solução.

Dimensão Como é coberta

Qualitativa Não criamos uma nova página de resultados de busca, nem propusemos um novo algoritmo para rankeamento dos documentos. Incrementamos a informação sobre a qualidade dos documentos trazendo à página de resultados da busca as informações fornecidas pelo próprio pesquisador acerca daquele documento, indicando, por exemplo, a classificação da relevância do mesmo no projeto de pesquisa em execução.

Apresentação Acrescentamos um nova maneira de apresentar o histórico de pesquisa, diferenciando atividades de pesquisa e navegação por meio de uma representação visual em linhas do tempo e sessões.

Cognição Adicionamos a possibilidade de o pesquisador organizar suas atividades de pesquisa em projetos e determinar objetivos que se pretende atingir. Possibilitamos ainda o controle de seus avanços e a associação de documentos e consultas que foram úteis para cada objetivo. Estas são algumas das maneiras de apoiar o aprendizado durante o período da pesquisa exploratória.

Temporal Esta foi a principal dimensão tratada nesta solução, a qual é coberta por meio da nova abordagem de histórico de pesquisa apoiada na relação que ela pode ter com as outras dimensões.

Personalização A ferramenta adapta-se às preferências e necessidades de execução do pesquisador por meio de ações diretas dele como, por exemplo, anotações, classificações e tagging de recursos, gestão de objetivos, indicação de remoção de itens específicos do histórico e preferências de registro, pausa e resumo de registro das atividades.

Colaboração Esta é uma dimensão que não teve recursos aplicados nesta primeira versão da ferramenta, mas foi projetada para ser atendida em versões futuras.

No capítulo seguinte nós procuramos demonstrar como foi planejado e conduzido os

experimentos em relação à proposta apresentada e os principais resultados obtidos que podem

ser usados para avaliar a utilidade da mesma no contexto apresentado e nortear o

desenvolvimento de novas versões e trabalhos futuros.

Page 80: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

80

Experimentos e Resultados

Neste capítulo fazemos algumas considerações acerca da avaliação de ferramentas de apoio a

pesquisa exploratória e apresentamos a estratégia dos experimentos que foram realizados para

avaliar a solução proposta, como os executamos e seus resultados.

5.1. Avaliação de sistemas de apoio à Pesquisa Exploratória

Segundo White, Marchionini e Muresan (2008, p. 434, tradução nossa1), “avaliar sistemas de

apoio à pesquisa exploratória não é substancialmente diferente da avaliação de qualquer outro

sistema altamente interativo”, embora a preocupação seja maior com medidas subjetivas,

como a satisfação do pesquisador, o engajamento, a inovação na informação e o resultado do

trabalho. Em 2006 um workshop sobre avaliação de sistemas de pesquisas exploratórias

(ESS2) levantou os seguintes fatores (WHITE, MURESAN e MARCHIONINI, 2006a) para

esta tarefa:

Envolvimento e prazer – avalia o grau de envolvimento dos pesquisadores com a

ferramenta e o grau de experimentação de emoções positivas durante as interações que o

processo de pesquisa exploratória exige, podendo ser medido por meio do número de eventos

acionáveis utilizados pelos pesquisadores no sistema.

1 “Evaluating ESS is not substantially different from evaluating any other highly interactive system.” (WHITE, MARCHIONINI e MURESAN, 2008, p. 434) 2 Exploratory Search System.

5 Capítulo

Page 81: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

81

Novidade da informação – avalia a quantidade de informação nova encontrada pelo

pesquisador, uma vez que o significado de “explorar” está relacionado a procurar e descobrir.

Sucesso da tarefa – avalia se o pesquisador foi capaz de encontrar a quantidade de

informação com detalhe suficiente para alcançar seu objetivo de pesquisa, o que difere dos

sistemas atuais em que o pesquisador está preocupado em encontrar, ou não, um documento

de destino em particular.

Tempo da tarefa – avalia o tempo gasto para atingir a plenitude de execução da

tarefa, conforme percepção do próprio pesquisador. Esta métrica poderia ser aplicada em

diferentes aspectos como o tempo total, o tempo gasto em busca direta versus exploração e o

tempo olhando para documentos irrelevantes.

Aprendizado e cognição – avalia a obtenção de resultados de aprendizagem (tarefa

fundamental da pesquisa exploratória), a perspectiva do pesquisador após a exploração e a

integralidade do espaço de informação coberto pela sua pesquisa.

Quanto à metodologia para se avaliar os ESS, os participantes do workshop

concordaram que “uma grande variedade de métodos candidatos tem de ser empregado, com a

expectativa de que os melhores métodos e práticas acabarão por prevalecer” (WHITE,

MURESAN e MARCHIONINI, 2006b, p. 59). Mesmo assim, estes autores alertam para o

fato de que “o domínio da tarefa deve conter uma mistura de tipos de tarefas: algumas que se

relacionam intimamente com as atividades regulares dos indivíduos e; algumas

completamente novas para eles [para que possa de fato haver exploração]. Os pesquisadores

que avaliam a ferramenta não podem ser envolvidos apenas em tarefas que lhe são

familiares”. Eles seguem aconselhando que “[...] os indivíduos devem ser autorizados a

conduzir suas atividades com o mínimo de interrupção [...] e técnicas como questionários e

entrevistas podem ser ferramentas valiosas, mas é preciso ter cuidado ao incluí-los no

experimento, de tal forma a não interferir com a atividade de exploração” (WHITE,

MURESAN e MARCHIONINI, 2006a, p. 2).

Apesar das peculiaridades do sistema proposto, ele é uma interface interativa e por

esta razão também deve ser avaliada como tal, com objetivo principal de identificar

problemas de interação. Para isto aplicamos alguns testes e questionários para verificar a

qualidade de uso do sistema, baseando-se nos conceitos de usabilidade definidos em Prates e

Barbosa (2003). As autoras também afirmam que as interfaces podem ser avaliadas no sentido

de sua aplicabilidade e comunicabilidade. Com relação à aplicabilidade consideramos as

orientações específicas de avaliação das ESS, citadas acima, porém não realizamos avaliação

específica para mensurar a comunicabilidade do sistema devido a problema de tempo.

Page 82: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

82

Escolhemos utilizar métodos de avaliação empírica, isto é, aqueles nos quais se envolve

usuários para a coleta de dados (PRATES e BARBOSA, 2003). Todos os experimentos de

avaliação foram executados no ambiente natural dos pesquisadores, no qual a aplicação é

utilizada de fato, sem a presença de observadores.

5.2. Definição de Experimentos e Grupo de Testes

Organizamos os experimentos da ferramenta com três objetivos: testar as funcionalidades

fornecidas pelo sistema; mensurar a qualidade do sistema, em termos de usabilidade e;

verificar a aplicabilidade do histórico no contexto de pesquisa exploratória;

Para o primeiro grupo de testes da ferramenta lembramos o cenário apresentado no

Capítulo 1 e convidamos alguns colaboradores de uma empresa especializada em

desenvolvimento de websites. Para completar o grupo convidamos também membros do

grupo de pesquisa em Sistemas Interativos Inteligentes (GSII) do Departamento de

Informática da UEM, totalizando 10 pessoas. Nosso objetivo, neste momento era de obter

uma avaliação qualitativa de todo o sistema. Este grupo foi cadastrado para ter exclusividade

no acesso à extensão na Chrome Web Store (website que serve de repositório de extensões

para o navegador Chrome). Após ter realizado os primeiros testes com este grupo

pretendemos tornar pública a oferta da ferramenta no repositório e comunicar os participantes

do nosso questionário sobre hábitos de pesquisa, para que mais pessoas possam testar a

ferramenta a fim de obter mais feedbacks.

Alguns testadores, com maior disponibilidade de tempo, começaram a utilizar o

sistema algumas semanas antes para realizar os testes de funcionalidades. Para este teste,

fizemos um checklist listando todas as funcionalidades e pedimos para os pesquisadores

checarem se a utilizaram, se funcionou de maneira adequada (como era esperado), ou se

houve algum erro ou falha na execução, e se tinham alguma sugestão para melhorar a tarefa

de execução daquela funcionalidade. Coletamos relatos de erros de script, de tradução e de

problemas de desempenho ao longo do uso do sistema. E, finalmente, fizemos registros de

sugestões de novas funcionalidades. Os problemas relatados tanto por e-mail quanto pelo

checklist de teste de funcionalidades foram tratados antes da execução dos testes de

usabilidade.

Para mensurar a qualidade do sistema, propusemos um projeto fictício,

determinamos algumas tarefas e repassamos aos pesquisadores a execução de alguns testes de

Page 83: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

83

uso, conduzido com o apoio da ferramenta TestRockit (http://www.testrockit.com/). As tarefas

analisadas tinham como objetivo testar:

1. Instalação da extensão, registro e autenticação no sistema;

2. Acessar as preferências e configurar exclusão de domínios e preferências de

notificação;

3. Criação de projetos e objetivos na aplicação servidora;

4. Preparação da extensão para uso (autenticação e seleção de projeto);

5. Uso básico da extensão em atividades de navegação: iniciar, pausar, registrar

informações em documentos: rating, tags e anotações;

6. Uso da extensão na atividade de pesquisa, para identificar palavras-chave de

consulta e documentos já visitados;

7. Uso básico do histórico de pesquisa: compreender sessões de pesquisa, identificar

atividades de pesquisa e navegação, compreender navegação em domínio e

encontrar informações sobre uma navegação realizada;

8. Interação com histórico de pesquisa: compreender e aplicar filtros para selecionar

atividades, navegação e pesquisa de interesse; remover atividades da linha do

tempo.

Para uma melhor aderência do teste de usabilidade com o contexto de uso da

ferramenta as tarefas de 1 a 5 foram testadas em um dia e as tarefas 6, 7 e 8 pelo menos 24h

depois. O cenário de tarefas utilizado procurou levar em consideração os aspectos citados na

Seção 2.3.2 para que refletissem tarefas de pesquisa exploratória. Realizamos um teste piloto

com duas pessoas antes de aplicá-lo aos demais participantes do grupo de testes.

O mesmo grupo de pesquisadores ficou livre para utilizar a ferramenta para outros

projetos de interesse pessoal. Então, para verificar a aplicabilidade do histórico no contexto

de pesquisa exploratória aplicamos um questionário (Apêndice G) ao grupo. Neste, tomamos

como referência algumas das métricas citadas na seção anterior.

Além do checklist, dos testes de usabilidade e do questionário, fizemos uma análise

do registro das atividades realizadas pelos pesquisadores, para identificar principalmente o

engajamento dos mesmos com o sistema; a eficácia da filtragem de atividades insignificantes

à pesquisa e; o potencial para utilização da base de dados em tarefas comuns de algoritmos de

recomendação.

Page 84: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

84

5.3. Resultados

O grupo de pesquisadores foi deixado bem à vontade no uso da ferramenta proposta,

utilizando-a em seu computador pessoal, sem interferência de observadores. Destes, três

foram apresentados à ferramenta em uma explanação breve de 20 minutos e os outros sete

começaram a utilizá-la sem qualquer prévia explicação, apenas por meio de convite. Estes

últimos indivíduos simulam os usuários que experimentariam a ferramenta sem conhecê-la

previamente, motivados apenas pela curiosidade da oferta de uma nova ferramenta de apoio à

pesquisa. Alguns dos pesquisadores utilizaram a ferramenta, mas enviaram feedbacks apenas

por e-mail. Nestes feedbacks foram relatados problemas e sugestões de funcionalidades.

Os testes de usabilidade foram feitos por sete pessoas do grupo, apresentando os

seguintes resultados:

Tabela 3 – Resultados das tarefas dos testes de usabilidade. As notas indicam o grau de satisfação sobre como a tarefa está projetada para ser realizada pelo pesquisador, em uma

escala de 0 a 10.

Tarefa Nota Média

Desvio Padrão

Mediana

01 – Instalação e Autenticação 7,86 2,55 9 02 – Preferências 8,14 1,57 8 03 – Criação de Projetos e Objetivos 8,71 1,25 9 04 – Preparação da Extensão 9,43 0,98 10 05 – Tarefas durante a Navegação 8,00 1,77 9 06 – Retomando a Pesquisa* 8,67 0,58 9 07 – Conhecendo o Histórico* 9,33 1,16 10 08 – Interações Avançadas com o Histórico* 9,33 1,16 10

* As tarefas 6, 7 e 8 foram executadas em uma segunda etapa de testes de usabilidade. Nesta, apenas três pesquisadores concluíram o teste.

Pelas notas atribuídas na Tabela 3, indicando a satisfação em como a tarefa está

projetada para ser realizada, julgamos que a interface está satisfatoriamente bem projetada

para esta primeira versão do sistema. Alguns comentários coletados do teste confirmam este

julgamento:

1. “A tarefa pôde ser realizada com facilidade. As Opções e Preferências estão

bem estruturadas.”

2. “Foi bem tranquilo a execução da tarefa[...]”

3. “Fica bem fácil organizar um projeto com os padrões definidos”

4. “Tranquila, funcionou sem problemas”

Page 85: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

85

Alguns deles focaram os comentários em sugestões para aprimorar o sistema, como

por exemplo: realizar a autenticação por meio de uma conta em outro sistema popular, como

Twitter/Facebook ou uma Google Account; incluir um campo em branco para identificar um

projeto do tipo “outro” e; salvar configurações de filtro na visualização do histórico.

Tivemos outros feedbacks também com opiniões positivas e sugestões de

aprimoramento:

1. “Com as informações que a extensão mostra sobre as páginas já visitadas,

facilita bastante saber o que já foi visto, e o que ainda não.”

2. “A ferramenta permitiu compreender o histórico da pesquisa ao organizar as

buscas em fluxos e associar as páginas visitadas pelo domínio. Estes podem ser

facilmente explorados e manipulados pela ferramenta de histórico do projeto.”

3. “A ferramenta permitiu filtrar as atividades de busca e navegação pelos seus

principais atributos, fornecendo a possibilidade de ter uma visão do histórico.

Seria interessante ter uma opção para salvar (e recuperar) as configurações de

filtros.”

O questionário final de avaliação foi respondido por oito pesquisadores. Indagados

sobre seu tempo de uso da extensão (i.e. com a ferramenta ativada registrando as atividades de

pesquisa) metade dos pesquisadores afirmaram tê-la usado entre 20 minutos e uma hora

diária, 25% informaram ter usado por menos de 20 minutos e os outros 25% entre uma a

quatro horas por dia. Levando em consideração que, deste grupo de pesquisadores, 60%

afirmaram usar o computador por mais de 8 horas diárias e 30% entre 4 a 8 horas por dia, é

evidente concluir, ao cruzar com a primeira informação, que a atividade de pesquisa

exploratória não foi realizada durante toda atividade de uso da Web (Apêndice D). Em muitos

momentos os pesquisadores estavam utilizando a Web para outros fins que não era da sua

pesquisa exploratória. O que ficou evidente também ao se conferir na base de dados da

aplicação a quantidade de atividades ignoradas pelo motivo de extensão pausada, mostrado na

Tabela 4.

Tabela 4 – Frequência de uso da extensão

Extensão pausada

Extensão ativada

Total

Quantidade de atividades registradas 19.093 2.067 21.160

90,23% 9,77% 100%

Page 86: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

86

O recurso mais utilizado no sistema, como mostra a Tabela 5, foi o de incluir tags para

representar o conteúdo de um documento. Todos os pesquisadores da amostra fizeram uso

dele. Associar um documento a um objetivo, ou ocultar uma atividade do histórico, também

foram usados por quase todos os pesquisadores. Metade dos pesquisadores sinalizou não ter

utilizado o recurso de anotações e três deles afirmaram não ter usado o recurso de classificar

por estrelas. As justificativas dadas foram: não ter achado como fazer e falta de tempo. Um

dos usuários também relatou não ter usado o recurso de associar atividade ao objetivo da

pesquisa por ter achado complicado e não ter ficado claro a ele o conceito disto no contexto

da ferramenta. Este mesmo usuário disse que não achou utilidade em classificar atividades

com estrelas.

Tabela 5 – Frequência de uso de recursos da extensão

Recurso Quantidade de

Pesquisadores

Incluir tags para representar o conteúdo de um documento/página 8

Associar atividade a um objetivo de pesquisa 7

Ocultar uma visita a uma página ou todas as visitas à determinada página ou domínio

7

Classificar atividade com estrelas 5

Fazer anotações em atividades 4

Quando solicitados a indicar um grau de 1 a 5 sobre quão agradável é a apresentação

visual do histórico do projeto, com linhas do tempo indicando sessões e elementos

diferenciando pesquisas e navegação, os resultados indicaram uma média de 3.63, com desvio

padrão de 1.88. De acordo com o Gráfico 1, isto significa que para dois pesquisadores a

apresentação não agradou, para um foi indiferente e os outros cinco consideraram agradável,

ou muito agradável, obter uma apresentação visual do histórico do projeto.

Page 87: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

87

Gráfico 1 - Agradabilidade da apresentação visual do histórico do projeto

Perguntamos também sobre a utilidade de alguns dos recursos do sistema e

descobrimos que os recursos considerados muito úteis pelos pesquisadores foram: a

possibilidade de poder pausar e retomar a pesquisa quando desejar; poder organizar as

atividades em projetos; e ocultar atividades de pesquisa, ou navegação, não relacionadas ao

projeto, como mostra a Tabela 6. Outros recursos como, por exemplo, a apresentação visual

do histórico e os filtros para refinar a visualização, também foram considerados úteis pela

maioria.

Tabela 6 – Utilidade dos recursos do sistema Muito

Útil Inútil

Poder organizar as pesquisas exploratórias em projetos e poder alternar entre projetos;

6 1 1

Poder criar objetivos para os projetos e associar atividades a estes objetivos;

3 2 1 2

Poder pausar e continuar a pesquisa quando desejar, suprimindo informações não relacionadas da visualização do histórico;

7 1

Da apresentação visual do histórico de pesquisa, com linhas do tempo indicando sessões e elementos diferenciando pesquisas e navegação;

3 3 1 1

Visualizar no histórico, informações sobre as atividades, como classificação de relevância, tags, anotações e quantidade de páginas navegadas;

4 2 1 1

Dos filtros e opções oferecidas para refinar a visualização do histórico do projeto;

4 1 2 1

De o sistema ocultar pesquisas que não geraram visitação em documentos presentes nos resultados da pesquisa;

4 2 2

Poder ocultar na tela de histórico as atividades ou sessões que julgar necessárias ou não correspondentes ao projeto;

5 1 2

Poder ocultar domínios por meio da sua configuração de preferências;

5 2 1

0

1

2

3

4

Muito Agradável ... ... ... Nada Agradável

Page 88: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

88

Com relação à utilidade da apresentação visual, temos um número próximo aos que a

consideraram agradável. Isto é, cinco pesquisadores consideraram a apresentação visual

agradável ou muito agradável (Gráfico 1) e seis a consideraram útil ou muito útil (Tabela 7).

Quando verificado a utilidade de se apresentar informações sobre as atividades (rating, tags,

anotações e quantidade de visitas) no histórico, notamos quase a mesma consideração de

utilidade, seis consideraram útil ou muito útil.

Quando indagados sobre se “esta apresentação pudesse ter dado melhor compreensão

das atividades realizadas e aprimoramento da pesquisa” houve uma perceptível divisão de

opiniões, como mostra o Gráfico 2. Acreditamos que os que opinaram mais próximo de ‘não

ajudou nada’ o fizeram por dois motivos: 1) pouco tempo de uso da ferramenta e; 2) por que

nesta versão ainda não implementamos recursos para recomendação de documentos e

consultas e a extração semântica de conceitos do documentos. Estas características provocam,

respectivamente, uma necessidade maior de uso do histórico para relembrar documentos mais

antigos e evidenciam o potencial de recuperação destes documentos por meio dos conceitos

identificados ao longo da pesquisa, bem como os outros elementos de diferenciação dos

documentos (rating, tags e objetivos associados).

Na avaliação geral da ferramenta, a maioria se mostrou satisfeito com o sistema, como

mostra o Gráfico 3, mas, mesmo assim, algumas insatisfações puderam ser notadas. Aqueles

que não estiveram plenamente satisfeitos relataram algumas ressalvas de modo que, se

atendidas, os fariam substituir o histórico tradicional pela solução proposta como mostra a

Tabela 7.

Gráfico 2 – Auxílio dado pela apresentação do histórico em conjunto com demais elementos do sistema.

-

1,00

2,00

3,00

4,00

Muito ... ... ... Nada

Page 89: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

89

Gráfico 3 – Grau de satisfação com o sistema

Tabela 7 – Opinião dos pesquisadores sobre substituir o histórico tradicional pela solução apresentada.

Substituiria o histórico tradicional? Sim 50% Sim, com ressalvas 50% Não, de forma alguma 0

Os pesquisadores mais críticos com a aplicação apresentaram as seguintes

considerações:

“Não vi utilidade real no sistema [...] Creio que a ideia pode funcionar, mas o

pagamento em ligar, desligar, criar projetos acaba afastando alguns usuários. Creio

que algumas atividades deveriam ser automatizadas com base em tempo de acesso

a documentos, etc. [...]”;

“Acredito que o sistema falha com relação à facilidade de aprendizagem. [...] foi

difícil compreender a relação entre os ícones (bolinhas) que apareciam. [...] ficou

pouco convidativo o clique nas ‘bolinhas’, foram várias visitas ao histórico até que

eu, por acaso, pensei em clicar na ‘bolinha’ e verificar as possibilidades que a

ferramenta me dava. [...] Outra dificuldade no uso da ferramenta, na minha

opinião, foi a necessidade de se fornecer muitas informações para o gerenciamento

das sessões de busca, por exemplo ter que informar os objetivos, atividades,

projetos, etc. [...] Acredito que falta um pouco de gerenciamento da evolução da

minha aprendizagem sobre o tema pesquisado.”

Em defesa da ferramenta podemos destacar a opinião de um pesquisador:

-

1,00

2,00

3,00

4,00

Page 90: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

90

“A ferramenta em si é muito boa, a interface é bem acabada e intuitiva.” “Na

minha percepção, a ferramenta cumpre seu papel muito bem. Qualquer

pesquisador gostaria de ter a visão do histórico de navegação oferecido pela

ferramenta para poder relembrar, ou repassar para outras pessoas o

conhecimento adquirido na pesquisa.”

Além das conclusões obtidas pelas respostas dadas ao questionário, analisando os

registros do sistema, é possível também tirar algumas conclusões. Durante o tempo em que a

extensão não estava pausada foram registradas 9,77% das atividades, como vimos na Tabela

4, totalizando 2.067 atividades. Entretanto, destas 2.067, apenas 850 foram de fato

consideradas válidas para apresentação do histórico de pesquisa. Isto porque, mais da metade

(58,8%) foram ocultas devido à configuração das preferências de uso escolhidas pelo usuário,

ou propostas nativamente pelo sistema. Por exemplo, foram ocultas 234 atividades de URLs

pertencentes à lista de domínios ignorados e 777 atividades com URLs cujo protocolo

pertencia à lista de protocolos ignorados. Também houve URLs ocultas por serem repetidas,

ou por atenderem a um determinado padrão identificado de redirecionamento. Os próprios

pesquisadores, por ação direta, ocultaram 186 destas atividades (8,9%), excluindo-as pela

extensão (68), ou pela visualização do histórico do projeto (117). Estes últimos números

demonstram o engajamento dos mesmos na utilização das interfaces da extensão e do

histórico do projeto.

Os projetos de pesquisa criados para atender o teste de usabilidade tiveram tags

criadas em comum entre os usuários como, por exemplo: “chile” (5 vezes), “viagem” (3

vezes), “trabalhar”/”trabalho” (3 vezes) e “estudar”/”estudos” (2 vezes). Os objetivos criados

também apresentaram estruturas parecidas, como mostra a Tabela 8. Acreditamos que com a

inclusão de um algoritmo de processamento de linguagem natural seria possível criar relações

entre projetos e objetivos por meio das tags e frases de objetivo. Deste modo, o sistema

poderia reconhecer projetos e objetivos semelhantes e recomendar diferentes documentos e

consultas que alcancem objetivos que forem parecidos aos objetivos de outros pesquisadores

que já realizaram projetos do mesmo tipo e fizeram associação de atividades aos seus

objetivos. Poderia até mesmo recomendar objetivos para o projeto, aliviando um pouco a

carga de construção de lista de objetivos.

Page 91: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

91

Tabela 8 – Objetivos escolhidos para o projeto do teste de usabilidade

Projeto Objetivos

1 Descobrir os cursos; Descobrir as agências; Avaliar os cursos; Avaliar as agências; Encontrar lugares legais para visitar; Conhecer a cidade da agência;

2 preparação para viagem ao chile/estadia e ambientação; Escolher aulas na Universidade Católica del Chile; Escolher empresa onde trabalharei

3 Viajar para o chile; Escolher as aulas; Escolher a empresa para estágio; Aprender um pouco da língua

4 Onde trabalhar?; Onde estudar?

5 Procurar cursos no chile; Hospedagens; Lugares imperdíveis para se conhecer no chile

6 Encontrar os cursos disponíveis na Universidade; Encontrar as disciplinas ofertadas; Encontrar as ementas das disciplinas; Descobrir se é possível realizar apenas algumas disciplinas do curso.

7 Encontrar informações sobre trabalho no Chile; Encontrar informações novos negócios no Chile; Encontrar agências no Chile

5.4. Considerações Finais

Em que pese às críticas recebidas dos pesquisadores que não ficaram satisfeitos com o sistema

proposto é importante lembrar, como citamos na Seção 3.2, que propor uma nova

apresentação visual para uma estrutura já consolidada é uma quebra de paradigma e um

desafio que exige bastante esforço. Deste modo, concordamos com estes pesquisadores de que

é necessária uma melhor investigação para descobrir uma maneira adequada de se oferecer

uma apresentação diferenciada, mas ao mesmo tempo útil para esta operação.

Por outro lado, os índices de aprovação quanto à utilidade de inúmeros recursos

introduzidos neste sistema nos estimula a acreditar que há espaço para melhorar o histórico de

pesquisa e a realização de atividades de pesquisa exploratória por meio da integração das

dimensões que levantamos neste trabalho, mesmo considerando a quantidade pequena de

amostra de pesquisadores. Inclusive, por esta razão pretendemos realizar uma nova iteração

de desenvolvimento do sistema, a fim de corrigir as falhas levantadas e aprimorá-lo com

algumas das sugestões indicadas pelos pesquisadores, expandindo os testes para um grupo

maior de pessoas por meio da oferta pública do sistema.

A informação coletada dos registros de atividades também nos dá parâmetros que

podem nortear trabalhos futuros envolvendo recomendação de documentos e consultas que

potencializem a descoberta e o aprendizado dos pesquisadores.

Page 92: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

92

Conclusões e Trabalhos Futuros

Como vimos nos capítulos anteriores, existe uma especialização da busca de informação

denominada pesquisa exploratória com foco em aprendizado e investigação que não é bem

atendida pelos buscadores atuais. Este tipo de busca mescla estratégias e comportamentos

explicados em diversos modelos como ISP, berry-picking, information foraging e sense-

making, possuindo necessidades de apoio específicas, como recursos que facilitem a

orientação no espaço de informação, a coleta e lembrança dos documentos visitados, a análise

e comparação de informações, a descoberta e produção de novo conhecimento e a geração de

sínteses e avaliação para tomada de decisão.

Identificamos, por meio de um framework, seis dimensões sob as quais é possível

desenvolver estratégias e oferecer recursos para apoiar a pesquisa exploratória na Web, são

elas: a Qualidade, a Apresentação, o Tempo, a Cognição, a Personalização e a Colaboração.

Desenvolvemos então um sistema com ênfase em uma ferramenta de histórico de pesquisa

relacionando-se com estas dimensões. Esta ferramenta tem o objetivo de oferecer uma nova

abordagem para substituir os históricos dos navegadores atuais, visando, principalmente, ser

mais condizente com as características de uma pesquisa exploratória e facilitando a

revisitação de longo e muito longo prazo. Por esta razão modelamos conceitualmente o

sistema de modo a distinguir o comportamento de busca e de navegação e aplicamos nele

mecanismos de descargas cognitivas associadas às atividades realizadas pelos pesquisadores.

6 Capítulo

Page 93: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

93

Estudamos os pesquisadores para que o sistema desenvolvido não viesse a modificar

seus principais hábitos e comportamentos de pesquisa, mas que se adaptasse a estes. Deste

modo, empregando elementos da dimensão de personalização, oferecemos mecanismos para

configurações de preferências e todo um conjunto de artefatos de classificação e organização

das atividades e projetos. A introdução de projetos com possibilidade de controle de objetivos

ampliaram as possibilidades na dimensão cognitiva. Por meio de uma nova abordagem de

visualização das atividades de pesquisa, diferenciando as pesquisas e a navegação, ampliamos

a dimensão da apresentação. Informamos nas páginas de resultados das pesquisas os

documentos antes visitados e classificados pelo pesquisador para ampliar o suporte à

dimensão qualitativa. Com a ferramenta de visualização do histórico do projeto cobrimos a

dimensão temporal. Finalmente, embora não tenhamos implementado, criamos um ambiente

para propiciar cobertura da dimensão de colaboração, o qual poderá ser explorado por meio da

aplicação de algoritmos de recomendação e da possibilidade de compartilhamento de projetos

entre pesquisadores.

Os testes realizados por uma amostra de pesquisadores mostrou que o nosso sistema é

simples e fácil de ser utilizado. Também pudemos comprovar pelos experimentos que

minimizar a quantidade de informações exibidas no histórico trazem ganhos e satisfação aos

pesquisadores. Os recursos considerados mais úteis por eles foram o controle para pausar e

retomar o registro das atividades dos projetos, a possibilidade de organizar as atividades em

projetos e a possibilidade de controlar o que é exibido, ou não, no histórico. A introdução no

histórico de pesquisa de algumas informações sobre as atividades, como, por exemplo,

classificação e rótulo dos documentos, associação destes com objetivos e anotações

permitiram por meio de filtros modificar dinamicamente a apresentação do histórico e isto

também agradou os pesquisadores. Por outro lado, ficou claro que há um grande desafio em

quebrar o paradigma de apresentação do histórico de navegação e alguns pesquisadores não

consideraram agradável e não perceberam utilidade na abordagem adotada.

Nesta versão, nossa ferramenta considera como atividades de pesquisas apenas aquelas

realizadas por meio da máquina de busca do Google. Uma vez que muitos pesquisadores

utilizam máquinas de buscas específicas para atividades acadêmicas, como ACM Digital

Library (dl.acm.org), IEEE Explorer (ieeexplore.ieee.org/) dentre outros, é importante que

mais destes sistemas sejam cobertos para identificar mais atividades de consulta em

ferramentas de busca, diferenciando-as das atividades de navegação. O sistema

deliberadamente não introduz um novo motor de busca dando preferência a registrar as

atividades do usuário de maneira passiva, a partir do próprio motor de busca que ele utiliza.

Page 94: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

94

Entretanto, isso é feito com técnicas de Web scraping das páginas do buscador e, por esta

razão, eventuais mudanças na página do buscador impactarão mudanças neste módulo do

sistema, sendo necessário constante monitoramento.

6.1. Trabalhos Futuros

Existem alguns campos de pesquisa bastante interessantes dentro do contexto da pesquisa

exploratória. Se tomarmos cada uma das dimensões sugeridas no Capítulo 3 já haverá bons

pontos de partida para novos trabalhos relacionados. Por exemplo, com relação à dimensão de

apresentação, a modificação da página de resultados de pesquisa aplicando técnicas de

visualização da informação pode reforçar a aquisição de conhecimento sobre os itens

retornados por meio de exibição de relações entre eles e auxiliar na definição de caminhos de

visitação a serem percorridos pelo pesquisador. Outras dimensões também podem ser

identificadas e suas contribuições com a pesquisa exploratória podem ser estudadas e testadas.

Enumeramos uma série de novos recursos que podem gerar novos trabalhos de

pesquisa para aperfeiçoar a solução desenvolvida, dando inclusive cobertura para outras

dimensões. Entre eles podemos citar:

1. Recuperar conceitos semânticos dos documentos visitados, possibilitando filtrar no

histórico os recursos relacionados a um conceito específico.

o Com os conceitos recuperados de cada documento é possível propor uma

ferramenta de modelagem de mapa conceitual, para que o pesquisador possa ir

montando seu modelo cognitivo do espaço de informação no qual está inserida

a pesquisa;

o Clusterizar as atividades de navegação, agrupando-as em semelhanças ou

cobertura de conceitos.

2. Compartilhar projetos de pesquisa para que pesquisadores com objetivos comuns

possam colaborar diretamente um com o outro, visualizando e interagindo com a

linha do tempo e sessões de pesquisa compartilhadas;

3. Recomendar documentos e consultas que possam potencializar o atingimento de

determinado objetivo pelo pesquisador com base na observação de documentos

associados a objetivos parecidos em projetos de pesquisa semelhantes executados

por outros pesquisadores do sistema.

4. Utilizar o recurso de menu de contexto do navegador para adicionar ações como

guardar trecho de texto, ou imagens, contidos no documento visitado. Estes

Page 95: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

95

elementos poderiam ser utilizados como pistas cognitivas e exibidas na linha do

tempo do histórico de pesquisa;

5. Indicar similaridade: entre consultas com base nas palavras-chaves e nos

resultados apresentados por diferentes consultas; e entre documentos, com base na

análise do seu conteúdo; Desta forma, na visualização do histórico pode-se agrupar

estas atividades em clusters.

6. Incluir novos mecanismos de pesquisas na cobertura do sistema como, por

exemplo, os específicos para trabalhos acadêmicos.

7. Permitir observação de documentos/páginas com objetivo de avisar o pesquisador

caso estas sofram alterações de conteúdo.

8. Organizar as atividades do usuário de forma automática, trocando o projeto caso o

sistema perceba que ele está no contexto de outra pesquisa exploratória.

9. Capturar imagens de telas (screenshots) dos documentos visitados, para apresenta-

las na visualização do histórico, visando aprimorar a lembrança do conteúdo.

Tão logo os navegadores ofereçam suporte a extensões para suas versões em sistemas

móveis outro foco que achamos interessante investigar é uma maneira de replicar a extensão e

apresentação do histórico para estes dispositivos. Neste caso, não basta apenas copiar o

código da aplicação, mas sim adaptá-la e prepará-la para um contexto de execução totalmente

diferente. Isto é importante, pois muitos pesquisadores utilizam tablets ou smartphones para

leituras de artigos e realizar pesquisas quando não estão no seu escritório.

Acreditamos que nosso trabalho tenha servido para elucidar algumas questões

relacionadas ao contexto de execução da pesquisa exploratória como, por exemplo, como ela

se difere de outros tipos de busca de informação, porque o caminho a ser percorrido é

importante para o pesquisador e como apoiar com ferramentas este tipo de busca de

informação. Neste último ponto, fornecemos um ponto de partida para novos trabalhos que

poderão focar em algumas das dimensões identificadas no framework proposto.

Page 96: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

96

Referências

AHN, J.-W. et al. Personalized web exploration with task models. In: International Conference on World Wide Web, 17, 2008, Beijing, China. Proceedings… New York: ACM. 2008. p. 1-10.

ALHENSHIRI, A. et al. Augmentating the Visual Presentation of Web Search Results. In: International Conference on Digital Information Management, 5, 2010, Thunder Bay, Canada. Proceedings... [S.l.]: IEEE Conference Publications. 2010. p. 101-107.

ANGELACCIO, M.; BUTTARAZZI, M.; PATRIGNANELLI, M. Graph Use to Visualize Web Search Results: MyWish 3.0. In: International Conference on Information Visualization, 11, 2007, Zurich, Switzerland. Proceedings... Los Alamitos, CA: IEEE Computer Society. 2007. p. 245-250.

BATES, M. J. The design of browsing and berrypicking techniques for the online search interface. Online Information Review, v. 13, n. 5, p. 407-424, 1989. ISSN ISSN: 1468-4527.

BUSCHER, G.; CUTRELL, E.; MORRIS, M. R. What Do You See When You're Surfing? Using Eye Tracking To Predict Salient Regions of Web Pages. In: SIGCHI Conference on Human Factors in Computing Systems, 27, 2009, Boston, USA. Proceedings... New York :ACM. 2009. p. 21-30.

DIRIYE, A. et al. Revisiting Exploratory Search from the HCI Perspective. In: International Workshop on Human-Computer Interaction and Information Retrieval, 4, 2010, New Brunswick, NJ. Proceedings... [S.l.]: [s.n.]. 2010. Disponível em: http://research.microsoft.com/en-us/um/people/ryenw/hcir2010/docs/HCIR2010Proceedings.pdf . Acesso em: 18 jan. 2013.

DÖRK, M. et al. VisGets: Coordinated Visualizations for Web-based Information Exploration and Discovery. IEEE Transactions on Visualization and Computer Graphics, Piscataway, NJ, v. 14, n. 6, p. 1205-1212, November 2008. ISSN 1077-2626.

GOLOVCHINSKY, G.; DIRIYE, A.; DUNNIGAN, T. The future is in the past: designing for exploratory search. In: Information Interaction in Context Symposium, 4, 2012, Nijmegen, Netherlands. Proceedings... New York:ACM. 2012. p. 52-61.

HAILPERN, J. et al. YouPivot: improving recall with contextual search. In: SIGCHI Conference on Human Factors in Computing Systems, 29, 2011, Vancouver, BC, Canada. Proceedings... New York: ACM. 2011. p. 1521-1530.

HEARST, M. A. Search User Interfaces. Berkeley, CA: Cambridge University Press, 2009.

Page 97: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

97

HOEBER, O.; SCHROEDER, D.; BROOKS, M. Real World User Evaluations of a Visual and Interactive Web Search Interface. In: International Conference Information Visualisation, 13, 2009, Washington, DC. Proceedings... Los Alamitos, CA: IEEE Computer Society. 2009. p. 119-126.

HUTCHINS, E. Cognition in the Wild. Cambridge, MA: MIT Press, 1995.

KOMLODI, A.; MARCHIONINI, G.; SOERGEL, D. Search history support for finding and using information: User interface design recommendations from a user study. Information Processing and Management: an International Journal, Tarryton, NY, v. 43, n. 1, p. 10-29, January 2007. ISSN 0306-4573.

KOMLODI, A.; SOERGEL, D.; MARCHIONINI, G. Search Histories for User Support in User Interfaces. Journal of the American Society for Information Science and Technology, New York, NY, v. 57, n. 6, p. 803-807, April 2006. ISSN 1532-2882.

KUHLTHAU, C. C. Inside the search process: Information seeking from the user's perspective. Journal of the American Society for Information Science, v. 42, n. 5, p. 361-371, June 1991. ISSN 1532-2890.

KULES, B.; CAPRA, R. Designing Exploratory Search Tasks for Evaluation of Information Seeking Support Systems. In: Information Seeking Support Systems, 1, 2008, Chapel Hill, NC. Workshop Report... [S.l.]: [s.n.]. 2009. Disponível em: http://ils.unc.edu/ISSS/ISSS_final_report.pdf. Acesso em 18 jan. 2013.

KULKARNI, C. E.; RAJU, S.; UDUPA, R. Memento: unifying content and context to aid webpage re-visitation. In: ACM Symposium on User Interface Software and Technology, 23, 2010, New York, NY. Proceedings... New York: ACM. 2010. p. 435-436.

LI, I. et al. Here's what I did: sharing and reusing web activity with ActionShot. In: SIGCHI Conference on Human Factors in Computing Systems, 28, 2010, Atlanta, USA. Proceedings... New York: ACM. 2010. p. 723-732.

LUNARDI, M. S.; MONAT, A. S.; CASTRO, J. M. F. Visualização dos resultados do Yahoo em nuvens de texto : uma aplicação construída a partir de web services. InfoDesign - Revista Brasileira de Design da Informação, v. 5, n. 1, p. 21-35, 2008. ISSN 1808-5377.

MARCHIONINI, G. Information-seeking strategies of novices using a full-text electronic encyclopedia. Journal of the American Society for Information Science, jan., 1989, 54-66.

MARCHIONINI, G. Exploratory search: from finding to understanding. Communications of the ACM - Supporting Exploratory Search, New York, NY, USA, v. 49, n. 4, p. 41-46, April 2006. ISSN 0001-0782.

MAYER, M. Web History Tools and Revisitation Support: A Survey of Existing Approaches and Directions. Foundations and Trends in Human-Computer Interactions, v. 2, n. 3, p. 173-278, March 2009.

MIRIZZI, R.; NOIA, T. D. From exploratory search to web search and back. In: Workshop on Ph.D. Students in Information and Knowledge Management, 3, 2010, Toronto , Canada. Proceedings... New York: ACM. 2010. p. 39-46.

MORRIS, D.; MORRIS, M. R.; VENOLIA, G. SearchBar: A Search-Centric Web History for Task Resumption and Information Re-finding. In: SIGCHI Conference on Human Factors in Computing Systems, 26, 2008, Florence, Italy. Proceedings... New York: ACM. 2008. p. 1207-1216.

Page 98: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

98

MORRIS, M. R.; HORVITZ, E. SearchTogether: An Interface for Collaborative Web Search. In: ACM Symposium on User Interface Software and Technology, 20, 2007, Newport, RI, USA. Proceedings… New York: ACM. 2007. p. 3-12.

NGUYEN, N. T.; ZHANG, J. A Novel Visualization Model for Web Search Results. IEEE Transactions on Visualization and Computer Graphics, Piscataway, NJ, USA, v. 12, n. 5, p. 981-988, September 2006. ISSN 1077-2626.

NORMAN, D. A. Cognitive Engineering. In: NORMAN, D. A.; DRAPER, S. W. User Centered System Design: New Perspective on Human-Computer Interaction. Hillsdale, NJ: Lawrence Erlbaum Associates, 1986. p. 31-61.

PIROLLI, P. L. T. Information Foraging Theory - Adaptive Interaction With Information. New York: Oxford University Press, 2007.

PRATES, R. O.; BARBOSA, S. D. J. Avaliação de Interfaces de Usuário - Conceitos e Métodos. In: COELLO, J. M. A.; FABBRI, S. C. P. F. Jornada de Atualização em Informática do Congresso da Sociedade Brasileira de Computação. Campinas: SBC, 2003. Cap. 6, p. 245-293.

RUSSELL, D. M. et al. The cost structure of sensemaking. In: INTERACT '93 and CHI '93 Conference on Human Factors in Computing Systems, 1993, Amsterdam, Netherlands. Proceedings... New York: ACM. 1993. p. 269-276.

SALLABERRY, A. et al. Interactive visualization and navigation of web search results revealing community structures and bridges. In: Graphics Interface, 2010, Ottawa, Ontario, Canada. Proceedings… Toronto: Canadian Information Processing Society. 2010. p. 105-112.

SCHWARTZ, B. The Paradox of Choice: Why More Is Less. New York, NY: Harper Perennial, 2005.

ŠIMKO, J.; TVAROZEK, M.; BIELIKOVA, M. Semantic History Map: Graphs Aiding Web Revisitation Support. In: Workshops on Database and Expert Systems Applications, 21, 2010, Bilbao, Spain. Proceedings… Los Alamitos, CA: IEEE Computer Society. 2010. p. 206-210.

TREHARNE, K.; POWERS, D. M. W. Search Engine Result Visualisation: Challenges and Opportunities. In: International Conference Information Visualisation, 13, 2009, Barcelona, Spain. Proceedings… Los Alamitos, CA: IEEE Computer Society. 2009. p. 633-638.

TVAROZEK, M.; BIELIKOVA, M. Reinventing the Web Browser for the Semantic Web. In: IEEE/WIC/ACM International Joint Conference on Web Intelligence and Intelligent Agent Technology, 16, 2009, Milano, Italy. Proceedings... [S.l.]: IEEE Computer Society. 2009. p. 113-116.

TVAROZEK, M.; BIELIKOVA, M. Factic: personalized exploratory search in the semantic web. In: International Conference on Web Engineering, 10, 2010, Vienna, Austria. Proceedings... [S.l.]: Springer-Verlag. 2010. p. 527-530.

WAI-TAT FU, W. D. Collaborative Indexing and Knowledge Exploration: A Social Learning Model. IEEE Intelligent Systems, Piscataway, NJ, USA, v. 27, n. 1, p. 39-46, January 2012. ISSN 1541-1672.

WHITE, R. W.; KULES, B.; BEDERSON, B. Exploratory search interfaces. ACM SIGIR Forum, New York, NY, v. 39, n. 2, p. 52, December 2005. ISSN 0163-5840.

Page 99: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

99

WHITE, R. W.; MARCHIONINI, G.; MURESAN, G. Evaluating Exploratory Search Systems: Introduction to special topic issue. Information Processing and Management, New York, NY, v. 44, n. 5, p. 433-436, March 2008. ISSN 0306-4573.

WHITE, R. W.; MURESAN, G.; MARCHIONINI, G. Evaluating Exploratory Search Systems. In: ACM SIGIR 2006 Workshop on "Evaluating Exploratory Search Systems", 2006, Seattle, WA. Proceedings... [S.l.]: [s.n.]. 2006. Disponível em: http://research.microsoft.com/en-us/um/people/ryenw/eess/eess2006_proceedings.pdf. Acesso em 18 jan. 2013.

WHITE, R. W.; MURESAN, G.; MARCHIONINI, G. Report on ACM SIGIR 2006 Workshop on Evaluating Exploratory Search Systems. ACM SIGIR Forum, New York, NY, v. 40, n. 2, p. 52-60, December 2006. ISSN 0163-5840.

WHITE, R. W.; ROTH, R. A. Exploratory Search: Beyond the Query-Response Paradigm. Chapel Hill, NC, USA: Morgan & Claypool, 2009.

WIKI, I. Information Visualization. Infovis: Wiki, 2013. Disponivel em: <http://www.infovis-wiki.net/index.php/Information_Visualization>. Acesso em: 18 jan. 2013.

WILDEMUTH, B. M.; FREUND, L. Assigning search tasks designed to elicit exploratory search behaviors. In: HCIR Symposium on Human-Computer Interaction and Information Retrieval, 6, 2012, New York, NY. Proceedings... New York: ACM. 2012. p. Article No. 4.

WILSON, M. L.; SCHRAEFEL, M. C. Improving Exploratory Search Interfaces: Adding Value or Information Overload? In: Workshop on Human-Computer Interaction and Information Retrieval, 2, 2008, Redmond, WA. Proceedings... [S.l.]: [S.n.]. 2008. Disponível em: http://research.microsoft.com/en-us/um/people/ryenw/hcir2008/doc/HCIR08-Proceedings.pdf. Acesso em 18 jan. 2013.

WON, S. S.; JIN, J.; HONG, J. I. Contextual web history: using visual and contextual cues to improve web browser history. In: SIGCHI Conference on Human Factors in Computing Systems, 27, 2009, Boston, USA. Proceedings... New York: ACM. 2009. p. 1457-1466.

Page 100: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

100

Apêndice A Protocolo de Revisão Sistemática

A.1. Motivação

Após realizar um levantamento bibliográfico para definição de uma proposta de trabalho na

área de HCI (Human Computer Interaction) e IR (Information Retrieval) definimos um

contexto de pesquisa. Trata-se de procurar descobrir e desenvolver um modelo para melhorar

a facilidade de encontrar informação em resultados de uma busca exploratória por meio de

melhorias na visualização dos dados. Neste sentido, formulamos algumas perguntas de

pesquisa e nos preparamos conforme este protocolo para realizar uma revisão sistemática.

A.2. Objetivos

Encontrar trabalhos relevantes e avaliá-los de maneira justa, rigorosa e replicável.

Descobrir conferências e eventos relacionados ao tema da nossa proposta de

trabalho a fim de poder acompanhar novas publicações e também encaminhar

propostas de publicação ao longo e/ou término da nossa pesquisa.

A.3. Perguntas de Pesquisa

1. Existem maneiras de melhorar a busca exploratória em ferramentas de pesquisa

baseadas na Web? Como isto tem sido feito nos últimos anos?

2. Informações sobre o conteúdo, relação e importância dos itens listados nas páginas

de resultados de ferramentas de pesquisa podem ser melhoradas com a aplicação

de técnicas de visualização da informação?

3. Existe uma maneira de registrar e indicar o histórico da pesquisa, permitindo ao

usuário compreender os passos dados e o aprendizado acumulado ao longo da sua

Page 101: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

101

tarefa de pesquisa exploratória?

4. A aplicação de técnicas de visualização da informação em páginas de resultados de

pesquisa de fato contribui para um melhor desempenho em buscas exploratórias?

A.4. Idioma

Serão pesquisados artigos publicados somente no idioma inglês.

A.5. Palavras-Chave

A partir da experiência obtida no levantamento bibliográfico realizado para redigir o artigo de

Trabalho Individual sobre o tema, selecionamos para pesquisa os seguintes conjuntos de

palavras-chave:

1. “exploratory search”

2. “exploratory search” AND “information visualization”

3. “exploratory search” AND “history”

4. “exploratory search” AND “user interface”

5. “search engine results pages”

6. “Web search results visualization”

7. “user interface” AND “search engine”

8. “search engine” AND “information visualization”

9. “information seeking” AND “information visualization”

10. “user interface” AND “history”

11. “information visualization” AND “history”

12. “web browser history”

A.6. Fontes de Pesquisa

Realizaremos a pesquisa nas fontes mais populares da área de Ciência da Computação, a

saber:

ACM Digital Library - The ACM Guide to Computing Literature21

IEEE Xplore Digital Library (incluindo IBM)22

21 http://portal.acm.org 22 http://ieeexplore.ieee.org

Page 102: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

102

ISI Web of Knowledge / Web of Science23

CiteSeer24

The DBLP Computer Science Bibliography25

A.7. Critérios de Pesquisa

Artigos publicados em Journals, Revistas ou Proceedings.

Palavras-Chaves devem estar no resumo/abstract do artigo.

As publicações devem ser do período de 2006 a 2012

o Caso, não haja artigos suficientes, ampliaremos o espectro de tempo para 2001-

2012.

Os resultados devem estar disponíveis em full text para download e leitura.

A.8. Metodologia

Será feita uma consulta para cada conjunto de palavras-chave em cada uma das fontes

escolhidas conforme os critérios definidos e registraremos os resultados obtidos.

Para cada resultado de consulta, serão guardadas informações dos artigos

encontrados - título, autores, abstract e outros dados importantes.

Para cada artigo, procede-se a leitura do título e abstract para selecionar aqueles que

parecem propor uma resposta para algumas das perguntas de pesquisa.

Para os artigos selecionados, baixa-se a versão FullText e daqueles que possuírem

mais de cinco páginas faz-se leitura. Se percebido não responder às questões levantadas o

artigo poderá ser descartado. Optamos por ler apenas os artigos com pelo menos seis páginas,

uma vez que artigos pequenos poderão não contribuir com informações relevantes sobre o

contexto de realização da pesquisa, descrição da análise de experimentos e resultados obtidos.

Finalmente será redigido um relatório com um resumo do conhecimento adquirido

após as leituras dos artigos completos no qual indicaremos quais perguntas já foram

respondidas, ou ainda precisam de respostas ou quais outras questões poderão ser levantadas a

partir do contexto pesquisado.

23 http://webofknowledge.com 24 http://citeseerx.ist.psu.edu 25 http://www.informatik.uni-trier.de/~ley/db/

Page 103: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

103

Apêndice B Questionário sobre Hábitos de Pesquisa Exploratória

Este questionário foi publicado na URL http://bit.ly/habitos-de-pesquisa e distribuído de

forma digital. Abaixo segue uma cópia da versão publicada.

-------------------------------------------------------------------------------------------------

Questionário sobre Pesquisa Exploratória – Parte 1 de 3

Olá, obrigado por acessar esta pesquisa.

O tempo estimado para preenchimento deste questionário é de 10 a 15 minutos.

Este questionário está dividido em três etapas:

1. Na primeira pedimos algumas informações para poder entender um pouco mais sobre você. São apenas 5 questões que visam determinar um perfil.

2. Na segunda etapa apresentamos um pequeno texto para explicar o que é uma Pesquisa Exploratória e faremos perguntas sobre seus hábitos de pesquisa na Internet e suas preferências de uso de ferramentas e navegadores. Serão 15 questões de múltipla escolha.

3. Na última etapa deixamos duas perguntas com espaço aberto para que você possa livremente expressar sua experiência e anseios acerca de uma pesquisa exploratória.

Queremos descobrir como você se organiza antes e durante a realização de um determinado tipo de pesquisa (busca de informação).

Nosso objetivo é validar (ou não) algumas hipóteses levantadas por nosso trabalho de pesquisa. Para isso, contamos com sua sinceridade em responder as questões a seguir.

Antecipadamente agradecemos sua atenção e esforço em nos ajudar.

Identificação de Perfil

As questões abaixo visam identificar perfis de usuários para possível segmentação.

1. Qual sua idade? _______

Page 104: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

104

2. Sexo? ( ) masculino ( ) feminino

3. Qual seu grau de formação acadêmica? ( ) Ensino Fundamental ou Médio ( ) Graduado ou cursando Graduação ( ) Graduado, cursando pós-graduação (especialização) ( ) Graduado, cursando pós-graduação (mestrado) ( ) Especialista (graduação + especialização concluída) ( ) Mestre ( ) Mestre, cursando doutorado ( ) Doutor ( ) Doutor, cursando pós-doutorado ( ) Pós-Doutor

4. Qual sua profissão? Se estudante, escreva “estudante” ________________________

5. Sua atuação profissional ou área de estudos está mais relacionada à: ( ) Administração, Marketing, Comunicação ( ) Artes Cênicas, Design, Música, Teatro... ( ) Computação, Informática ( ) Engenharias (civil, elétrica, materiais, produção, ...) ( ) Biologia, Medicina, Agronomia, Veterinária, ... ( ) Filosofia, Serviço Social, Ciências Sociais, ... ( ) Outro: __________________________

-------------------------------------------------------------------------------------------------

Questionário sobre Pesquisa Exploratória – Parte 2 de 3

Pesquisa Exploratória

Uma pesquisa exploratória tem como objetivo fazer com que o pesquisador familiarize-se com um determinado assunto pouco conhecido ou ainda não explorado. A duração de uma pesquisa exploratória pode levar dias ou meses e, por isso, estende-se por diversas sessões de pesquisa. Durante essas sessões, o pesquisador pode encontrar conceitos que ele ainda não entende e, por isso, precisará aprender (pesquisando) sobre este conceito antes de prosseguir. Alguns autores classificam a Pesquisa Exploratória como busca de informação visando aprendizado e investigação.

Na pesquisa exploratória a meta não é simplesmente achar uma informação, mas conduzir o pesquisador para compreender um tópico a fim de tomar melhores decisões com as informações encontradas e com o aprendizado acumulado durante a tarefa de busca de informação. As pesquisas exploratórias têm ênfase em ampliar conhecimento ou proporcionar desenvolvimento pessoal.

São exemplos de pesquisas exploratórias:

• Desenvolver um novo produto por meio da compreensão de um fenômeno ou problema;

Page 105: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

105

• Encontrar soluções para problemas complexos, por meio de aprofundamento do conhecimento e realização de experimentos.

• Dominar uma linguagem de programação para desenvolver novos sistemas para determinado dispositivo;

Exemplos que NÃO são pesquisas exploratórias:

• Procurar pelo nome completo de um artista;

• Localizar o endereço ou telefone de contato de uma empresa;

• Encontrar o menor preço para um produto ou serviço e;

• Listar os jogadores de uma equipe de futebol.

Sobre “Hábitos de Pesquisa”

6. Com a explicação acima, você acredita que conseguiu compreender o que é uma pesquisa exploratória? ( ) Não ( ) Sim ( ) Talvez, ainda tenho dúvidas

7. Você costuma recorrer à Internet nas situações a seguir? Se alguma das tarefas a seguir você nunca realizou, deixe em branco. Nunca Pouco

Algumas Vezes Muito

Planejar uma viagem de férias para destino ainda não conhecido (inclui escolher o destino)

Realizar e escrever um Trabalho de Conclusão de Curso / Monografia

Escrever um artigo técnico para um blog ou trabalho acadêmico

Criar uma apostila e slides para uma disciplina ou curso

Aprender uma Linguagem de Programação ou uma nova técnica/metodologia para aplicação no trabalho

8. Quais recursos não informatizados você utiliza durante seu processo de pesquisa exploratória? Pode marcar mais de uma opção. [ ] Anotações em papel/caderno [ ] Consulta às pessoas especialistas no assunto [ ] Leituras de publicações impressas (livros, revistas, jornais, etc.) [ ] Visita à biblioteca [ ] Outro: ______________________

9. Como você costuma iniciar uma pesquisa na Internet? Pode marcar mais de uma opção. [ ] Acessando uma ferramenta de pesquisa (ex., digitando www.google.com) e nela digitando os termos de pesquisa (palavras-chave); [ ] Digitando termos de pesquisa (palavras-chave) na barra de endereço do navegador; [ ] Digitando termos de pesquisa (palavras-chave) no campo de pesquisa oferecido

Page 106: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

106

pelo navegador; [ ] Acessando diretamente sites específicos que você já conhece (ex. Wikipedia)

10. Quando você resolve encerrar a pesquisa que você está fazendo? [ ] Quando termina o prazo que eu tenho para obter minhas conclusões; [ ] Quando começo a encontrar conteúdos repetidos, que já visualizei em sessões de pesquisa anteriores; [ ] Quando sinto que aprendi o suficiente sobre o assunto de interesse e já tenho confiança para realizar a tarefa pretendida;

11. Você costuma se lembrar do endereço (URL) de uma página ou documento que achou interessante há alguns dias e que precisa retornar para consultá-la(o)? Considere páginas e documentos visitados no período de um dia a seis meses. Considere conseguir se lembrar pelo menos do site (domínio) onde a página se encontra e de forma que você acessando-o conseguirá reencontrá-la. ( ) Sim, sempre. ( ) Sim, na maioria das vezes eu lembro. ( ) Não, na maioria da vezes não lembro. ( ) Não, nunca.

12. O que você costuma fazer quando precisa revisitar uma página ou documento que sabe já ter visto anteriormente? Pode marcar mais de uma opção ou descrever seu próprio método/ações. [ ] Recorro aos favoritos do navegador, pois sempre guardo lá link para páginas interessantes [ ] Utilizo um serviço como Delicious, Diigo ou similar para salvar páginas interessantes com tags apropriadas [ ] Acesso o histórico de navegação, oferecido pelo navegador [ ] Sempre anoto link interessantes em um arquivo ou papel [ ] Tento refazer a pesquisa que mostrou aquele resultado pra mim [ ] Tento pesquisar pelo texto ou palavras-chave que lembro existirem naquele documento [ ] Outro: _________________________________________

Sobre ferramentas para pesquisa Queremos entender um pouco sobre suas preferências de uso de softwares e seus recursos.

13. Qual ferramenta de busca (website de pesquisa) você utiliza com maior frequência? ( ) ASK - www.ask.com ( ) Baidu - www.baidu.com ( ) Bing - www.bing.com(.br) ( ) Google - www.google.com(.br) ( ) Yahoo - www.yahoo.com(.br) ( ) Outro: ___________________

Page 107: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

107

14. Você conhece e utiliza alguns destes outros recursos oferecidos por estas ferramentas, para enriquecer o entendimento sobre o assunto pesquisado? Pode marcar mais de uma opção Artigos Acadêmicos (Google Scholar, Microsoft Academic Search, ...) Busca Avançada Delimitação do Tempo de Publicação do Conteúdo (Período) Imagens Mapas Vídeos Histórico de pesquisas feitas (Google Web History)

15. Qual o navegador que você mais utiliza para realizar pesquisas na internet? ( ) Apple Safari ( ) Google Chrome ( ) Microsoft Internet Explorer ( ) Mozilla Firefox ( ) Opera Browser ( ) Não sei identificar o navegador que eu utilizo

16. Quais destes recursos oferecidos pelo próprio navegador de internet você utiliza para apoiar sua pesquisa na web: Pode marcar mais de um [ ] Salvar e acessar Favoritos/Marcadores (bookmarks) no Navegador [ ] Visualizar o Histórico de Navegação

17. Sobre o recurso "Histórico de Navegação"... Pode marcar mais de um [ ] Não conheço [ ] Conheço, mas não vejo utilidade para uma pesquisa exploratória [ ] Conheço, mas acho difícil de usar [ ] Conheço, mas acho que precisa ser melhorado para servir de apoio à pesquisa exploratória [ ] Conheço, mas não acho prático a forma de apresentação da informação de páginas visitadas [ ] Conheço, mas por listar todo histórico de navegação fica difícil extrair/encontrar informação útil

18. Você está familiarizado com a instalação e uso de extensões ou complementos para o navegador que você utiliza? ( ) Não ( ) Sim

19. Você utiliza alguma extensão ou complemento de navegador que otimiza seu processo de pesquisa na web? Qual? ( ) Nenhuma ( ) Outro: ___________________________________________________

-------------------------------------------------------------------------------------------------

Page 108: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

108

Questionário sobre Pesquisa Exploratória – Parte 3 de 3

Muito obrigado por chegar até aqui!

Pedimos mais um pouco de esforço para enriquecer ainda mais nossa pesquisa.

Tente responder as duas questões a seguir e depois clique em enviar para encerrar a pesquisa.

20. Aponte outras ferramentas (sites ou softwares) que você costuma utilizar para apoiar suas pesquisas exploratórias. Ex.: Delicious, ACM Digital Library, Mendeley, etc... _______________________________________________________________________________________________________________________________________________________________________________________________________________

21. Qual recurso ou ferramenta ainda não existente você acha que seria útil para melhorar seu processo de pesquisa exploratória? _______________________________________________________________________________________________________________________________________________________________________________________________________________

-------------------------------------------------------------------------------------------------

Page 109: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

109

Apêndice C Tabulação das Respostas do

Questionário sobre Hábitos de Pesquisa Exploratória

C.1. Perfil dos Participantes

Total de Respostas: ........................................................................................... 161

Idade Idade mínima: ...................................................................................................... 16 Idade máxima: ..................................................................................................... 63 Média de idade: .............................................................................................. 30,09 desvio padrão: .................................................................................................... 8,5 Mediana: .............................................................................................................. 29

Faixas Etárias:

16 a 20 anos

21 a 25 anos

26 a 30 anos

31 a 35 anos

36 a 40 anos

41 a 45 anos

46 a 50 anos

51 a 55 anos

56 a 60 anos

Acima de 60

7 42 54 29 9 7 7 3 2 1

Sexo Homens 101 62,7% Mulheres 60 37,3%

Formação Ensino Fundamental ou Médio 9 5,6%Graduado(a) ou cursando Graduação 53 32,9%Graduado(a), cursando pós-graduação (especialização) 31 19,3%Graduado(a), cursando pós-graduação (mestrado) 11 6,8%Especialista (graduação + especialização concluída) 22 13,7%Mestre 17 10,6%Mestre, cursando doutorado 10 6,2%Doutor(a) 7 4,3%Doutor(a), cursando pós-doutorado 1 0,6%

Área de Atuação/Estudo Computação, Informática 67 41,6%Administração, Marketing, Comunicação 37 23,0%Outros (Educação, Ciências da Informação, Direito, Geografia, Religião, Comércio, Meio-Ambiente, ...)

19 11,8%

Biologia, Medicina, Agronomia, Veterinária, ... 13 8,1%Engenharias (civil, elétrica, materiais, produção, ...) 10 6,2%Filosofia, Serviço Social, Ciências Sociais, ... 8 5,0%Artes Cênicas, Design, Música, Teatro... 7 4,3%

Page 110: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

110

C.2. Entendimento do conceito de Pesquisa Exploratória

“Com a explicação acima, você acredita que conseguiu compreender o que é uma pesquisa exploratória?” Não 2 1,2%Sim 140 87,0%Talvez, ainda tenho dúvidas 19 12%

C.3. Comportamento de Pesquisa

Você costuma recorrer à Internet nas situações a seguir?

Recorre a Internet para: Muito Algumas

Vezes Pouco Nunca

Planejar Férias 93 59,6% 38 24,4% 20 12,8% 5 3,2%Fazer TCC 98 63,6% 33 21,4% 17 11,0% 6 3,9%Escrever Artigos 99 64,3% 28 18,2% 22 14,3% 5 3,2%Preparar Apostila/Slides 83 54,2% 41 26,8% 24 15,7% 5 3,3%Aprender LP ou Técnica 112 73,7% 21 13,8% 13 8,6% 6 3,9%

Recorre a Internet para: Muito +

Algumas Vezes

Pouco + Nunca

Planejar Férias 131 81,3% 25 18,7%Fazer TCC 131 81,3% 23 18,7%Escrever Artigos 127 78,9% 27 21,1%Preparar Apostila/Slides 124 77,0% 29 23,0%Aprender LP ou Técnica 133 82,6% 19 17,4%

Em média, 80,22% recorrem à Internet muito ou algumas vezes para realizar

pesquisas do tipo exploratória, citadas na pesquisa.

Quais recursos não informatizados você utiliza durante seu processo de pesquisa exploratória? Anotações em papel/caderno 110 68,3%Consulta às pessoas especialistas no assunto 93 57,8%Leitura de publicações impressas 138 85,7%Visita à biblioteca 61 37,9%

Como você costuma iniciar uma pesquisa na Internet? Acessando uma ferramenta de pesquisa (ex., digitando www.google.com) e nela digitando os termos de pesquisa (palavras-chave).

113 70,2%

Digitando termos de pesquisa (palavras-chave) na barra de endereço do navegador.

82 50,9%

Digitando termos de pesquisa (palavras-chave) no campo de pesquisa oferecido.

47 29,2%

Acessando diretamente sites específicos que você já conhece (ex. Wikipedia).

53 32,9%

Page 111: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

111

Quando você resolve encerrar a pesquisa que você está fazendo? Quando termina o prazo que eu tenho para obter minhas conclusões. 38 23,6% Quando começo a encontrar conteúdos repetidos, que já visualizei em sessões de pesquisa anteriores.

94 58,4%

Quando sinto que aprendi o suficiente sobre o assunto de interesse e já tenho confiança para realizar a tarefa pretendida.

117 72,7%

Você costuma se lembrar do endereço (URL) de uma página ou documento que achou interessante há alguns dias e que precisa retornar para consultá-la (o)?26 Sim, sempre. 4 10,0%Sim, na maioria das vezes eu lembro. 11 27,5%Não, na maioria das vezes não lembro. 24 60,0%Não, nunca. 1 2,5%

O que você costuma fazer quando precisa revisitar uma página ou documento que sabe já ter visto anteriormente? ?27 Serviços Externos 13 32,5%Refaz Pesquisa que originou resultados 20 50,0%Tenta pesquisar pelo conteúdo 17 42,5%Recorre a papel/arquivo de anotação 9 22,5%Acessa o Histórico 26 65,0%Procura nos Favoritos 28 70,0%

C.4. Ferramentas de Apoio

Qual ferramenta de busca (site de pesquisa) você utiliza com maior frequência? ASK 1 0,6% Baidu 0 0,0% Bing 0 0,0% Google 157 98,7% Yahoo 1 0,6% Outro 0 0%

Você conhece e utiliza alguns destes outros recursos oferecidos por estas ferramentas, para enriquecer o entendimento sobre o assunto pesquisado? Artigos Acadêmicos 107 66,5%Busca Avançada 94 58,4%Delimitação de Tempo 49 30,4%Imagens 131 81,4%Mapas 87 54,0%Vídeos 84 52,2%Histórico de Pesquisas 19 11,8%

26 Questão inserida na pesquisa somente a partir de uma data. Por esta razão possui menos respostas que as demais. A coluna de porcentagem considera em relação à quantidade de pessoas expostas a esta questão. 27 Questão inserida na pesquisa somente a partir de uma data. Por esta razão possui menos respostas que as demais. A coluna de porcentagem considera em relação à quantidade de pessoas expostas a esta questão.

Page 112: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

112

Qual o navegador que você mais utiliza para realizar pesquisas na Internet? Chrome 101 63,5% Firefox 37 23,3% Internet Explorer 14 8,8% Opera 1 0,6% Safari 6 3,8%

Você está familiarizado com a instalação e uso de extensões ou complementos para o navegador que você utiliza? Sim 103 64,0% Não 58 36,0%

Quais destes recursos oferecidos pelo próprio navegador de Internet você utiliza para apoiar sua pesquisa na Web: Favoritos 86 53,4%Histórico 62 38,5%

Sobre o recurso "Histórico de Navegação"... Não conhece. 8 5,0% Conheço, mas não vejo utilidade para uma pesquisa exploratória. 24 14,9% Conheço, mas acho difícil de usar. 2 1,2% Conheço, mas acho que precisa ser melhorado para servir de apoio à pesquisa exploratória.

62 38,5%

Conheço, mas não acho prática a forma de apresentação da informação de páginas visitadas.

49 30,4%

Conheço, mas por listar todo histórico de navegação fica difícil extrair/encontrar informação útil.

69 42,9%

Você utiliza alguma extensão ou complemento de navegador que otimiza seu processo de pesquisa na web? Qual? Não 145 90,1% Sim 16 9,9%

Extensões citadas:

pesquisa em documentação de códigos, pesquisa em wiki, plugins de grupos de email para printar a pagina (esqueci o nome) AVG que verifica a confiabilidade do site Ferramenta para salvar sessões Diigo Bookmark google search by image Atalho Google Xmarks GOOGLE HACKS Better History ReadItLater (agora chama-se Pocket) Crio alguns Keymarks nos favoritos do Firefox para realizar pesquisas diretamente na barra

de endereço em sites customizados Surf canion downloader downloadhelper

Page 113: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

113

Aponte outras ferramentas (sites ou softwares) que você costuma utilizar para apoiar suas pesquisas exploratórias. 1. Periódicos da CAPEs (http://www.periodicos.capes.gov.br/), Estante Virtual

(http://www.estantevirtual.com.br/), Wolfram Alpha (http://www.wolframalpha.com/) e similares, sites de Universidades, sites de livrarias.

2. Delicious e outros sites de gerenciamento de links. 3. Costumava utilizar o library.nu até o seu fechamento, com isso procuro ainda opcoes similares como o

ebokee. Esta foi a maior perda dos ultimos anos na comunidade academica 4. Twitter 5. Wiki próprio 6. Nunca utilizei nada além do google ou sites especializados no tema de pesquisa (como o Observatório de

Imprensa para a monografica). 7. "http://www.ibict.br/

http://www.wdl.org/pt/ http://www.scielo.org/php/index.php http://www.sib.uem.br/index.php?option=com_content&view=article&id=2&Itemid=110 http://www.periodicos.capes.gov.br.ez79.periodicos.capes.gov.br/index.php?option=com_phome"

8. Mozilla Firefox Sites da Microsoft na Web 9. Delicious e Mendeley. 10. Delicious, Digg, Bookmarks do Chrome 11. basicamente delicious e os favoritos do navegador 12. Ebsco, periódico da CAPES, working papers da ANPAD 13. "ACM DIGITAL

BIBLIOTECAS DIGITAIS DE UNIVERSIDADES" 14. Preezy, Powerpoint, Adobe Premier, Xilisoft, MovieMaker, ... 15. Bibliotecas digitais (ACM, IEEE, Springer) 16. www.scielo.org , www.cpdoc.fgv.br. 17. Delicious, Diigo 18. Twitter, 19. Delicious, ACM Digital Library 20. Periódicos Capes 21. Uso muito a pesquisa interna entre os artigos da revista Techne, dentro do próprio site da editora PINI

[http://www.revistatechne.com.br/index.asp], mas este é um recurso direto da editora volta à engenharia do Brasil. Não utilizo outros recursos além daqueles ofertados pelo Google, que atendem às minhas necessidades atuais.

22. "ACM, IEEE, CiteSeerX, Engineering Village, ScienceDirect, SpringerLink, Web of Knowledge. Ferramenta: JabRef"

23. Delicious, planilhas (microsoft excel, libre office calc), google docs "Delicious Mendeley Scielo Gigablast"

24. Acm digital library 25. Portal de periódicos da CAPES 26. Evernote 27. Uso apenas os favoritos do navegador mesmo, e sincronizo eles usando o Xmarks. 28. Delicious para salvar sites, Mendeley para gerenciar arquivos, outras bibliotecas digitais com a ACM,

IEEE, Springer 29. Wikipedia, MSDN, Slideshare, scridb 30. Aplicativos e/ou extensões para marcar algum conteúdo como lista de leitura, por ex. Readability e as

Listas de Leitura do Safari

Page 114: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

114

31. googles 32. http://www.scielo.com.br/ para pesquisas de artigos cientificos 33. Yahoo Perguntas e Respostas 34. "Portal da Capes

Scielo Banco de teses e dissertações de universidades e da Capes" Costumo fazer fichamentos com o EndNote.

35. delicious, acm, wikipedia 36. Pocket, readability, instapaper, alfred. 37. GOOGLE HACKS, 38. Mendeley 39. Blogs, Tutoriais, Artigos e etc. 40. google books frequentemente, diigo, 41. Wolfram - http://www.wolframalpha.com/ 42. "Aonde.com

Scielo" 43. Yahoo! Geocities e Scielo. 44. Wikipedia, Mendeley 45. Wikipedia 46. Sempre que busco aprender sobre um assunto que foge do meu conhecimento, busco em bases de dados de

trabalhos cientificamente coomprovados como SciElo, ScienceDirect, Engineering Village, Emerald, SpringerLink, Periódicos Capes, etc.

47. Redes Sociais. 48. wikipedia 49. ACM, IEEE, Compendex, ScienceDirect, Scirus, Biblioteca digital de teses e dissertações da USP 50. "youtube

google plus sites de universidades domínio público shareslide"

51. delicious 52. "Em ordem de importância

IEEExplorer ACM Digital Library ScienceDirect"

53. Utilizo sites acadêmicos apenas (Scielo, PePsic, CAPES, PubMed, etc) 54. Google Reader, Python, Excel 55. ISI Web of Science 56. Wikipedia, Altdevblog, StackOverflow, MSDN. 57. ACM Digital Library, Google Scholar 58. ACM Digital Library, SciELO, Since Direct, IEEE Explorer, Scirus, Microsoft Academic Search, Biblioteca

Digital Brasileira de Teses e Dissertações, Biblioteca Digital Brasileira de Computação 59. Scopus, IEEE Xplore, ACM Digital Library, Science Direct, SciELO, Scribd, Google Books 60. Minha técnica é bastante rudimentar. Durante a pesquisa vou salvando as URLs dos sites que me

interessam em um arquivo TXT ou no Google Docs. Junto com as URLs coloco uma breve descrição, escrita por mim, para lembrar o que de importante existe naquele site.

61. Mendeley 62. medline, BVS 63. Pinterest, Hootsuite 64. ACM Digital Library, Períodico Capes, Google Scholar. 65. Scribd, www.dominiopublico.gov.br 66. Scielo, pubmed 67. blogs, redes sociais,

Page 115: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

115

68. Delicious 69. Scielo, Portal Periódicos, Google Acadêmico, Wiley Online Library, sites de Instituições de ensino

(Universidades), Journals. 70. Library 71. Google Earth, Google Maps, Site Brasil Escola, Site do MEC, Atlas Geográfico escolar, Site NG Brasil. 72. IEEE e ACM 73. Bible Works, Banco de dados no site da universidade 74. Mendeley, delicious 75. google, code.google.com, github 76. Delicious, ACM Digital Library, SpringerLink, Mendeley. 77. PubMed, 78. aclweb.org 79. Twitter (favoritos), DropBox (para armazenar resumos) 80. "ncbi

Web of Science pubmed"

81. Bibliotecas digitais em geral, wikipedia, páginas de grupos de pesquisas com suas publicações, páginas pessoais de pesquisadores com suas publicações, páginas com conteúdo didático, slides disponibilizados por outros professores/pesquisadores

82. ACM, Springer, IEEExplore, Delicious, 83. Mendeley 84. portal periodicos capes 85. Read It Later 86. Google e Youtube 87. getpocket.com 88. endnote 89. Blogs, Planilha Excel e o Google Reader.

Além de 22 menções explícitas de não conhecer outro recurso e/ou utilizar apenas a própria ferramenta de busca do Google. Qual recurso ou ferramenta ainda não existente você acha que seria útil para melhorar seu processo de pesquisa exploratória? 1. uma app-compendio tal qual a library.nu 2. melhorar o meu aprendizado sobre a internet pois a utilizo bastante quando tenho tempo geralmente é

minha secretaria (filha)que digita os meus trabalhos ou me orienta. 3. Acredito que uma ferramenta que "compreendesse" o assunto que estou pesquisando e desse mais

relevância aos resultados seria fantástico, pois muitas vezes palavras chaves podem conflitar entre vários assuntos

4. Um indexador de objetivos, onde voce planeja a pesquisa e então ao encontrar um resultado satisfatório relaciona aquela resposta a um tópico da sua lista de objetivos, sendo assim indexados os detalhes para dúvidas.

5. Eu sempre mantinha um email dentro da minha caixa com o endereço dos sites que achava interessante. Como não sou lá muito organizada perdia muita coisa e frequentemente tinha que abrir um por um para achar o que estava procurando. Uma ferramenta que organizasse toda a pesquisa realizada, por histórico (datas da pesquisa e de acessos), endereço e fácil acesso e retorno ao tema já encontrado (o nome e o que encontrou no site de importante ao invés do endereço eletronico), uma pesquisa dentro do que já foi encontrado (pesquisar apenas dentro do que está salvo dentro dessa ferramenta), e também poder criar nela várias pastas e subpastas, porque voce pode estar procedendo mais de uma pesquisa ao mesmo tempo.

6. logica boleana

Page 116: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

116

7. Uma ferramenta que além do links da paginas, armazenasse também os textos dentro de cada uma das paginas. Um Delicious avançado.

8. Não sei se já existe, mas acredito que seria interessante um histórico mais elaborado de navegação, com a opção de separar as buscas. Por exemplo, começo fazendo uma busca X, porém como utilizo o site de buscas pra quase tudo, então faço outra busca Y que não tem nada a ver com o conteúdo buscado em X. Logo a possibilidade de poder voltar para a busca X seria interessante.

9. acho que o delicious supre as maiores necessidades (marcação com tags e possibilidade de descrição do conteúdo) só acho que se tivesse algo que pudesse ser marcado diretamente como é feito com o favoritos no navegador (clicar na estrela, sem a necessidade de control c e v do link) ou algo que pudesse selecionar e salvar um comentário ou nota diretamente na página que estou vendo.

10. Algum recurso online que organize as informações (autor, palavras-chave, objetivos, teorias e metodologias utilizadas, etc) e mostre de forma gráfica as informações. Como se fosse uma biliometria automática.

11. Acredito que um filtro mais preciso para eliminar informações homônimas.. 12. Uma ferramenta que permitisse gerenciar o meu aprendizado/aquisição de conhecimento durante a

pesquisa exploratória 13. Um banco de dados que permita localizar todas as publicaçãos , refinadas por autor, com resumos e links

para as referências dos textos. Um editor de textos em PDF , que facilite a utilização das informações destes documentos.

14. Histórico do navegador mais amigável talvez com uma busca melhorada 15. Um resumo do que encontrou. Exemplo: foram encontrados tantos artigos do ano A, outros tanto do ano B.

Um gráfico. Atualmente só mostra a quantidade de registros encontrados. Ter uma opção para baixar todos automaticamente, ou pelo menos selecionar vários para fazer download. Existir um site que busca em todos os outros e não volta artigos repetidos seria muito bom. Exibir por conferencias/periódicos seria interessante.

16. Ferramentas que apoiam e auxiliam na revisão sistemática. 17. Um sistema que fosse eliminando do resultado de busca na Web, os assuntos ou tópicos já explorado e que

não é do meu interesse. 18. Melhor forma de apresentação da pesquisa 19. Um sistema inteligente que guardasse os assuntos/temas explorados e as páginas visitadas, semelhante ao

histórico de navegador, mas que não permitisse que qualquer pessoa apagasse. 20. Talvez uma maneira mais intuitiva e fácil de agrupar e subdividir os favoritos facilitasse bastante o

processo de pesquisa. 21. Uma ferramenta de gerenciamento/organização do conteúdo já visitado 22. Como existia uma ferramenta do Google para adicionar os favoritos na nuvem, para continuar a pesquisa

em lugares diferentes aos padrões como casa, escritório. 23. Acharia bem útil uma ferramente que organizasse o histórico de navegação 24. forma de grifar o texto na internet e ao salvar o site as partes grifadas continuarem marcadas 25. tradução automática, por exemplo pesquisar sobre um conteudo usando uma expressão de busca em

portugues e ele sugerir também artigos/resultados em outras linguas. 26. Se o próprio buscador, durante a busca, pudesse disponibilizar ferramentas de edição para fichamento de

artigos e teses e armazenasse gratuitamente essas informações para mim e para outros pesquisadores, acho que facilitaria bastante.Um dos grandes problemas que percebo durante as pesquisas exploratórias é a quantidade enorme de informações. Se isso é bom por um lado, por outro acaba nos levando a ter contato com opiniões, discussões e estudos superficiais sobre o assunto - o que pode acabar requerendo mais tempo do que o planejado para a pesquisa.

27. mais semântica 28. "A busca do histórico é ruim, se comparada às buscas de pastas e arquivos. O retorno não é imediato e a

precisão é baixa. Uma busca não existente seria como do alfred, mas mais aprimorado: hoje o alfred busca pasta, arquivos e até induz pesquisa no google/youtube/outros, mas são resultados que necessitam do browser para terminar a pesquisa. O que poderia ser feito é uma ferramenta como o alfred, mas com o retorno das buscas web no

Page 117: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

117

próprio app, mas com possibilidade de visualização no browser. Além disso, possibilidade de integração de API`s de outros serviços de consulta offline (pocket, instapaper etc)."

29. "Um filtro nos próprios buscadores que só exiba resultados de sites confiáveis e que são especialistas no ramo do interesse. Por exemplo, o Google confere pontos ao site quando aquela determinada matéria for útil ao usuário, que vota por meio de botões de ""útil"" e ""não me ajudou"", assim atribuindo ao site que mais ajuda uma melhor apresentação no buscador."

30. "tem uma extensão do diigo que tem uma série de ferramentas interessantes, como marcar partes do texto, colocar comentários sobre o texto, marcar para ler depois, mas eles ""ficam escondidos"", de uma forma que torna a atividade pouco pratica e pouco utilizada. Outro detalhe seriam formas de achar imagens já vistas, pois parte do objeto de estudo exploratório pode vir a não ser somente texto em algumas áreas (como design e comunicação), e é bem mais difícil retornar a achar uma imagem específica, do que um texto específico."

31. Sendo sincera nunca pensei em algo como um recurso ou ferramenta para melhorar minha pesquisa, mais talvez seria interessante um recurso temático em que você poderia ver o banco de dados a ser explorado não ser se isso seria possível pela imensidão de trabalhos existentes, mais as vezes as palavras chaves não ajuda encontra aquilo que se quer.

32. Uma ferramenta recomendadora baseada no interesse do usuário. 33. Uma ferramenta que me possibilitasse procurar trabalhos pelo nível de aprofundamento no assunto em

pesquisa. Se quero entender alguma metodologia, linguagem de programação, entre outros, a partir do nada me deparo com o seguinte impasse: se recorro a bases científicas, as publicações requerem um nível mínimo de entendimento sobre o assunto; se busco os termos no Google de forma irrestrita, não é possível afirmar a qualidade das informações encontradas. Assim, uma ferramenta que me ajudasse a definir o nível de aprofundamento que os trabalhos encontrados tratam sobre determinado assunto seria muito interessante.

34. Aplicativo específico para tal objetivo. 35. "Alguma forma de selecionar uma parte de um texto encontrado na internet, clicar com o botão direito e

adicionar a um ""diretório"" de ""parágrafos"" sobre determinado assunto, sendo possível pesquisar keywords nesse diretório; Após realizar uma busca, associar as páginas encontradas as keywords pesquisadas; (um dicionário da forma [keywords1 -> link1, keywords1 -> link2, keyword2 -> link1] ) Talvez essas ferramentas já existam e eu não as conheço."

36. No caso dos navegadores, acredito que o menu "Favoritos" deveria ser melhor organizado. Ele também apresenta problema de eficiência quando tem-se muitos links salvos nele. Fica muito demorado para encontrar algo que foi salvo... muitas vezes acabo recorrendo ao Google... rsrsrs. Não sei se existe outro método para organizar os links no "favoritos", mas criando pastas, apenas, não ajuda.

37. Talvez uma biblioteca com livros digitalizados de livre e gratuito acesso a todos, como numa biblioteca pública, mesmo que fosse apenas para consulta sem a possibilidade de download de materiais.

38. Acho que o pior são os sites de tradução. Muito ruim. 39. uma ferramenta que conseguisse além de integrar todas as minhas fontes, melhorar a forma como as

consultas a essas fontes sÃo feitas. seja apra encontrar pelo link ou com uma busca orgânica, buscando o conteúdo diretamente.

40. Atualmente existem ferramentas suficientes, algumas públicas e outras não. Seria muito mais interessante se o acesso fosse público sempre.

41. Um bloco de notas que acompanhasse os sites visitados. Permitindo acesso a anotações feitas em uma primeira visita.

42. Um search de conteúdo de livros disponíveis comercialmente. Exemplo: faço uma busca de "Volumetric Rendering" e a ferramenta lista todos os livros da Amazon que tratam o assunto. O search embutido da Amazon deixa bastante a desejar nesse quesito.

43. Visualização da relação dos sites listados nos resultados. 44. "Ranking de citações (existem ferramentas para isso, mas não conheço nenhum via web). 45. Mapeamento ou mapa mental de referências e trabalhos (por meio de grafos ou links)."

Page 118: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

118

46. Eu já trabalhei com o método de revisão sistemática da literatura e tive a oportunidade experimentar uma ferramenta para auxiliar neste processo denominada StArt (http://lapes.dc.ufscar.br/ferramentas/start-tool). Eu vejo este método como uma forma altamente eficiente para que possamos organizar nossas ideias e objetivos de pesquisa. Penso que a existência de mais ferramentas que apoiem ou se baseiem nesta técnica seria de grande valia para melhorar o processo de pesquisa, especialmente na pesquisa exploratória.

47. Não consigo imaginar algo especificamente. Todavia, acredito que qualquer ferramenta de apoio deve ser online. Ajuda muito você poder ter acesso aos dados da pesquisa em qualquer lugar, mesmo que não esteja com o seu próprio computador.

48. Gostaria que o histórico de navegação apresentasse não somente os links visitados mas também um thumbnail/printscreen dos sites visitados recentemente.

49. Uma ferramenta que permitisse classificar o artigo, armazenando o arquivo em disco, atribuindo algumas características, como prioridade, ano, síntese e possível conexão com o trabalho a ser desenvolvido.

50. um banco de dados de artigos científicos elencados por assunto, autor, qualificação da revista em que foi publicado

51. Sites acadêmicos e com mais referencias 52. Melhores filtros. 53. Não vejo como melhorar mais os programas que eu já uso. 54. que não repetisse tanto as informações já apresentadas 55. "Bibliotecas digitais, que não sejam vinvuladas á Universidades ou Escolas. Hoje as bilbiotecas digitais

estão vinculadas (as que eu conheço e utilizo) ás Universidades ou escolas, o que acaba por barrar o processo de pesquisa, já que muitas vezes o usuário necessita ser acadêmico ou aluno para utilizar. Porém, que nessas bibliotecas sejam disponibilizados livros (digitalizados na íntegra) não apenas partes, resumos, ou artigos (que qualquer um escrever e publicar)."

56. Gostaria que houvesse uma maneira mais enriquecida de visualizar tanto os resultados quanto o histórico das buscas.

57. PODERIA EXISTIR UMA FERRAMENTA QUE "ENTENDESSE" O QUE SE QUER PESQUISAR, FILTRANDO MELHOR O CONTEÚDO E DIRECIONANDO PARA PÁGINAS ESPECÍFICAS E DE CONTEÚDO, POIS SE ACHA MUITA INUTILIDADE NA REDE.

58. Talvez um software/extensão no qual pudesse centralizar tudo e organizar de maneira livre ou com sugestões/modelos de como organizar a pesquisa.

59. Base de dados com busca por metodologias experimentais específicas. 60. Melhorar mecanismos de buscas em redes sociais: e.g., o que meus contatos estão fazendo/compartilhando

sobre o assunto. Isso seria mto interessante no facebook. 61. Organização de histórico do navegador. 62. registrar as pesquisar no histórico por palavra-chave 63. Uma maneira eficiente de registrar a data de visita dos sites que utilizei como referência. 64. endnote gratuito

Page 119: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

119

Apêndice D Formulário de Identificação de Participante em Testes

Quero ser testador beta da Exploratory Search App (pt-BR)

Olá! Obrigado pelo seu interesse em tornar-se testador do nosso sistema de apoio à Pesquisa Exploratória.

Nosso objetivo com esse questionário é colher informações sobre seu perfil para que possamos realizar avaliações adequadas sobre sua utilização do sistema.

As informações fornecidas são vitais para o aprimoramento do sistema.

Os testadores tem a missão de nos ajudar a:

Testar a coerência e eficácia da nossa hipótese de pesquisa;

Usando a ferramenta em um ou mais projetos do seu interesse e prover feedbacks sobre sua utilidade;

Respondendo alguns questionários durante o período de uso da ferramenta, para reportar sua experiência.

Mensurar a usabilidade e satisfação do uso do sistema;

Executando algumas tarefas pré-determinadas e realizar considerações sobre elas, incluindo sugestões para facilitar o uso;

Corrigir bugs e aprimorar o sistema;

Checando o funcionamento dos recursos oferecidos pela ferramenta;

Propondo novas funcionalidades;

Reportando problemas de desempenho;

Podem também, conforme seu conhecimento: reportar erros de tradução / sugerir correções e; reportar erros de codificação (javascript/html/css);

Depois de responder este questionário, seu e-mail será incluído no grupo de testadores e após, você já poderá iniciar os testes sobre o sistema.

Para iniciar o uso do sistema você deverá instalar a extensão (disponível na Chrome Web Store apenas ao grupo de testadores) e fazer um registro no website do sistema.

O link para baixar a extensão e realizar o registro, bem como demais instruções serão enviadas por e-mail na sequência.

Muito obrigado!

---------------------------------------------------------------------------------------------

Nome Completo: _____________________

E-mail: _____________________________

Data de Nascimento : __________________

Page 120: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

120

Sexo: ( ) masculino ( ) feminino

Grau de Instrução ( ) Concluído apenas até ensino Fundamental ou Médio ( ) Graduado, não estudante no momento ( ) Graduação, pós-graduando uma especialização/MBA ( ) Graduação, pós-graduando stricto-senso (mestrado, doutorado, pós-doutorado) ( ) Especialista, não estudante no momento ( ) Mestre, não estudante no momento ( ) Doutor, não estudante no momento

Profissão: __________________

Há quanto tempo você tem essa atuação profissional? ( ) Menos de um ano ( ) Entre 1 a 2 anos ( ) Entre 3 a 5 anos ( ) Acima de 5 anos

Em média, quantas horas por semana você utiliza o computador? ( ) Até 5 horas (menos de 1h por dia, em média) ( ) Entre 5 a 10 horas (média de entre 1h e 1h30 por dia) ( ) Entre 11 e 30 horas (média de 1h30 a 4h por dia) ( ) Entre 30 a 60 horas (média de 4h a 8h por dia) ( ) Acima de 60 horas (mais que 8h por dia)

Como você se classifica em termos de experiência com a internet? ( ) Iniciante, não tenho muito conhecimento e faço poucas tarefas; ( ) Intermediário, uso habitualmente no trabalho e em casa e tenho poucas dúvidas a respeito; ( ) Avançado, possuo formação adequada ou experiência suficiente pra entender detalhes

Page 121: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

121

Apêndice E Checklist de Funcionalidades

E.1. Checklist de Testes das Funcionalidades da Extensão

Após ter usado o sistema por pelo menos cinco dias, gostaríamos que respondesse este questionário que avalia suas funcionalidades e nos servirá de guia para correções e novas implementações.

Para cada funcionalidade listada abaixo, indique se ela funcionou adequadamente ou se contém erros. Caso não a tenha utilizado, deixe em branco. Haverá depois campo apropriado para sugestões de melhorias e de novas funcionalidades. Funcionou

corretamente Não

funcionou Ocorreu um

erro

Instalar a extensão

Autenticar-se (login/senha)

Escolher projeto

Iniciar o registro das atividades

Pausar o registro das atividades

Retomar o registro das atividades

Trocar de projeto

Adicionar rating (estrelas) a um documento ou consulta

Desfazer rating

Adicionar tags em documentos

Remover tags de documentos

Fazer anotações em atividades

Remover anotações em atividades

Associar atividades com objetivos do projeto

Ocultar visita ao documento em visualização

Ocultar todas as visitas para o documento em visualização

Ocultar todas as visitas ao domínio do documento em visualização

Acessar o histórico de pesquisa

Acessar a gestão do projeto (editar projeto)

Acessar seu perfil de usuário

Fazer logout da extensão

Mostrar informações do documento atual (título, URL, tempo de visita)

Exibir na janela popup da extensão quais os resultados de uma consulta já foram visitado

Identificar na própria página de resultados do Google, quais documentos já foram visitados no projeto.

Caso alguma funcionalidade acima tenha retornado-lhe algum erro, tente descrever o contexto em que isso aconteceu e o erro retornado.

Page 122: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

122

Você acha que alguma das funcionalidades acima poderia ser melhorada de alguma forma? Como?

Indique se não gostou da aparência / forma de interagir / tempo de execução ou qualquer outro item que possa nos indicar um caminho para melhorar esta funcionalidade.

Existem algumas novas funcionalidades que você julga que poderiam ser úteis se incorporadas à extensão? Descreva-as!

E.2. Checklist de Testes das Funcionalidades da Aplicação

Servidora e Histórico de Pesquisa

Funcionalidades de Login e Senha Funcionou

corretamente Não

funcionou Ocorreu um

erro

Fazer login

Lembrar senha

Trocar senha

Fazer logout

Funcionalidades de Edição de Projetos Funcionou

corretamente Não

funcionou Ocorreu um

erro

Acessar lista de projetos

Criar novo projeto

Excluir projeto

Acessar Edição de Projeto

Editar informações básicas do projeto (título, descrição e tipo)

Adicionar e remover tags do projeto

Alterar nome e status de objetivos

Excluir objetivo

Adicionar novo objetivo

Ver últimas atividades registradas e quantidade de atividades ignoradas

Ver documentos mais visitados

Ver consultas (pesquisas) mais realizadas

Ver as tags mais utilizadas

Ver anotações

Page 123: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

123

Funcionalidades do Histórico do Projeto Funcionou

corretamente Não

funcionou Ocorreu um

erro

Acessar histórico de pesquisa

Exibir e Ocultar Opções e Filtros do Histórico

Ver detalhes da navegação (clique)

Ver detalhes da pesquisa (clique)

Alterar período de datas da apresentação do histórico

Alterar o intervalo entre sessões na apresentação do histórico

Aplicar filtros para atividades:

Somente classificadas com quantidade específica de estrelas

Somente atividades com anotação

Somente atividades associadas a objetivo determinado

Aplicar filtros para navegação:

Por nome do domínio

Por navegação com número mínimo de documentos visitados

Por documentos com tag específicas

Ocultar todas as atividades de navegação

Aplicar filtros para Pesquisa:

Por texto na consulta;

Por posterior visitação mínima nos resultados

Ocultar todas as atividades de pesquisa

Navegar pela miniatura da linha do tempo

Ocultar toda uma sessão de atividades

Mover uma navegação para outro projeto

Mover uma pesquisa para outro projeto

Funcionalidades da Tela de Preferências Funcionou

corretamente Não

funcionou Ocorreu um

erro

Acessar página de preferências

Vincular conta do Delicious

Desvincular conta do Delicious

Alterar idioma da interface

Modificar preferências de notificações

Alterar intervalo de tempo de sessão

Adicionar nome de domínio para ignorar

Remover nome de domínio da lista de domínios ignorados

Adicionar protocolo para ignorar

Remover protocolo da lista de protocolos ignorados

Adicionar extensão de arquivo para ignorar

Remover extensão da lista de extensões de arquivos ignoradas

Page 124: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

124

Apêndice F Roteiro de Testes de Usabilidade

Os testes de usabilidade foram aplicados por meio da ferramenta testrockit.com e divididos

em duas etapas.

F.1. Primeira Etapa

Esta etapa consiste de três tarefas e inicia-se a partir do link http://usabilidade-etapa-01.

Tempo estimado de 40 minutos no total de todas as tarefas desta etapa.

T01 – Instalação e autenticação

Instrução:

Consideramos que você já está familiarizado com a instalação de extensões no Google Chrome. Se você ainda não estiver com a extensão de Pesquisa Exploratória instalada no seu navegador, deve instalar antes de prosseguir com as demais tarefas. Também consideramos que você já possui um registro na aplicação servidora. Apenas para encerrar esta tarefa, acesse www.exploratorysearch.com/app e autentique-se com seu nome de usuário e senha. Relate aqui sua experiência no processo de instalação da extensão e de autenticação no sistema. ATENÇÃO: SÓ CLIQUE NO BOTÃO 'DONE' QUANDO VOCÊ REALMENTE TERMINAR TODA TAREFA. Ao final de cada tarefa lhe será dado espaço para comentar a experiência. É muito importante que você relate se teve dificuldades ou não, se tem sugestões para torná-la mais fácil ou se está satisfeito em como ela está projetada.

T02 – Suas preferências

Instrução:

Agora, você deverá acessar as preferências de uso do sistema de Pesquisa Exploratória e modificá-las conforme suas reais necessidades ou preferências de uso. Troque o idioma se preferir, ative ou desative notificações e adicione exclusões de domínios ou tipos de arquivos que você julga que não interessa mostrá-los no histórico de pesquisa. Detalhe: o idioma da interface da aplicação servidora pode ser alterado, mas o da extensão do navegador será adaptado ao idioma do seu navegador. Comente se conseguiu realizar estas tarefas sem maiores dificuldade

Page 125: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

125

T03 – Projetos e objetivos

Instrução:

Crie um projeto de pesquisa com objetivos para a situação hipotética a seguir: Imagine-se um profissional de desenvolvimento Web em uma empresa brasileira deste

segmento de porte médio (aprox. 50 funcionários). Você foi escolhido para fazer uma imersão no mercado chileno para futura abertura de uma unidade naquele país.

Para isto, você fará uma viagem ao Chile, onde irá ficar por 30 dias frequentando aulas

de alguma disciplina de um curso de sua escolha no período da manhã na Universidad Católica del Chile e estagiando numa agência digital, também de sua escolha.

A matrícula no curso e o estágio em uma empresa chilena foram oferecidos pela

associação local de fomento a novos negócios e por isso você não precisa se preocupar em fazer contato com departamentos da universidade ou com as empresas, apenas escolher o nome do curso/disciplina e da empresa.

Seu dever será então escolher as aulas que pretende assistir, a empresa onde deseja

estagiar e levantar algumas outras informações que julgar pertinente para sua estadia e ambientação no Chile. Sua viagem inicia em 30 dias.

ESTA TAREFA TERMINA APÓS VOCÊ CRIAR OS PROJETOS E OS OBJETIVOS QUE ACHAR SEREM NECESSÁRIOS PARA SUA EXECUÇÃO.

T04 – Preparar a extensão;

Instrução:

Nesta tarefa você deverá conferir se a extensão está instalada no seu navegador e escolher para uso o projeto recém-criado (da Viagem ao Chile). Você deve deixar a extensão pronta para registrar suas atividades de pesquisa neste projeto. Tendo certeza disto, você poderá encerrar esta tarefa.

T05 – Tarefas durante a navegação;

Instrução:

Você deverá realizar algumas atividades de navegação (ou pesquisa) e durante elas utilizar a extensão para incluir informações sobre alguns dos documentos visitados. Aproveite esta tarefa para pesquisar as informações que você julgar necessário para sua viagem de 30 dias ao Chile. Lembre-se dos seus objetivos! Gostaríamos que você gastasse pelo menos 20 minutos nesta atividade. Para encerrar esta atividade você deve ter tentado: 1) classificar (estrelas) alguns documentos/páginas; 2) adicionar algumas anotações durante as atividades e;

Page 126: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

126

3) criar ou associar tags que julgar ser útil para representar alguns documentos ou páginas visitadas dentro do seu espaço de pesquisa. 4) associar a atividade a um ou mais objetivos da sua pesquisa; Após ter feito isso, você pode encerrar esta tarefa. Após a tarefa, se desejar você pode pausar a extensão ou mudar de projeto. Estará encerrado aqui a primeira bateria de testes de usabilidade. Quando desejar você pode retomar este projeto e fazer mais classificações, anotações e associações de objetivos e de tags, mas a próxima etapa dos testes de usabilidade só deverão ser feitos pelo menos após 24h da execução desta.

F.2. Tarefas da 2ª Etapa

Esta etapa consiste de três tarefas e inicia-se a partir do link http://usabilidade-etapa-02.

Tempo estimado de 45 minutos no total de todas as tarefas desta etapa.

T06 – Retomar pesquisa e refazer buscas

Instrução:

Nesta tarefa você deverá retomar a pesquisa que estava fazendo para a viagem no Chile, lembra-se? Você deve preparar a extensão para voltar a registrar suas atividades neste projeto. Tente se lembrar de alguns documentos que você visitou antes e tente revisitá-los sem usar o histórico. Você talvez precise refazer algumas busca que fez nas sessões de pesquisas anteriores. Faça-as e tente verificar se a extensão lhe ajuda a relembrar as páginas já visitadas e aquelas que não foram visitadas ainda. Comente sua experiência neste sentido. Você pode continuar por mais alguns minutos neste projeto de pesquisa, tentando atingir seus outros objetivos. Depois de pelo menos 20 minutos de atividade, você poderá encerrar esta tarefa e partir para a próxima.

T07 – Conhecer o histórico da pesquisa

Instrução:

Nesta tarefa você deverá acessar o histórico da pesquisa, fornecido pela extensão.

Page 127: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

127

Estando na tela de histórico, você deve tentar entender o que representa suas atividades de navegação e o que representa suas atividades de pesquisa (busca). Tente identificar navegações em vários documentos de um mesmo site. Sinta-se livre para interagir com o histórico por um tempo e identificar as páginas que você classificou, 'taggeou' ou inseriu anotações. Tente ler as anotações. Você acredita que conseguiu compreender a representação do histórico e consultar as informações do passado? Comente sua experiência neste sentido.

T08 – Interação avançada com o histórico

Instrução:

Sua tarefa permanece dentro do histórico de pesquisa. Agora você deverá utilizar o quadro de opções e filtros do histórico para tentar modificar a visualização do histórico. Queremos que você perceba as potencialidades que a ferramenta pode trazer para sua visualização. Se achar que o histórico possui atividades inúteis ou desinteressantes para o projeto, tente excluí-las e reporte se isso te ajudou a enxergar melhor os documentos e pesquisas que têm a ver com seu projeto. Ao encerrar a tarefa, faça comentários sobre sua experiência no uso dos filtros. Esta é sua última tarefa de teste de usabilidade. Agradecemos por ter contribuído conosco.

Page 128: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

128

Apêndice G Questionário Final de Avaliação

Este questionário foi aplicado a cada participante do grupo de testes, de forma eletrônica pela

URL: http://bit.ly/questionario-avaliacao-final

Questionário Final de Avaliação

1. Quanto tempo, em média, desde que instalou a extensão, você acredita ter

realizado atividades com a extensão ativada, isto é, registrando suas atividades de

pesquisa?

Considere apenas dias de uso do navegador

( ) menos de 20 minutos por dia

( ) entre 20 minutos e uma hora por dia

( ) entre uma a duas horas por dia

( ) entre duas a quatro horas por dia

( ) quatro e oito horas por dia

( ) acima de oito horas por dia, mas não o dia todo

( ) deixei a extensão ativada o tempo inteiro

1.1 Se você utilizou a extensão ativada por menos de vinte minutos por dia,

sinalize o(s) motivo(s):

____________________________________________________________

____________________________________________________________

2. Quais dos seguintes recursos da extensão você NÃO utilizou?

Considere aqui os projetos de pesquisa realizados por seu interesse próprio, não leve

em consideração, portanto, os testes de usabilidade.

[ ] Classificar atividade com estrelas

[ ] Associar atividade a um objetivo de pesquisa

[ ] Fazer anotações em atividades

[ ] Incluir tags para representar o conteúdo de um documento/página

[ ] Ocultar uma visita a uma página ou todas as visitas à determinada página ou

Page 129: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

129

domínio.

2.1 Se você não utilizou algum dos recursos acima, sinalize o(s) motivo(s):

__________________________________________________________________

__________________________________________________________________

3. Em um grau de 1 a 5, onde 1 equivale a nada agradável e 5 equivale a muito

agradável, indique se você achou agradável a apresentação visual do histórico de

pesquisa, com linhas do tempo indicando sessões e elementos diferenciando

pesquisas e navegação?

Grau: _____

4. Em um grau de 1 a 5, onde 1 equivale a totalmente inútil e 5 equivale a muito útil,

indique a utilidade:

4.1. de poder organizar suas pesquisas exploratórias em projetos e poder alternar

entre projetos;

4.2. de poder criar objetivos para seus projetos e associar atividades a estes

objetivos;

4.3. de poder pausar e continuar sua pesquisa quando desejar, suprimindo

informações não relacionadas da visualização do histórico;

4.4. da apresentação visual do histórico de pesquisa, com linhas do tempo

indicando sessões e elementos diferenciando pesquisas e navegação;

4.5. de você visualizar no histórico informações sobre as atividades, como

classificação de relevância, tags, anotações e quantidade de páginas

navegadas;

4.6. dos filtros e opções oferecidas para refinar a visualização do histórico do

projeto;

4.7. de o sistema ocultar pesquisas que não geraram visitação em documentos

presentes nos resultados da pesquisa;

4.8. de você poder ocultar na tela de histórico as atividades ou sessões que você

julgar necessárias ou não correspondentes ao projeto;

4.9. de você poder ocultar domínios por meio da sua configuração de preferências;

Page 130: Dissertação de Thiago Prado de Campos - v2013.03.22 ...mestrado/diss/2013/campos.pdf · Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá

130

5. A forma da apresentação do histórico de pesquisa em conjunto com os demais

elementos do sistema, ajudou você, de alguma forma a compreender melhor as

atividades que você realizou e lhe proporcionou percepções para aprimorar suas

atividades de pesquisa? Indique entre 1 (não ajudou em nada) ou 5 (ajudou

muito).

Valor: ______

6. Dê uma nota de 0 a 10 para o sistema em geral, onde:

- Com zero, você demonstra estar muito insatisfeito com o sistema, não tendo ele

qualquer utilidade nas suas tarefas de pesquisa exploratória e

- Com dez, você demonstra estar plenamente satisfeito com o sistema, tendo ele muita

utilidade para apoiar suas tarefas de pesquisa exploratória.

Nota: __________

6.1 Se você não deu nota 10 na pergunta anterior, indique aqui o que falta

ao sistema para que você possa considerá-lo muito útil e tornar-se

plenamente satisfeito.

____________________________________________________________

____________________________________________________________

7 Você substituiria o convencional histórico de navegação do navegador pela solução

por nós apresentada?

Considere a solução devidamente integrada ao navegador (e com sua conta do Google) e

com aprimoramentos de desempenho;

( ) Sim, com certeza.

( ) Sim, mas com as ressalvas indicadas na questão 9.

( ) Não, de forma alguma.

8 Adicione outras considerações que julgar necessário sobre sua avaliação do sistema

(extensão e aplicação servidora).

________________________________________________________________________

________________________________________________________________________