aluno: ricardo martins bernardes gesid/ppga/ea/ufrgs ufrgs um estudo sobre a demanda de...

39
Aluno: Ricardo Martins Bernardes GESID/PPGA/EA/UFRGS UFRGS Um estudo sobre a demanda de informações Um estudo sobre a demanda de informações em em sites Web sites Web : o caso de uma unidade de : o caso de uma unidade de pesquisa de uma empresa de P&D para o pesquisa de uma empresa de P&D para o agronegócio brasileiro agronegócio brasileiro Aluno: Ricardo Martins Bernardes Aluno: Ricardo Martins Bernardes Orientador: Professor Dr. Henrique Freitas Orientador: Professor Dr. Henrique Freitas

Upload: internet

Post on 17-Apr-2015

103 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Aluno: Ricardo Martins Bernardes GESID/PPGA/EA/UFRGS UFRGS Um estudo sobre a demanda de informações em sites Web: o caso de uma unidade de pesquisa de

Aluno: Ricardo Martins Bernardes GESID/PPGA/EA/UFRGS

UFRGS

Um estudo sobre a demanda de informações em Um estudo sobre a demanda de informações em sites sites WebWeb: o caso de uma unidade de pesquisa de uma : o caso de uma unidade de pesquisa de uma

empresa de P&D para o agronegócio brasileiroempresa de P&D para o agronegócio brasileiro

Aluno: Ricardo Martins BernardesAluno: Ricardo Martins Bernardes

Orientador: Professor Dr. Henrique FreitasOrientador: Professor Dr. Henrique Freitas

Page 2: Aluno: Ricardo Martins Bernardes GESID/PPGA/EA/UFRGS UFRGS Um estudo sobre a demanda de informações em sites Web: o caso de uma unidade de pesquisa de

Aluno: Ricardo Martins Bernardes GESID/PPGA/EA/UFRGS

AgendaAgenda

Tema e justificativaTema e justificativa Objetivo GeralObjetivo Geral Objetivos específicosObjetivos específicos Referencial teóricoReferencial teórico MétodoMétodo de de pesquisapesquisa ResultadosResultados ConclusõesConclusões

Page 3: Aluno: Ricardo Martins Bernardes GESID/PPGA/EA/UFRGS UFRGS Um estudo sobre a demanda de informações em sites Web: o caso de uma unidade de pesquisa de

Aluno: Ricardo Martins Bernardes GESID/PPGA/EA/UFRGS

WebWeb: um canal de negócios em : um canal de negócios em expansãoexpansão

e-commercee-commerce: crescimento exponencial: crescimento exponencial Impacto nas organizaçõesImpacto nas organizações Evolução da mídia Evolução da mídia Internet Internet & &

Convergência tecnológicaConvergência tecnológica

Page 4: Aluno: Ricardo Martins Bernardes GESID/PPGA/EA/UFRGS UFRGS Um estudo sobre a demanda de informações em sites Web: o caso de uma unidade de pesquisa de

Aluno: Ricardo Martins Bernardes GESID/PPGA/EA/UFRGS

Evolução da mídia InternetEvolução da mídia Internet

Servidor Web2

Internet

6

99

Usuário Web2 modem

modem

Servidor Web

Qualquerdispositivo

Qualquermeio

Internet Qualquer meio

Usuário Web

Page 5: Aluno: Ricardo Martins Bernardes GESID/PPGA/EA/UFRGS UFRGS Um estudo sobre a demanda de informações em sites Web: o caso de uma unidade de pesquisa de

Aluno: Ricardo Martins Bernardes GESID/PPGA/EA/UFRGS

Foco do EstudoFoco do Estudo

Necessidade de estudos de Necessidade de estudos de audiência em audiência em sitessites

Customização e personalização de Customização e personalização de conteúdosconteúdos

Análise de aderência Análise de aderência sitesite X missão X missão

Page 6: Aluno: Ricardo Martins Bernardes GESID/PPGA/EA/UFRGS UFRGS Um estudo sobre a demanda de informações em sites Web: o caso de uma unidade de pesquisa de

Aluno: Ricardo Martins Bernardes GESID/PPGA/EA/UFRGS

Objetivo GeralObjetivo Geral

Compreender a demanda por Compreender a demanda por informações em um site Web, informações em um site Web, através da análise de registros através da análise de registros

de acessos (log de transações), de acessos (log de transações), visando sua configuração e visando sua configuração e

evoluçãoevolução

Page 7: Aluno: Ricardo Martins Bernardes GESID/PPGA/EA/UFRGS UFRGS Um estudo sobre a demanda de informações em sites Web: o caso de uma unidade de pesquisa de

Aluno: Ricardo Martins Bernardes GESID/PPGA/EA/UFRGS

Objetivos EspecíficosObjetivos Específicos coletar os registros de navegação de usuários através das páginas de conteúdo coletar os registros de navegação de usuários através das páginas de conteúdo

((clickstreamclickstream), bem como os registros de palavras-chave (), bem como os registros de palavras-chave (keywordskeywords) utilizadas no ) utilizadas no

mecanismo de busca do site Web;mecanismo de busca do site Web;

aplicar procedimentos quantitativos tradicionais visando elucidar as métricas básicas aplicar procedimentos quantitativos tradicionais visando elucidar as métricas básicas

de acesso ao site Web;de acesso ao site Web;

analisar e discutir os registros de navegação de usuários através das páginas do site, analisar e discutir os registros de navegação de usuários através das páginas do site,

procurando definir suas preferências de navegação e de conteúdo;procurando definir suas preferências de navegação e de conteúdo;

analisar e discutir as necessidades explícitas de consumo de informações, contidas no analisar e discutir as necessidades explícitas de consumo de informações, contidas no

registro de palavras-chave utilizadas pelos visitantes no mecanismo de busca do site;registro de palavras-chave utilizadas pelos visitantes no mecanismo de busca do site;

discutir as informações obtidas, verificando sua adeqüabilidade à estratégia da discutir as informações obtidas, verificando sua adeqüabilidade à estratégia da

organização em estudo;organização em estudo;

tecer algumas considerações visando orientar futuros estudos de análise de logs.tecer algumas considerações visando orientar futuros estudos de análise de logs.

Page 8: Aluno: Ricardo Martins Bernardes GESID/PPGA/EA/UFRGS UFRGS Um estudo sobre a demanda de informações em sites Web: o caso de uma unidade de pesquisa de

Aluno: Ricardo Martins Bernardes GESID/PPGA/EA/UFRGS

Método de PesquisaMétodo de Pesquisa

Nível e Nível e designdesign de pesquisa de pesquisa

Estudo de casoEstudo de caso

Fontes de evidênciaFontes de evidência

Estudo simples & múltiplos sub-estudosEstudo simples & múltiplos sub-estudos

Nível exploratórioNível exploratório

Page 9: Aluno: Ricardo Martins Bernardes GESID/PPGA/EA/UFRGS UFRGS Um estudo sobre a demanda de informações em sites Web: o caso de uma unidade de pesquisa de

Aluno: Ricardo Martins Bernardes GESID/PPGA/EA/UFRGS

Escopo da investigaçãoEscopo da investigação

Mecanismo deBusca/ Outro

Site

Visitante

Pré-processamento,

uso de pacotes

estatísticos e de

mineração de dados

Análise de

padrões de

navegação e de

preferências

Melhor agrupamento derecursos, melhoria na

recuperação de informações,subsídios para e-estratégia, etc

Necessidades de Informação

Informação acessada

Registro de Transações(logs de acesso às páginas,logs de mecanismos de

busca)

Site Web

Page 10: Aluno: Ricardo Martins Bernardes GESID/PPGA/EA/UFRGS UFRGS Um estudo sobre a demanda de informações em sites Web: o caso de uma unidade de pesquisa de

Aluno: Ricardo Martins Bernardes GESID/PPGA/EA/UFRGS

ResultadosResultados

Estatísticas gerais de acesso ao site Estatísticas gerais de acesso ao site

Preferências e padrões primários de Preferências e padrões primários de

navegação dos visitantes no site navegação dos visitantes no site

Preferências explícitas dos visitantes, Preferências explícitas dos visitantes,

simbolizadas pelos termos inseridos no simbolizadas pelos termos inseridos no

mecanismo de busca do site mecanismo de busca do site

Page 11: Aluno: Ricardo Martins Bernardes GESID/PPGA/EA/UFRGS UFRGS Um estudo sobre a demanda de informações em sites Web: o caso de uma unidade de pesquisa de

Aluno: Ricardo Martins Bernardes GESID/PPGA/EA/UFRGS

Métricas de freqüência e de tempo de Métricas de freqüência e de tempo de exposição do exposição do site:site:

duração da sessãoduração da sessão

número de número de pageviewspageviews / sessão / sessão

origem de primeiro e segundo níveisorigem de primeiro e segundo níveis

distribuição dos acessos no tempodistribuição dos acessos no tempo

Page 12: Aluno: Ricardo Martins Bernardes GESID/PPGA/EA/UFRGS UFRGS Um estudo sobre a demanda de informações em sites Web: o caso de uma unidade de pesquisa de

Aluno: Ricardo Martins Bernardes GESID/PPGA/EA/UFRGS

Preferências e padrões primários de Preferências e padrões primários de navegação (navegação (clickstream)clickstream)

primeiras ações ao entrar no primeiras ações ao entrar no sitesite

ferramenta utilizada para consultasferramenta utilizada para consultasex.: A-B*, A*B*...ex.: A-B*, A*B*...

conteúdo preferido no primeiro conteúdo preferido no primeiro clickclick

atividades P&D, publicações, serviços, atividades P&D, publicações, serviços,

......

Page 13: Aluno: Ricardo Martins Bernardes GESID/PPGA/EA/UFRGS UFRGS Um estudo sobre a demanda de informações em sites Web: o caso de uma unidade de pesquisa de

Aluno: Ricardo Martins Bernardes GESID/PPGA/EA/UFRGS

Primeiro Primeiro clickclick no no sitesite

Home-Page2973

A

Índice de Serviços

D

Mecanismo de

Busca do Site

E

Índice de Novidades

F

Informações sobre a Unidade

GInformações sobre a Equipe

Técnica

H

Missão/Objetivos

da Unidade

I

Índice de atividades de

Pesquisa

B

Índice de Publicações

C

Índice de informações

sobre a Unidade

J

506; 17,0%437; 14,7%

407; 13,7%

343; 11,5%

261; 8,8%

199; 6,7%

181; 6,1%

171; 5,8%

126; 4,2%

Page 14: Aluno: Ricardo Martins Bernardes GESID/PPGA/EA/UFRGS UFRGS Um estudo sobre a demanda de informações em sites Web: o caso de uma unidade de pesquisa de

Aluno: Ricardo Martins Bernardes GESID/PPGA/EA/UFRGS

Termos de consulta (Termos de consulta (keywordskeywords))

origemorigem freqüênciafreqüência termos mais utilizadostermos mais utilizados pertinênciapertinência

Page 15: Aluno: Ricardo Martins Bernardes GESID/PPGA/EA/UFRGS UFRGS Um estudo sobre a demanda de informações em sites Web: o caso de uma unidade de pesquisa de

Aluno: Ricardo Martins Bernardes GESID/PPGA/EA/UFRGS

Palavras-chave utilizadas pelos visitantesPalavras-chave utilizadas pelos visitantesConsiderando o contextoConsiderando o contexto

Contexto da consulta Freqüência (%)

Dentro do Contexto da Unidade de P&D 1.866 64,2

Fora do contexto da Unidade mas dentro do

contexto da Embrapa

463 15,9

Fora do contexto da Unidade e da Embrapa,

mas dentro do contexto do agronegócio

105 3,6

Dúbio ou não identificado 177 6,1

Informações administrativas 128 4,4

Fora do contexto do Agronegócio 94 3,2

Busca por Receitas 72 2,5

Total 2.905 100,0

Page 16: Aluno: Ricardo Martins Bernardes GESID/PPGA/EA/UFRGS UFRGS Um estudo sobre a demanda de informações em sites Web: o caso de uma unidade de pesquisa de

Aluno: Ricardo Martins Bernardes GESID/PPGA/EA/UFRGS

ConclusõesConclusões

Quanto ao objetivo do estudo:Quanto ao objetivo do estudo:

planejamento físico & lógico do planejamento físico & lógico do sitesite subsídiossubsídios::

fortalecimento de relaçõesfortalecimento de relações

articulação com ecossistemaarticulação com ecossistema

demanda por informações demanda por informações

aderência com a proposta da organização aderência com a proposta da organização

Page 17: Aluno: Ricardo Martins Bernardes GESID/PPGA/EA/UFRGS UFRGS Um estudo sobre a demanda de informações em sites Web: o caso de uma unidade de pesquisa de

Aluno: Ricardo Martins Bernardes GESID/PPGA/EA/UFRGS

ConclusõesConclusões

Quanto aos aspectos práticos e metodológicosQuanto aos aspectos práticos e metodológicos ferramentas e dadosferramentas e dados desenho prévio do desenho prévio do sitesite preparação de dadospreparação de dados

aspectos dependentes do siteaspectos dependentes do siteaspectos independentes do siteaspectos independentes do site

potencial para novos estudospotencial para novos estudos potencial para deselvolvimento de métodospotencial para deselvolvimento de métodos estratégia de pesquisaestratégia de pesquisa

Page 18: Aluno: Ricardo Martins Bernardes GESID/PPGA/EA/UFRGS UFRGS Um estudo sobre a demanda de informações em sites Web: o caso de uma unidade de pesquisa de

Aluno: Ricardo Martins Bernardes GESID/PPGA/EA/UFRGS

UFRGS

Um estudo sobre a demanda de informações em Um estudo sobre a demanda de informações em sites sites WebWeb: o caso de uma unidade de pesquisa de uma : o caso de uma unidade de pesquisa de uma

empresa de P&D para o agronegócio brasileiroempresa de P&D para o agronegócio brasileiro

Aluno: Ricardo Martins BernardesAluno: Ricardo Martins Bernardes

Orientador: Professor Dr. Henrique FreitasOrientador: Professor Dr. Henrique Freitas

Page 19: Aluno: Ricardo Martins Bernardes GESID/PPGA/EA/UFRGS UFRGS Um estudo sobre a demanda de informações em sites Web: o caso de uma unidade de pesquisa de

FIM DA APRESENTAÇÃOFIM DA APRESENTAÇÃO

O restante dos slides são para O restante dos slides são para fundamentar respostas à bancafundamentar respostas à banca

Page 20: Aluno: Ricardo Martins Bernardes GESID/PPGA/EA/UFRGS UFRGS Um estudo sobre a demanda de informações em sites Web: o caso de uma unidade de pesquisa de

Aluno: Ricardo Martins Bernardes GESID/PPGA/EA/UFRGS

Linhas de investigação em Linhas de investigação em Web MiningWeb Mining

Mineração Web

Mineração de

Conteúdo de

Páginas

Mineração para

Resultado de

Buscas

Padrões Gerais

de Acesso

Customização

de uso

Mineração de

Conteúdo Web

Mineração de

Estrutura Web

Mineração de

Uso Web

Page 21: Aluno: Ricardo Martins Bernardes GESID/PPGA/EA/UFRGS UFRGS Um estudo sobre a demanda de informações em sites Web: o caso de uma unidade de pesquisa de

Aluno: Ricardo Martins Bernardes GESID/PPGA/EA/UFRGS

Conjunto de dadosConjunto de dados

Limpeza dos dados e definição da amostraLimpeza dos dados e definição da amostra

Conjunto 1: Conjunto 1: clickstreamclickstream registro de páginas transferidas com sucesso para visitantes não registro de páginas transferidas com sucesso para visitantes não

identificados, oriundos do domínio '.br' , que acessaram mais de identificados, oriundos do domínio '.br' , que acessaram mais de uma página - diferentes - durante a visita, no período de 2 de uma página - diferentes - durante a visita, no período de 2 de fevereiro de 1999 a 30 de abril de 2000.fevereiro de 1999 a 30 de abril de 2000.

Conjunto 2: Conjunto 2: keywordskeywords palavras-chave inseridas no mecanismo de busca do site entre às palavras-chave inseridas no mecanismo de busca do site entre às

18h25 horas de 08/11/1999 e 11h09 horas de 15/06/2000.18h25 horas de 08/11/1999 e 11h09 horas de 15/06/2000.

Page 22: Aluno: Ricardo Martins Bernardes GESID/PPGA/EA/UFRGS UFRGS Um estudo sobre a demanda de informações em sites Web: o caso de uma unidade de pesquisa de

Aluno: Ricardo Martins Bernardes GESID/PPGA/EA/UFRGS

Descrição dos dadosDescrição dos dados

dados de navegação do visitante (dados de navegação do visitante (clickstreamclickstream))::

Conjunto de dadosConjunto de dados

...scm619.ufrgs.br - - [30/Jun/1999:20:40:01 -0300] "GET /index.html HTTP/1.0" 200 15300scm619.ufrgs.br - - [30/Jun/1999:20:42:09 -0300] "GET /images/logotipo.gif HTTP/1.0" 200 10234scm619.ufrgs.br - - [30/Jun/1999:20:44:09 -0300] "GET /unidade/equipe.html HTTP/1.0" 200 37285...

Page 23: Aluno: Ricardo Martins Bernardes GESID/PPGA/EA/UFRGS UFRGS Um estudo sobre a demanda de informações em sites Web: o caso de uma unidade de pesquisa de

Aluno: Ricardo Martins Bernardes GESID/PPGA/EA/UFRGS

Descrição dos dadosDescrição dos dadospalavras-chave (palavras-chave (keywordskeywords) inseridas no mecanismo de busca) inseridas no mecanismo de busca

Conjunto de dadosConjunto de dados

Page 24: Aluno: Ricardo Martins Bernardes GESID/PPGA/EA/UFRGS UFRGS Um estudo sobre a demanda de informações em sites Web: o caso de uma unidade de pesquisa de

Aluno: Ricardo Martins Bernardes GESID/PPGA/EA/UFRGS

Fundamentação TeóricaFundamentação Teórica

Rede, Estratégia e SobrevivênciaRede, Estratégia e Sobrevivência

Internet, Web & convergência tecnológica Internet, Web & convergência tecnológica

O fenômeno da rede Web:O fenômeno da rede Web:

popularização exponencialpopularização exponencial

A resposta das Empresas A resposta das Empresas

Usuários, suas trilhas e comportamentoUsuários, suas trilhas e comportamento

Page 25: Aluno: Ricardo Martins Bernardes GESID/PPGA/EA/UFRGS UFRGS Um estudo sobre a demanda de informações em sites Web: o caso de uma unidade de pesquisa de

Aluno: Ricardo Martins Bernardes GESID/PPGA/EA/UFRGS

Método de PesquisaMétodo de Pesquisa

Nível e Nível e designdesign da pesquisa da pesquisa O Caso - contextualizaçãoO Caso - contextualização O EstudoO Estudo

descrição dos dadosdescrição dos dados limites e pressupostoslimites e pressupostos limpeza dos dados e definição da amostralimpeza dos dados e definição da amostra

Page 26: Aluno: Ricardo Martins Bernardes GESID/PPGA/EA/UFRGS UFRGS Um estudo sobre a demanda de informações em sites Web: o caso de uma unidade de pesquisa de

Aluno: Ricardo Martins Bernardes GESID/PPGA/EA/UFRGS

O casoO caso

contextualizaçãocontextualização

Empresa de P&D para o agronegócioEmpresa de P&D para o agronegócio Mudança orientaçãoMudança orientação

produto -> mercadoproduto -> mercado

P -> P&DP -> P&D

Page 27: Aluno: Ricardo Martins Bernardes GESID/PPGA/EA/UFRGS UFRGS Um estudo sobre a demanda de informações em sites Web: o caso de uma unidade de pesquisa de

Aluno: Ricardo Martins Bernardes GESID/PPGA/EA/UFRGS

Método de PesquisaMétodo de Pesquisa

O EstudoO Estudo Limites e pressupostosLimites e pressupostos

quanto à origem e identificação dos acessosquanto à origem e identificação dos acessos quanto à estruturação das sessões e visitantesquanto à estruturação das sessões e visitantes quanto ao tempo de exposição de páginas e do quanto ao tempo de exposição de páginas e do

sitesite quanto à ação dequanto à ação de robots robots e e spidersspiders outros aspectos outros aspectos

Page 28: Aluno: Ricardo Martins Bernardes GESID/PPGA/EA/UFRGS UFRGS Um estudo sobre a demanda de informações em sites Web: o caso de uma unidade de pesquisa de

Aluno: Ricardo Martins Bernardes GESID/PPGA/EA/UFRGS

FerramentasFerramentas

Windows 98,DOS e Solaris 2,xWindows 98,DOS e Solaris 2,x dbase IV, Basicdbase IV, Basic SAS, stata, C4.5SAS, stata, C4.5 WUNWUN

Page 29: Aluno: Ricardo Martins Bernardes GESID/PPGA/EA/UFRGS UFRGS Um estudo sobre a demanda de informações em sites Web: o caso de uma unidade de pesquisa de

Aluno: Ricardo Martins Bernardes GESID/PPGA/EA/UFRGS

Alguns resultadosAlguns resultados

Em média, o visitante requisitou 5,7 páginas, e ficou Em média, o visitante requisitou 5,7 páginas, e ficou

conectado aproximadamente 8m:36s no siteconectado aproximadamente 8m:36s no site

Instituições de ensino e pesquisa do RS apresentaram Instituições de ensino e pesquisa do RS apresentaram

uma média de 6,4 uma média de 6,4 pageviews pageviews por sessão por sessão

Apenas 2,8% do total de domínios de terceiro nível Apenas 2,8% do total de domínios de terceiro nível

registrados (19 organizações), foram responsáveis por registrados (19 organizações), foram responsáveis por

38,9% das sessões realizadas no site. 38,9% das sessões realizadas no site.

Existe uma predominância de provedores que servem a Existe uma predominância de provedores que servem a

Região Sul e Sudeste do BrasilRegião Sul e Sudeste do Brasil

Page 30: Aluno: Ricardo Martins Bernardes GESID/PPGA/EA/UFRGS UFRGS Um estudo sobre a demanda de informações em sites Web: o caso de uma unidade de pesquisa de

Aluno: Ricardo Martins Bernardes GESID/PPGA/EA/UFRGS

Alguns resultadosAlguns resultados

Considerando apenas instituições de ensino e pesquisa Considerando apenas instituições de ensino e pesquisa do RS, a Urcamp foi responsável por 45% das sessõesdo RS, a Urcamp foi responsável por 45% das sessões

UNISC e UCPEL tiveram o maior número de UNISC e UCPEL tiveram o maior número de pageviewspageviews por sessão (7,0 e 6,7)por sessão (7,0 e 6,7)

20,1% das sessões ocorreram nos finais-de-semana20,1% das sessões ocorreram nos finais-de-semana 46,2% das sessões ocorreram fora do horário de 46,2% das sessões ocorreram fora do horário de

expedienteexpediente 26,9% das sessões tiveram duração superior a 10 26,9% das sessões tiveram duração superior a 10

minutosminutos 73,0% das sessões era constituída por 1 a 6 páginas73,0% das sessões era constituída por 1 a 6 páginas

Page 31: Aluno: Ricardo Martins Bernardes GESID/PPGA/EA/UFRGS UFRGS Um estudo sobre a demanda de informações em sites Web: o caso de uma unidade de pesquisa de

Aluno: Ricardo Martins Bernardes GESID/PPGA/EA/UFRGS

Alguns resultadosAlguns resultados

82,7% da freqüência ao mecanismo de busca, apareceu do 82,7% da freqüência ao mecanismo de busca, apareceu do quarto click em diantequarto click em diante

45,4% do primeiro click recaiu sobre os links "Índice de 45,4% do primeiro click recaiu sobre os links "Índice de Atividades de Pesquisa" (17%), "Publicações" (14,7%) e Atividades de Pesquisa" (17%), "Publicações" (14,7%) e "Serviços" (13,7%)"Serviços" (13,7%)

Outras unidades de negócios da organização que mantém Outras unidades de negócios da organização que mantém o o sitesite procuraram, predominantemente, informações sobre procuraram, predominantemente, informações sobre a “Equipe Técnica” (66 de 181 casos)a “Equipe Técnica” (66 de 181 casos)

os links "Consultoria em Nutrição Animal" e "Laboratório os links "Consultoria em Nutrição Animal" e "Laboratório de Nutrição Animal" foram a primeira escolha de 26,4% dos de Nutrição Animal" foram a primeira escolha de 26,4% dos visitantes que acessaram o portfolio de produtos e serviçosvisitantes que acessaram o portfolio de produtos e serviços

Page 32: Aluno: Ricardo Martins Bernardes GESID/PPGA/EA/UFRGS UFRGS Um estudo sobre a demanda de informações em sites Web: o caso de uma unidade de pesquisa de

Aluno: Ricardo Martins Bernardes GESID/PPGA/EA/UFRGS

Alguns resultadosAlguns resultados

em média, o tempo entre consultas na mesma sessão em média, o tempo entre consultas na mesma sessão ficou 2m:49sficou 2m:49s

o percentual de consultas relacionadas diretamente à o percentual de consultas relacionadas diretamente à missão da unidade de pesquisa foi 64,2%missão da unidade de pesquisa foi 64,2%

as consultas cobertas pela missão da empresa as consultas cobertas pela missão da empresa representaram 80,1%. representaram 80,1%.

o percentual das consultas dentro do contexto do o percentual das consultas dentro do contexto do agronegócio, totalizou 83,7% agronegócio, totalizou 83,7%

Page 33: Aluno: Ricardo Martins Bernardes GESID/PPGA/EA/UFRGS UFRGS Um estudo sobre a demanda de informações em sites Web: o caso de uma unidade de pesquisa de

Aluno: Ricardo Martins Bernardes GESID/PPGA/EA/UFRGS

Alguns resultadosAlguns resultados

2.362 termos consultados foram reduzidos para 435 2.362 termos consultados foram reduzidos para 435 termos diferentes após a sumarizaçãotermos diferentes após a sumarização

42,5% das consultas giravam em torno de 4,1% dos 42,5% das consultas giravam em torno de 4,1% dos termostermos

82,7% das consultas buscavam as espécies animais 82,7% das consultas buscavam as espécies animais cobertas pela missão da Unidade (bovinocultura e cobertas pela missão da Unidade (bovinocultura e ovinocultura)ovinocultura)

Page 34: Aluno: Ricardo Martins Bernardes GESID/PPGA/EA/UFRGS UFRGS Um estudo sobre a demanda de informações em sites Web: o caso de uma unidade de pesquisa de

Aluno: Ricardo Martins Bernardes GESID/PPGA/EA/UFRGS

Palavras-chave utilizadas pelos visitantesPalavras-chave utilizadas pelos visitantes

Termo utilizado pelo visitante Freqüência

ovinos 81pecuária 67ovinocultura 58confinamento 48campos 37pastagens 29gado de corte 28pastagem 27ovino 17leite 16bovinos 15caprinos 14gado 14suínos 13gado de leite 11história da pecuária 10suinocultura 10Sub-total(%)

495(20,4)

outros(%)

1.931(79,6)

Total(%)

2.426(100,0)

Page 35: Aluno: Ricardo Martins Bernardes GESID/PPGA/EA/UFRGS UFRGS Um estudo sobre a demanda de informações em sites Web: o caso de uma unidade de pesquisa de

Aluno: Ricardo Martins Bernardes GESID/PPGA/EA/UFRGS

Palavras-chave utilizadas pelos visitantes, Palavras-chave utilizadas pelos visitantes, após classificadas pelo Thesagroapós classificadas pelo Thesagro

Termo classificado pelo Thesagro Freqüência

pecuária 188ovino 155confinamento 89pastagem 81ovinocultura 64campo 62gado de corte 53instalação para animal 46nutrição animal 32leite 30bovino 29gado leiteiro 28gado 27ovelha 27doenca animal 26planta forrageira 23caprino 22capim 22Sub-total(%)

1.004(42,5)

outros termos(%)

1.358(57,5)

Total(%)

2.362(100,0)

Page 36: Aluno: Ricardo Martins Bernardes GESID/PPGA/EA/UFRGS UFRGS Um estudo sobre a demanda de informações em sites Web: o caso de uma unidade de pesquisa de

Aluno: Ricardo Martins Bernardes GESID/PPGA/EA/UFRGS

Atividades de criação Atividades de criação

Atividade de criação

Explícita

na

consulta

Implícita

na

sessão

Bovinocultura 412 161

Ovinocultura 377 21

Caprinocultura 43 1

Suínocultura 42 6

Avicultura 32 1

Psicultura 23 0

Bubalinocultura 13 1

Eqüinocultura 14 0

Outras atividades 27 0

Totais 983 191

Total Geral 1.174

Page 37: Aluno: Ricardo Martins Bernardes GESID/PPGA/EA/UFRGS UFRGS Um estudo sobre a demanda de informações em sites Web: o caso de uma unidade de pesquisa de

Aluno: Ricardo Martins Bernardes GESID/PPGA/EA/UFRGS

Um exemplo de saída do programa c4.5Um exemplo de saída do programa c4.5

......

Rule 13:Rule 13:

pageviews <= 7pageviews <= 7

-> class nao acessou o feedback [99.0%]-> class nao acessou o feedback [99.0%]

Rule 17:Rule 17:

pageviews > 7pageviews > 7

tempo > 241tempo > 241

tempo <= 467tempo <= 467

-> class nao acessou o feedback [98.4%]-> class nao acessou o feedback [98.4%]

Default class: nao acessou o feedbackDefault class: nao acessou o feedback

Evaluation on training data (4729 items):Evaluation on training data (4729 items):

Rule Size Error Used Wrong AdvantageRule Size Error Used Wrong Advantage

---- ---- ----- ---- ----- ------------- ---- ----- ---- ----- ---------

....................

13 1 1.0% 3918 32 (0.8%) 0 (0|0) nao acessou o feedback13 1 1.0% 3918 32 (0.8%) 0 (0|0) nao acessou o feedback

17 3 1.6% 86 0 (0.0%) 0 (0|0) nao acessou o feedback17 3 1.6% 86 0 (0.0%) 0 (0|0) nao acessou o feedback

Tested 4729, errors 91 (1.9%) <<Tested 4729, errors 91 (1.9%) <<

(a) (b) <-classified as(a) (b) <-classified as

---- -------- ----

51 74 (a): class acessou o feedback51 74 (a): class acessou o feedback

17 4587 (b): class nao acessou o feedback17 4587 (b): class nao acessou o feedback

Page 38: Aluno: Ricardo Martins Bernardes GESID/PPGA/EA/UFRGS UFRGS Um estudo sobre a demanda de informações em sites Web: o caso de uma unidade de pesquisa de

Aluno: Ricardo Martins Bernardes GESID/PPGA/EA/UFRGS

Um exemplo de saída do programa c4.5Um exemplo de saída do programa c4.5

C4.5 [release 5] rule generator Wed Nov 1 13:45:14 2000C4.5 [release 5] rule generator Wed Nov 1 13:45:14 2000

--------------------------------------------------------------

Read 2905 cases (3 attributes) from busca2Read 2905 cases (3 attributes) from busca2

------------------------------------

Processing tree 0Processing tree 0

Final rules from tree 0:Final rules from tree 0:

......

Rule 88:Rule 88:

Termo Thesagro = alimento animalTermo Thesagro = alimento animal

class Apr [41.7%]class Apr [41.7%]

......

Rule Size Error Used Wrong AdvantageRule Size Error Used Wrong Advantage

---- ---- ----- ---- ----- ------------- ---- ----- ---- ----- ---------

88 1 58.3% 46 24 (52.2%) 12(22|10) Apr88 1 58.3% 46 24 (52.2%) 12(22|10) Apr

......

Tested 2905, errors 1974 (68.0%) <<Tested 2905, errors 1974 (68.0%) <<

Page 39: Aluno: Ricardo Martins Bernardes GESID/PPGA/EA/UFRGS UFRGS Um estudo sobre a demanda de informações em sites Web: o caso de uma unidade de pesquisa de

Aluno: Ricardo Martins Bernardes GESID/PPGA/EA/UFRGS

Estrutura do arquivo de sessõesEstrutura do arquivo de sessões

Structure for database: E:\TUDONOVO\FILES\DBF\Structure for database: E:\TUDONOVO\FILES\DBF\SESSAOBR.DBFSESSAOBR.DBF

Number of data records: 4968Number of data records: 4968

Date of last update : 13/11/00Date of last update : 13/11/00

Field Field Name Type Width Dec Field Field Name Type Width Dec IndexIndex

NUMEROSESS Character 6 NNUMEROSESS Character 6 N

HOSTACESSO Numeric 5 NHOSTACESSO Numeric 5 N

NAORESOLV Numeric 1 NNAORESOLV Numeric 1 N

DOMNUMERO Numeric 5 NDOMNUMERO Numeric 5 N

DOMPARTE1 Character 5 NDOMPARTE1 Character 5 N

DOMPARTE2 Character 15 NDOMPARTE2 Character 15 N

DOMPARTE2R Character 15 NDOMPARTE2R Character 15 N

DOMPARTE3 Character 15 NDOMPARTE3 Character 15 N

DATAACESSO Date 8 NDATAACESSO Date 8 N

DIASEMACES Character 3 NDIASEMACES Character 3 N

HORAACESSO Character 6 NHORAACESSO Character 6 N

CONTAHOST Numeric 3 NCONTAHOST Numeric 3 N

ELAPDAYS Numeric 4 NELAPDAYS Numeric 4 N

ROBOTS Numeric 1 NROBOTS Numeric 1 N

PAGINAS Character 205 NPAGINAS Character 205 N

PAGINASS Character 254 NPAGINASS Character 254 N

PAGINASST Character 254 NPAGINASST Character 254 N

PAGINASSV Character 254 NPAGINASSV Character 254 N

PAGINASSA Character 70 NPAGINASSA Character 70 N

TOTSEGSES Numeric 5 NTOTSEGSES Numeric 5 N

NUMPAG Numeric 3 NNUMPAG Numeric 3 N

NUMPAGT Numeric 3 NNUMPAGT Numeric 3 N

PRIMPAG Character 3 NPRIMPAG Character 3 N

INICIO Numeric 1 NINICIO Numeric 1 N

CATEPOCA Numeric 1 NCATEPOCA Numeric 1 N

CATDIA Numeric 1 NCATDIA Numeric 1 N

CATHORA Numeric 1 NCATHORA Numeric 1 N

CATPER Numeric 1 NCATPER Numeric 1 N

CATEMPO Numeric 1 NCATEMPO Numeric 1 N

CATNUMPAG Numeric 1 NCATNUMPAG Numeric 1 N

CATNUMPAGR Numeric 1 NCATNUMPAGR Numeric 1 N