ferramentas de busca na web. disciplina: controle dos registros do conhecimento iii professora:...

23
Ferramentas de busca na WEB

Upload: internet

Post on 18-Apr-2015

103 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Ferramentas de busca na WEB. Disciplina: Controle dos Registros do Conhecimento III Professora: Úrsula Blattmann Aluno: Marcos Henrique Camerini Universidade

Ferramentas de busca na WEB

Page 2: Ferramentas de busca na WEB. Disciplina: Controle dos Registros do Conhecimento III Professora: Úrsula Blattmann Aluno: Marcos Henrique Camerini Universidade

Disciplina: Controle dos Registros do Conhecimento IIIDisciplina: Controle dos Registros do Conhecimento IIIProfessora: Úrsula BlattmannProfessora: Úrsula BlattmannAluno: Marcos Henrique CameriniAluno: Marcos Henrique CameriniUniversidade Federal de Santa CatarinaUniversidade Federal de Santa CatarinaFlorianópolis , 2005Florianópolis , 2005

Page 3: Ferramentas de busca na WEB. Disciplina: Controle dos Registros do Conhecimento III Professora: Úrsula Blattmann Aluno: Marcos Henrique Camerini Universidade

Internet necessária na criação de ferramentas para localização de Internet necessária na criação de ferramentas para localização de dados e informações. dados e informações. As primeiras conhecidas foram o Archie, Verônica e Jughead. As primeiras conhecidas foram o Archie, Verônica e Jughead. Com a explosão da Web e a conseqüente disseminação e publicações Com a explosão da Web e a conseqüente disseminação e publicações por esse meio, passaram a surgir também, ferramentas específicas.por esse meio, passaram a surgir também, ferramentas específicas.Hoje se estima mais de um bilhão de páginas HTML.Hoje se estima mais de um bilhão de páginas HTML.Existem basicamente dois tipos de ferramentas de busca: Existem basicamente dois tipos de ferramentas de busca: os motores e os diretórios. Porém, a partir dessas duas categorias, os motores e os diretórios. Porém, a partir dessas duas categorias, tem sido criadas outras ferramentas que vem apresentar uma variação tem sido criadas outras ferramentas que vem apresentar uma variação muito grande no tipo, número e qualidade das informações muito grande no tipo, número e qualidade das informações recuperadas.recuperadas.Para melhor entender os resultados na busca de informações, é Para melhor entender os resultados na busca de informações, é necessário conhecer os diferentes tipos de ferramentas e suas necessário conhecer os diferentes tipos de ferramentas e suas

peculiaridadespeculiaridades..

Page 4: Ferramentas de busca na WEB. Disciplina: Controle dos Registros do Conhecimento III Professora: Úrsula Blattmann Aluno: Marcos Henrique Camerini Universidade

DIRETÓRIOSDIRETÓRIOS

Nos primórdios da Internet constituíram-se na primeira solução paraNos primórdios da Internet constituíram-se na primeira solução paralocalizar e organizar informações da Web, e sua estrutura comportava umlocalizar e organizar informações da Web, e sua estrutura comportava umvolume pequeno, de coleta não automática. Sua base de dados organiza osvolume pequeno, de coleta não automática. Sua base de dados organiza ossites por categorias e sub-categorias, de forma hierárquica. Comumentesites por categorias e sub-categorias, de forma hierárquica. Comumenterelacionam itens como: educação, esporte, entretenimento, viagens, compras,relacionam itens como: educação, esporte, entretenimento, viagens, compras,informática, etc. A seleção dos sites é efetuada por seres humanos, chamadosinformática, etc. A seleção dos sites é efetuada por seres humanos, chamadoseditores, ou também, através de robôs para a coleta de novos URLs. editores, ou também, através de robôs para a coleta de novos URLs. A inclusão se dá pela análise das sugestões apresentadas por usuários,A inclusão se dá pela análise das sugestões apresentadas por usuários,Embora os executores não divulguem os critérios adotados para seleção dosEmbora os executores não divulguem os critérios adotados para seleção dosmesmos. mesmos. O primeiro diretório da Web foi o The World Wide Web Virtual LibraryO primeiro diretório da Web foi o The World Wide Web Virtual Library((http://www.vlib.org/http://www.vlib.org/) de novembro de 1992, sediado no CERN, berço da Web.) de novembro de 1992, sediado no CERN, berço da Web.Abaixo outros exemplos:Abaixo outros exemplos:http://www.yahoo.com/http://www.yahoo.com/ http://www.snap.com/http://www.snap.com/http://looksmart.com http://looksmart.com http://dmoz.org/http://dmoz.org/brasileiros:brasileiros:http://www.cade.com.brhttp://www.cade.com.br http://www.surf.com.brhttp://www.surf.com.brhttp://vaievem.com.brhttp://vaievem.com.br

Page 5: Ferramentas de busca na WEB. Disciplina: Controle dos Registros do Conhecimento III Professora: Úrsula Blattmann Aluno: Marcos Henrique Camerini Universidade

DIFERENÇAS ENTRE OS DIRETÓRIOSDIFERENÇAS ENTRE OS DIRETÓRIOS

Embora sigam princípios genéricos, variam quanto a organização, àEmbora sigam princípios genéricos, variam quanto a organização, àforma de descrição dos recursos e a cobertura.forma de descrição dos recursos e a cobertura.Quanto à organização, a maioria adota listas hierárquicas por assunto,Quanto à organização, a maioria adota listas hierárquicas por assunto,sendo que alguns utilizam sistemas tradicionais como de cabeçalhossendo que alguns utilizam sistemas tradicionais como de cabeçalhosde assunto (Library of Congress) ou classificação Dewey. de assunto (Library of Congress) ou classificação Dewey. Quanto às descrições dos sites, na sua maioria limitam-se aQuanto às descrições dos sites, na sua maioria limitam-se aapresentar títulos e breves resumos de até 30 palavras. Há tambémapresentar títulos e breves resumos de até 30 palavras. Há tambémdiretórios que fornecem descrições criteriosas dos recursos, osdiretórios que fornecem descrições criteriosas dos recursos, osDiretórios avaliativos ou acadêmicosDiretórios avaliativos ou acadêmicos que utilizam um processo que utilizam um processoseletivo de recursos mais rigorosos e não incluem propagandas. Estesseletivo de recursos mais rigorosos e não incluem propagandas. Estesgeralmente têm a elaboração da análise realizada por estudantes degeralmente têm a elaboração da análise realizada por estudantes demestrado ou mestres em biblioteconomia. mestrado ou mestres em biblioteconomia. Exemplos: Exemplos: O Argus O Argus ((http://www.clearinghouse.net/http://www.clearinghouse.net/););

InfomineInfomine ((http://infomine.ucr.eduhttp://infomine.ucr.edu); ); Britannica Britannica ((http://www.britannica.comhttp://www.britannica.com).).

Page 6: Ferramentas de busca na WEB. Disciplina: Controle dos Registros do Conhecimento III Professora: Úrsula Blattmann Aluno: Marcos Henrique Camerini Universidade

Quanto aos assuntos nem todos são genéricos, algunsQuanto aos assuntos nem todos são genéricos, algunscobrem áreas específicas e são conhecidos por cobrem áreas específicas e são conhecidos por diretóriosdiretóriostemáticos ou especializadostemáticos ou especializados. Há por exemplo diretórios. Há por exemplo diretóriosespecializados em imagens, jornais, revistas, softwares;especializados em imagens, jornais, revistas, softwares;outros específicos como: ciências, saúde, legislação,outros específicos como: ciências, saúde, legislação,informática, etc.informática, etc.Há também diretórios temáticos:Há também diretórios temáticos:

(http://www.tematicos.com); (http://www.tematicos.com); (http://www.buscopio.com).(http://www.buscopio.com).

Dada a freqüência com que são construídas novasDada a freqüência com que são construídas novasferramentas de busca, um novo tipo de diretório foi criado:ferramentas de busca, um novo tipo de diretório foi criado:diretórios de ferramentas de buscadiretórios de ferramentas de busca. . Exemplo: Exemplo: FinderSeeker FinderSeeker

(http://www.finderseeker.com/);(http://www.finderseeker.com/);Search.comSearch.com (http://search.cnet.com/)(http://search.cnet.com/)

Page 7: Ferramentas de busca na WEB. Disciplina: Controle dos Registros do Conhecimento III Professora: Úrsula Blattmann Aluno: Marcos Henrique Camerini Universidade

MOTORES DE BUSCAMOTORES DE BUSCA

Diferentemente dos diretórios, os motores de busca não organizam asDiferentemente dos diretórios, os motores de busca não organizam aspáginas de suas bases hierarquicamente. Priorizam a abrangênciapáginas de suas bases hierarquicamente. Priorizam a abrangênciabuscando reunir o maior número possível de recursos através dabuscando reunir o maior número possível de recursos através dabusca por palavras-chave, por meio de programas robôs, em prejuízobusca por palavras-chave, por meio de programas robôs, em prejuízoda seletividade. Com bases de dados imensas permitem a busca porda seletividade. Com bases de dados imensas permitem a busca porpalavras-chave ou, às vezes, em linguagem natural.palavras-chave ou, às vezes, em linguagem natural.São decorrentes do crescimento vertiginoso da Web e daSão decorrentes do crescimento vertiginoso da Web e daimpossibilidade de coletas manuais. Os robôs, também sãoimpossibilidade de coletas manuais. Os robôs, também sãoconhecidos por aranhas (spiders), rastejadores ou (crawlers) agentesconhecidos por aranhas (spiders), rastejadores ou (crawlers) agentesviajantes (wanderers), e vermes (worms). Consistem em programas deviajantes (wanderers), e vermes (worms). Consistem em programas decoleta de novos dados, lançados regularmente na rede mundial, para acoleta de novos dados, lançados regularmente na rede mundial, para abusca de dados atualizados sobre o maior numero possível debusca de dados atualizados sobre o maior numero possível dedocumentos, para após a indexação, integrá-los à sua base.documentos, para após a indexação, integrá-los à sua base.Geralmente iniciam a busca através de sites conhecidos, em especialGeralmente iniciam a busca através de sites conhecidos, em especialos que têm muitos links. O programa que localiza também elege eos que têm muitos links. O programa que localiza também elege eordena os resultados por relevância.ordena os resultados por relevância.

Page 8: Ferramentas de busca na WEB. Disciplina: Controle dos Registros do Conhecimento III Professora: Úrsula Blattmann Aluno: Marcos Henrique Camerini Universidade

DIFERENÇAS ENTRE OSDIFERENÇAS ENTRE OSMOTORES DE BUSCAMOTORES DE BUSCA

Diferem entre si,Diferem entre si,fundamentalmente em relaçãofundamentalmente em relaçãoa fatores como: tamanho dea fatores como: tamanho desuas bases de dados, critériossuas bases de dados, critériospara indexação, inclusão depara indexação, inclusão depáginas e ordenação depáginas e ordenação deresultados. Variam tambémresultados. Variam tambémquanto à atualização de basequanto à atualização de basede dados, recursos de busca ede dados, recursos de busca emodo de apresentação demodo de apresentação deresultados.resultados.

Page 9: Ferramentas de busca na WEB. Disciplina: Controle dos Registros do Conhecimento III Professora: Úrsula Blattmann Aluno: Marcos Henrique Camerini Universidade

Tamanho da base de dadosTamanho da base de dados

Geralmente é medido em número de URLs. Se umGeralmente é medido em número de URLs. Se ummotor cobre mais na Web, maior será a chance de conter amotor cobre mais na Web, maior será a chance de conter ainformação procurada. Por conseqüência, os motoresinformação procurada. Por conseqüência, os motoresmaiores são mais usados, atraindo maior número demaiores são mais usados, atraindo maior número deanunciantes.anunciantes.Entretanto nenhum motor contém todas asEntretanto nenhum motor contém todas aspáginas da Web. Os melhores não alcançam 60% delas.páginas da Web. Os melhores não alcançam 60% delas.Os quatro maiores são Google, WebTop.com, Altavista eOs quatro maiores são Google, WebTop.com, Altavista eFast Search. Há o Todobr, que indexa unicamente sitesFast Search. Há o Todobr, que indexa unicamente sitesbrasileiros. Foi desenvolvido pela UFMG e lançado embrasileiros. Foi desenvolvido pela UFMG e lançado emnovembro de 1999. Costuma trazer mais resultados que asnovembro de 1999. Costuma trazer mais resultados que asmaiores ferramentas estrangeiras. maiores ferramentas estrangeiras.

Page 10: Ferramentas de busca na WEB. Disciplina: Controle dos Registros do Conhecimento III Professora: Úrsula Blattmann Aluno: Marcos Henrique Camerini Universidade

Critérios para indexaçãoCritérios para indexação

Os motores criam índices chamados tecnicamente de arquivosOs motores criam índices chamados tecnicamente de arquivosinvertidos. Eles contém todos os termos que podem ser utilizados nasinvertidos. Eles contém todos os termos que podem ser utilizados nasbuscas e os respectivos URLs. Podem ainda conter informação dabuscas e os respectivos URLs. Podem ainda conter informação daposição das palavras na página, os posição das palavras na página, os tagstags HTML associados ao texto. A HTML associados ao texto. Aindexação se dá pela freqüência com que a palavra ou termo apareceindexação se dá pela freqüência com que a palavra ou termo apareceno texto. Alguns motores indexam também outros termos que nãono texto. Alguns motores indexam também outros termos que nãofazem parte do texto visível, mas que contém informações úteis efazem parte do texto visível, mas que contém informações úteis eimportantes. Exemplo disso são a importantes. Exemplo disso são a Tag ImageTag Image, textos associados com, textos associados comimagens. imagens. Alguns motores não incluem em seu índice as chamadas Alguns motores não incluem em seu índice as chamadas palavraspalavrasproibidasproibidas. São as palavras e termos muito comuns, como por exemplo,. São as palavras e termos muito comuns, como por exemplo,a preposição a preposição “de”“de”, ou o artigo , ou o artigo “the”“the”. Como ocorrem com alta freqüência. Como ocorrem com alta freqüênciasão excluídas por economia de espaço e tempo de processamento.são excluídas por economia de espaço e tempo de processamento.Outros as incluem nos índices, mas ignoram no ato da busca.Outros as incluem nos índices, mas ignoram no ato da busca.Geralmente os motores não divulgam quais as palavras proibidas.Geralmente os motores não divulgam quais as palavras proibidas.

Page 11: Ferramentas de busca na WEB. Disciplina: Controle dos Registros do Conhecimento III Professora: Úrsula Blattmann Aluno: Marcos Henrique Camerini Universidade

Critérios para inclusão de páginasCritérios para inclusão de páginas

O número de itens nas bases é determinado pelos critérios adotadosO número de itens nas bases é determinado pelos critérios adotadospara inclusão. Alguns motores procuram incluir todas as páginas depara inclusão. Alguns motores procuram incluir todas as páginas decada site visitado. Porém, existem sites que requerem senhas, oucada site visitado. Porém, existem sites que requerem senhas, oupáginas atrás de um firewall e páginas com o páginas atrás de um firewall e páginas com o metatagmetatag Meta Robot Meta Robot““noindex” (comando acrescentado ao marcador de cabeçalho paranoindex” (comando acrescentado ao marcador de cabeçalho paraindicar ao robô que elas não devem ser capturadas). Existem tambémindicar ao robô que elas não devem ser capturadas). Existem tambémpáginas não indexadas, chamadas de Web invisível, que contém páginas não indexadas, chamadas de Web invisível, que contém ramesrames e e image-maps image-maps. Altavista, Google, Fast e Northern são alguns. Altavista, Google, Fast e Northern são algunsdos poucos que indexam frames, porém, capturam de formados poucos que indexam frames, porém, capturam de formaincompleta, pois não trazem o contexto em que estão inseridas. incompleta, pois não trazem o contexto em que estão inseridas. ImageImagemaps maps são figuras contendo dois ou mais links, cada um vinculado asão figuras contendo dois ou mais links, cada um vinculado aregiões diferentes da imagem.regiões diferentes da imagem. Páginas dinâmicas Páginas dinâmicas são formadas de são formadas deinformações contidas em bases de dados e montadas quando se clica noinformações contidas em bases de dados e montadas quando se clica nolink.link.Tem como característica a inserção de um “?” como parte de seu URL.Tem como característica a inserção de um “?” como parte de seu URL.Ocorre que a maioria dos motores ao encontrar esse sinal recusa aOcorre que a maioria dos motores ao encontrar esse sinal recusa aindexação, para evitar a situação de se obter milhares de páginas “quaseindexação, para evitar a situação de se obter milhares de páginas “quaseiguais”.iguais”.

Page 12: Ferramentas de busca na WEB. Disciplina: Controle dos Registros do Conhecimento III Professora: Úrsula Blattmann Aluno: Marcos Henrique Camerini Universidade

Freqüência de atualização de dadosFreqüência de atualização de dados

Dada a dinâmica de atualização das páginas eDada a dinâmica de atualização das páginas esites, se faz necessário atualizar as bases dossites, se faz necessário atualizar as bases dosmotores. Isso para incluir novos e excluir osmotores. Isso para incluir novos e excluir osdesativados ou os não mais existentes. Os motores dedesativados ou os não mais existentes. Os motores debusca em média atualizam sua base mensalmente.busca em média atualizam sua base mensalmente.Determinadas páginas, aquelas mais visitadas e comDeterminadas páginas, aquelas mais visitadas e comgrande fluxo de usuários, até o fazem semanalmente. Hágrande fluxo de usuários, até o fazem semanalmente. Hádiferença também, entre os robôs, no tempo necessáriodiferença também, entre os robôs, no tempo necessáriopara adição ao índice. Por isso podem ocorrer meses atépara adição ao índice. Por isso podem ocorrer meses atéque um novo site seja adicionado. LookSmart e Inktomi jáque um novo site seja adicionado. LookSmart e Inktomi jádisponibilizam programas que cobram uma taxa paradisponibilizam programas que cobram uma taxa paradisponibilizar num prazo de 48 horas.disponibilizar num prazo de 48 horas.

Page 13: Ferramentas de busca na WEB. Disciplina: Controle dos Registros do Conhecimento III Professora: Úrsula Blattmann Aluno: Marcos Henrique Camerini Universidade

Interfaces e recursos para buscaInterfaces e recursos para busca

Os motores diferem também nesse ponto. GeralmenteOs motores diferem também nesse ponto. Geralmentefornecem dois modos de busca: simples, para leigos, e, avançadafornecem dois modos de busca: simples, para leigos, e, avançadapara experientes ou profissionais. para experientes ou profissionais. A busca simples permite aos usuários entrem de forma direta, semA busca simples permite aos usuários entrem de forma direta, sema necessidade de conhecimento de lógica booleana. A buscaa necessidade de conhecimento de lógica booleana. A buscaavançada permite a utilização de expressões booleanasavançada permite a utilização de expressões booleanascomplexas. Podem permitir também limitação por data, domínio,complexas. Podem permitir também limitação por data, domínio,idioma ou tipo de arquivo (nome da extensão). Alguns dão opçãoidioma ou tipo de arquivo (nome da extensão). Alguns dão opçãoaté de busca pela raiz da palavra, aumentando a abrangência daaté de busca pela raiz da palavra, aumentando a abrangência dapesquisa. Raros motores dispõem de busca em linguagem natural,pesquisa. Raros motores dispõem de busca em linguagem natural,onde a entrada se dá na forma de uma sentença completa.onde a entrada se dá na forma de uma sentença completa.Não há padronização nas interfaces e recursos de busca entre osNão há padronização nas interfaces e recursos de busca entre osdiversos motores, por isso, é importante a leitura das páginas dediversos motores, por isso, é importante a leitura das páginas deajuda e orientação, dada a diversidade de tratamentos.ajuda e orientação, dada a diversidade de tratamentos.

Page 14: Ferramentas de busca na WEB. Disciplina: Controle dos Registros do Conhecimento III Professora: Úrsula Blattmann Aluno: Marcos Henrique Camerini Universidade

Critério de ordenação de resultadosCritério de ordenação de resultados

Considerando a quantidade de páginas naConsiderando a quantidade de páginas naInternet, é comum obter-se um grande número deInternet, é comum obter-se um grande número deresultados para qualquer busca. Desta forma, éresultados para qualquer busca. Desta forma, éimportante a seqüência em que os resultados sãoimportante a seqüência em que os resultados sãodisponibilizados. Com a finalidade de permitir quedisponibilizados. Com a finalidade de permitir queapareçam os melhores sites em primeiro lugar, aapareçam os melhores sites em primeiro lugar, amaioria dos motores utiliza algoritmos demaioria dos motores utiliza algoritmos deordenação de resultados. Um dos critérios mais utilizadosordenação de resultados. Um dos critérios mais utilizadosestá na localização e a freqüência de ocorrência do termoestá na localização e a freqüência de ocorrência do termoem uma página. Outro critério de relevância é o número deem uma página. Outro critério de relevância é o número determos da consulta presente na página. Os motorestermos da consulta presente na página. Os motoresconsideram também o tamanho dos textos. consideram também o tamanho dos textos.

Page 15: Ferramentas de busca na WEB. Disciplina: Controle dos Registros do Conhecimento III Professora: Úrsula Blattmann Aluno: Marcos Henrique Camerini Universidade

Além dos mecanismos acima, nos motores tem sido usadoAlém dos mecanismos acima, nos motores tem sido usadotambém:também:●● MetatagsMetatags de palavra-chave e descrição - (para chamar a de palavra-chave e descrição - (para chamar a

atenção sobre suas páginas);atenção sobre suas páginas);●● Popularidade dos linksPopularidade dos links - atribuem maior relevância à - atribuem maior relevância à

páginas muito referenciadas em outros sites, ou sites páginas muito referenciadas em outros sites, ou sites importantes;importantes;

●● Direct HitDirect Hit – (http://www.directhit.com) serviço que – (http://www.directhit.com) serviço que monitora quais os monitora quais os linkslinks que milhares de usuários que milhares de usuários selecionam entre os apresentados e o tempo de selecionam entre os apresentados e o tempo de permanência. permanência. (http://www.lycos.com) e (http://www.metabusca.com);(http://www.lycos.com) e (http://www.metabusca.com);

●● Inclusão de site em diretóriosInclusão de site em diretórios – Motores híbridos, ou – Motores híbridos, ou seja, possuem um diretório vinculado ao site, costuma seja, possuem um diretório vinculado ao site, costuma atribuir maior relevância pela importância;atribuir maior relevância pela importância;

Page 16: Ferramentas de busca na WEB. Disciplina: Controle dos Registros do Conhecimento III Professora: Úrsula Blattmann Aluno: Marcos Henrique Camerini Universidade

●● ConceitosConceitos – O motor Northern Light aplica análise – O motor Northern Light aplica análise conceitual para determinar a intenção da busca;conceitual para determinar a intenção da busca;

●● PagamentoPagamento – O GoTo (http://www.goto.com) diferencia- – O GoTo (http://www.goto.com) diferencia-se por apresentar em primeiro lugar os sites cujos se por apresentar em primeiro lugar os sites cujos produtores pagaram para isso;produtores pagaram para isso;

●● SpamSpam – defini-se com um conjunto de métodos – defini-se com um conjunto de métodos considerados pouco éticos para promover páginas, considerados pouco éticos para promover páginas, através da repetição de palavras irrelevantes. (técnicas através da repetição de palavras irrelevantes. (técnicas usuais consistem no uso de texto invisível, escrito na usuais consistem no uso de texto invisível, escrito na mesma cor que o fundo, não perceptível pelo usuário, mesma cor que o fundo, não perceptível pelo usuário, mas lida pelo robô).mas lida pelo robô).

●● Forma de apresentação de resultadosForma de apresentação de resultados – Apresentação – Apresentação do número de documentos encontrados. Contendo o do número de documentos encontrados. Contendo o título e um pequeno resumo. Pode conter também título e um pequeno resumo. Pode conter também tamanho do arquivo, data, URL e idioma e em alguns tamanho do arquivo, data, URL e idioma e em alguns casoscasos related pages related pages..

Page 17: Ferramentas de busca na WEB. Disciplina: Controle dos Registros do Conhecimento III Professora: Úrsula Blattmann Aluno: Marcos Henrique Camerini Universidade

MOTORES DE BUSCA OU DIRETÓRIOS ?MOTORES DE BUSCA OU DIRETÓRIOS ?

Conforme visto, há várias diferenças essenciais entre motores deConforme visto, há várias diferenças essenciais entre motores debusca e diretórios, que apresentam vantagens e desvantagens. busca e diretórios, que apresentam vantagens e desvantagens. ●● Os diretórios têm bases de dados menores, mas contém Os diretórios têm bases de dados menores, mas contém

informações mais relevantes e são mais apropriados para buscas informações mais relevantes e são mais apropriados para buscas por tópicos de interesse genérico. por tópicos de interesse genérico.

●● Ao se pesquisar em um diretório, a consulta contempla apenas o Ao se pesquisar em um diretório, a consulta contempla apenas o título, categoria e uma sucinta descrição dos documentos.título, categoria e uma sucinta descrição dos documentos.

●● Já os motores proporcionam a localização de qualquer tipo de Já os motores proporcionam a localização de qualquer tipo de informação desde que exista na Internet e esteja indexada. informação desde que exista na Internet e esteja indexada.

●● Os motores de busca procuram compensar o excesso de itens Os motores de busca procuram compensar o excesso de itens encontrados, apresentando-os por grau de relevância e realizam encontrados, apresentando-os por grau de relevância e realizam uma pesquisa no texto completo. ●uma pesquisa no texto completo. ● Outra diferença importante Outra diferença importante é a rapidez para a informação se incluída. Como nos diretórios a é a rapidez para a informação se incluída. Como nos diretórios a inclusão tem a intervenção humana, sua inclusão pode demorar inclusão tem a intervenção humana, sua inclusão pode demorar pelo menos um mês. Nos motores, pela indexação automática, pelo menos um mês. Nos motores, pela indexação automática, costuma ser mais rápido.costuma ser mais rápido.

Page 18: Ferramentas de busca na WEB. Disciplina: Controle dos Registros do Conhecimento III Professora: Úrsula Blattmann Aluno: Marcos Henrique Camerini Universidade

METAMOTORESMETAMOTORES

Multibuscadores permitem a execução de uma mesmaMultibuscadores permitem a execução de uma mesmabusca em mais de uma ferramenta (motores ou diretórios)busca em mais de uma ferramenta (motores ou diretórios)ao mesmo tempo, exibindo todos os resultados em uma sóao mesmo tempo, exibindo todos os resultados em uma sólista. Neste caso há uma caixa de pesquisa para cadalista. Neste caso há uma caixa de pesquisa para cadamotor, e as consultas são encontradas e submetidasmotor, e as consultas são encontradas e submetidasseparadamente para cada ferramenta. Existem algunsseparadamente para cada ferramenta. Existem algunsmetamotores que utilizam um software instalado no própriometamotores que utilizam um software instalado no própriomicro que objetiva facilitar a construção local demicro que objetiva facilitar a construção local deestratégias de busca e contem outras ferramentas deestratégias de busca e contem outras ferramentas deapoio.apoio.Exemplos: Exemplos: Mata Hari Mata Hari

(http://www.thewebtools.com/)(http://www.thewebtools.com/)CopernicCopernic (http://www.copernic.com/)(http://www.copernic.com/)

Page 19: Ferramentas de busca na WEB. Disciplina: Controle dos Registros do Conhecimento III Professora: Úrsula Blattmann Aluno: Marcos Henrique Camerini Universidade

DIFERENÇAS ENTRE METAMOTORESDIFERENÇAS ENTRE METAMOTORES

Existem variações entre eles. Apresentam diferenças em relação àExistem variações entre eles. Apresentam diferenças em relação àinterface de busca, motores utilizados na pesquisa, modo deinterface de busca, motores utilizados na pesquisa, modo deprocessamento das consultas, forma de compilação e apresentação processamento das consultas, forma de compilação e apresentação

dederesultados. Podem funcionar como os diretórios de ferramentasresultados. Podem funcionar como os diretórios de ferramentastemáticas. O tempo de resposta e o modo como os resultados sãotemáticas. O tempo de resposta e o modo como os resultados sãoretornados, são consideravelmente afetados pela forma em que asretornados, são consideravelmente afetados pela forma em que asferramentas são pesquisadas: seqüencial ou simultânea. ferramentas são pesquisadas: seqüencial ou simultânea. Metamotores são indicados nos casos em que não se encontramMetamotores são indicados nos casos em que não se encontrammuitos resultados quando se pesquisa apenas um motor. muitos resultados quando se pesquisa apenas um motor. Também apresentam desvantagens. Nessa interface os recursosTambém apresentam desvantagens. Nessa interface os recursosespecíficos de cada motor, tornam-se inacessíveis. Por isso, osespecíficos de cada motor, tornam-se inacessíveis. Por isso, osmetamotores são mais indicados para busca de termos únicos oumetamotores são mais indicados para busca de termos únicos oubuscas simples, sem sofisticação. Além disso, tomam mais tempobuscas simples, sem sofisticação. Além disso, tomam mais tempoporque o tempo de resposta será o da ferramenta mais lenta.porque o tempo de resposta será o da ferramenta mais lenta.

Page 20: Ferramentas de busca na WEB. Disciplina: Controle dos Registros do Conhecimento III Professora: Úrsula Blattmann Aluno: Marcos Henrique Camerini Universidade

Como se manter atualizado sobre motores de buscaComo se manter atualizado sobre motores de busca

Consultar:Consultar:

Search Engine WatchSearch Engine Watch(http://www.searchenginewatch.com)(http://www.searchenginewatch.com)

SearchIQ SearchIQ (http://www.searchiq.com/)(http://www.searchiq.com/)Search Engine ShowdownSearch Engine Showdown

(http://www.searchengineshowdown.com/)(http://www.searchengineshowdown.com/)About.com Web Search GuideAbout.com Web Search Guide

(http://www.Websearch.about.com/)(http://www.Websearch.about.com/)Recomenda-se também a revista Online, na versão impressa e atravésRecomenda-se também a revista Online, na versão impressa e atravésdo site:do site: (http://www.onlineinc.com/)(http://www.onlineinc.com/)O site Ferramentas de Busca na Internet traz uma lista por categoriaO site Ferramentas de Busca na Internet traz uma lista por categoriade ferramentas:de ferramentas:

(http://www.eb.ufmg.br/cendon/links/motores.htm)(http://www.eb.ufmg.br/cendon/links/motores.htm)

Page 21: Ferramentas de busca na WEB. Disciplina: Controle dos Registros do Conhecimento III Professora: Úrsula Blattmann Aluno: Marcos Henrique Camerini Universidade

Referências:Referências:

Cendón, Beatriz Valadares. Ferramentas de busca na Cendón, Beatriz Valadares. Ferramentas de busca na Web. Web. Ciência da Informação Ciência da Informação –– v.30, n.1, p.39-49, v.30, n.1, p.39-49, jan./abr.2001. Disponível em: jan./abr.2001. Disponível em: <http://www.ibict.br/cienciadainformacao/viewarticle.php<http://www.ibict.br/cienciadainformacao/viewarticle.php?id=257&layout=abstract>. Acesso em 03 de Abril de ?id=257&layout=abstract>. Acesso em 03 de Abril de 2005. 2005.

Page 22: Ferramentas de busca na WEB. Disciplina: Controle dos Registros do Conhecimento III Professora: Úrsula Blattmann Aluno: Marcos Henrique Camerini Universidade
Page 23: Ferramentas de busca na WEB. Disciplina: Controle dos Registros do Conhecimento III Professora: Úrsula Blattmann Aluno: Marcos Henrique Camerini Universidade