1 busca de informação na internet 18 de julho de 2015 augusto vinhaes

60
1 Busca de Busca de informação na informação na Internet Internet 28 de junho de 2022 Augusto Vinhaes

Upload: bernardo-telles

Post on 07-Apr-2016

214 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 1 Busca de informação na Internet 18 de julho de 2015 Augusto Vinhaes

1

Busca de informação Busca de informação na Internetna Internet

27 de abril de 2023

Augusto Vinhaes

Page 2: 1 Busca de informação na Internet 18 de julho de 2015 Augusto Vinhaes

2

Agenda

1) Internet ▪ Conceitos básicos ▪ Serviços ▪ World Wide Web ▪ Protocolo Http ▪ Website 2) Ferramentas de busca ▪ Conceitos básicos 3) Ferramentas de busca na Web ▪ Conceitos básicos ▪ Tipos 4) Diretórios ▪ Conceitos e características básicas ▪ Diferenças entre os diretórios: ▪ Princípios de organização ▪ Descrição dos sites ▪ Assuntos cobertos

▪ Atividade:utilizar as ferramentas de busca

5) Motores de busca ▪ Conceitos e características básicas ▪ Diferenças entre os motores: ▪ Tamanho da base de dados ▪ Critérios de indexação ▪ Critérios para inclusão de páginas ▪ Freqüência de atualização da base de dados ▪ Interfaces e recursos de busca ▪ Critérios de ordenação dos resultados ▪ Atividade:utilizar as ferramentas de busca

6) Diretórios ou motores de busca ?

7) Metamotores

8) Mecanismo de pesquisa personalizado Google

Page 3: 1 Busca de informação na Internet 18 de julho de 2015 Augusto Vinhaes

3

Internet

▪ Internet

▪ A Internet é considerada uma grande rede, ligando milhões de computadores de médio e grande porte (hosts) além de microcomputadores, através de linhas telefônicas comuns, linhas de comunicação privadas, cabos de fibra ótica, cabos submarinos, satélites e outros meios de comunicação.

▪ Os computadores que compõem a Internet podem estar localizados, por exemplo, em universidades, empresas, cooperativas, prefeituras, e nas próprias residências.

▪ Para o usuário, corresponde a um grupo de serviços disponíveis para troca de informações (Correio eletrônico, Ftp, Telnet, Chat, NewsGroup,

WWW, Gopher, etc).

Page 4: 1 Busca de informação na Internet 18 de julho de 2015 Augusto Vinhaes

4

WWW e HTTP

▪ WWW (World Wide Web): é um dos serviços da Internet que corresponde a parte multimídia da mesma e que possibilita a exibição de páginas de hipertexto (documentos com textos, imagens, som, vídeo, programas, etc). É formada por milhões de páginas ou “locais” chamados sites.

▪ Http: é o protocolo que determina como acontece a comunicação no ambiente www, entre o computador que executa o navegador e o servidor que guarda a página.

Page 5: 1 Busca de informação na Internet 18 de julho de 2015 Augusto Vinhaes

5

Website

▪ Website

▪ Conjunto de páginas (webpages) agrupadas por um mesmo assunto, propósito ou objetivo, podendo ser de uma empresa ou indivíduo.

▪ Formado por páginas dinâmicas e/ou estáticas que podem ou não estar localizadas dentro de um mesmo servidor.

▪ Possue uma URL que possibilita sua localização. http://www.mct.gov.br = 200.130.9.36

1. HyperText Transfer Protocol: protocolo para transferência de páginas. 2. Indica que é uma página Web (visualizar imagens, textos, ouvir sons, etc). 3. Identificação da organização ou empresa. 4. Tipo de organização (.com - organização comercial, .edu - organização educacional, .org - organização sem fins-lucrativos, .gov - governo). 5. Identificação do país (.br, .fr, .us, etc).

Page 6: 1 Busca de informação na Internet 18 de julho de 2015 Augusto Vinhaes

6

Ferramentas de busca na Web

▪ Ferramentas de busca (search engines)

▪ Existem desde os primórdios da Internet e sua crição foi motivada pela necessidade de localização dos seus recursos informacionais.

▪ Archie – busca arquivos em repositórios de ftp (muito antiga). Veronica e Jughead – busca conteúdo nos Gophers.

▪ Ferramentas de busca na Web

▪ São Websites especializados em buscar e listar páginas da Internet a partir de informações (palavra-chave ou assunto) fornecidas pelo utilizador.

▪ Surgimento motivado pelo aparecimento da WWW.

Page 7: 1 Busca de informação na Internet 18 de julho de 2015 Augusto Vinhaes

7

Ferramentas de busca na Web

▪ São centenas de ferramentas e bilhões de páginas Html.

▪ Tipos ▪ Diretórios (catálogos por assunto) ▪ Motores de busca (índices) ▪ Metamotores (multibuscadores)

▪ A principal diferença é a forma como seus bancos de dados são compilados.

▪ Possuem características específicas que determinam o tipo, número e qualidade dos recursos recuperados, que podem variar enormemente.

▪ O entendimento das características de cada ferramenta aumenta a eficiência na procura dos recursos informacionais.

Page 8: 1 Busca de informação na Internet 18 de julho de 2015 Augusto Vinhaes

8

Ferramentas de busca na Web

▪ Diretórios

▪ Primeira solução para organizar e localizar os recursos da Web.

▪ Criado quando o conteúdo da Web era pequeno e permitia que fosse coletado de forma não automática.

▪ Os sites são organizados e classificados com a ajuda de editores em categorias e subcategorias (base de dados).

▪ Árvores hierárquicas de assunto com tópicos de interesse amplo (educação, esporte, entretenimento, viagens, compras, etc) para atender um público variado.

Page 9: 1 Busca de informação na Internet 18 de julho de 2015 Augusto Vinhaes

9

Ferramentas de busca na Web

▪ Diretórios

▪ Localização da informação: navegação nas categorias através do mouse e/ou busca via formulário e palavras-chave.

▪ Editores tomam conhecimento de novos sites através de sugestões de usuários, pesquisas na Internet (listas de anúncios de novas páginas) ou robôs.

▪ Sites coletados passam pela seleção de editores, o que pode indicar qualidade dos dados.

▪ Apenas os melhores recursos informacionais são escolhidos para inclusão.

▪ Necessidade de um grande número de editores (15.000 no caso do Open Directory da Netscape).

Page 10: 1 Busca de informação na Internet 18 de julho de 2015 Augusto Vinhaes

10

Ferramentas de busca na Web

▪ Diretórios

▪ Grandes diretórios podem conter dezenas de milhares de categorias e subcategorias.

▪ Alguns exemplos:

▪ 1º diretório da Web (nov. 1992): The World Wide Web Virtual Library (http://www.vlib.org) ▪ Open Directory (http://dmoz.org) ▪ Ipl2 (http://www.ipl.org/div/subject) ▪ Diretório do Google (http://www.google.com.br/dirhp?hl=pt-BR)

Page 11: 1 Busca de informação na Internet 18 de julho de 2015 Augusto Vinhaes

11

Ferramentas de busca na Web

▪ Principais diferenças entre os diretórios

▪ Referentes aos princípios de organização:

▪ A maioria usa listas hierárquicas de assunto, mas alguns usam esquemas tradicionais de classificação como a Classificação

Decimal de Dewey (BUBL Link - http://bubl.ac.uk/link).

▪ Estes geralmente são mantidos por profissionais da informação ou bibliotecários, visando otimizar o acesso aos recursos da Web.

Page 12: 1 Busca de informação na Internet 18 de julho de 2015 Augusto Vinhaes

12

Ferramentas de busca na Web

▪ Principais diferenças entre os diretórios

▪ Referentes à descrição dos sites:

▪ Empresas comerciais incluem títulos e resumos de até 30 caracteres.

▪ Alguns se diferenciam por fornecer descrições criteriosas e detalhadas dos sites, podendo até incluir críticas e avaliações (diretórios avaliativos ou acadêmicos).

▪ Diretórios avaliativos ou acadêmicos:- Utilizam estudantes de mestrado em biblioteconomia ou ciência da informação e especialistas em assuntos específicos.- Associados a bibliotecas ou instituições de ensino.- Seleção mais rigorosa de sites e não inclui propaganda. Ex: Infomine (http://infomine.ucr.edu), Ipl2 (http://www.ipl.org/div/subject)

Page 13: 1 Busca de informação na Internet 18 de julho de 2015 Augusto Vinhaes

13

Ferramentas de busca na Web

▪ Principais diferenças entre os diretórios

▪ Referentes aos assuntos cobertos:

▪ Alguns diretórios são genéricos e cobrem todos os assuntos, mas outros cobrem áreas específicas (diretórios temáticos ou especializados).

▪ Diretórios temáticos:- Imagens, jornais, listas de discussão, ferramentas de busca, etc.- Assuntos específicos como saúde, ciências, legislação, etc.Ex:

Informática: Criarweb (http://www.criarweb.com/diretorio) Bases de dados: CompletePlanet (http://aip.completeplanet.com) Website de bibliotecas: LibWeb (http://lists.webjunction.org/libweb)

Page 14: 1 Busca de informação na Internet 18 de julho de 2015 Augusto Vinhaes

14

Ferramentas de busca na Web

▪ Motores de busca

▪ Surgiram quando o número de recursos na Web adquiriu proporções que impediam a sua coleta manual e também a busca através de navegação.

▪ São formados por 4 componentes: um robô, que localiza e busca documentos na Web; um indexador, que extrai a informação dos documentos e constrói a base; o motor de busca propriamente dito; a interface, que é utilizada pelos usuários.

▪ Os robôs (spiders ou aranhas) vasculham a Internet em intervalos regulares (1 ou 2 meses) visitando sites, lendo seu conteúdo e seguindo seus links para outras páginas.

▪ Os documentos encontrados pelos robôs são encaminhados aos indexadores, que extraem a informação das páginas html e as armazenam em uma base de dados.

Page 15: 1 Busca de informação na Internet 18 de julho de 2015 Augusto Vinhaes

15

Ferramentas de busca na Web

▪ Motores de busca

▪ Localização da informação: ▪ Uma página Web é usada para efetuar a pesquisa na base de dados. ▪ O usuário formula a consulta através de combinações de palavras- chave, que é transmitida ao motor de busca propriamente dito. ▪ O programa (mb) localiza na base de dados os itens que devem constituir a resposta. ▪ O programa (mb) ordena os resultados colocando os mais relevantes em primeiro lugar na lista de resultados (descrição dos sites e links).

▪ Foco na abrangência das bases de dados, que podem alcançar centenas de milhões de ítens, e não na seletividade.

▪ O usuário pode sugerir sua URL ao invéz de esperar que o site seja encontrado pela varredura do robô (ou robôs trabalhando em paralelo).

Page 16: 1 Busca de informação na Internet 18 de julho de 2015 Augusto Vinhaes

16

MB

Motor de busca genérico

Page 17: 1 Busca de informação na Internet 18 de julho de 2015 Augusto Vinhaes

17

Ferramentas de busca na Web

▪ Motores de busca

▪ Motores de busca especializados em:

▪ Linguagem natural - True Knowledge (http://www.trueknowledge.com)

▪ Assunto / temáticos: Ask for Kids (http://www.askkids.com) Medical WorldSearch (http://www.mwsearch.com) FindSounds (http://www.findsounds.com)

▪ Alguns exemplos:

▪ Google (http://www.google.com.br) ▪ Yahoo (http://www.yahoo.com.br) ▪ Exalead (http://www.exalead.com/search)

Page 18: 1 Busca de informação na Internet 18 de julho de 2015 Augusto Vinhaes

18

Ferramentas de busca na Web

▪ Principais diferenças entre os motores de busca

▪ Referentes ao tamanho da base de dados:

▪ É medido em número de páginas da Web e importante para que a ferramenta seja considerada boa. As melhores contém cerca de 60%

da Web.

Fonte: Sullivan, Danny. Search Engine Size Wars V Erupts. [online] Disponível na Internet via www. URL: http://blog.searchenginewatch.com/blog/041111-084221. Arquivo capturado em 29 outubro 2007.

> 20 bilhões

Page 19: 1 Busca de informação na Internet 18 de julho de 2015 Augusto Vinhaes

19

Fonte: Bondar, Serge. Search Engine Indexing Limits: Where Do the Bots Stop?. [online] Disponível na Internet via www. URL: http://http://articles.sitepoint.com/article/indexing-limits-where-bots-stop#. Arquivo capturado em 23 novembro 2009.

As bases de dados de cada motor não são iguais e para a mesmabusca, cada ferramenta trará bons resultados que outras não acharam.Logo, para uma busca completa, há a necessidade de se usar mais deuma ferramenta.

Page 20: 1 Busca de informação na Internet 18 de julho de 2015 Augusto Vinhaes

20

Ferramentas de busca na Web

▪ Principais diferenças entre os motores de busca

▪ Referentes aos critérios de indexação (inclusão da palavra no índice):

▪ O índice contém todos os termos que podem ser usados na busca de informações e a URL das páginas que os contém, dados sobre a posição das palavras na página e tags HTML.

▪ Existem vários critérios de indexação: - Inclusão de cada palavra do texto visível das páginas;

- Inclusão das palavras que ocorrem com freqüência; - Inclusão de palavras e frases importantes contidas no título ou nos cabeçalhos e nas primeiras linhas; - Inclusão de termos que não fazem parte do texto visível: metatags de classificação, de descrição, de palavras-chave e

texto ALT do tag Image.

▪ Um termo só será encontrado se estiver contido no índice. Logo, os critérios usados para encontrar os sites e indexá-los influenciam o resultado das buscas.

Page 21: 1 Busca de informação na Internet 18 de julho de 2015 Augusto Vinhaes

21

Ferramentas de busca na Web

▪ Principais diferenças entre os motores de busca

▪ Referentes aos critérios para inclusão de páginas:

▪ Determinam o número de itens nas bases de dados dos motores.

▪ Principais critérios: - Inclusão na base de todas ou a maioria das páginas de cada site; - Inclusão apenas da home page e algumas páginas principais; - Inclusão de mensagens de grupos de discussão, sites de ftp

e gophers;

▪ Páginas que NÃO são incluídas nos motores de busca: - Sites que requerem senha de entrada ou páginas atrás do Firewall; - Páginas com o Metatag Meta Robot “noindex”; - Páginas isoladas (não referenciadas por outras páginas);

Page 22: 1 Busca de informação na Internet 18 de julho de 2015 Augusto Vinhaes

22

Ferramentas de busca na Web

▪ Principais diferenças entre os motores de busca

▪ Web invisível (web profunda ou deep web): - No passado: páginas com frames, image-maps e dinâmicas. - Atualmente: páginas geradas pelos sistemas de bancos de dados “on-the-fly”, como resultado de uma consulta específica - “Searchable databases”.

A Web profunda é de 1000 a 2000 vezes maiorque a web superficial (Bergman, 2001).

Onde encontrar: em diretórios (Infomine,CompletePlanet) e via Google (buscar porhealth database ou base de dados saúde)

Page 23: 1 Busca de informação na Internet 18 de julho de 2015 Augusto Vinhaes

23

Ferramentas de busca na Web

▪ Principais diferenças entre os motores de busca

▪ Referentes à freqüência de atualização da base de dados:

▪ As bases de dados precisam ser atualizadas periodicamente para adicionar novas páginas, deletá-las ou incluir modificações das existentes.

▪ Cada motor tem sua própria estratégia e tecnologia.

▪ Principais estratégias: - Atualização completa da base pelo menos uma vez por mês; - Atualização semanal para páginas mais populares entre usuários e que mudam com freqüência; - Atualização diária de novas URLs e links mortos;

▪ Cada motor leva um tempo para adicionar na base uma página nova coletada pelo robô ou submetida pelo usuário. (meses) (pago 48h)

Page 24: 1 Busca de informação na Internet 18 de julho de 2015 Augusto Vinhaes

24

Ferramentas de busca na Web

▪ Principais diferenças entre os motores de busca

▪ Referentes as interfaces e recursos de busca:

▪ Dois modos de busca: - Simples (leigos - auxiliada por janelas e com conectivos booleanos inseridos automaticamente entre os termos); - Avançada (experientes - expressões booleanas complexas);

▪ Atenção: espaço será AND (Google e Yahoo) – cuidado com OR ! ▪ Outros recursos oferecidos: busca por frase, proximidade de palavras, sensibilidade à caixa de caracteres, domínio, tipo de arquivos, idioma.

▪ Como não existe padronização, recomenda-se: - Leitura das páginas de ajuda da ferramenta; - Consulta de tabelas comparativas em revistas especializadas ou na

Internet. Site da biblioteca da University of California Berkeley

Page 25: 1 Busca de informação na Internet 18 de julho de 2015 Augusto Vinhaes

25

Ferramentas de busca na Web

▪ Principais diferenças entre os motores de busca

▪ Referentes aos critérios de ordenação dos resultados:

▪ Tem a finalidade de permitir que os melhores sites (mais relevantes) apareçam em primeiro lugar nos resultados mostrados.

▪ Para um mesmo número de resultados, a melhor ferramenta é aquela que traz itens mais relevantes entre os primeiros resultados.

▪ Os motores utilizam algorimos de ordenação de resultados com critérios tais como: - A localização e freqüência de ocorrência das palavras na página; - Freqüência de ocorrência das palavras e a proximidade delas; - Densidade com que um termo é usado em cada documento; - Páginas muito referenciadas em outros sites ou sites importantes;

- Motores híbridos atribuem maior relevância aos sites de seu diretório

▪ Os algoritmos de ordenação por relevância são um dos maiores fatores diferenciais de competição entre os motores e não são revelados.

Page 26: 1 Busca de informação na Internet 18 de julho de 2015 Augusto Vinhaes

26

Ferramentas de busca na Web

▪ Atividade: utilizar as ferramentas de busca abaixo.

▪ Diretórios que utilizam listas hierárquicas de assunto: ▪ The World Wide Web Virtual Library (http://www.vlib.org) ▪ Open Directory (http://dmoz.org) ▪ Google (http://www.google.com.br/dirhp?hl=pt-BR)

▪ Diretórios que utilizam a CDD: BUBL Link (http://bubl.ac.uk/link)

▪ Diretórios avaliativos ou acadêmicos: Infomine (http://infomine.ucr.edu) Ipl2 (http://www.ipl.org/div/subject)

▪ Diretórios temáticos: Informática: Criarweb (http://www.criarweb.com/diretorio) Bases de dados: CompletePlanet (http://aip.completeplanet.com) Website de bibliotecas: LibWeb (http://lists.webjunction.org/libweb)

▪ Motores de busca genéricos: Google (http://www.google.com.br) Yahoo (http://www.yahoo.com.br) Exalead (http://www.exalead.com/search)

▪ Motores de busca especializados em: ▪ Linguagem natural: True Knowledge (http://www.trueknowledge.com) ▪ Assunto / temáticos: Ask for Kids (http://www.askkids.com) Medical WorldSearch (http://www.mwsearch.com) FindSounds (http://www.findsounds.com)

Page 27: 1 Busca de informação na Internet 18 de julho de 2015 Augusto Vinhaes

27

Ferramentas de busca na Web

▪ Diretórios ou motores de busca ?

▪ Existem diferenças importantes entre diretórios e motores de busca, o que gera vantagens e desvantagens associadas ao uso de cada um deles.

▪ Os diretórios tem bases de dados menores, mas com informação mais relevante. Exemplo: ▪ A procura por “search engines” no diretório do Yahoo, navegando por categoria, só encontra sites relevantes: dir.yahoo.com / Computers and Internet / Internet / World Wide

Web / Searching the Web / Search Engines and Directories. ▪ O mesmo não acontece se procurarmos no motor de busca, que irá retornar milhões de resultados (muitos não relevantes).

Page 28: 1 Busca de informação na Internet 18 de julho de 2015 Augusto Vinhaes

28

Ferramentas de busca na Web

▪ Diretórios ou motores de busca ?

▪ Diretórios são mais apropriados para buscas por tópicos que sejam de interesse para um grande número de pessoas, pois provavelmente fazem parte da árvore hierárquica.

▪ Ou para tópicos muito amplos que retornariam um número elevado de respostas em um motor de busca.

▪ Motores de busca permitem a localização de qualquer tipo de informação, mesmo que específica, desde que exista na Internet e esteja indexada.

▪ Motores possuem bases de dados muito grandes (bilhões de páginas) e, por isso, pode-se recuperar muitos resultados não relacionados com os tópicos pesquisados (menor precisão).

Page 29: 1 Busca de informação na Internet 18 de julho de 2015 Augusto Vinhaes

29

Ferramentas de busca na Web

▪ Diretórios ou motores de busca ?

▪ Apesar dos motores possuírem grandes bases de dados, seus robôs podem não indexar alguns tipos de páginas que poderiam ser incluídas nos diretórios (Web invisível).

▪ As descrições dos sites obtidas nos diretórios é de melhor qualidade, já que são feitas manualmente.

▪ As descrições dos motores podem não conter informações adequadas, já que são elaboradas automaticamente pelos robôs. Robôs não conseguem identificar o tema central de um documento, detectar elementos importantes como gráficos ou imagens, extrair dados como autor, afiliação institucional ou data de publicação.

Page 30: 1 Busca de informação na Internet 18 de julho de 2015 Augusto Vinhaes

30

Ferramentas de busca na Web

▪ Diretórios ou motores de busca ?

▪ A pesquisa feita pelo diretório irá consultar apenas título, categoria e uma breve descriçao. A maioria dos motores proporciona pesquisa no texto integral dos documentos. Lembrar do page depth

▪ Atualmente a distinção entre diretórios e motores de busca não é tão nítida e a marioria das ferramentas pode ser considerada híbrida. ▪ Diretórios permitem buscas por palavras-chave em suas categorias, devido a dificuldade de navegação (grande número de sites); ▪ Motores tem incluído diretórios em suas páginas (Google e Yahoo). ▪ Diretórios tem feito parcerias com motores para “redirecionar” para eles, de forma automática e transparente, a pesquisa que não encontrou resultado.

Page 31: 1 Busca de informação na Internet 18 de julho de 2015 Augusto Vinhaes

31

Ferramentas de busca na Web

▪ Metamotores (multibuscadores)

▪ Seu surgimento foi motivado pelo fato de que melhores resultados em uma pesquisa são obtidos com o uso de várias ferramentas diferentes.

▪ Permitem a execução da busca em mais de uma ferramenta (diretórios ou motores) e exibem os resultados encontrados em uma só lista.

▪ Não possuem bases de dados e fornecem um “snapshot” dos resultados mais relevantes de várias ferramentas.

▪ Fazem um pré-processamento da consulta do usuário para prepará-la para submissão a cada ferramenta.

Page 32: 1 Busca de informação na Internet 18 de julho de 2015 Augusto Vinhaes

32

Ferramentas de busca na Web

Metamotor

Motor de busca Convencional

Metamotor genérico

Page 33: 1 Busca de informação na Internet 18 de julho de 2015 Augusto Vinhaes

33

Ferramentas de busca na Web

▪ Metamotores (multibuscadores)

▪ Alguns exemplos: ▪ Mamma (http://www.mamma.com) ▪ Dogpile (http://www.dogpile.com)

▪ Metamotor com Clustering (agrupamento dos resultados em categorias): ▪ Carrot (http://search.carrot2.org/stable/search) ▪ Quintura (http://www.quintura.com)

▪ Existe também o software instalado no micro, que facilita a construção da estratégia de busca e contém ferramantas de apoio (eliminação de links duplicados e quebrados, ordenação dos resultados, armazenamento da busca, geração de relatórios, etc). ▪ Copernic (http://www.copernic.com)

Page 34: 1 Busca de informação na Internet 18 de julho de 2015 Augusto Vinhaes

34

Ferramentas de busca na Web

▪ Pseudometamotores: são interfaces para varias ferramentas, mas sem um mecanismo de busca integrada. As buscas são submetidas separadamente para cada ferramenta. ▪ InfoPeople (http://www.infopeople.org/search/tools.html)

▪ Algumas desvantagens dos metamotores: ▪ Os recursos de busca específicos de cada motor, usados para obter

maior refinamento nas pesquisas, tornam-se inacessíveis. ▪ As buscas levam mais tempo porque é necessário processamento

adicional para compilar os resultados obtidos e também porque o tempo de resposta final será o da ferramenta mais lenta.

▪ Quando usar: ▪ Quando não encontrar muitos resultados pesquisando em um só motor. ▪ Para determinar qual ferramenta traz as melhores respostas para uma

determinada consulta e em buscas simples.

Page 35: 1 Busca de informação na Internet 18 de julho de 2015 Augusto Vinhaes

35

Ferramentas de busca na Web

▪ Atividade: utilizar as ferramentas de busca abaixo.

▪ Metamotores genéricos: ▪ Mamma (http://www.mamma.com) ▪ Dogpile (http://www.dogpile.com) ▪ Carrot (http://search.carrot2.org/stable/search) ▪ Quintura (http://www.quintura.com)

▪ Instalado no micro: Copernic (http://www.copernic.com)

▪ Pseudometamotores: InfoPeople (http://www.infopeople.org/search/tools.html)

Page 36: 1 Busca de informação na Internet 18 de julho de 2015 Augusto Vinhaes

36

Ferramentas de busca na Web

▪ Global Search Market Share

Fonte: Search Engine Watch. Global search market share, July 2009 vs. July 2008. [online] Disponível na Internet via www. URL: http://searchenginewatch.com/3634922. Arquivo capturado em 24 novembro 2009.

Page 37: 1 Busca de informação na Internet 18 de julho de 2015 Augusto Vinhaes

37

Ferramentas de busca na Web

▪ Maior índice de criação de novas páginas aconteceu em 2007.▪ De janeiro até abril de 2009, 46 milhões de novas páginas foram criadas.

Fonte: Pavarin, Guilherme. Novos sites foram freados em 2008. [online] Disponível na Internet via www. URL: http://info.abril.com.br/noticias/internet/novos-sites-foram-freados-em-2008-08052009-37.shl. Arquivo capturado em 14 maio 2009.

Page 38: 1 Busca de informação na Internet 18 de julho de 2015 Augusto Vinhaes

38

Ferramentas de busca na Web

▪ Mais informações

▪ Ler a documentação da ferramenta que está disponível no próprio site e se manter atualizado, já que ela está em constante evolução.

▪ Obter informações também em sites que publicam artigos sobre as ferramentas e tabelas comparativas de características, como os abaixo:

- Search Engine Watch (www.searchenginewatch.com). - Search Engine Showdown (www.searchengineshowdown.com). - About.com Web Search Guide (Websearch.about.com). - Site da Biblioteca da University of California Berkeley (http://www.lib.berkeley.edu).

Page 39: 1 Busca de informação na Internet 18 de julho de 2015 Augusto Vinhaes

39

Pesquisa personalizada Google

▪ Mecanismo de pesquisa personalizado Google

▪ Permite que você crie um mecanismo de busca para seu Website, Blog ou uma coleção de Websites.

▪ Alguns recursos interessantes:

▪ É possível pesquisar apenas o conteúdo de um Website ou um determinado tema (assunto). ▪ Podemos personalizar o box de pesquisa e a página de resultados, ajustar o ranking e convidar amigos para participar da construção do mecanismo. ▪ Pesquisa contextualizada - um ciclista pesquisando por “roda” em um mecanismo personalizado obterá somente resultados relevantes.

Page 40: 1 Busca de informação na Internet 18 de julho de 2015 Augusto Vinhaes

40

Page 41: 1 Busca de informação na Internet 18 de julho de 2015 Augusto Vinhaes

41

Page 42: 1 Busca de informação na Internet 18 de julho de 2015 Augusto Vinhaes

42

Page 43: 1 Busca de informação na Internet 18 de julho de 2015 Augusto Vinhaes

43

Page 44: 1 Busca de informação na Internet 18 de julho de 2015 Augusto Vinhaes

44

Page 45: 1 Busca de informação na Internet 18 de julho de 2015 Augusto Vinhaes

45

Page 46: 1 Busca de informação na Internet 18 de julho de 2015 Augusto Vinhaes

46

Page 47: 1 Busca de informação na Internet 18 de julho de 2015 Augusto Vinhaes

47

Page 48: 1 Busca de informação na Internet 18 de julho de 2015 Augusto Vinhaes

48

Page 49: 1 Busca de informação na Internet 18 de julho de 2015 Augusto Vinhaes

49

Page 50: 1 Busca de informação na Internet 18 de julho de 2015 Augusto Vinhaes

50

Page 51: 1 Busca de informação na Internet 18 de julho de 2015 Augusto Vinhaes

51

Pesquisa personalizada Google

▪ Gerenciamento dos “meus mecanismos de pesquisa”: http://www.google.com.br › Efetuar login > Configurações > Configurações da conta do google > Meus mecanismos de pesquisa

▪ Painel de controle

▪ Permite a modificação de um mecanismo de pesquisa já criado. Por ex: ▪ Retirar os links patrocinados

▪ Criar label de refinamento ▪ Configurar as keywords (ex: bikeonline)

▪ Estatísticas

▪ Permite a visualização das estatísticas de acesso e utilização do mecanismo de pesquisa e também as consultas realizadas pelos usuários.

Page 52: 1 Busca de informação na Internet 18 de julho de 2015 Augusto Vinhaes

52

Pesquisa personalizada Google

▪ Como o usuário acessa o mecanismo de pesquisa personalizado: ▪ Página inicial do mecanismo de pesquisa http://www.google.com/cse/home?cx=013530060800273303914:2p_g7ejlz1g

▪ Incluir o mecanismo de pesquisa na página inicial do iGoogle http://www.igoogle.com.br

▪ Incluir o box de pesquisa em um website: ▪ Food and Agriculture Organization › http://www.fao.org ▪ MacWorld › www.macworld.com

Page 53: 1 Busca de informação na Internet 18 de julho de 2015 Augusto Vinhaes

53

Page 54: 1 Busca de informação na Internet 18 de julho de 2015 Augusto Vinhaes

54www.ensp.fiocruz.br/portal-ensp

Page 55: 1 Busca de informação na Internet 18 de julho de 2015 Augusto Vinhaes

55

www.ensp.fiocruz.br/portal-ensp

Page 56: 1 Busca de informação na Internet 18 de julho de 2015 Augusto Vinhaes

56

Page 57: 1 Busca de informação na Internet 18 de julho de 2015 Augusto Vinhaes

57

Page 58: 1 Busca de informação na Internet 18 de julho de 2015 Augusto Vinhaes

58

Page 59: 1 Busca de informação na Internet 18 de julho de 2015 Augusto Vinhaes

59

Page 60: 1 Busca de informação na Internet 18 de julho de 2015 Augusto Vinhaes

60

Referências

▪ REED, David. A Balanced Introduction to Computer Science. New Jersey: Prentice Hall, 2005.

▪ CENDON, Beatriz Valadares. Ferramentas de busca na Web. Ci. Inf. ,  Brasília,  v. 30,  n. 1, 2001 .  Disponível em: <http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0100- 19652001000100006&lng=pt&nrm=iso>. Acesso em: 01  Nov  2007.

▪ Bergman, Michael K.White Paper: The Deep Web: Surfacing Hidden Value. Journal of Electronic Publishing (JEP). v.7, n.1, aug.,  2001. Avaiable in: http://quod.lib.umich.edu/cgi/t/text/text-idx?c=jep;view=text;rgn=main;idno= 3336451.0007.104. Access in: sep. 14, 2010.