arquitetura de máquinas de busca prof. marcus silva [email protected]

36
Arquitetura de Máquinas de Busca Prof. Marcus Silva [email protected]

Upload: internet

Post on 17-Apr-2015

102 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Arquitetura de Máquinas de Busca Prof. Marcus Silva drakhos@gmail.com

Arquitetura de Máquinas de Busca

Prof. Marcus [email protected]

Page 2: Arquitetura de Máquinas de Busca Prof. Marcus Silva drakhos@gmail.com

O que é Máquina de Busca?

Page 3: Arquitetura de Máquinas de Busca Prof. Marcus Silva drakhos@gmail.com

Máquina de Busca

“Um motor de busca, motor de pesquisa ou máquina de busca é um sistema de software projetado para encontrar informações armazenadas em um sistema computacional a partir de palavras-chave indicadas pelo utilizador, reduzindo o tempo necessário para encontrar informações”.

http://pt.wikipedia.org/wiki/Motor_de_busca

Page 4: Arquitetura de Máquinas de Busca Prof. Marcus Silva drakhos@gmail.com

Como funciona uma Máquina de Busca?

Page 5: Arquitetura de Máquinas de Busca Prof. Marcus Silva drakhos@gmail.com

Arquitetura da Máquina de Busca

Page 6: Arquitetura de Máquinas de Busca Prof. Marcus Silva drakhos@gmail.com

Histórico,

ou como eu gosto de pensar: “a vida antes do Google!”

Page 7: Arquitetura de Máquinas de Busca Prof. Marcus Silva drakhos@gmail.com

Histórico

A primeira ferramenta utilizada para busca na Internet foi o Archie (da palavra em Inglês, "archive" sem a letra "v"). Foi criado em 1990 por Alan Emtage, um estudante da McGill University em Montreal. O programa baixava as listas de diretório de todos arquivos localizados em sites públicos de FTP (File Transfer Protocol) anônimos, criando uma base de dados que permitia busca por nome de arquivos.

Page 8: Arquitetura de Máquinas de Busca Prof. Marcus Silva drakhos@gmail.com

Histórico

Enquanto o Archie indexava arquivos de computador, o Gopher indexava documentos de texto. Ele foi criado em 1991, por Mark McCahill da University of Minnesota.

Page 9: Arquitetura de Máquinas de Busca Prof. Marcus Silva drakhos@gmail.com

Histórico Desde então, as buscas evoluíram e em 1993, Matthew Gray, criou Wandex, o primeiro sistema de busca que indexava e também buscava no índice da web pages. Coletava e armazenava em um banco de dados, bem como utilizava uma interface de pesquisa.

Page 10: Arquitetura de Máquinas de Busca Prof. Marcus Silva drakhos@gmail.com

Histórico

Em 1993, Martijn Koster criava Aliweb (Archie-Like Indexing Web). Aliweb permitiu que os usuários enviassem suas próprias páginas a serem indexadas.

Excite foi introduzido em 1993 por seis estudantes da Universidade de Stanford. Usou-se análise estatística de relações de palavra para auxiliar no processo de busca.

Page 11: Arquitetura de Máquinas de Busca Prof. Marcus Silva drakhos@gmail.com

Histórico

EINet Galaxy (Galáxia) foi criada em 1994 como parte do Consórcio de Pesquisa MCC na Universidade do Texas, em Austin.

Yahoo foi fundado por David Filo e Jerry Yang, formandos da Universidade de Stanford em janeiro de 1994 e incorporado no dia 2 de março de 1995.

Page 12: Arquitetura de Máquinas de Busca Prof. Marcus Silva drakhos@gmail.com

Histórico

Brian Pinkerton, da Universidade de Washington lançou WebCrawler em 20 de Abril de 1994. Ele foi o primeiro rastreador que indexava páginas inteiras. Foi o primeiro motor de pesquisa de texto completo na Internet, todo o texto de cada página foi indexada pela primeira vez.

Page 13: Arquitetura de Máquinas de Busca Prof. Marcus Silva drakhos@gmail.com

Histórico

Lycos foi contruido na Carnegie Mellon University em torno de Julho de 1994. Michael Mauldin era responsável por este site de busca e continua a ser o cientista chefe no Lycos Inc.

Page 14: Arquitetura de Máquinas de Busca Prof. Marcus Silva drakhos@gmail.com

Histórico

O site de busca Infoseek entrou em operação em 1995. Ele realmente não traz nada de novo à cena do motor de busca. É agora propriedade da Walt Disney Internet Group e o domínio encaminha para Go.com.

Page 15: Arquitetura de Máquinas de Busca Prof. Marcus Silva drakhos@gmail.com

Histórico

Alta Vista também começou em 1995. Foi o primeiro motor de pesquisa que usava linguagem natural e avançadas técnicas de busca. Ela também fornece uma pesquisa de multimídia para fotos, músicas e vídeos.

Page 16: Arquitetura de Máquinas de Busca Prof. Marcus Silva drakhos@gmail.com

Histórico

Looksmart foi fundada em 1995. Esse site de busca competiu com o site de busca do Yahoo!.

A corporação Inktomi surgiu em 20 de Maio de 1996 com o seu motor de busca Hotbot.

Page 17: Arquitetura de Máquinas de Busca Prof. Marcus Silva drakhos@gmail.com

O que nos leva ao...

Page 18: Arquitetura de Máquinas de Busca Prof. Marcus Silva drakhos@gmail.com

Histórico

Google foi lançada em 1997 por Sergey Brin e Larry Page, como parte de um projeto de pesquisa na Universidade de Stanford. Ele usa as ligações de entrada para classificar sites. Atualmente, o Google hospeda e desenvolve uma série de serviços e produtos baseados na internet e gera lucro principalmente através da publicidade pelo AdWords.

Page 19: Arquitetura de Máquinas de Busca Prof. Marcus Silva drakhos@gmail.com

E mais recentemente...

Page 20: Arquitetura de Máquinas de Busca Prof. Marcus Silva drakhos@gmail.com

Histórico

Bing é o nome do novo buscador da internet lançado pela Microsoft em 28 de maio de 2009, na feira de tecnologia All Things Digital. Ao contrário do Google, o novo buscador não mostra os resultados de acordo com sua popularidade, mas organiza os links de acordo com a relevância.

Page 21: Arquitetura de Máquinas de Busca Prof. Marcus Silva drakhos@gmail.com

Quais são os Tipos de Máquinas de Busca?

Page 22: Arquitetura de Máquinas de Busca Prof. Marcus Silva drakhos@gmail.com

Buscadores Globais

São buscadores que pesquisam todos os documentos na rede e a apresentação do resultado de acordo com o seu algoritmo de relevância.

Page 23: Arquitetura de Máquinas de Busca Prof. Marcus Silva drakhos@gmail.com

Buscadores Verticais São buscadores que realizam pesquisas "especializadas" em bases de dados próprias de acordo com suas propensões.

Page 24: Arquitetura de Máquinas de Busca Prof. Marcus Silva drakhos@gmail.com

Guias Locais São buscadores exclusivamente locais ou regionais. As informações se referem a endereços de empresas ou prestadores de serviços.

Page 25: Arquitetura de Máquinas de Busca Prof. Marcus Silva drakhos@gmail.com

Por que isso é importante?

Page 26: Arquitetura de Máquinas de Busca Prof. Marcus Silva drakhos@gmail.com
Page 27: Arquitetura de Máquinas de Busca Prof. Marcus Silva drakhos@gmail.com
Page 28: Arquitetura de Máquinas de Busca Prof. Marcus Silva drakhos@gmail.com
Page 29: Arquitetura de Máquinas de Busca Prof. Marcus Silva drakhos@gmail.com
Page 30: Arquitetura de Máquinas de Busca Prof. Marcus Silva drakhos@gmail.com

Google books

Page 31: Arquitetura de Máquinas de Busca Prof. Marcus Silva drakhos@gmail.com

Google Earth

Page 32: Arquitetura de Máquinas de Busca Prof. Marcus Silva drakhos@gmail.com
Page 33: Arquitetura de Máquinas de Busca Prof. Marcus Silva drakhos@gmail.com
Page 34: Arquitetura de Máquinas de Busca Prof. Marcus Silva drakhos@gmail.com
Page 35: Arquitetura de Máquinas de Busca Prof. Marcus Silva drakhos@gmail.com
Page 36: Arquitetura de Máquinas de Busca Prof. Marcus Silva drakhos@gmail.com

É importante agora?