copy of trabalho de redes

27
Máquinas de busca na Internet

Upload: ticinformaticauff

Post on 22-Jul-2015

216 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Copy of trabalho de redes

Máquinas de busca na Internet

Page 2: Copy of trabalho de redes

1. Introdução2. Conceito3. Evolução4. Tipos de Máquinas de Busca5. Como funciona?6. Google7. Relevância8. SEO9. Meta tags

10. "Burlando" os resultados11. Conclusão12. Perguntas sobre o tema13. Referências

Sumário

Page 3: Copy of trabalho de redes

Com a quantidade de informação disponível hoje na Web, seria muito difícil acharmos exatamente o conteúdo que procuramos com facilidade.

Para nos auxiliar nessa tarefa, foram criadas as máquinas de busca da web.

Nesta apresentação mostraremos o que são as máquinas de busca, como evoluiram e como elas funcionam.

Introdução

Page 4: Copy of trabalho de redes

● Ferramenta criada com objetivo de busca de conteúdos armazenados na Web (World Wide Web), dentro de uma rede corporativa ou de um computador pessoal

● Permite que o utilizador solicite o conteúdo a partir de um critério específico, geralmente palavras chaves, e retorna com resultados relevantes a tal critério

Conceito

Page 5: Copy of trabalho de redes

● Surgiram no século XX, ● A primeira máquina de busca, chamada Archie, foi

criada para indexar arquivos na Internet● Após o Archie e a criação da Web, vários surgiram:

○ Wanderer; Veronica; WebCrawler; AltaVista (muito utilizado); Lycos; Yahoo (navegação por diretórios); Google (PageRank); Bing

● Os primeiros motores de buscas as buscas eram feitas por categorias

● Inicialmente, Os Webmasters enviavam as suas URLs para as máquinas de busca

● Não eram possíveis buscar imagens, por exemplo

Evolução

Page 6: Copy of trabalho de redes

Os principais são:● Baseadas em Crawlers (ou "Spiders")

○ São totalmente automáticas○ Não possuem hierarquia○ Resultados específicos

● Diretórios○ Possuem hierarquia○ São analisados por pessoas, que organizam o

conteúdo por categorias○ Resultados genéricos

Tipos de Máquinas de busca

Page 7: Copy of trabalho de redes

Baseadas em Crawlers:

1. Varrem a web

2. Indexam o conteúdo

3. Classifica o conteúdo

4. Exibe os resultados

Como funcionam?

Page 8: Copy of trabalho de redes

Varrendo a Web

● Spiders/Crawlers

● Caminham entre os links

● Armazenam as páginas

Como funcionam?

Page 9: Copy of trabalho de redes

Indexação

● Catálogo de páginas

● Lê/Descompacta/Análisa

● Armazena as informações importantes

Como funcionam?

Page 10: Copy of trabalho de redes

Classificação do conteúdo

● Faz a ordenação de todo o conteúdo indexado pela sua relevância.

Como funcionam?

Page 11: Copy of trabalho de redes

Exibição do resultados

● Lista para o usuário os resultados mais relevantes para a busca feita.

● Exibe informações como título, breve descrição e link.

Como funcionam?

Page 12: Copy of trabalho de redes

Como funcionam?

(Fonte:http://evoluindonainformatica.wordpress.com/author/lanalbs/)

Page 13: Copy of trabalho de redes

● Criada em 1998, por Larry Page e Sergey Brin● A maior ferramenta de busca atualmenteCaracterísticas:● Utiliza "spiders"

● Busca por imagem

● Correção ortográfica

● Google Instant○ Resultados

● Qualidade dos resultados: relevância○ Como calcular?

Google

Page 14: Copy of trabalho de redes

PAGERANK!

Page 15: Copy of trabalho de redes

RelevânciaPageRank ● Criado por Sergey Brin e Larry Page

● Mede a importância da página através dos links que apontam para ela e do quão importante esses links são.

● Escala de 0 a 10.

Retirado de: http://www.mestreseo.com.br/pagerank/pagerank-alto-como-conseguir-por-que em 24/02/2013

Page 16: Copy of trabalho de redes

Fórmula do PageRank

PR(A) = (1 - d) + d(PR(T1)/C(T1) +...+ PR(Tn)/C(Tn))

Relevância

Page 17: Copy of trabalho de redes

Exemplo de cálculo de PR(Meu site) PR(A) = 0PR(B) = PR(C) = PR(D) = 4PR(E) = PR(F) = PR(G) = PR(H) = PR(I) =3PR(J) = PR(K) = 2

C(B) = C(C) = C(D) = 10C(E) = C(F) = C(G) = C(H) = C(I) = 8C(J) = C(K) = 9

PR(A) = (1-0.85) + 0.85*(PR(B)/C(B) + … + PR(K)/C(K))PR(A) = (1-0.85) + 0.85*( 3*4/10 + 5*3/8 + 2*2/9)PR(A) = 3.14

- Exemplo retirado do artigo "PageRank 3 na primeira atualização? Saiba como e por quê" (Frank Marcel para MestreSEO)

Relevância

Page 18: Copy of trabalho de redes

Além do PageRank, o Google e as outras ferramentas de busca analisam outras coisas, por exemplo:● A quantidade que a palavra chave aparece na web

page● O local que a keyword aparece: no título, no texto, na

URL● O domínio de topo (TLD - Top Level Domain)

Relevância

Page 19: Copy of trabalho de redes

Em 2011, Google fez uma grande mudança no seu algoritmo, afetando cerca de 11,8%¹ das suas buscas. Essa atualização ficou conhecida como Panda.

Devido a grande mudança nos resultados das buscas, a Google fez um questionário com 23 perguntas para ajudar os Webmasters no ranking dos seus sites

Segue algumas:

Relevância

¹ http://www.google.com/competition/howgooglesearchworks.html

Page 20: Copy of trabalho de redes

"5- A ortografia e o estilo do artigo estão corretos, ou inúmeros erros persistem ? "

"21- O artigo é curto, sem substância, ou sem especificações úteis? "

"18- Este é o tipo de página que você deseja marcar, compartilhar com um amigo ou recomendar? "

4- Você chegaria a dar informações sobre o seu cartão de crédito neste site?

Relevância

Fonte: http://pt.kioskea.net/faq/10244-o-algoritmo-do-google-panda-foi-revelado

Page 21: Copy of trabalho de redes

Esforço do Webmaster para melhorar a classificação do site no motor de busca.

Técnicas White Hat:São considerados assim se estão de acordo com as orientações dos Search Engines.

Técnicas Black Hat:● Cloaking● Texto escondido

SEO (Search Engine Optimization)

Page 22: Copy of trabalho de redes

São códigos implementados dentro da página para auxiliar máquinas de busca● Devem ser criadas individualmente para cada página● Ficam "escondidas" para quem navega através do

navegador. Só é possível visualizar vendo o código da página

● Eram muito utilizados pelas ferramentas de busca para auxiliar os robôs

Meta tags

Page 23: Copy of trabalho de redes

Exemplos de Meta tags:● Meta Description

○ Definição da página

● Meta Keywords○ Palavras chaves para descrever a página

● Meta Robots○ Comandos para os "spiders"

● Title○ Não é uma Meta tag, mas é o mais importante

■ Exemplo:<title>Climatempo - Previsão do Tempo | Meteorologia e Notícias em Tempo Real</title>

Meta tags

Page 24: Copy of trabalho de redes

Lembrando que no PageRank a classificação dos resultados é feita de acordo com o número de links que apontam para a página. Porém na web podem ser criadas páginas web "falsas".

Google bombs● Uma das mais famosa é a "Miserable Failure".

Spamdexing● Usado para fins comerciais

"Burlando" os resultados

Page 25: Copy of trabalho de redes

Sem os motores de busca seria muito dificil as pesquisar por conteúdo na web. A invenção destes tornou possivel encontrar um assunto específico diante desta enorme quantidade de informação. Portanto podemos dizer que estes são base para a Internet da forma que conhecemos e nos habituamos a utilizar.

Conclusão

Page 26: Copy of trabalho de redes

Beatriz Valadares Cendón (2001). Ferramentas de busca na Web - http://www.scielo.br/pdf/%0D/ci/v30n1/a06v30n1.pdfSergey Brin and Lawrence Page. The Anatomy of a Large-Scale Hypertextual Web Search Engine, Stanford University, Stanford, CA, USA - http://infolab.stanford.edu/~backrub/google.htmlSEOmoz - The Begginers Guide to SEO - http://www.seomoz.org/beginners-guide-to-seoWordStream - History of Search - chttp://www.wordstream.com/articles/internet-search-engines-historyWikipedia - Web Search Engine - http://en.wikipedia.org/wiki/Web_search_engineHow Stuff Work? - http://computer.howstuffworks.com/internet/basics/search-engine.htmSearch Engine Watch - http://searchenginewatch.com/article/2065173/How-Search-Engines-WorkRed Carpet Web - http://www.redcarpetweb.com/basics9.html

https://sites.google.com/site/historiasobreossitesdebusca/

Referências

Page 27: Copy of trabalho de redes

Wikipedia - Bombardeio Googlehttp://en.wikipedia.org/wiki/Google_bombWikipedia - SEOhttp://en.wikipedia.org/wiki/Search_engine_optimizationWikipedia - Camuflagemhttp://en.wikipedia.org/wiki/CloakingWikipedia - Spamdexinghttp://en.wikipedia.org/wiki/SpamdexingSearchengineland - What is SEOhttp://searchengineland.com/guide/what-is-seohttp://www.seomarketing.com.br/meta-tags-google.phphttp://pt.kioskea.net/faq/10244-o-algoritmo-do-google-panda-foi-reveladohttp://www.youtube.com/watch?feature=player_embedded&v=mTBShTwCnD4http://brasilmedia.com/Como-funciona-uma-Maquina-de-Busca.html#.USrUFzd57nghttp://www.seohoje.com/blog/como-funciona-o-algoritmo-de-busca-do-google/http://evoluindonainformatica.wordpress.com/author/lanalbs/http://support.google.com/webmasters/bin/answer.py?hl=en&answer=79812http://www.google.com/competition/howgooglesearchworks.html

Referências