copy of trabalho de redes

Post on 22-Jul-2015

216 Views

Category:

Documents

1 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Máquinas de busca na Internet

1. Introdução2. Conceito3. Evolução4. Tipos de Máquinas de Busca5. Como funciona?6. Google7. Relevância8. SEO9. Meta tags

10. "Burlando" os resultados11. Conclusão12. Perguntas sobre o tema13. Referências

Sumário

Com a quantidade de informação disponível hoje na Web, seria muito difícil acharmos exatamente o conteúdo que procuramos com facilidade.

Para nos auxiliar nessa tarefa, foram criadas as máquinas de busca da web.

Nesta apresentação mostraremos o que são as máquinas de busca, como evoluiram e como elas funcionam.

Introdução

● Ferramenta criada com objetivo de busca de conteúdos armazenados na Web (World Wide Web), dentro de uma rede corporativa ou de um computador pessoal

● Permite que o utilizador solicite o conteúdo a partir de um critério específico, geralmente palavras chaves, e retorna com resultados relevantes a tal critério

Conceito

● Surgiram no século XX, ● A primeira máquina de busca, chamada Archie, foi

criada para indexar arquivos na Internet● Após o Archie e a criação da Web, vários surgiram:

○ Wanderer; Veronica; WebCrawler; AltaVista (muito utilizado); Lycos; Yahoo (navegação por diretórios); Google (PageRank); Bing

● Os primeiros motores de buscas as buscas eram feitas por categorias

● Inicialmente, Os Webmasters enviavam as suas URLs para as máquinas de busca

● Não eram possíveis buscar imagens, por exemplo

Evolução

Os principais são:● Baseadas em Crawlers (ou "Spiders")

○ São totalmente automáticas○ Não possuem hierarquia○ Resultados específicos

● Diretórios○ Possuem hierarquia○ São analisados por pessoas, que organizam o

conteúdo por categorias○ Resultados genéricos

Tipos de Máquinas de busca

Baseadas em Crawlers:

1. Varrem a web

2. Indexam o conteúdo

3. Classifica o conteúdo

4. Exibe os resultados

Como funcionam?

Varrendo a Web

● Spiders/Crawlers

● Caminham entre os links

● Armazenam as páginas

Como funcionam?

Indexação

● Catálogo de páginas

● Lê/Descompacta/Análisa

● Armazena as informações importantes

Como funcionam?

Classificação do conteúdo

● Faz a ordenação de todo o conteúdo indexado pela sua relevância.

Como funcionam?

Exibição do resultados

● Lista para o usuário os resultados mais relevantes para a busca feita.

● Exibe informações como título, breve descrição e link.

Como funcionam?

Como funcionam?

(Fonte:http://evoluindonainformatica.wordpress.com/author/lanalbs/)

● Criada em 1998, por Larry Page e Sergey Brin● A maior ferramenta de busca atualmenteCaracterísticas:● Utiliza "spiders"

● Busca por imagem

● Correção ortográfica

● Google Instant○ Resultados

● Qualidade dos resultados: relevância○ Como calcular?

Google

PAGERANK!

RelevânciaPageRank ● Criado por Sergey Brin e Larry Page

● Mede a importância da página através dos links que apontam para ela e do quão importante esses links são.

● Escala de 0 a 10.

Retirado de: http://www.mestreseo.com.br/pagerank/pagerank-alto-como-conseguir-por-que em 24/02/2013

Fórmula do PageRank

PR(A) = (1 - d) + d(PR(T1)/C(T1) +...+ PR(Tn)/C(Tn))

Relevância

Exemplo de cálculo de PR(Meu site) PR(A) = 0PR(B) = PR(C) = PR(D) = 4PR(E) = PR(F) = PR(G) = PR(H) = PR(I) =3PR(J) = PR(K) = 2

C(B) = C(C) = C(D) = 10C(E) = C(F) = C(G) = C(H) = C(I) = 8C(J) = C(K) = 9

PR(A) = (1-0.85) + 0.85*(PR(B)/C(B) + … + PR(K)/C(K))PR(A) = (1-0.85) + 0.85*( 3*4/10 + 5*3/8 + 2*2/9)PR(A) = 3.14

- Exemplo retirado do artigo "PageRank 3 na primeira atualização? Saiba como e por quê" (Frank Marcel para MestreSEO)

Relevância

Além do PageRank, o Google e as outras ferramentas de busca analisam outras coisas, por exemplo:● A quantidade que a palavra chave aparece na web

page● O local que a keyword aparece: no título, no texto, na

URL● O domínio de topo (TLD - Top Level Domain)

Relevância

Em 2011, Google fez uma grande mudança no seu algoritmo, afetando cerca de 11,8%¹ das suas buscas. Essa atualização ficou conhecida como Panda.

Devido a grande mudança nos resultados das buscas, a Google fez um questionário com 23 perguntas para ajudar os Webmasters no ranking dos seus sites

Segue algumas:

Relevância

¹ http://www.google.com/competition/howgooglesearchworks.html

"5- A ortografia e o estilo do artigo estão corretos, ou inúmeros erros persistem ? "

"21- O artigo é curto, sem substância, ou sem especificações úteis? "

"18- Este é o tipo de página que você deseja marcar, compartilhar com um amigo ou recomendar? "

4- Você chegaria a dar informações sobre o seu cartão de crédito neste site?

Relevância

Fonte: http://pt.kioskea.net/faq/10244-o-algoritmo-do-google-panda-foi-revelado

Esforço do Webmaster para melhorar a classificação do site no motor de busca.

Técnicas White Hat:São considerados assim se estão de acordo com as orientações dos Search Engines.

Técnicas Black Hat:● Cloaking● Texto escondido

SEO (Search Engine Optimization)

São códigos implementados dentro da página para auxiliar máquinas de busca● Devem ser criadas individualmente para cada página● Ficam "escondidas" para quem navega através do

navegador. Só é possível visualizar vendo o código da página

● Eram muito utilizados pelas ferramentas de busca para auxiliar os robôs

Meta tags

Exemplos de Meta tags:● Meta Description

○ Definição da página

● Meta Keywords○ Palavras chaves para descrever a página

● Meta Robots○ Comandos para os "spiders"

● Title○ Não é uma Meta tag, mas é o mais importante

■ Exemplo:<title>Climatempo - Previsão do Tempo | Meteorologia e Notícias em Tempo Real</title>

Meta tags

Lembrando que no PageRank a classificação dos resultados é feita de acordo com o número de links que apontam para a página. Porém na web podem ser criadas páginas web "falsas".

Google bombs● Uma das mais famosa é a "Miserable Failure".

Spamdexing● Usado para fins comerciais

"Burlando" os resultados

Sem os motores de busca seria muito dificil as pesquisar por conteúdo na web. A invenção destes tornou possivel encontrar um assunto específico diante desta enorme quantidade de informação. Portanto podemos dizer que estes são base para a Internet da forma que conhecemos e nos habituamos a utilizar.

Conclusão

Beatriz Valadares Cendón (2001). Ferramentas de busca na Web - http://www.scielo.br/pdf/%0D/ci/v30n1/a06v30n1.pdfSergey Brin and Lawrence Page. The Anatomy of a Large-Scale Hypertextual Web Search Engine, Stanford University, Stanford, CA, USA - http://infolab.stanford.edu/~backrub/google.htmlSEOmoz - The Begginers Guide to SEO - http://www.seomoz.org/beginners-guide-to-seoWordStream - History of Search - chttp://www.wordstream.com/articles/internet-search-engines-historyWikipedia - Web Search Engine - http://en.wikipedia.org/wiki/Web_search_engineHow Stuff Work? - http://computer.howstuffworks.com/internet/basics/search-engine.htmSearch Engine Watch - http://searchenginewatch.com/article/2065173/How-Search-Engines-WorkRed Carpet Web - http://www.redcarpetweb.com/basics9.html

https://sites.google.com/site/historiasobreossitesdebusca/

Referências

Wikipedia - Bombardeio Googlehttp://en.wikipedia.org/wiki/Google_bombWikipedia - SEOhttp://en.wikipedia.org/wiki/Search_engine_optimizationWikipedia - Camuflagemhttp://en.wikipedia.org/wiki/CloakingWikipedia - Spamdexinghttp://en.wikipedia.org/wiki/SpamdexingSearchengineland - What is SEOhttp://searchengineland.com/guide/what-is-seohttp://www.seomarketing.com.br/meta-tags-google.phphttp://pt.kioskea.net/faq/10244-o-algoritmo-do-google-panda-foi-reveladohttp://www.youtube.com/watch?feature=player_embedded&v=mTBShTwCnD4http://brasilmedia.com/Como-funciona-uma-Maquina-de-Busca.html#.USrUFzd57nghttp://www.seohoje.com/blog/como-funciona-o-algoritmo-de-busca-do-google/http://evoluindonainformatica.wordpress.com/author/lanalbs/http://support.google.com/webmasters/bin/answer.py?hl=en&answer=79812http://www.google.com/competition/howgooglesearchworks.html

Referências

top related