copy of trabalho de redes
Post on 22-Jul-2015
216 Views
Preview:
TRANSCRIPT
Máquinas de busca na Internet
1. Introdução2. Conceito3. Evolução4. Tipos de Máquinas de Busca5. Como funciona?6. Google7. Relevância8. SEO9. Meta tags
10. "Burlando" os resultados11. Conclusão12. Perguntas sobre o tema13. Referências
Sumário
Com a quantidade de informação disponível hoje na Web, seria muito difícil acharmos exatamente o conteúdo que procuramos com facilidade.
Para nos auxiliar nessa tarefa, foram criadas as máquinas de busca da web.
Nesta apresentação mostraremos o que são as máquinas de busca, como evoluiram e como elas funcionam.
Introdução
● Ferramenta criada com objetivo de busca de conteúdos armazenados na Web (World Wide Web), dentro de uma rede corporativa ou de um computador pessoal
● Permite que o utilizador solicite o conteúdo a partir de um critério específico, geralmente palavras chaves, e retorna com resultados relevantes a tal critério
Conceito
● Surgiram no século XX, ● A primeira máquina de busca, chamada Archie, foi
criada para indexar arquivos na Internet● Após o Archie e a criação da Web, vários surgiram:
○ Wanderer; Veronica; WebCrawler; AltaVista (muito utilizado); Lycos; Yahoo (navegação por diretórios); Google (PageRank); Bing
● Os primeiros motores de buscas as buscas eram feitas por categorias
● Inicialmente, Os Webmasters enviavam as suas URLs para as máquinas de busca
● Não eram possíveis buscar imagens, por exemplo
Evolução
Os principais são:● Baseadas em Crawlers (ou "Spiders")
○ São totalmente automáticas○ Não possuem hierarquia○ Resultados específicos
● Diretórios○ Possuem hierarquia○ São analisados por pessoas, que organizam o
conteúdo por categorias○ Resultados genéricos
Tipos de Máquinas de busca
Baseadas em Crawlers:
1. Varrem a web
2. Indexam o conteúdo
3. Classifica o conteúdo
4. Exibe os resultados
Como funcionam?
Varrendo a Web
● Spiders/Crawlers
● Caminham entre os links
● Armazenam as páginas
Como funcionam?
Indexação
● Catálogo de páginas
● Lê/Descompacta/Análisa
● Armazena as informações importantes
Como funcionam?
Classificação do conteúdo
● Faz a ordenação de todo o conteúdo indexado pela sua relevância.
Como funcionam?
Exibição do resultados
● Lista para o usuário os resultados mais relevantes para a busca feita.
● Exibe informações como título, breve descrição e link.
Como funcionam?
Como funcionam?
(Fonte:http://evoluindonainformatica.wordpress.com/author/lanalbs/)
● Criada em 1998, por Larry Page e Sergey Brin● A maior ferramenta de busca atualmenteCaracterísticas:● Utiliza "spiders"
● Busca por imagem
● Correção ortográfica
● Google Instant○ Resultados
● Qualidade dos resultados: relevância○ Como calcular?
PAGERANK!
RelevânciaPageRank ● Criado por Sergey Brin e Larry Page
● Mede a importância da página através dos links que apontam para ela e do quão importante esses links são.
● Escala de 0 a 10.
Retirado de: http://www.mestreseo.com.br/pagerank/pagerank-alto-como-conseguir-por-que em 24/02/2013
Fórmula do PageRank
PR(A) = (1 - d) + d(PR(T1)/C(T1) +...+ PR(Tn)/C(Tn))
Relevância
Exemplo de cálculo de PR(Meu site) PR(A) = 0PR(B) = PR(C) = PR(D) = 4PR(E) = PR(F) = PR(G) = PR(H) = PR(I) =3PR(J) = PR(K) = 2
C(B) = C(C) = C(D) = 10C(E) = C(F) = C(G) = C(H) = C(I) = 8C(J) = C(K) = 9
PR(A) = (1-0.85) + 0.85*(PR(B)/C(B) + … + PR(K)/C(K))PR(A) = (1-0.85) + 0.85*( 3*4/10 + 5*3/8 + 2*2/9)PR(A) = 3.14
- Exemplo retirado do artigo "PageRank 3 na primeira atualização? Saiba como e por quê" (Frank Marcel para MestreSEO)
Relevância
Além do PageRank, o Google e as outras ferramentas de busca analisam outras coisas, por exemplo:● A quantidade que a palavra chave aparece na web
page● O local que a keyword aparece: no título, no texto, na
URL● O domínio de topo (TLD - Top Level Domain)
Relevância
Em 2011, Google fez uma grande mudança no seu algoritmo, afetando cerca de 11,8%¹ das suas buscas. Essa atualização ficou conhecida como Panda.
Devido a grande mudança nos resultados das buscas, a Google fez um questionário com 23 perguntas para ajudar os Webmasters no ranking dos seus sites
Segue algumas:
Relevância
¹ http://www.google.com/competition/howgooglesearchworks.html
"5- A ortografia e o estilo do artigo estão corretos, ou inúmeros erros persistem ? "
"21- O artigo é curto, sem substância, ou sem especificações úteis? "
"18- Este é o tipo de página que você deseja marcar, compartilhar com um amigo ou recomendar? "
4- Você chegaria a dar informações sobre o seu cartão de crédito neste site?
Relevância
Fonte: http://pt.kioskea.net/faq/10244-o-algoritmo-do-google-panda-foi-revelado
Esforço do Webmaster para melhorar a classificação do site no motor de busca.
Técnicas White Hat:São considerados assim se estão de acordo com as orientações dos Search Engines.
Técnicas Black Hat:● Cloaking● Texto escondido
SEO (Search Engine Optimization)
São códigos implementados dentro da página para auxiliar máquinas de busca● Devem ser criadas individualmente para cada página● Ficam "escondidas" para quem navega através do
navegador. Só é possível visualizar vendo o código da página
● Eram muito utilizados pelas ferramentas de busca para auxiliar os robôs
Meta tags
Exemplos de Meta tags:● Meta Description
○ Definição da página
● Meta Keywords○ Palavras chaves para descrever a página
● Meta Robots○ Comandos para os "spiders"
● Title○ Não é uma Meta tag, mas é o mais importante
■ Exemplo:<title>Climatempo - Previsão do Tempo | Meteorologia e Notícias em Tempo Real</title>
Meta tags
Lembrando que no PageRank a classificação dos resultados é feita de acordo com o número de links que apontam para a página. Porém na web podem ser criadas páginas web "falsas".
Google bombs● Uma das mais famosa é a "Miserable Failure".
Spamdexing● Usado para fins comerciais
"Burlando" os resultados
Sem os motores de busca seria muito dificil as pesquisar por conteúdo na web. A invenção destes tornou possivel encontrar um assunto específico diante desta enorme quantidade de informação. Portanto podemos dizer que estes são base para a Internet da forma que conhecemos e nos habituamos a utilizar.
Conclusão
Beatriz Valadares Cendón (2001). Ferramentas de busca na Web - http://www.scielo.br/pdf/%0D/ci/v30n1/a06v30n1.pdfSergey Brin and Lawrence Page. The Anatomy of a Large-Scale Hypertextual Web Search Engine, Stanford University, Stanford, CA, USA - http://infolab.stanford.edu/~backrub/google.htmlSEOmoz - The Begginers Guide to SEO - http://www.seomoz.org/beginners-guide-to-seoWordStream - History of Search - chttp://www.wordstream.com/articles/internet-search-engines-historyWikipedia - Web Search Engine - http://en.wikipedia.org/wiki/Web_search_engineHow Stuff Work? - http://computer.howstuffworks.com/internet/basics/search-engine.htmSearch Engine Watch - http://searchenginewatch.com/article/2065173/How-Search-Engines-WorkRed Carpet Web - http://www.redcarpetweb.com/basics9.html
https://sites.google.com/site/historiasobreossitesdebusca/
Referências
Wikipedia - Bombardeio Googlehttp://en.wikipedia.org/wiki/Google_bombWikipedia - SEOhttp://en.wikipedia.org/wiki/Search_engine_optimizationWikipedia - Camuflagemhttp://en.wikipedia.org/wiki/CloakingWikipedia - Spamdexinghttp://en.wikipedia.org/wiki/SpamdexingSearchengineland - What is SEOhttp://searchengineland.com/guide/what-is-seohttp://www.seomarketing.com.br/meta-tags-google.phphttp://pt.kioskea.net/faq/10244-o-algoritmo-do-google-panda-foi-reveladohttp://www.youtube.com/watch?feature=player_embedded&v=mTBShTwCnD4http://brasilmedia.com/Como-funciona-uma-Maquina-de-Busca.html#.USrUFzd57nghttp://www.seohoje.com/blog/como-funciona-o-algoritmo-de-busca-do-google/http://evoluindonainformatica.wordpress.com/author/lanalbs/http://support.google.com/webmasters/bin/answer.py?hl=en&answer=79812http://www.google.com/competition/howgooglesearchworks.html
Referências
top related