hanking dos melhores sites de busca

13
UNIVERSIDADE GAMA FILHO – UGF PÓS GRADUAÇÃO EM ENGENHARIA DE SOFTWARE METODOLOGIA DA PESQUISA E DA PRODUÇÃO CIENTÍFICA Marcos Rogerio Santiago RANQUEAMENTO E DEFINIÇÃO DOS MELHORES SITES DE BUSCA ATUALMENTE NA INTERNET Goiânia 2009

Upload: marcos-rogerio

Post on 27-Jun-2015

979 views

Category:

Documents


7 download

DESCRIPTION

Pesquisa científica que objetiva o hanqueamento dos melhores sites de busca da internet atualmente

TRANSCRIPT

Page 1: Hanking dos melhores sites de busca

UNIVERSIDADE GAMA FILHO – UGF

PÓS GRADUAÇÃO EM ENGENHARIA DE SOFTWARE

METODOLOGIA DA PESQUISA E DA PRODUÇÃO CIENTÍFICA

Marcos Rogerio Santiago

RANQUEAMENTO E DEFINIÇÃO DOS MELHORES SITES DE BUSCA ATUALMENTE NA INTERNET

Goiânia2009

Page 2: Hanking dos melhores sites de busca

Marcos Rogerio Santiago

RANQUEAMENTO E DEFINIÇÃO DOS MELHORES SITES DE BUSCA ATUALMENTE NA INTERNET

Pré-projeto de pesquisa apresentado à Universidade Gama Filho – UGF/POSEAD, para conclusão da terceira atividade proposta na disciplina Metodologia da Pesquisa e da Produção Científica.

Orientadora: Professora Sandra Brant

Goiânia2009

Page 3: Hanking dos melhores sites de busca

RESUMO

Este trabalho se propõe a definir através de método científico quais são os cinco melhores sites de busca atualmente na internet. Com o constante aumento do uso da rede, e consequentemente, com a utilização cada vez maior desta ferramenta para estudos, pesquisas, entretenimento, curiosidades e tantos outros fins, o uso de ferramentas de busca é imprescindível. Em vista da quantidade de ferramentas disponíveis e a tendência que existe de se adotar sempre determinado site, por ele ter uma maior fama, exercer maior influência, e/ou “apresentar” melhores opções de uso, para se comprovar se realmente tais sites são os que têm melhores resultados, foi feito este estudo.

Page 4: Hanking dos melhores sites de busca

ABSTRACT

This paper aims to define through scientific method which are the top five search engines currently on the Internet. With the constant increase in network usage, and therefore, the increased use of this tool for studies, research, entertainment, trivia and many other purposes, the use of search engines is essential. Given the amount of tools available and the tendency is always to adopt a particular site, because he has a greater fame, greater influence and / or "present" best use options, to determine whether it really such sites are those have better outcomes, this study has been done.

Page 5: Hanking dos melhores sites de busca

SUMÁRIO

Conteúdo

1 – Introdução pag. 5

2 – Objetivos pag. 6

2.1 – Geral pag. 6

2.2 - Específico pag. 6

3 – Literatura sobre o tema pag. 6

3.1 Motor de busca pag. 7

3.2 Page Rank™ pag. 7

4 – Metodologia pag. 8

5 – Conclusão pag. 11

Lista de tabelas

Tabela 1 – Ranqueamento pag. 8

Tabela 2 – Organização do ranqueamento pag. 9

Tabela 3 – Pesquisas realizadas pag. 9

Tabela 4 – Análise de link pag. 10

Tabela 5 – Opcionais de busca pag. 10

Tabela 6 – Resumo pag. 10

Tabela 7 – Cálculos aritméticos pag. 11

Tabela 8 – Colocação do site de busca pag. 11

Page 6: Hanking dos melhores sites de busca

51 INTRODUÇÃO

O conhecimento do ser humano, a cada dia que passa, se torna maior

e mais especializado. A humanidade observou que o conhecimento que é passado

adiante torna-se frutuoso e, como que numa construção, onde os tijolos são

colocados um a um para formar uma edificação, as contribuições de nossos

antepassados aliadas às nossas, vão formando o saber, e com isso uma nova

consciência vai ganhando vida e um novo mundo vai surgindo.

Com o advento da internet, o mundo tornou-se pequeno do ponto de

vista do conhecimento e da informação. Não é preciso demonstrar este fenômeno

visto que a grande maioria de nós já usufrui desta realidade. A cada dia mais e mais

instrumentos são criados para facilitar nossa busca pela satisfação de nossos

objetivos.

Nós, como indivíduos ávidos de conhecimento e sempre abertos a

utilização de novas tecnologias, acabamos por desenvolver uma mentalidade que

pode, às vezes, nos prejudicar. Sempre que sabemos que algo novo está no

mercado, nos sentimos como se o que temos atualmente já não atende mais as

nossas necessidades. Logo que podemos, tratamos de nos livrar daquele item, que

agora já não é a última versão – mas que nos atendia – e vamos atrás desta última

versão, brilhante, dourada, que vai resolver todos os nossos problemas, ignorando

muitas vezes, que aquela última versão não foi totalmente testada, que talvês não

seja compatível, ou que simplesmente desabilitou algo que gostávamos na versão

anterior. Este efeito acontece em várias áreas de nossa vida. O carro novo, o

software novo e também a disponibilização de novos serviços.

Quando falamos em “serviços de busca da internet”, quase que

substituimos o termo pela palavra “GOOGLE”, como se esta fosse a única

ferramenta de busca existente. Este trabalho não pretende ser um crítico deste

pensamento, mas sim, fazer uma análise científica para determinar quais são os

cinco melhores sites de busca atualmente na net.

Um outro fator impulsionador deste trabalho foi a falta de literatura que

abranja este foco. Encontram-se vários estudos sobre as vantagens de se utilizar

esta ou aquela tecnologia, estudos estatísticos sobre o perfil dos que utilizam estas

Page 7: Hanking dos melhores sites de busca

6

ferrramentas, estudo de marketing utilizando ferramentas de busca, etc., mas nada

que nos diga com bases científicas: - Qual é a melhor ferramenta de busca hoje?.

Este material pretende, com bases sólidas, responder esta pergunta.

2 OBJETIVOS

2.1 GERAL

Este documento tem como objetivo fornecer uma lista dos 5 melhores

sites de busca atualmente, dando aos seus leitores a segurança necessária e o

conforto em conhecer os opcionais mais interessantes existentes nestas

ferramentas. Também pretende ser referência para o ranqueamento de sites de

busca no futuro, fornecendo critérios que poderão ser seguidos com vistas a

construção de novas listas.

2.2 ESPECÍFICO

Através deste estudo, conhecer cada opcional, cada tecnologia

empregada nos sites mais conhecidos, conhecer outras ferramentas menos

conhecidas, estabelecer relações entre elas, entender suas tecnologias e ao final

fazer uma conclusão segura, indicando os opcionais de cada site. Estes opcionais

podem existir em uma ferramenta de busca e não existir em outra, de forma que

poderemos, após a conclusão desta pesquisa, aproveitar melhor o que estas

ferramentas nos oferecem.

3 LITERATURA SOBRE O TEMA

Como mensionado da seção de introdução deste documento, não

existem muitas literaturas sobre o assunto. Existem, contudo, artigos, pesquisas,

registros estatísticos e conceitos interessantes que ajudarão na elaboração dos

métodos de estudo que utilizaremos aqui. Nesta seção, serão explicitados estes

conceitos e também serão abordadas questões sobre como funcionam os

mecanismos de busca.

Page 8: Hanking dos melhores sites de busca

7

3.1 MOTOR DE BUSCA

Um motor de busca, motor de pesquisa, máquina de busca,

mecanismo de busca ou buscador é um sistema de software projetado para

encontrar informações armazenadas em um sistema computacional a partir de

palavras-chave indicadas pelo utilizador, reduzindo o tempo necessário para

encontrar informações.

Ao se realizar uma consulta, a lista de ocorrências de assuntos é criada

em poucos segundos por meio de um conjunto de softwares de computadores,

conhecidos como spiders, que vasculham toda a Web em busca de ocorrências de

um determinado assunto em uma página. Ao encontrar uma página com muitos

links, os spiders embrenham-se por eles, conseguindo, inclusive, vasculhar os

diretórios internos - aqueles que tenham permissão de leitura para usuários - dos

sites nos quais estão trabalhando.

Fonte:(http://pt.wikipedia.org/wiki/Motor_de_busca)

3.2 PAGERANK

PageRank™ é uma família de algoritmos de análise de rede que dá

pesos numéricos a cada elemento de uma coleção de documentos hiperligados,

como as páginas da internet, com o propósito de medir a sua importância nesse

grupo por meio de um motor de busca. O algoritmo pode ser aplicado a qualquer

coleção de objetos com ligações recíprocas e referências. O peso numérico dado a

cada elemento E é chamado PageRank de E e notado como PR(E). Suas

propriedades são muito discutidas por especialistas em otimização dos motores de

busca (SEO, sigla em inglês para search engine optimization).

A importância se dá pelo número de votos que uma página recebe. Um

voto é um link em qualquer lugar da Internet para aquela página. Votos de páginas

mais importantes valem mais do que votos de páginas menos importantes. Esse

critério de ordenação das páginas, de acordo com várias pessoas, é bastante

democrático, refletindo o que a "Internet pensa" sobre determinado termo. Lembre-

se que cerca de dez bilhões de páginas são levadas em conta. A qualidade das

páginas mais importantes são naturalmente garantidas, classificadas e eleitas pela

Page 9: Hanking dos melhores sites de busca

8própria internet. Além de todas as páginas terem a mesma condição de subir nessa

lista, conquistando votos pela Internet afora.

Fonte:(http://pt.wikipedia.org/wiki/PageRank)

4 METODOLOGIA

Analisando os conceitos citados, podemos concluir que os links que

aparecem nas primeiras posições dos sites de busca que utilizam a tecnologia

PageRank™ são, de fato aqueles que têm a maior preferência na opinião dos

internautas, ou seja, daqueles que realmente utilizam as ferramentas de busca.

Partindo deste princípio, escolheremos três sites que utilizam esta tecnologia e a

partir deles, faremos pesquisas sobre o melhor buscador da internet.

Os três sites para busca escolhidos são: www.altavista.com,

www.google.com.br e http://search.yahoo.com. Em seguida, para escolhermos o

melhor termo ao qual obteremos uma lista de sites buscadores, testaremos algumas

palavras/frases e observaremos o resultado. As palavras/frases utilizadas foram:

buscadores; melhor “ferramentas de busca”; “site de busca”; ferramenta de busca;

buscador; busca na net; “busca na net”; melhor buscador; “melhor buscador”. Os

melhores resultados para as palavras ou frases acima foram: buscador e “site de

busca” com aspas.

Na tabela 1, mostra-se os cinco primeiros sites de busca encontrados

pela ordem de relevância:

Site de busca Palavra - buscador Frase - “site de busca”www.altavisca.com www.cade.com.br

www.google.com.br www.bing.comradaruol.uol.com.br buscador.terra.com.br

www.google.com.br www.aonde.com.br www.buscaki.com.br www.copycola.com.br www.buscapopular.com.br

www.google.com.br busca.uol.com.brwww.linkador.comwww.buscador.comwww.buscador.clarin.comwww.mibuscador.net

www.aonde.com.brcade.search.yahoo.combr.www.altavista.combusca.uol.com.brwww.sitesdebusca.com.br

search.yahoo.com www.google.com www.www.altavista.com search.ask.com www.alltheweb.com buscador.terra.com

www.google.com.br www.buscaaqui.com.br www.aonde.com.br br.www.altavista.com aonde.org

Tabela 1 – Ranqueamento. Pesquisa realizada em 05/11/2009

Após a descoberta dos sites encontrados, foram feitas análises para

filtrar os endereços com intuito de observar se os links eram redundantes. Depois de

feita esta análise restaram os seguintes links:

Page 10: Hanking dos melhores sites de busca

9

Links Ocorrênciaswww.aonde.com.br 4

busca.uol.com.br 3

www.altavista.com 3

www.google.com.br 3

search.yahoo.com 2

buscador.terra.com.br 2

www.bing.com 1

www.alltheweb.com 1

www.buscaaqui.com.br 1

www.buscador.clarin.com 1

www.buscador.com 1

www.buscaki.com.br 1

www.buscapopular.com.br 1

www.copycola.com.br 1

www.linkador.com 1

www.mibuscador.net 1

search.ask.com 1

www.sitesdebusca.com.br 1Tabela 2 – Ranqueamento2

A partir do critério de relevância, ou seja, quantidade de cliques que

recebe, conclui-se que os links da tabela acima correspondem à eleição dos sites

mais utilizados. O fato do google aparecer apenas na quarta colocação acontece

porque de acordo com os critérios estabelecidos observou-se que o google não

aparece nas pesquisas realizadas em seu próprio link. Como proposto em nosso

método de pesquisa, analisaremos então os cinco primeiros colocados da lista. Os

critérios de análise são: Quantidade de sites retornados; Índice de relevância dos 10

primeiros links; Links quebrados; Links repetidos e; Diferencial tecnológico.

A frase usada para a pesquisar os critérios será "pós graduação à

distância", sem as aspas. As tabelas 3 e 4 abaixo mostram os resultados obtidos:

www.aonde.com.br busca.uol.com.br www.altavista.com www.google.com.br search.yahoo.com Sim - www.portal.Anhembi.br Sim - FGV.br/mba Sim - www.portal.Anhembi.br Sim - www.eadunicid.com.br/pos-

graduacaoSim - http://www.viaxedu.com

Sim - www.FGV.br/fgvonline Sim - www.eadunicid.com.br/pos-graduacao

Sim - www.FGV.br/fgvonline Sim - FGV.br/mba Sim - http://www.estacio.br/ead

Não - www.monografiasrio.com.br Sim - www.PosEAD.com.br Não - www.monografiasrio.com.br Sim - www.metodista.br Sim - http://nith.com.br

Sim - www.Fiap.com.br/mbagestaoti Sim - www.ESAB.edu.br/Pos_Graduacao

Sim - www.estacio.br/ead Sim - www.esab.edu.br Sim - http://www.hgscursos.com.br

Não - www.Concursos.com.br Sim - www.uninove.br/pos Sim - www.pos-ead.senac.br Sim - www.posead.com.br Sim - http://www.posead.com.br

Sim - www.pos-ead.senac.br Repetido - http://www.esab.edu.br Sim - www.claretiano.edu.br/ead-pos-graduacao

Sim - posead.grupouninter.com.br Não - http://profiles.studyusa.com

Sim - www.posead.com.br Repetido - http://www.posead.com.br Repetido - www.claretiano.edu.br Sim - www.senac.br/pos-ead Sim - http://www.facete.org.br

Sim - www.estacio.br Sim - http://posead.grupouninter.com.br

Não - www.capes.gov.br Não - portal.mec.gov.br Sim - http://www.posadistancia.com

Repetido - www.pos-ead.senac.br Sim - http://www.senac.br/pos-ead Sim - www.posead.com.br Não - www.capes.gov.br Sim - http://www.minervinacursos.com.br

Sim - www.claretiano.edu.br Não - http://www.capes.gov.br Sim - www.institutoeficaz.com.br Sim - www.posondeeuestiver.com.br Não - http://cdchaves.sites.uol.com.br

Tabela 3 - Pesquisas realizadas em 07/11/2009

Page 11: Hanking dos melhores sites de busca

10

www.aonde.com.br busca.uol.com.br www.altavista.com www.google.com.br search.yahoo.com Sites retornados = Não informado Sites retornados = 224.000 Sites retornados = 4.950.000 Sites retornados = 9.140.000 Sites retornados = 4.940.000

Sites relevantes = 7 Sites relevantes = 7 Sites relevantes = 7 Sites relevantes = 8 Sites relevantes = 8

Links quebrados = 0 Links quebrados = 0 Links quebrados = 0 Links quebrados = 0 Links quebrados = 0

Links repetidos = 1 Links repetidos = 2 Links repetidos = 1 Links repetidos = 0 Links repetidos = 0

Tabela 4 – Análise dos links da Tabela 3

Agora passaremos a analisar as opções que cada site apresenta, o seu diferencial tecnológico. Serão levantadas as novidades, os facilitadores disponibilizados, os serviços disponíveis que podem auxiliar na qualidade da pesquisa. Em alguns sites existem outras funcionalidades além das descritas aqui, porém, tais funcionalidades não fazem parte do escopo desta pesquisa.

www.aonde.com.br busca.uol.com.br www.altavista.com www.google.com.br search.yahoo.com Busca Brasil e mundo = não Busca Brasil e mundo = sim Busca Brasil e mundo = sim Busca Brasil e mundo = sim Busca Brasil e mundo = sim

Todas as palavras = não Todas as palavras = sim Todas as palavras = sim Todas as palavras = sim Todas as palavras = sim

Com frase exata = não Com frase exata = sim Com frase exata = sim Com frase exata = sim Com frase exata = sim

Por domínio = não Por domínio = sim Por domínio = sim Por domínio = sim Por domínio = sim

Por url = não Por url = não Por url = sim Por url = sim Por url = sim

Pequisa por idioma = não Pequisa por idioma = sim Pequisa por idioma = sim Pequisa por idioma = sim Pequisa por idioma = sim

Com exceção de palavras = não Com exceção de palavras = sim Com exceção de palavras = sim Com exceção de palavras = sim Com exceção de palavras = sim

Resultados por página = não Resultados por página = sim Resultados por página = sim Resultados por página = sim Resultados por página = sim

Buscar imagens relacionadas = não Buscar imagens relacionadas = sim Buscar imagens relacionadas = sim Buscar imagens relacionadas = sim Buscar imagens relacionadas = sim

Buscar vídeos relacionados = não Buscar vídeos relacionados = sim Buscar vídeos relacionados = não Buscar vídeos relacionados = sim Buscar vídeos relacionados = sim

Buscar por tempo decorrido = não Buscar por tempo decorrido = não Buscar por tempo decorrido = sim Buscar por tempo decorrido = sim Buscar por tempo decorrido = não

Abre link em outra página - sim Abre link em outra página - não Abre link em outra página - não Abre link em outra página - não Abre link em outra página - não

Buscar entre datas = não Buscar entre datas = não Buscar entre datas = sim Buscar entre datas = sim Buscar entre datas = não

Buscar por formatos = não Buscar por formatos = não Buscar por formatos = sim Buscar por formatos = sim Buscar por formatos = sim

Em qualquer lugar da página = não Em qualquer lugar da página = não Em qualquer lugar da página = não Em qualquer lugar da página = sim Em qualquer lugar da página = sim

Pesquisar em páginas similares = não Pesquisar em páginas similares = não Pesquisar em páginas similares = não Pesquisar em páginas similares = sim Pesquisar em páginas similares = não

Páginas em cache = não Páginas em cache = não Páginas em cache = não Páginas em cache = sim Páginas em cache = não

Mapas relacionado à pesquisa = não Mapas relacionado à pesquisa = não Mapas relacionado à pesquisa = não Mapas relacionado à pesquisa = sim Mapas relacionado à pesquisa = não

Pesquisa por países = não Pesquisa por países = não Pesquisa por países = não Pesquisa por paíse+s = sim Pesquisa por países = sim

Tabela 5 – Opcionais de busca

www.aonde.com.br busca.uol.com.br www.altavista.com www.google.com.br search.yahoo.com Ocorrências positivas = 1 Ocorrências positivas = 9 Ocorrências positivas = 12 Ocorrências positivas = 18 Ocorrências positivas = 13

Ocorrências negativas = 18 Ocorrências negativas = 10 Ocorrências negativas = 7 Ocorrências negativas = 1 Ocorrências negativas = 6

Tabela 6 – Resumo da Tabela 5

Para a pontuação dos sites serão utilizados os números referentes aos

seguintes campos: Tabela 4 - Sites retornados e sites relevantes; Tabela 6 –

Ocorrências positivas.

Serão calculados os valores utilizando-se de média ponderada, onde

os mais bem colocados serão aqueles de maior média. Serão atribuídos pesos: 1

para número de sites retornados, 4 para sites relevantes e 2 para o número de

ocorrências positivas.

Page 12: Hanking dos melhores sites de busca

11

www.aonde.com.br busca.uol.com.br www.altavista.com www.google.com.br search.yahoo.com (7 x 4 + 1 x 1 + 1 x 2) /( 4 + 1 + 2) = 4,43

(7 x 4 + 2 x 1 + 9 x 2) / ( 4 + 1 + 2) = 6,86

(7 x 4 + 4 x 1 + 12 x 2) / ( 4 + 1 + 2) = 8,00

(8 x 4 + 5 x 1 + 18 x 2) / ( 4 + 1 + 2) = 10,43

(8 x 4 + 3 x 1 + 13 x 2) / 4 + 1 + 2) = 8,71

Tabela 7 – Cálculos aritméticos

Após os cálculos, temos o seguinte resultado:

Colocação Site de busca Média ponderada

1º www.google.com.br 10,432º http://search.yahoo.com 8,713º www.altavisca.com 8,004º http://busca.uol.com.br 6,865º www.aonde.com.br 4,43

Tabela 8 – Colocação final

5 CONCLUSÃO

Após todas as pesquisas e análises aplicadas, chegou-se ao resultado

da tabela 8. Na seção introdutória deste documento foi dito que um dos objetivos

seria uma análise científica, imparcial e objetiva dos sites de busca da internet.

Consequentemente esta análise revelou que de fato o GOOGLE está no topo do

ranking dos melhores sites buscadores. Portanto, a tendência já obervada pelos

internautas se confirma através destes estudo. Que esta ferramenta seja útil em

outros momentos e que não nos deixemos levar pelas tendências. Que antes,

façamos os devidos estudos para se ter certeza de nossas escolhas e assim,

teremos segurança e subsídios para exigirmos cada vez mais serviços de qualidade.

Page 13: Hanking dos melhores sites de busca

12

6 REFERÊNCIAS BIBLIOGRÁFICAS

Portal Tributário, Sites de busca. Disponível em: < http://www.portaltributario.com.br/sites_de_busca.htm > Acesso em: 03 de novembro de 2009

Portal SEM Brasil, Art., Os rumos dos buscadores na internet. Disponível em: < http://www.sembrasil.com.br/artigos/os-rumos-dos-buscadores-na- internet.html>Acesso em: 04 de novembro de 2009

Portal SEM Brasil, Art., Mecanismos de busca. Disponível em: < http://www.sembrasil.com.br/artigos/mecanismo-de-busca-porta-de-entrada- para-usuarios-novatos-e-avancados.html> Acesso em: 04 de novembro de 2009.

Portal SEM Brasil, Artigo, Sites de busca. Disponível em: < http://www.sembrasil.com.br/conteudo/12/Sites_de_Busca.html? gclid=CIeOjcHg7p0CFR9N5Qodd3IAMQ>Acesso em: 04 de novembro de 2009.

Wikipédia, a enciclopédia livre, artigo, Motor de busca. Disponível em: < http://pt.wikipedia.org/wiki/PageRank >Acesso em: 03 de novembro de 2009

Wikipédia, a enciclopédia livre, artigo, Motor de busca. Disponível em: <http://pt.wikipedia.org/wiki/Motor_de_busca> . Acesso em: 02 de novembro de 2009

Wikipédia, a enciclopédia livre, artigo, Motor de busca. Disponível em:< http://www.cadastre.com.br/buscadores.htm > Acesso em: 02 de novembro de 2009

Wikipédia, a enciclopédia livre, artigo, Motor de busca. Disponível em: < http://pt.wikipedia.org/wiki/Google > Acesso em: 03 de novembro de 2009.