hanking dos melhores sites de busca
DESCRIPTION
Pesquisa científica que objetiva o hanqueamento dos melhores sites de busca da internet atualmenteTRANSCRIPT
UNIVERSIDADE GAMA FILHO – UGF
PÓS GRADUAÇÃO EM ENGENHARIA DE SOFTWARE
METODOLOGIA DA PESQUISA E DA PRODUÇÃO CIENTÍFICA
Marcos Rogerio Santiago
RANQUEAMENTO E DEFINIÇÃO DOS MELHORES SITES DE BUSCA ATUALMENTE NA INTERNET
Goiânia2009
Marcos Rogerio Santiago
RANQUEAMENTO E DEFINIÇÃO DOS MELHORES SITES DE BUSCA ATUALMENTE NA INTERNET
Pré-projeto de pesquisa apresentado à Universidade Gama Filho – UGF/POSEAD, para conclusão da terceira atividade proposta na disciplina Metodologia da Pesquisa e da Produção Científica.
Orientadora: Professora Sandra Brant
Goiânia2009
RESUMO
Este trabalho se propõe a definir através de método científico quais são os cinco melhores sites de busca atualmente na internet. Com o constante aumento do uso da rede, e consequentemente, com a utilização cada vez maior desta ferramenta para estudos, pesquisas, entretenimento, curiosidades e tantos outros fins, o uso de ferramentas de busca é imprescindível. Em vista da quantidade de ferramentas disponíveis e a tendência que existe de se adotar sempre determinado site, por ele ter uma maior fama, exercer maior influência, e/ou “apresentar” melhores opções de uso, para se comprovar se realmente tais sites são os que têm melhores resultados, foi feito este estudo.
ABSTRACT
This paper aims to define through scientific method which are the top five search engines currently on the Internet. With the constant increase in network usage, and therefore, the increased use of this tool for studies, research, entertainment, trivia and many other purposes, the use of search engines is essential. Given the amount of tools available and the tendency is always to adopt a particular site, because he has a greater fame, greater influence and / or "present" best use options, to determine whether it really such sites are those have better outcomes, this study has been done.
SUMÁRIO
Conteúdo
1 – Introdução pag. 5
2 – Objetivos pag. 6
2.1 – Geral pag. 6
2.2 - Específico pag. 6
3 – Literatura sobre o tema pag. 6
3.1 Motor de busca pag. 7
3.2 Page Rank™ pag. 7
4 – Metodologia pag. 8
5 – Conclusão pag. 11
Lista de tabelas
Tabela 1 – Ranqueamento pag. 8
Tabela 2 – Organização do ranqueamento pag. 9
Tabela 3 – Pesquisas realizadas pag. 9
Tabela 4 – Análise de link pag. 10
Tabela 5 – Opcionais de busca pag. 10
Tabela 6 – Resumo pag. 10
Tabela 7 – Cálculos aritméticos pag. 11
Tabela 8 – Colocação do site de busca pag. 11
51 INTRODUÇÃO
O conhecimento do ser humano, a cada dia que passa, se torna maior
e mais especializado. A humanidade observou que o conhecimento que é passado
adiante torna-se frutuoso e, como que numa construção, onde os tijolos são
colocados um a um para formar uma edificação, as contribuições de nossos
antepassados aliadas às nossas, vão formando o saber, e com isso uma nova
consciência vai ganhando vida e um novo mundo vai surgindo.
Com o advento da internet, o mundo tornou-se pequeno do ponto de
vista do conhecimento e da informação. Não é preciso demonstrar este fenômeno
visto que a grande maioria de nós já usufrui desta realidade. A cada dia mais e mais
instrumentos são criados para facilitar nossa busca pela satisfação de nossos
objetivos.
Nós, como indivíduos ávidos de conhecimento e sempre abertos a
utilização de novas tecnologias, acabamos por desenvolver uma mentalidade que
pode, às vezes, nos prejudicar. Sempre que sabemos que algo novo está no
mercado, nos sentimos como se o que temos atualmente já não atende mais as
nossas necessidades. Logo que podemos, tratamos de nos livrar daquele item, que
agora já não é a última versão – mas que nos atendia – e vamos atrás desta última
versão, brilhante, dourada, que vai resolver todos os nossos problemas, ignorando
muitas vezes, que aquela última versão não foi totalmente testada, que talvês não
seja compatível, ou que simplesmente desabilitou algo que gostávamos na versão
anterior. Este efeito acontece em várias áreas de nossa vida. O carro novo, o
software novo e também a disponibilização de novos serviços.
Quando falamos em “serviços de busca da internet”, quase que
substituimos o termo pela palavra “GOOGLE”, como se esta fosse a única
ferramenta de busca existente. Este trabalho não pretende ser um crítico deste
pensamento, mas sim, fazer uma análise científica para determinar quais são os
cinco melhores sites de busca atualmente na net.
Um outro fator impulsionador deste trabalho foi a falta de literatura que
abranja este foco. Encontram-se vários estudos sobre as vantagens de se utilizar
esta ou aquela tecnologia, estudos estatísticos sobre o perfil dos que utilizam estas
6
ferrramentas, estudo de marketing utilizando ferramentas de busca, etc., mas nada
que nos diga com bases científicas: - Qual é a melhor ferramenta de busca hoje?.
Este material pretende, com bases sólidas, responder esta pergunta.
2 OBJETIVOS
2.1 GERAL
Este documento tem como objetivo fornecer uma lista dos 5 melhores
sites de busca atualmente, dando aos seus leitores a segurança necessária e o
conforto em conhecer os opcionais mais interessantes existentes nestas
ferramentas. Também pretende ser referência para o ranqueamento de sites de
busca no futuro, fornecendo critérios que poderão ser seguidos com vistas a
construção de novas listas.
2.2 ESPECÍFICO
Através deste estudo, conhecer cada opcional, cada tecnologia
empregada nos sites mais conhecidos, conhecer outras ferramentas menos
conhecidas, estabelecer relações entre elas, entender suas tecnologias e ao final
fazer uma conclusão segura, indicando os opcionais de cada site. Estes opcionais
podem existir em uma ferramenta de busca e não existir em outra, de forma que
poderemos, após a conclusão desta pesquisa, aproveitar melhor o que estas
ferramentas nos oferecem.
3 LITERATURA SOBRE O TEMA
Como mensionado da seção de introdução deste documento, não
existem muitas literaturas sobre o assunto. Existem, contudo, artigos, pesquisas,
registros estatísticos e conceitos interessantes que ajudarão na elaboração dos
métodos de estudo que utilizaremos aqui. Nesta seção, serão explicitados estes
conceitos e também serão abordadas questões sobre como funcionam os
mecanismos de busca.
7
3.1 MOTOR DE BUSCA
Um motor de busca, motor de pesquisa, máquina de busca,
mecanismo de busca ou buscador é um sistema de software projetado para
encontrar informações armazenadas em um sistema computacional a partir de
palavras-chave indicadas pelo utilizador, reduzindo o tempo necessário para
encontrar informações.
Ao se realizar uma consulta, a lista de ocorrências de assuntos é criada
em poucos segundos por meio de um conjunto de softwares de computadores,
conhecidos como spiders, que vasculham toda a Web em busca de ocorrências de
um determinado assunto em uma página. Ao encontrar uma página com muitos
links, os spiders embrenham-se por eles, conseguindo, inclusive, vasculhar os
diretórios internos - aqueles que tenham permissão de leitura para usuários - dos
sites nos quais estão trabalhando.
Fonte:(http://pt.wikipedia.org/wiki/Motor_de_busca)
3.2 PAGERANK
PageRank™ é uma família de algoritmos de análise de rede que dá
pesos numéricos a cada elemento de uma coleção de documentos hiperligados,
como as páginas da internet, com o propósito de medir a sua importância nesse
grupo por meio de um motor de busca. O algoritmo pode ser aplicado a qualquer
coleção de objetos com ligações recíprocas e referências. O peso numérico dado a
cada elemento E é chamado PageRank de E e notado como PR(E). Suas
propriedades são muito discutidas por especialistas em otimização dos motores de
busca (SEO, sigla em inglês para search engine optimization).
A importância se dá pelo número de votos que uma página recebe. Um
voto é um link em qualquer lugar da Internet para aquela página. Votos de páginas
mais importantes valem mais do que votos de páginas menos importantes. Esse
critério de ordenação das páginas, de acordo com várias pessoas, é bastante
democrático, refletindo o que a "Internet pensa" sobre determinado termo. Lembre-
se que cerca de dez bilhões de páginas são levadas em conta. A qualidade das
páginas mais importantes são naturalmente garantidas, classificadas e eleitas pela
8própria internet. Além de todas as páginas terem a mesma condição de subir nessa
lista, conquistando votos pela Internet afora.
Fonte:(http://pt.wikipedia.org/wiki/PageRank)
4 METODOLOGIA
Analisando os conceitos citados, podemos concluir que os links que
aparecem nas primeiras posições dos sites de busca que utilizam a tecnologia
PageRank™ são, de fato aqueles que têm a maior preferência na opinião dos
internautas, ou seja, daqueles que realmente utilizam as ferramentas de busca.
Partindo deste princípio, escolheremos três sites que utilizam esta tecnologia e a
partir deles, faremos pesquisas sobre o melhor buscador da internet.
Os três sites para busca escolhidos são: www.altavista.com,
www.google.com.br e http://search.yahoo.com. Em seguida, para escolhermos o
melhor termo ao qual obteremos uma lista de sites buscadores, testaremos algumas
palavras/frases e observaremos o resultado. As palavras/frases utilizadas foram:
buscadores; melhor “ferramentas de busca”; “site de busca”; ferramenta de busca;
buscador; busca na net; “busca na net”; melhor buscador; “melhor buscador”. Os
melhores resultados para as palavras ou frases acima foram: buscador e “site de
busca” com aspas.
Na tabela 1, mostra-se os cinco primeiros sites de busca encontrados
pela ordem de relevância:
Site de busca Palavra - buscador Frase - “site de busca”www.altavisca.com www.cade.com.br
www.google.com.br www.bing.comradaruol.uol.com.br buscador.terra.com.br
www.google.com.br www.aonde.com.br www.buscaki.com.br www.copycola.com.br www.buscapopular.com.br
www.google.com.br busca.uol.com.brwww.linkador.comwww.buscador.comwww.buscador.clarin.comwww.mibuscador.net
www.aonde.com.brcade.search.yahoo.combr.www.altavista.combusca.uol.com.brwww.sitesdebusca.com.br
search.yahoo.com www.google.com www.www.altavista.com search.ask.com www.alltheweb.com buscador.terra.com
www.google.com.br www.buscaaqui.com.br www.aonde.com.br br.www.altavista.com aonde.org
Tabela 1 – Ranqueamento. Pesquisa realizada em 05/11/2009
Após a descoberta dos sites encontrados, foram feitas análises para
filtrar os endereços com intuito de observar se os links eram redundantes. Depois de
feita esta análise restaram os seguintes links:
9
Links Ocorrênciaswww.aonde.com.br 4
busca.uol.com.br 3
www.altavista.com 3
www.google.com.br 3
search.yahoo.com 2
buscador.terra.com.br 2
www.bing.com 1
www.alltheweb.com 1
www.buscaaqui.com.br 1
www.buscador.clarin.com 1
www.buscador.com 1
www.buscaki.com.br 1
www.buscapopular.com.br 1
www.copycola.com.br 1
www.linkador.com 1
www.mibuscador.net 1
search.ask.com 1
www.sitesdebusca.com.br 1Tabela 2 – Ranqueamento2
A partir do critério de relevância, ou seja, quantidade de cliques que
recebe, conclui-se que os links da tabela acima correspondem à eleição dos sites
mais utilizados. O fato do google aparecer apenas na quarta colocação acontece
porque de acordo com os critérios estabelecidos observou-se que o google não
aparece nas pesquisas realizadas em seu próprio link. Como proposto em nosso
método de pesquisa, analisaremos então os cinco primeiros colocados da lista. Os
critérios de análise são: Quantidade de sites retornados; Índice de relevância dos 10
primeiros links; Links quebrados; Links repetidos e; Diferencial tecnológico.
A frase usada para a pesquisar os critérios será "pós graduação à
distância", sem as aspas. As tabelas 3 e 4 abaixo mostram os resultados obtidos:
www.aonde.com.br busca.uol.com.br www.altavista.com www.google.com.br search.yahoo.com Sim - www.portal.Anhembi.br Sim - FGV.br/mba Sim - www.portal.Anhembi.br Sim - www.eadunicid.com.br/pos-
graduacaoSim - http://www.viaxedu.com
Sim - www.FGV.br/fgvonline Sim - www.eadunicid.com.br/pos-graduacao
Sim - www.FGV.br/fgvonline Sim - FGV.br/mba Sim - http://www.estacio.br/ead
Não - www.monografiasrio.com.br Sim - www.PosEAD.com.br Não - www.monografiasrio.com.br Sim - www.metodista.br Sim - http://nith.com.br
Sim - www.Fiap.com.br/mbagestaoti Sim - www.ESAB.edu.br/Pos_Graduacao
Sim - www.estacio.br/ead Sim - www.esab.edu.br Sim - http://www.hgscursos.com.br
Não - www.Concursos.com.br Sim - www.uninove.br/pos Sim - www.pos-ead.senac.br Sim - www.posead.com.br Sim - http://www.posead.com.br
Sim - www.pos-ead.senac.br Repetido - http://www.esab.edu.br Sim - www.claretiano.edu.br/ead-pos-graduacao
Sim - posead.grupouninter.com.br Não - http://profiles.studyusa.com
Sim - www.posead.com.br Repetido - http://www.posead.com.br Repetido - www.claretiano.edu.br Sim - www.senac.br/pos-ead Sim - http://www.facete.org.br
Sim - www.estacio.br Sim - http://posead.grupouninter.com.br
Não - www.capes.gov.br Não - portal.mec.gov.br Sim - http://www.posadistancia.com
Repetido - www.pos-ead.senac.br Sim - http://www.senac.br/pos-ead Sim - www.posead.com.br Não - www.capes.gov.br Sim - http://www.minervinacursos.com.br
Sim - www.claretiano.edu.br Não - http://www.capes.gov.br Sim - www.institutoeficaz.com.br Sim - www.posondeeuestiver.com.br Não - http://cdchaves.sites.uol.com.br
Tabela 3 - Pesquisas realizadas em 07/11/2009
10
www.aonde.com.br busca.uol.com.br www.altavista.com www.google.com.br search.yahoo.com Sites retornados = Não informado Sites retornados = 224.000 Sites retornados = 4.950.000 Sites retornados = 9.140.000 Sites retornados = 4.940.000
Sites relevantes = 7 Sites relevantes = 7 Sites relevantes = 7 Sites relevantes = 8 Sites relevantes = 8
Links quebrados = 0 Links quebrados = 0 Links quebrados = 0 Links quebrados = 0 Links quebrados = 0
Links repetidos = 1 Links repetidos = 2 Links repetidos = 1 Links repetidos = 0 Links repetidos = 0
Tabela 4 – Análise dos links da Tabela 3
Agora passaremos a analisar as opções que cada site apresenta, o seu diferencial tecnológico. Serão levantadas as novidades, os facilitadores disponibilizados, os serviços disponíveis que podem auxiliar na qualidade da pesquisa. Em alguns sites existem outras funcionalidades além das descritas aqui, porém, tais funcionalidades não fazem parte do escopo desta pesquisa.
www.aonde.com.br busca.uol.com.br www.altavista.com www.google.com.br search.yahoo.com Busca Brasil e mundo = não Busca Brasil e mundo = sim Busca Brasil e mundo = sim Busca Brasil e mundo = sim Busca Brasil e mundo = sim
Todas as palavras = não Todas as palavras = sim Todas as palavras = sim Todas as palavras = sim Todas as palavras = sim
Com frase exata = não Com frase exata = sim Com frase exata = sim Com frase exata = sim Com frase exata = sim
Por domínio = não Por domínio = sim Por domínio = sim Por domínio = sim Por domínio = sim
Por url = não Por url = não Por url = sim Por url = sim Por url = sim
Pequisa por idioma = não Pequisa por idioma = sim Pequisa por idioma = sim Pequisa por idioma = sim Pequisa por idioma = sim
Com exceção de palavras = não Com exceção de palavras = sim Com exceção de palavras = sim Com exceção de palavras = sim Com exceção de palavras = sim
Resultados por página = não Resultados por página = sim Resultados por página = sim Resultados por página = sim Resultados por página = sim
Buscar imagens relacionadas = não Buscar imagens relacionadas = sim Buscar imagens relacionadas = sim Buscar imagens relacionadas = sim Buscar imagens relacionadas = sim
Buscar vídeos relacionados = não Buscar vídeos relacionados = sim Buscar vídeos relacionados = não Buscar vídeos relacionados = sim Buscar vídeos relacionados = sim
Buscar por tempo decorrido = não Buscar por tempo decorrido = não Buscar por tempo decorrido = sim Buscar por tempo decorrido = sim Buscar por tempo decorrido = não
Abre link em outra página - sim Abre link em outra página - não Abre link em outra página - não Abre link em outra página - não Abre link em outra página - não
Buscar entre datas = não Buscar entre datas = não Buscar entre datas = sim Buscar entre datas = sim Buscar entre datas = não
Buscar por formatos = não Buscar por formatos = não Buscar por formatos = sim Buscar por formatos = sim Buscar por formatos = sim
Em qualquer lugar da página = não Em qualquer lugar da página = não Em qualquer lugar da página = não Em qualquer lugar da página = sim Em qualquer lugar da página = sim
Pesquisar em páginas similares = não Pesquisar em páginas similares = não Pesquisar em páginas similares = não Pesquisar em páginas similares = sim Pesquisar em páginas similares = não
Páginas em cache = não Páginas em cache = não Páginas em cache = não Páginas em cache = sim Páginas em cache = não
Mapas relacionado à pesquisa = não Mapas relacionado à pesquisa = não Mapas relacionado à pesquisa = não Mapas relacionado à pesquisa = sim Mapas relacionado à pesquisa = não
Pesquisa por países = não Pesquisa por países = não Pesquisa por países = não Pesquisa por paíse+s = sim Pesquisa por países = sim
Tabela 5 – Opcionais de busca
www.aonde.com.br busca.uol.com.br www.altavista.com www.google.com.br search.yahoo.com Ocorrências positivas = 1 Ocorrências positivas = 9 Ocorrências positivas = 12 Ocorrências positivas = 18 Ocorrências positivas = 13
Ocorrências negativas = 18 Ocorrências negativas = 10 Ocorrências negativas = 7 Ocorrências negativas = 1 Ocorrências negativas = 6
Tabela 6 – Resumo da Tabela 5
Para a pontuação dos sites serão utilizados os números referentes aos
seguintes campos: Tabela 4 - Sites retornados e sites relevantes; Tabela 6 –
Ocorrências positivas.
Serão calculados os valores utilizando-se de média ponderada, onde
os mais bem colocados serão aqueles de maior média. Serão atribuídos pesos: 1
para número de sites retornados, 4 para sites relevantes e 2 para o número de
ocorrências positivas.
11
www.aonde.com.br busca.uol.com.br www.altavista.com www.google.com.br search.yahoo.com (7 x 4 + 1 x 1 + 1 x 2) /( 4 + 1 + 2) = 4,43
(7 x 4 + 2 x 1 + 9 x 2) / ( 4 + 1 + 2) = 6,86
(7 x 4 + 4 x 1 + 12 x 2) / ( 4 + 1 + 2) = 8,00
(8 x 4 + 5 x 1 + 18 x 2) / ( 4 + 1 + 2) = 10,43
(8 x 4 + 3 x 1 + 13 x 2) / 4 + 1 + 2) = 8,71
Tabela 7 – Cálculos aritméticos
Após os cálculos, temos o seguinte resultado:
Colocação Site de busca Média ponderada
1º www.google.com.br 10,432º http://search.yahoo.com 8,713º www.altavisca.com 8,004º http://busca.uol.com.br 6,865º www.aonde.com.br 4,43
Tabela 8 – Colocação final
5 CONCLUSÃO
Após todas as pesquisas e análises aplicadas, chegou-se ao resultado
da tabela 8. Na seção introdutória deste documento foi dito que um dos objetivos
seria uma análise científica, imparcial e objetiva dos sites de busca da internet.
Consequentemente esta análise revelou que de fato o GOOGLE está no topo do
ranking dos melhores sites buscadores. Portanto, a tendência já obervada pelos
internautas se confirma através destes estudo. Que esta ferramenta seja útil em
outros momentos e que não nos deixemos levar pelas tendências. Que antes,
façamos os devidos estudos para se ter certeza de nossas escolhas e assim,
teremos segurança e subsídios para exigirmos cada vez mais serviços de qualidade.
12
6 REFERÊNCIAS BIBLIOGRÁFICAS
Portal Tributário, Sites de busca. Disponível em: < http://www.portaltributario.com.br/sites_de_busca.htm > Acesso em: 03 de novembro de 2009
Portal SEM Brasil, Art., Os rumos dos buscadores na internet. Disponível em: < http://www.sembrasil.com.br/artigos/os-rumos-dos-buscadores-na- internet.html>Acesso em: 04 de novembro de 2009
Portal SEM Brasil, Art., Mecanismos de busca. Disponível em: < http://www.sembrasil.com.br/artigos/mecanismo-de-busca-porta-de-entrada- para-usuarios-novatos-e-avancados.html> Acesso em: 04 de novembro de 2009.
Portal SEM Brasil, Artigo, Sites de busca. Disponível em: < http://www.sembrasil.com.br/conteudo/12/Sites_de_Busca.html? gclid=CIeOjcHg7p0CFR9N5Qodd3IAMQ>Acesso em: 04 de novembro de 2009.
Wikipédia, a enciclopédia livre, artigo, Motor de busca. Disponível em: < http://pt.wikipedia.org/wiki/PageRank >Acesso em: 03 de novembro de 2009
Wikipédia, a enciclopédia livre, artigo, Motor de busca. Disponível em: <http://pt.wikipedia.org/wiki/Motor_de_busca> . Acesso em: 02 de novembro de 2009
Wikipédia, a enciclopédia livre, artigo, Motor de busca. Disponível em:< http://www.cadastre.com.br/buscadores.htm > Acesso em: 02 de novembro de 2009
Wikipédia, a enciclopédia livre, artigo, Motor de busca. Disponível em: < http://pt.wikipedia.org/wiki/Google > Acesso em: 03 de novembro de 2009.