gt 8 informação e tecnologia - uel.br · um algoritmo para encontrar e exibir as páginas...

15
XIII Encontro Nacional de Pesquisa em Ciência da Informação - XIII ENANCIB 2012 GT 8 Informação e Tecnologia PANORAMA ATUAL DO USO DOS MECANISMOS DE BUSCA NA WEB Comunicação Oral Rogerio Paulo Muller Fernandes - Universidade Estadual de Londrina Silvana Drumond Monteiro - Universidade Estadual de Londrina Maria Júlia Carneiro Giraldes - Universidade Estadual de Londrina Fernando Luiz Vechiato - Universidade Estadual de Londrina [email protected]

Upload: phambao

Post on 20-Sep-2018

214 views

Category:

Documents


0 download

TRANSCRIPT

XIII Encontro Nacional de Pesquisa em Ciência da Informação - XIII ENANCIB 2012

GT 8 Informação e Tecnologia

PANORAMA ATUAL DO USO DOS MECANISMOS DE BUSCA NA WEB

Comunicação Oral

Rogerio Paulo Muller Fernandes - Universidade Estadual de Londrina

Silvana Drumond Monteiro - Universidade Estadual de Londrina

Maria Júlia Carneiro Giraldes - Universidade Estadual de Londrina

Fernando Luiz Vechiato - Universidade Estadual de Londrina

[email protected]

PANORAMA ATUAL DO USO DOS MECANISMOS DE BUSCA NA WEB

Resumo: Apresenta um panorama atual do uso dos mecanismos de busca na Web a partir de pesquisas nacionais e internacionais. Define, categoriza e retrata os mecanismos de busca face sua importância nas atividades e mercado publicitário online. Destaca o grande domínio do Google em relação a seus principais concorrentes e aponta um futuro de inovações na área ainda a ser desenvolvido.

Palavras-chave: Mecanismos de Busca. Web. Google.

1 INTRODUÇÃO

Os impactos e as transformações resultantes dos avanços tecnológicos têm sido tão

frequentes e profundos na sociedade contemporânea que se torna até redundante explicitar

essa realidade. Um destaque talvez deva ser dado ao papel da informação, que sempre teve

uma função crucial no desenvolvimento de qualquer sociedade e que deixou de ser uma

prerrogativa de poucos para se tornar um requisito e um direito básico de todos os cidadãos.

A crescente criação e conversão de informações para o ambiente digital têm levado,

no entanto, a uma proliferação de conteúdos que ao mesmo tempo em que possibilita o seu

amplo e rápido acesso torna também cada vez mais difícil a obtenção de informações

relevantes.

Como porta de entrada para esse mundo digital os mecanismos de busca, designados

como oráculos digitais por Gabriel (2008), com seus complexos algoritmos varrem a Web em

busca de sites cujo conteúdo atenda as necessidades dos usuários. A qualidade dos resultados

é o maior desafio em um mercado econômica e socialmente importante, altamente

concentrado, dominado pelo Google, mas sujeito a inovações.

O acesso às informações e a venda de bens e serviços estão cada vez mais atrelados

ao posicionamento nas listas de resultados e mesmo a alta satisfação dos usuários com o

desempenho dos mecanismos de busca obscurece a frequência com que resultados

irrelevantes são ainda apresentados.

No intuito de estabelecer um panorama atual acerca desses mecanismos de busca,

apresenta-se a seguir, além das inerentes definições e contextualizações, categorias e dados

relacionados ao seu uso.

2 MECANISMOS DE BUSCA

Um mecanismo de busca é basicamente uma ferramenta que permite ao usuário

localizar um documento que contenha uma(s) determinada(s) palavras(s). Seu trabalho é

conectar palavras digitadas (queries) em uma base de dados criada de páginas Web (um

índice) que produz uma lista de URLs (e resumo do conteúdo) que pressupostamente são os

resultados mais relevantes para a busca realizada (BATTELLE, 2005, p. 19).

Possui três principais funções essenciais para a qualidade e a velocidade do

mecanismo:

a) crawling: um programa denominado crawler1 varre a Web coletando páginas novas e

atualizadas para serem incluídas no índice;

b) indexing: as informações recolhidas são armazenadas e indexadas na base de dados;

c) searching: uma interface de busca é exibida para o usuário realizar a pesquisa, a

interface e o software relacionado que conecta a busca do usuário com o índice executa

um algoritmo para encontrar e exibir as páginas relevantes.

Cada processo é dependente do anterior, como ilustra a Figura 1, pois a busca

somente pode ser realizada se houver um índice prévio, que por sua vez, é gerado a partir das

paginas coletadas e indexadas.

Figura 1 – Anatomia de um Mecanismo de Busca

_____________ 1 Rastreador. Também chamado de spider (aranha) e bot (abreviatura de robot), entre outros. O

Googlebot, por exemplo, é o robô de rastreamento da web do Google

A categorização dos mecanismos de busca (Figura 2) e o maior detalhamento dos

seus diferentes aspectos podem ser conferidos nos artigos de Monteiro (2009), Monteiro et al

(2011), entre outros2 que descrevem e analisam a seguinte tipologia:

anatomia;

forma geral de organização ou indexação;

ordenação dos resultados;

apresentação dos resultado;

paradigma semiótico.

As categorias dos mecanismos de busca estão em constante atualização pela própria

dinâmica da Web, sujeitas ao aparecimento e desaparecimento num curto espaço de tempo, de

novos atores, conceitos, recursos e serviços.

Battelle (2005, p. 253), há alguns atrás, já apontava que no campo dos mecanismos de

busca os estudos estavam, no melhor dos casos, solucionados em 5% de todo seu potencial e

que a busca estava se modificando em um ritmo muito rápido, com várias inovações sendo

desenvolvidas, mas que num futuro próximo certamente estariam condenadas.

3 USO DOS MECANISMOS DE BUSCA

Baeza-Yates e Rivera Loaiza (2003, p. 2) destacam que existem três principais formas

de se encontrar um site:

Direta: já se conhece o endereço do site, seja pela publicidade em meios de

comunicação tradicionais ou por meio de outra pessoa (a primeira é uma forma cara

e a segunda lenta em função da necessidade de comunicação entre as pessoas para a

obtenção do endereço eletrônico);

Navegando: para isso deve haver links ao site, seja mediante publicidade na Internet

ou por outras razões (forma natural, porém somente se chega aos sites com mais

recursos ou que são mais populares);

Usando um mecanismo de busca: para isso o mecanismo de busca deve ter

previamente encontrado o site (opção mais simples e praticamente a única para

novos ou pequenos sites).

_____________ 2 Ver página do Grupo de Pesquisa Informação e Conhecimento no Ciberespaço <http://www.uel.br/grupo-

pesquisa/ciberespaco/index_entrada. html>

Figura 2 – Categorias dos Mecanismos de Busca

No entanto, a realidade atual é que os usuários estão cada vez mais iniciando suas

buscas por informações, empresas e produtos, através de mecanismos de busca. Seja por que

eles não lembram um endereço específico, seja porque as URLs nem sempre são intuitivas ou

porque é mais fácil digitar algumas palavras-chave no campo de busca do que a URL na barra

de endereços.

Pesquisa realizada pela Pew Internet (2012, p. 5) sobre o uso dos mecanismos de

busca pelos adultos americanos aponta, conforme Figura 3, que a sua utilização para

encontrar as informações desejadas é uma das atividades online mais populares, apenas

rivalizada pelo e-mail.

Figura 3 – Atividades mais Populares na Internet

Fonte3: PEW INTERNET (2012).

Quando analisado por grupos, os dados da pesquisa demonstram que o uso dos

mecanismos de busca é mais popular entre os jovens adultos usuários da Internet de 18 a 29

anos (96%), entre aqueles com curso superior (95%) e aqueles com os mais altos

rendimentos domésticos (95%). Pelo menos uma vez ao dia são usados por 54% dos usuários

e a avaliação da performance indica um ótimo desempenho e elevada confiança na

capacidade dos mecanismos de busca, a saber:

_____________ 3 O uso de redes sociais não era controlado antes de fevereiro de 2005. “Obter notícias online” e “comprar um

produto online” não foram pesquisados em 2012.

91% dos usuários afirmam que sempre ou na maioria das vezes encontram a informação que estão procurando quando eles usam os mecanismos de busca;

73% dos usuários dizem que todas ou a maioria das informações que encontram quando utilizam os mecanismos de busca são precisas e confiáveis;

66% dos usuários afirmam que os mecanismos de busca são uma fonte justa e imparcial de informações;

55% dos usuários de mecanismos de busca dizem que, em sua experiência, a qualidade dos resultados da pesquisa está cada vez melhor ao longo do tempo, enquanto apenas 4% dizem que piorou;

52% dos usuários de mecanismos de busca dizem que os resultados de pesquisas se tornaram mais relevantes e úteis ao longo do tempo, enquanto apenas 7% relatam que os resultados se tornaram menos relevantes (PEW INTERNET (2012, p. 3).

Apesar dos altos índices de sucesso alcançados, nem sempre a experiência dos

usuários na utilização dos mecanismos de busca é positiva. Quatro em cada dez usuários na

pesquisa relatam não só resultados contraditórios que impossibilitavam descobrir qual a

informação correta, como também um excesso de informações nos resultados que os

deixavam atônitos (sobrecarregados). Além disso, um em cada três apontou ausência de

informações importantes ou essenciais nos resultados apresentados.

Os dados da StatOwl (2012) exemplificam o uso dos mecanismos em relação ao

numero de palavras-chave utilizadas e páginas pesquisadas. A Figura 4 mostra que os

usuários utilizam entre uma de dez palavras em suas consultas e que majoritariamente as

buscas são realizadas com 4 (27,48%), 3 (24,27%) ou 5 (18,06%) palavras-chave.

Figura 4 –Número de Palavras-chave Usadas nos Mecanismos de Busca – Junho 2011/Junho 2012

Fonte: STATOWL (2012).

Quanto maior o número de palavras numa frase, maior a possibilidade de ter a busca

restrita, no entanto, o percentual de 69,81% relativo às buscas feitas com 3 a 5 palavras-

chave indica a adequação ao usuário destes totais.

A Figura 5, por sua vez, demonstra que 98,97% dos usuários não vão além da

primeira página de resultados dos mecanismos de busca, acentuando o imediatismo dos

usuários e a importância fundamental de se figurar no topo dos resultados.

Com números diferentes, mas não alterando o fato, pesquisa da WBI Brasil (2012)

aponta que a maioria dos usuários brasileiros, 48,3%, avança até a terceira página de

resultados de busca, com 18% visualizando somente a primeira e 33,7 indo até a segunda.

Figura 5 – Página de Resultados dos Mecanismos de Busca – Junho 2011/Junho 2012

Fonte: STATOWL (2012).

4 LINK PATROCINADO X BUSCA ORGÂNICA

Com o objetivo de potencializar e melhorar a classificação de um site nas páginas de

resultados naturais (orgânicos) nos sites de busca, surgiu toda uma indústria de consultoria

visando a implementação de estratégias para um melhor posicionamento dos sites de seus

clientes, a área de Otimização para Mecanismos de Busca, mais conhecida pelo acrônimo

SEO do inglês Search Engine Optimization. O termo se refere tanto as técnicas utilizadas

como as pessoas que realizam este tipo de trabalho

A busca orgânica é o processo usual realizado pelos usuários ao efetuarem suas

pesquisas e consultarem os resultados listados pelos mecanismos de busca. Aparecem do

lado esquerdo da página e não são, em tese, diretamente manipuláveis.

Já o link patrocinado é um formato de anúncio publicitário pago, exibido em

determinadas buscas por palavras-chave com o intuito de gerar trafego para o site do

anunciante. Aparecem do lado direito da página ou antecedendo os resultados da busca

orgânica. A ordem em que aparecem depende do valor a ser pago por cada clique e da

qualidade do anúncio.

Mapeamento realizado pela WBI Brasil (2012) dos hábitos e preferências dos e-

consumidores brasileiros em relação ao uso dos buscadores para a pesquisa de serviços e

produtos (Figura 6) demonstra que a grande maioria dos usuários (84,45%) “clica” nos

resultados de busca orgânicos, ficando os “cliques” nos anúncios online com 14,55%.

Figura 6 – Link Patrocinado x Busca Orgânica nos Mecanismos de Busca no Brasil de 2006 a 2012

Fonte: WBI BRASIL (2012).

O termo SEM (Search Engine Marketing), Marketing para Mecanismos de Busca

engloba tanto o SEO quanto os links patrocinados, além de outras ferramentas e faz parte das

diversas estratégicas de marketing digital que visam promover produtos e serviços, que vão

do banner ao marketing em redes sociais.

A despeito das estratégias visando uma melhor visibilidade de um determinado site,

são os algoritmos como o PageRank do Google que determinam a relevância e importância

das páginas e, consequentemente, o posicionamento na página de resultados. Qualidade do

site baseado em conteúdo relevante e útil são as recomendações, inclusive dos melhores

SEO. No entanto, táticas de manipulação são comuns e levam com frequência os

mecanismos de busca a se aperfeiçoarem para evitar que sejam burlados.

4 DOMÍNIO DO GOOGLE

Em um dos mais importantes artigos até hoje publicados intitulado The Anatomy of a

Large-Scale Hypertextual Web Search Engine4, Sergey Brin e Larry Page revolucionaram as

tecnologias de recuperação da informação ao apresentarem, em 1998, o algoritmo PageRank

já destacavam: “A medida mais importante de um mecanismo de busca é a qualidade nos

resultados das buscas. Nossa experiência com Google nos demonstrou que a qualidade dos

seus resultados é melhor que a maioria dos mecanismos comerciais.”

Os anos se passaram e a constatação feita duas décadas atrás continua cada vez mais

verdadeira: “Googlar” virou verbo e o Google hoje é quase sinônimo de pesquisa na Web. A

Figura 7 apresenta uma comparação do uso dos mecanismos de busca nos Estados Unidos

nos anos de 2004 e 2012, com grande predomínio do Google.

Figura 7 – Evolução do Uso dos Mecanismos de Busca

Fonte: PEW INTERNET (2012).

O percentual de 83% de uso já é um número extremamente significativo, no entanto,

ainda não reflete a atual influência do Google. Segundo dados da StatCounter, em junho de

2012, conforme Figura 8, no mercado global de mecanismos de busca o Google alcança o

_____________ 4 Anatomia de um mecanismo de busca hipertextual de larga escala para a Web.

percentual de 91,78%. Em países como Brasil (98,05%) e Argentina (95,67%), na América

do Sul, ou Espanha (96,54%) e Portugal (97,44%), na Europa, o domínio é ainda maior.

Provavelmente, somente na China onde o Baidu (53,91%) lidera, o Google (41,44%)

não é principal mecanismo de busca, não obstante em Hong Kong o Google está a frente com

65,94% e o Yahoo em segundo com significativos 33,22%. Na Rússia, o Yadex (40,91%) é o

segundo colocado e mantém ainda uma proximidade com o Google (56,68%), enquanto na

Coreia do Sul, Naver (10,67%) e Daum (6,05%) mantém respectivamente a segunda e a

terceira colocação em relação ao Google (75,37%)

Os dados da StatConter para os Estados Unidos são Google (79,61%), Bing (9,83%),

Yahoo (8,8%), AOL (0,73%), Ask Jeeves (0,7%) e outros (0,33). Apesar de haver alguma

variação nos resultados entre diferentes sites e/ou metodologias5, os dados apresentados não

deixam dúvidas quanto ao grande domínio do Google em relação aos demais mecanismos de

busca, salvo as exceções anteriormente apresentadas.

Figura 8 – Os 5 Principais Mecanismos de Busca no Mundo em Junho de 2012

Fonte: STATCOUNTER (2012).

_____________ 5 A pesquisa da Pew Internet , por exemplo, entrevistou um total de 2.253 adultos, enquanto a StatCounter é um

serviço de web analytics (medição, coleta, análise e a produção de relatórios de navegação) cujo código de monitoramento está instalado em mais de 3 milhões de sites no mundo todo, com diferentes atividades e localizações geográficas.

5 MERCADO PUBLICITÁRIO NA INTERNET

De praticamente zero em meados da década de 1990 para um negócio multibilionário

hoje em dia, a busca continua sendo, segundo relatório da IAB (2012) das receitas de

publicidade na Internet nos Estados Unidos, a principal fonte de receita de publicidade online

com 46,5% do total em 2011, perfazendo a soma de U$ 14,80 bilhões de dólares de um total

de U$ 31,70 bilhões de dólares, um incremento de 22% em relação ao ano anterior (Figura

96).

Em cima dessa importância econômica direta, o relatório destaca que os mecanismos

de busca são crucialmente importantes tanto para os usuários da Internet à procura de

informações quanto para empresas que desejam vender bens e serviços aos usuários.

Figura 9 – Formatos de Publicidade na Internet 2010/2011

Fonte: IAB (2012).

Relacionadas à exibição a receita com publicidade inclui: exibição de banners (21,5%

da receita de 2011, ou US $6,80 bilhões), Rich Media7 (4,1%, ou US $1,30 bilhões), de vídeo

digital (5,7%, ou R$1,80 bilhões) e patrocínio (3,5%, ou US $1,10 bilhões).

Anúncios classificados responderam por 8,1% da receita de 2011 ou R$2,60 bilhões,

receitas de geração de leds 4,8% ou U$ 1,50 bilhões e receitas de e-mail representaram 0,7%

do faturamento de 2011 ou U$ 213 milhões de dólares. _____________ 6 O relatório traz textualmente os percentuais numericamente fracionados e no gráfico os mesmos são

apresentados arredondados. 7 Publicidade que contém elementos gráficos ou interativos mais elaborados do que os banners standard. Estes

anúncios permitem uma grande interação, podendo conter vários elementos multimídia (vídeo, áudio, etc.) (GLOSSARIUM, 2012).

Em relevo a publicidade móvel que cresceu 149% em relação a 2010, um total de US

$1,60 bilhões ou 5,0% da receita de 2011 e se tornou uma categoria significativa.

Os dados do primeiro trimestre de 2012 indicam que a as receitas de publicidade na

Internet tiveram um incremento de 15% ou U$ 1,1 bilhão de dólares em relação ao mesmo

período de 2011, estabelecendo um novo recorde para o período.

5 CONSIDERAÇÕES FINAIS

A Web já se tornou a principal fonte de informação e entretenimento e com seus

números superlativos relacionados a toda gama de recursos disponíveis, leva seus usuários a

dependerem fundamentalmente dos mecanismos de busca para poderem ter acesso às

informações desejadas.

A localização de conteúdos, pessoas, locais e produtos, o que acontece, o que se

aprende e apreende, em que se acredita, tudo acaba sendo informado e ao mesmo tempo

influenciado pelos mecanismos de busca e seus respectivos algoritmos nos resultados

apresentados.

Com o Google “dando as cartas”, o Bing tentando ser uma alternativa viável e o

Yahoo ainda presente, o mercado de busca na Internet apresenta-se concentrado e cada vez

mais econômica e socialmente importante.

Os mecanismos de busca são os maiores geradores de tráfego a sites de comércio

eletrônico, sendo a busca na internet responsável por quase a metade do bilionário mercado

publicitário online.

O perfil de uma busca realizada hoje na Web aponta para o uso de 3 a 5 palavras-

chave, com consulta aos resultados restrita quase exclusivamente à primeira página, e uso

expressivo e dominante do Google como mecanismo de busca utilizado.

As projeções de que apenas uma pequena parte do campo de busca foi desenvolvida,

somadas a iniciativas como a Web Semântica e as frequentes inovações que, não raro na

Web, modificam completamente o seu status quo, sugerem que o futuro dos mecanismos de

busca ainda está por ser determinado.

OVERVIEW OF THE CURRENT USE OF SEARCH ENGINES IN THE WEB

Abstracts: Presents an overview of the current use of search engines from national and international web analytics and research. Define, categorize, and portrays the search engines face their importance in online activities and advertising market. Highlights the great Google's dominance over its main competitors and suggests a future of innovation in the area still being developed. Keywords: Search Engines. Web. Google.

REFERÊNCIAS

BAEZA YATES, Ricardo; RIVERA LOAIZA, Cuauhtémoc. Ubicuidad y usabilidad en la Web. Revista de gerencia tecnológica informática, v. 1, n. 2, jul. 2003. Disponível em: <http://www.cidlisuis.org/aedo/RGTIN2V1/RGTI_04.pdf>. Acesso em: 01 jun. 2012.

BATTELLE, J. The Search: how Google its rivals rewrote the rules of business and transformed our culture. New York: Portifolio, 2005.

BRIN, Sergey; PAGE, Larry.The anatomy of a largescale hypertextual web search engine. In: PROCEEDINGS OF THE 7TH WORLD WIDE WEB CONFERENCE, 7, 1998, Brisbane. Proceedings… Brisbane: Elsevier Sciences, 1998. Disponível em: <http://infolab.stanford.edu/pub/papers/google.pdf>. Acesso em: 01 jun. 2012.

GABRIEL, Martha Carrer Cruz. Oráculos digitais. In: FILE SYMPOSIUM RIO 2006. Disponível em: < http://www.digitaloracles.com.br/digitaloracles-port.pdf>. Acesso em: 03 jun. 2012.

GLOSSARIUM. Dicionário técnico. 2012. Disponível em: <http://www.glossarium.com.br/index.php>. Acesso em: 03 jun. 2012.

INTERACTIVE ADVERTISING BUREAU. Internet Advertising Revenue Report. 2012. Disponível em: <http://www.iab.net/media/file/ IAB_Internet_Advertising_Revenue_Report_FY_2011.pdf>. Acesso em: 01 jun. 2012

MONTEIRO, Silvana Drumond. As múltiplas sintaxes dos mecanismos de busca no ciberespaço. Informação & Informação, v. 14, n. especial, p. 68-102, 2009. Disponível em: < http://www.uel.br/revistas/uel/index.php/ informacao/article/view/2027/3223>. Acesso em: 01 jun. 2011.

MONTEIRO, Silvana Drumond; GIRALDES, Maria Júlia C.; VECHIATO, Fernando Luiz; MÜLLER FERNANDES, Rogerio Paulo. Em busca da compreensão da "busca" no ciberespaço. In: ENCONTRO NACIONAL DE PESQUISA EM CIÊNCIA DA INFORMAÇÃO, 12, 23-26 out. 2011, Brasília. Anais... Brasília: UnB, 2011. 1 CD-ROM, p. 1-18.

PEW INTERNET. Search Engine Use 2012. Disponível em: <http://pewinternet.org/~/media//Files/Reports/2012/ PIP_Search_Engine_Use_2012.pdf>. Acesso em: 01 jun. 2012.

STATOWL. Search engine. Disponível em: <<http://www.statowl.com/search_engine_ keyword_count.php>. Acesso em: 03 jun. 2012.

STATCONTEUR. Global Stats: top 5 search engines from Jun 2011 to Jun 2012. Disponível em: <http://gs.statcounter.com/>. Acesso em: 05 jun. 2012

WBI BRASIL. 8ª Edição do Raio– x do E-commerce: Quem é quem na mente do consumidor. 2012. Disponível em: http://www.wbibrasil.com.br/2012/pesquisas/ WBI_BRASIL_-_Pesquisa_mecanismos_busca_2012.pdf>. Acesso em: 05 junho 2012.

WIKIPEDIA. Googlar. 2012. Disponível em: <http://pt.wikipedia.org/wiki/Googla>. Acesso em: 03 jun. 2012.