big data and content rate in blogs

25
ASSOCIAÇÃO EDUCACIONAL LUTERANA BOM JESUS/IELUSC CURSO DE COMUNICAÇÃO SOCIAL FACULDADE DE PUBLICIDADE E PROPAGANDA Débora Luise Bertling Big Data: Uma análise por meio da qualificação de conteúdo em blogs. JOINVILLE 2014

Upload: debbie-bertling

Post on 07-Apr-2017

58 views

Category:

Marketing


0 download

TRANSCRIPT

Page 1: Big Data and Content Rate in Blogs

ASSOCIAÇÃO EDUCACIONAL LUTERANA – BOM JESUS/IELUSC CURSO DE COMUNICAÇÃO SOCIAL

FACULDADE DE PUBLICIDADE E PROPAGANDA

Débora Luise Bertling

Big Data: Uma análise por meio da qualificação de conteúdo em blogs.

JOINVILLE

2014

Page 2: Big Data and Content Rate in Blogs

BIG DATA: UMA ANÁLISE POR MEIO DA QUALIFICAÇÃO DE CONTEÚDO EM

BLOGS.

Débora Luise Bertling

Associação Educacional Luterana – BOM JESUS/IELUSC Curso de Comunicação Social

Faculdade de Publicidade e Propaganda Orientador: Profº Msc. Henrique Budal Arins

Resumo

O presente artigo insere-se no contexto do Projeto Experimental Inovador

desenvolvido pelas alunas Débora Luise Bertling, Jacqueline Fernanda Goetz

Mueller e Simone Vieira como Trabalho de Conclusão do Curso de Publicidade e

Propaganda.

Traz a contextualização da aplicabilidade do Big Data para melhorar as linhas

editoriais de blogs por meio da qualificação de conteúdo e tem como objetivo

descobrir quais as formas de qualificação existentes na internet brasileira e qual é a

maneira que se pode extrair dados dos leitores para que, em cima deles, se

apliquem ferramentas de Big Data para análise.

A pesquisa foi realizada com dois sites, o Adoro Cinema e o Trip Advisor, por

meio de observação e análise em pesquisa descritiva. Os resultados obtidos

mostraram a interação dos usuários, avaliando e interagindo nos sites por meio de

notas e críticas.

Concluiu-se então, que a aplicabilidade das ferramentas de Big Data nos

dados gerados por meio da qualificação de conteúdo em blogs é válida. Essa

qualificação é feita por um site semelhante aos analisados e transforma os dados

qualitativos em quantitativos, tornando a utilização do Big Data mais assertiva.

Palavras-chave: Big Data; Qualificação; Blogs.

1. Big Data

A dicotomia entre real e virtual torna-se tênue neste novo cenário constituído

de tantos rastros e dados digitais, deixados a cada segundo por internautas.

Page 3: Big Data and Content Rate in Blogs

WEISER apud LEMOS (2005, p. 5) citou como as tecnologias digitais “ (...) se

entrelaçam no tecido da vida quotidiana até se tornarem indistinguíveis”. Dessa

forma, cada vez mais os usuários fornecem dados que podem desvendar seu

comportamento e forma de pensar.

O grande desafio para as empresas é saber como desvendar e utilizar estes

dados de forma produtiva. É um enorme volume de informação, porém se não

souberem tirar valor dela, torna-se inútil. A questão é: O que é relevante e o que não

é? Qual a pergunta a ser respondia por todos estes dados?

Para responder essas perguntas surge o termo Big Data, que é o adjetivo que

se dá a um grande conjunto de dados, que, normalmente, não podem ser tratados

por tecnologias convencionais, principalmente em relação ao custo.

A partir da análise, cruzamento e interpretação dos dados começa-se a dar

sentido para essa grande cadeia de informações, as quais são capazes de agregar

valor estratégico ao mercado. Segundo MANYIKA; CHU; BROWN, (2011, p.4), “Big

Data – grandes poços de dados que são capturados, comunicados, agregados,

armazenados e analisados – é agora parte de cada setor e função da economia

global”.

O Big Data apresenta duas vertentes em sua estrutura. A primeira, que é a

definição dos objetivos do negócio, e que trabalha inicialmente com duas

estratégias: a fase da mensuração, em que os dados são medidos cientificamente e

a exatidão é o ponto chave: sabe-se exatamente qual é o objetivo. A fase de

experimentação é a que permite uma variável maior, pois parte de hipóteses e

aplicações de métodos de verificação. A segunda vertente contempla a relação entre

dados transacionais (dados coletados pela empresa através de um banco de dados

de uma estrutura) e os dados não transacionais (dados que não possuem estrutura

formal, tais como os gerados através das mídias sociais).

Numa empresa, a aplicação do Big Data, em mensuração e dados

transacionais, é possível pela compreensão do banco de dados e é chamada de

Gerenciamento de Performance. Os analistas podem filtrar e segmentar

determinados perfis de dados já cadastrados, utilizando informações do histórico da

empresa, tais como intervalo de compra de determinados clientes ou aumento de

vendas em determinadas épocas do ano. Estes dados transacionais, a princípio,

não chamam atenção pela inovação mas tem papel crucial na elaboração de

estratégias, é a partir deles que é possível achar um perfil de consumidor e explorar

Page 4: Big Data and Content Rate in Blogs

datas de procura e compras, como citados no exemplo anterior. Essa exploração de

dados leva em conta o comportamento do consumidor em experiências passadas,

suas preferências e compras levam à criação de um modelo segmentado em que

são permitidas ações para grupos, tais como cross-selling (produtos

complementares) e up-selling (produtos adicionais).

Logo após, o Social Analitycs envolve o acompanhamento em tempo real de

dados não transacionais gerados em redes e mídias sociais. Essa análise se dá

através de três pilares: Audiência (exposição), engajamento (participação) e alcance

(disseminação).

E por fim há a Tomada de Decisão, processo no qual a análise de dados não

transacionais e projetos de experimentação geram respostas para as empresas.

Aqui, ferramentas como o crowdsourcing fazem parte do campo de pesquisa.

Através das respostas obtidas, os analistas conseguem gerar conceitos válidos de

valor, viabilidade e adequação de determinado produto ou serviço.

Nesse contexto, surgem dois tipos de profissionais de Big Data. O chamado

DataBase Administrator (DBA) que é responsável por gerir o banco de dados de

uma empresa, instalar o software, resolver bugs, cadastrar usuários, fazer backups

periódicos e estar envolvido com o bom funcionamento do sistema e o chamado

Estatístico que é o responsável por transformar os dados coletados em informações

estratégicas de valor.

Para o DataBase Administrator, a estrutura do Big Data é composta por

softwares capazes de realizar tudo o que já foi descrito acima como bancos de

dados NoSQL, e também sistemas colunares, como o Big Table (sistema utilizado

pelo Google), Lotus Notes, Mongo DB e o Neo4j.

Depois dessa infraestrutura estabelecida acontece a segunda etapa em que

há mensuração e análise dos dados, é o chamado Big Data Analytics. Aqui, é

possível extrair apenas as informações úteis do enorme volume de dados adquiridos

e analisados, para transformar esses dados em decisões de negócio.

O conceito de Big Data é novo, portanto muitas vezes difícil de entender e

aplicar. Para facilitar no manuseio desta ferramenta, especialistas criaram sub-

termos que são empregados para uma melhor definição e entendimento do Big

Data. São estes: Volume, variedade, velocidade, valor e veracidade.

O volume baseia-se na grande quantidade de dados e informações trocadas

a cada segundo. Aqui, não se fala sobre terabytes, mas sim sobre zettabytes

Page 5: Big Data and Content Rate in Blogs

(1021 byte) ou yottabytes (1024 byte). Segundo Bernard Marr (2014), se nós

pegarmos todos os dados gerados desde o começo do mundo até o ano de 2008,

essa mesma quantidade será gerada, em breve, a cada minuto. Isso faz com que as

ferramentas que antes eram usadas para mensurar estes dados tornem-se

insuficientes. Este volume de dados vem de sistemas estruturados (banco de dados)

e sistemas não estruturados (mídias sociais), este sendo a maioria. Por minuto, são

produzidos bilhões de e-mails, mensagens no Facebook, compras online, acessos

de vídeos, etc. O grande desafio é utilizar o Big Data para mensurar quais são os

dados importantes e de que forma utilizá-los.

A velocidade está ligada a estes novos dados gerados cada vez mais

rápido, e por isso a necessidade de agir em tempo real. Nas mídias sociais,

principalmente, os chamados virais dissipam-se quase que instantaneamente e o

engajamento gera novas informações que precisam ser mensuradas. As

ferramentas de Big Data permitem analisar estes dados em tempo real, quando

ainda estão sendo gerados, antes mesmo de serem inseridos num banco de dados.

Um exemplo é a velocidade com que os dados de um cartão de crédito são

transmitidos na hora da compra.

A variedade está ligada ao fato de que 80% dos dados gerados atualmente

não provém de banco de dados estruturados, como antigamente. Agora temos fotos,

vídeos, mensagens de voz, sms, redes sociais, e-mails, conversas online, e uma

grande infinidade de dados não estruturados que contém informações valiosas. Com

a tecnologia do Big Data é possível mensurar e analisar estes dados também.

A veracidade serve para avaliar esta infinidade de dados, em que existe um

risco muito grande de informações falsas transmitidas. Torna-se necessário ter

certeza de que os dados são verídicos e que fazem sentido. A qualidade de um bom

trabalho de Big Data é justamente avaliar os dados gerados e filtrar os que, de fato,

são verdadeiros e úteis naquele determinado período e objetivo.

O valor torna a prática justificável. É imprescindível que a empresa que

adquira os serviços de Big Data tenha um retorno dos investimentos. É o que torna

tudo relevante na esfera de negócio. Gerar valor, tanto financeiro quanto na imagem

da empresa.

Dentro do universo de Big Data, pode-se definir três tipos de empresas:

as que apresentam um problema de Big Data, as que fornecem consultoria para

solucionar os problemas e as que fornecem a tecnologia que o estruturará. Para

Page 6: Big Data and Content Rate in Blogs

exemplificar pode-se usar a Amazon, como empresa que apresenta um problema de

Big Data, pois precisa analisar transações e pedidos diariamente; o escritório Big

Data Corp, como empresa que oferece consultoria e solução de problemas através

do Big Data; e novamente a Amazon como empresa que fornece tecnologia, com a

Amazon Web Service, que disponibiliza ferramentas para análise de dados. Assim, o

Big Data funciona através de quatro frentes: definição de problema, coleta de dados,

tratamento de dados e escolha da tecnologia que irá trabalhar as informações

recebidas.

2. Contexto Histórico dos Blogs

Nesse momento da comunicação na internet, em que as pessoas deixam de

ser apenas leitores para tornarem-se produtores de conteúdo surgem os weblogs,

conhecidos popularmente como blogs. Em 1997, o Jornal Barger criou o termo

‘’weblog’’, que era direcionado aos sites que divulgavam links de novos sites. Em

1999 o site Pitas criou uma ferramenta para manutenção de páginas pela internet, e

logo após surgiram o Blogger e o Wordpress, plataformas em que é possível

hospedar um blog com facilidade.

[…] esses sistemas proporcionaram uma maior facilidade na publicação e manutenção dos sites, que não mais exigiam o conhecimento da linguagem HTML e, por isso, passaram a ser rapidamente adotados e apropriados para os mais diversos usos. Além disso, a posterior agregação da ferramenta de comentários aos blogs também foi fundamental para a popularização do sistema. (ALMADA, Larissa. 2009)

Com essa facilidade, muitas pessoas começaram a usar os blogs com o

suporte de diário online de seu autor, onde ele pode expor suas opiniões

abertamente, dar dicas de lugares e produtos, contar seu dia-a-dia, descobertas e

tudo aquilo que julgar ser interessante a quem lê o blog.

Page 7: Big Data and Content Rate in Blogs

Os blogueiros eram figuras críticas que exerciam livremente o prazer de comunicar suas visões sobre as mais diversas questões com que se deparavam em seu dia a dia, sem terem que obedecer às regras e convenções do sistema, o limite era até onde a imaginação pudesse ir. (ALMADA, Larissa. 2011)

Dessa forma, eles são livres para comentar, opinar e expor ideias e opiniões

sem terem que se reportar à condições sistemáticas ou ao que é moralmente aceito.

Ali é o espaço deles e de seus pensamentos, sem normas.

Com a profissionalização dos blogs, eles deixaram de ser apenas diários

virtuais e passaram a ser cada vez mais comerciais, tendo, muitas vezes, mais

audiência do que um canal de TV fechada, por exemplo. São grandes formadores de

opinião e influenciam diretamente os leitores nas suas compras. Por essa razão,

podem ser considerados uma nova forma de mídia online.

A Teoria da Cauda Longa, criada por Chris Anderson (2006), diz que:

Nossa cultura e economia estão mudando do foco de um relativo pequeno número de 'hits" (produtos que vendem muito no grande mercado) no topo da curva de demanda, para um grande número de nichos na cauda. Como o custo de produção e distribuição caiu, especialmente nas transações online, agora é menos necessário massificar produtos em um único formato e tamanho para consumidores. Em uma era sem problema de espaço nas prateleiras e sem gargalos de distribuição, produtos e serviços segmentados podem ser economicamente tão atrativos quanto produtos de massa.

Por isso, é cada vez mais forte a parceria de marcas com blogueiros, em que

produtos específicos são anunciados em blogs muito bem segmentados e com

leitores assíduos. O mercado de nicho trouxe não só a queda da massificação de

produtos, mas também as novas oportunidades de utilizar os blogs como

ferramentas de mídia eficazes em suas campanhas publicitárias.

Normalmente essa parceria se dá em 4 formatos diferentes:

- Publieditorial: O blogueiro recebe uma amostra do produto/serviço e elabora

um post onde conta sobre sua experiência com o mesmo. O texto deve ser aprovado

pela marca antes de ser publicado e deve conter a tag ‘‘publicidade’’, informando

aos leitores que aquele post foi patrocinado pela marca.

Page 8: Big Data and Content Rate in Blogs

- Banners: São colocados no layout do blog, normalmente na barra superior

ou no lado direito, onde o leitor ao decorrer da leitura sempre tem a marca visível.

- Citação de marca: O blogueiro no decorrer de seu texto faz a menção da

marca, sem aprofundar nos detalhes de determinado produto ou serviço, apenas a

cita e em alguns casos pode deixar o nome da marca como link direcionando ao site

da mesma.

- Eventos: O blogueiro comparece a eventos ligados diretamente a marca,

para cobrir o evento e fazer um post contando com detalhes como foi. Os gastos

com passagens e hospedagens também são por conta da marca anunciante.

2.1 Novos Modelos de Comportamento

Se as mudanças tecnológicas foram grandes, o aspecto social não fica para

trás. De fato, todas as mudanças ocorreram em prol de um objetivo: facilitar as redes

sociais (ou humanas) dentro da nova tecnologia, a internet.

Conforme Garton, Haythornthwaite e Wellman (1997):

When a computer network connects people or organizations, it is a social network. Just as a computer network is a set of machines connected by a set of cables, a social network is a set of people (or organizations or other social entities) connected by a set of social relations, such as friendships, co-working, or information exchange.

Dentre os novos modelos de comportamentos influenciados pela web, a

interação e troca de informações é a maior delas. A interação, segundo o dicionário

Aurélio, é o fenômeno que consiste no fato de que o comportamento de cada

indivíduo torna-se estímulo para o outro.

Dessa forma, constroem-se relações e comportamentos virtuais baseados na

troca. Se um determinado indivíduo produz conteúdo e posta na internet,

automaticamente poderá influenciar o comportamento de outro indivíduo. Por

exemplo : O site Reclame Aqui, em que usuários postam suas reclamações sobre

determinadas empresas ou marcas. Nele o indivíduo ‘A’ posta sua reclamação sobre

o mau atendimento de determinada empresa, então o indivíduo ‘B’ lê e apesar de

Page 9: Big Data and Content Rate in Blogs

não ter nenhuma experiência com aquela empresa, forma a sua opinião baseada na

experiência do indivíduo ‘A’.

Essa facilidade na troca de informações fez com que a vida online tornasse-

se natural. É cada vez mais frequente o uso de desktops, notebooks, tablets e

smartphones para resolver assuntos do dia-a-dia, reencontrar amigos, fazer

compras, contar experiências e até mesmo achar sua alma gêmea. Essas

ferramentas, junto com a internet, já se tornaram partes do corpo do indivíduo que

antes de decidir em qual restaurante jantar, procura resenhas sobre os locais no

Foursquare. Antes de comprar determinado aparelho eletrônico pesquisa os preços

no Mercado Livre, e que, ao viajar, não curte o local sem antes tirar uma foto e

postar no Instagram.

A coletividade de arquivos digitais também é presente nesses novos

comportamentos, aqui o indivíduo não precisa mais ir à loja comprar o cd para ouvir

determinada música, ele pode simplesmente entrar no iTunes e comprar por ali. Da

mesma forma livros que já são disponibilizados em e-book, as fotos que antes eram

reveladas agora são armazenadas em site como Flickr e as enciclopédias foram

substituídas pela Wikipédia, onde cada um pode compartilhar conhecimento.

Para toda essa troca de informações, o indivíduo não precisa estar próximo

ao outro, facilitando essa relação, mas ainda distanciado das pessoas no mundo

real. Segundo Reid (1991), “a conversação mediada também proporciona um

distanciamento físico entre os interagentes, mas, funcionando, muitas vezes, como

um tipo de comunicação semelhante à face a face, mas a distância”.

Dentro dos novos modelos de comportamentos gerados pelo mundo digital,

temos dois que se destacam. Em 2001, o nova-iorquino Marc Prensky apresentou

ao mundo pela primeira vez os termos ‘’imigrantes digitais e nativos digitais”. Em seu

artigo “Digital natives, digital immigrants”, Prensky separa dois tipos de

consumidores do mundo digital. Um deles chama-se ‘’Imigrantes Digitais”, um novo

modelo de comportamento surgido da população que vivenciou a transição do

analógico para o digital, e que dia-a-dia tenta adaptar-se a esse novo estilo de vida.

São indivíduos que aprenderam a usar o computador já na fase adulta, e que

precisam adaptar-se a esse mundo. Normalmente têm dificuldades para assimilar

essas novas experiências e sempre precisarão de uma ajuda adicional. Estão

aprendendo a lidar com as novas facilidades e, por vezes, tem receio em confiar em

compras online, por exemplo.

Page 10: Big Data and Content Rate in Blogs

Alguns deles, porém, conseguem lidar bem com essa transição e aos poucos

vão experimentando todo o lado bom do advento digital, porém sempre serão

considerados imigrantes.

E também os “Nativos Digitais”, que Marc Prensky (2011) cita como os

indivíduos que nasceram e cresceram dentro da grande bolha digital e que tratam

tudo com naturalidade e rapidez.

Para eles não há dificuldade como para os imigrantes digitais, pois cresceram

dentro dessa realidade. São indivíduos que podem ler e-mails, jogar, acessar suas

redes sociais e assistir televisão ao mesmo tempo e em plena consciência do que

estão fazendo. Normalmente tem maior facilidade para lidar com aparelhos

eletrônicos e não imaginam a vida sem eles, possivelmente enquadram-se na

categoria em que estes aparelhos são como que uma extensão de seu próprio

corpo.

Para Prensky:

Crianças criadas com o computador pensam diferente do resto de nós. Eles desenvolvem um espírito de hipertexto. Temos então uma nova geração com uma grande mistura de diferentes habilidades cognitivas do que seus antecessores, esses são os nativos digitais. (2001).

Em 2013, o Brasil já se encontrava no ranking como o 4º país com mais

nativos digitais do mundo, apenas atrás de países como China, EUA e Índia.

2.2 Produção de Conteúdo para Blogs

Diante da grande quantidade de informações oferecidas ao usuário

diariamente é grande também o desafio para prender a atenção do mesmo. Para

isso, faz-se necessária a criação de textos bem estruturados, compreensíveis e de

fácil leitura. Os estudos de FRANCO apud NIELSEN (1994) já remetiam a

conclusões de que os usuários preferem a linguagem objetiva, os textos concisos e

o design escaneável.

Mas antes de falar sobre o escrever, precisa-se entender como o usuário lê.

Segundo experiências do Eyetrack, existem dois tipos de leitores online: Os

escaneadores, que ao entrar em determinada página passam os olhos e captam as

palavras mais importantes, chegando a uma conclusão através destas palavras e

partindo para a próxima atividade online, e existem também os leitores que leem

Page 11: Big Data and Content Rate in Blogs

palavra por palavra, estes, como já é explícito, leem com atenção e passam mais

tempo na página.

Ainda dentro destes dois grupos de leitores, pode-se categorizar mais três:

Os exploradores, que não buscam por um objetivo específico, os que tem um motivo

específico e os que coletam algo mas que não buscam por uma resposta definitiva.

Conclui-se, então, que para ambos os perfis de leitores, deve existir algo que

chame a atenção do mesmo e que o motive a continuar a leitura, porém diante do

atarefado dia-a-dia dos usuários, prender-se a um texto que não o acrescente algo é

frustrante. Para solucionar isso, Roy Peter Clark, em 2008, criou o método chamado

de Pirâmide Invertida, que vem ajudando escritores online a estruturar melhor seus

textos e assim atingir um maior número de leitores.

Este método consiste em dividir as informações do texto em etapas, sendo

elas: A informação mais importante com a conclusão logo no começo, a fim de

informar ao leitor do que se trata, e assim se houver interesse ele continuar a leitura.

O título desperta o interesse e deve ser bem construído. Depois o material que

amplia esta informação, aprofundando melhor o assunto, logo após o contexto e por

fim o material secundário. Segundo Mencher (2010):

Os leitores desejam saber o que aconteceu assim que a matéria começa a se desenvolver. Se for interessante, prestarão atenção. De outra forma, irão a outro lugar. As pessoas vivem ocupadas demais para parar sem nenhuma recompensa.

Alguns cuidados são interessantes nesta etapa, tais como cuidar para não

começar com artigos, nem expressões de ligação, utilizar palavras fortes no começo

e no final para intensificar a importância do texto e dividi-lo em blocos temáticos.

Também é válida a substituição da voz ativa pela voz passiva. Segundo Guillermo,

“Ao colocar as palavras portadoras de informações à esquerda nos títulos, nos

parágrafos que seguem e nos leads, melhora a escaneabilidade e, assim, a

efetividade do SEO”.

Algumas dicas para a construção dos textos são úteis, porém o conteúdo

ainda é o mais importante. Avaliar qual a expectativa e reação dos leitores através

dos comentários é algo valioso para entender como o texto vem sido entendido e

como pode ser melhorado.

Page 12: Big Data and Content Rate in Blogs

3. Métricas de Conteúdo e Busca

Além do conteúdo de um texto e da melhor forma de escrevê-lo, é preciso

que ele esteja ao alcance do usuário. Para tanto, utilizam-se técnicas para alavancar

a posição em buscadores, tais como: Utilizar palavras semanticamente similares, e

não apenas repetir as palavras em grande quantidade, faz com que o universo

daquele assunto torne-se mais amplo e, por consequência, sua página apareça nos

resultados de buscas mais facilmente. A relação do conteúdo do corpo do texto com

as palavras-chave inseridas também tem elevada importância, mais além, as

palavras-chave em negrito tendem a se destacar no índice de importância da

página, não utilizar metáforas que confundem os buscadores, e por fim, a mais

importante ação de todas, o uso de palavras-chave no título da tag, no cabeçalho da

Page HTML.

O uso de boas tags é considerado o item mais importante no SEO para a

convergência de quem faz a busca para visitante e leitor da página. Para facilitar a

definição dessas tags, pode-se usar a hierarquização da Pirâmide Invertida,

comentada na produção de conteúdo.

Porém, deve-se lembrar que é fundamental a página apresentar conteúdo

interessante e de fácil acesso ao usuário. Estar no topo das buscas é benéfico

desde que o conteúdo encontrado no site seja interessante ao usuário. FRANCO

apud NODDLER (2007):

Matt Cutts, um dos atualizadores do algoritmo (conjunto de equações matemáticas feitas para calcular resultados) do Google, disse em 2007, numa conferência em Seattle, que a empresa vem tentando apresentar resultados de buscas que sejam relevantes para as pessoas. Por esse motivo, eles buscam codificar pela usabilidade e compreensão no algoritmo. Assim, escrever para as pessoas em vez de escrever para os buscadores é a melhor estratégia, a longo prazo, para garantir alta colocação neles.

4. Plano de Pesquisa

4.1 Problema

Qual é a aplicabilidade das tecnologias de Big Data dentro da qualificação de

conteúdo em blogs?

Page 13: Big Data and Content Rate in Blogs

4.2 Objetivos

- Descobrir as diferentes maneiras de qualificação de conteúdo em sites de

avaliação;

- Verificar características que levem o usuário a ter um maior engajamento

com o site.

- Diagnosticar como essas interações fomentam estruturas do Big Data.

Universo e amostra

A pesquisa ocorrerá em ambiente digital formado por sites de qualificação de

conteúdo selecionados de acordo com os seguintes critérios:

- Segmento de entretenimento e turismo;

- Engajamento de usuários da web; medido através do número de

usuários cadastrados nos sites.

O primeiro deles é o Adoro Cinema (www.adorocinema.com), site brasileiro

lançado no ano 2000 que conta com mais de 6 milhões de visitantes/mês e mais de

600 mil usuários cadastrados. Ele traz informações sobre filmes, os bastidores,

personagens, atores, entrevistas e também premiações. Em 2003 ganhou o prêmio

Ibest como um dos três melhores sites de cinema da época. Depois de muitos anos

de jornada, inovação em design e conteúdo sempre atualizado, em julho de 2013, o

AdoroCinema se juntou com a Webedia Brasil para constituir um dos maiores grupos

de portais de entretenimento online do país. Conta com 4 milhões de vídeos vistos

por mês, segundo o Google Analytics de maio/2014, e com mais de 14 mil fichas de

avaliação de filmes, mais de 32 mil fichas de avaliação de personalidades e mais de

13 mil trailers. As avaliações feitas pelos usuários já somam mais de 1 milhão e as

críticas escritas pelos usuários ultrapassam as 80 mil.

O segundo é o TripAdvisor, que é um dos maiores sites de avaliação de

viagens e turismo do mundo. Ele foi fundado no ano de 2000 e foi financiado por

investidores privados. É um dos primeiros sites a adotar o modelo de ter o conteúdo

Page 14: Big Data and Content Rate in Blogs

gerado pelos próprios usuários, e com o capital vindo de publicidade. Possui mais de

32 milhões de membros, 170 milhões de avaliações e está presente em 45 países.

4.3 Método

A pesquisa será feita através do método descritivo de casos:

O tipo de pesquisa que se classifica como "descritiva", tem por premissa buscar a resolução de problemas melhorando as práticas por meio da observação, análise e descrições objetivas (...) (THOMAS; NELSON; SILVERMAN, 2007).

Para tanto, será feito o cadastro pessoal nos sites escolhidos visando um

maior envolvimento em cada um deles. A coleta de informações ocorrerá através da

observação da estrutura, do comportamento dos demais usuários nos sites e do

sistema de qualificação de conteúdo que eles proporcionam. Cada site será avaliado

de acordo com critérios pré-estabelecidos a fim de responder aos objetivos gerados:

Quadro 1- Critérios de Avaliação

Page 15: Big Data and Content Rate in Blogs

Com as informações obtidas, será feita a análise e descrição dos resultados

baseando-se nos objetivos propostos anteriormente, a fim de descrever maneiras

em que o Big Data pode ser aplicável no processo de qualificação de conteúdo em

blogs.

5. Análise de Dados

5.1 Adoro Cinema

O site Adoro Cinema é um portal de qualificação de filmes que, segundo

informações coletadas com a equipe do site via e-mail, possui 630 mil usuários

cadastrados que geram, mês a mês, 110 mil notas e 2.220 críticas. A mensuração

da participação de cada usuário não pode ser feita em virtude do número alto de

cadastros, porém através da análise pude observar que as críticas são feitas por

usuários distintos, em cada gênero de filme preferido, portanto pode-se considerar

que a média de participação é muito boa.

Figura 1- Página Inicial do Site

Fonte: adorocinema.com.br

Os usuários podem criar, organizar e compartilhar suas próprias bibliotecas

de filmes, dar notas e escrever críticas, participar de promoções e recomendar via

Facebook, Twitter e Google+.

Page 16: Big Data and Content Rate in Blogs

Nele observa-se que as categorias de qualificação são divididas em três: As

críticas da equipe do próprio site, as críticas da imprensa e as críticas dos usuários

cadastrados. Elas podem ser por meio de notas (estrelas) que têm peso de 1 a 5,

sendo 5 a nota mais alta, ou por meio de críticas descrevendo a opinião do escritor

sobre o filme. O site oferece a mensuração das notas e críticas feitas pelos usuários,

apresentando uma média geral e a quantidade de críticas escritas.

Figura 2 - Página Inicial de Críticas. Continua.

Fonte: adorocinema.com.br

Fig. 3:

Fonte: adorocinema.com.br

Figura 3 - Página Inicial de Críticas. Continuação.

Page 17: Big Data and Content Rate in Blogs

Figura 4 - Mensuração de Críticas

Fonte: adorocinema.com.br

Na página de cada filme aparece a crítica positiva e a crítica negativa mais úteis

dos usuários, essa qualificação é feita por meio de votação dos próprios usuários no

decorrer da leitura.

Figura 5 - Críticas Positiva e Negativa

Fonte: adorocinema.com.br

Nessas páginas ainda é possível classificar e visualizar as críticas mais úteis, as

mais recentes e também as críticas dos usuários com mais seguidores, ou dos

usuários com mais críticas escritas.

Figura 6 - Forma de Visualização das Críticas

Fonte: adorocinema.com.br

Page 18: Big Data and Content Rate in Blogs

Caso o usuário não queira escrever nenhuma crítica, nem dar nenhum nota, ele

pode apenas se tornar fã de algum dele.

Figura 7 - Ícone de Fã

Fonte: adorocinema.com.br

A maioria das críticas são feitas por homens, principalmente em filmes de

aventura, terror, ação e ficção. As mulheres acabam avaliando em maior número

filmes românticos, desenhos animados e comédias. A característica que mais leva

os usuários a qualificarem os filmes é gostarem dele, a maioria das críticas vão para

filmes que foram bem avaliados, ou seja, se o usuário gostou, irá recomendar.

5.2 Trip Advisor

Parte do maior site de viagens do mundo, o Trip Advisor Brasil oferece as

opções de criar mapas de viagens, avaliar locais visitados, inserir fotos, avaliar

destinos, hotéis, restaurantes e atrações. Oferece aos usuários a possibilidade de

pesquisar preços de passagens aéreas e de compartilhar suas experiências de

viagens a fim de formar um grande acervo de avaliações.

Logo na página inicial aparecem os locais mais comentados, fotos de

viajantes, destino em destaque e uma barra de pesquisa. Em cada destino

aparecem quantas pessoas avaliaram aquele local, a previsão do tempo, guias de

viagem, melhores restaurantes e melhores atrações do local.

O sistema de qualificação é feito através de notas e críticas. As notas são

visualizadas por meio de bolinhas e podem ser do horrível (uma bolinha) ao

excelente (cinco bolinhas). As críticas cada usuário pode descrever sua experiência,

seja positiva ou negativa. O site possui opções mais amplas do que a maioria dos

Page 19: Big Data and Content Rate in Blogs

sites, aqui ele pode inserir o tipo de visita (romântica, família, amigos, negócios ou

sozinho), a data da visita, fotos que tirou no local e também notas opcionais,

divididas em três: Para hotéis e pousadas são avaliados o atendimento, o custo

benefício, a qualidade do sono, a limpeza, a localização, os quartos, a piscina e a

sala de ginástica. Para restaurantes e lanchonetes são avaliados o atendimento, a

comida, o custo benefício e o ambiente. Para atrações são avaliados a duração, os

banheiros, a escada ou elevador, o guarda-volumes, o estacionamento e se a

atração é paga ou gratuita. Em cada local ou atração há um ranking de avaliações

positivas.

Figura 8 - Exemplo de Avaliação de Destino

Fonte: tripadvisor.com.br

Page 20: Big Data and Content Rate in Blogs

Os usuários são pessoas que gostam de viajar e de expor suas viagens.

Grande parte deles avalia cada item de sua viagem de forma completa e

normalmente não interagem entre si. Quando não gostam de algum local ou atração,

avaliam na mesma intensidade de quando gostam, relatando a experiência negativa

que tiveram.

Figura 9 - Exemplo de Avaliação de Destino 2

Fonte: tripadvisor.com.br

No perfil de cada usuário aparecem os números de contribuições, de votos

úteis, de cidades visitadas, os quilômetros percorridos e a porcentagem do mundo

viajado. É mostrado todos os locais que foram qualificados e dentro de cada local

todas as avaliações de hotéis, restaurantes ou atrações do mesmo. Por meio do

número de avaliações os usuários ganham selos de qualificação do seu perfil,

tornando suas críticas mais confiáveis na medida em que ganham mais selos.

Page 21: Big Data and Content Rate in Blogs

Figura 10 - Exemplo de Perfil de Usuário

Fonte: tripadvisor.com.br

Figura 11 - Exemplo de Perfil de Usuário 2

Fonte: tripadvisor.com.br

Percebeu-se que os dois sites aparecem na página de busca do Google

quando se procura por um filme ou local, gerando visitantes e usuários cadastrados,

ou seja, os métodos de avaliação influenciam diretamente no número de usuários.

Page 22: Big Data and Content Rate in Blogs

6. Conclusão

A partir das análises feitas pode-se concluir que a qualificação de conteúdo

ocorre por meio de usuários que gostam de compartilhar informações sobre seus

filmes e viagens preferidos. E como comportamento usual, os usuários da internet o

fazem a fim de oferecer informação útil aos que buscam por determinadas opiniões.

Normalmente as críticas são feitas pelo sistema de notas, por ser um método rápido,

embora muitos realmente gostem de dedicar tempo à escrita de críticas, listando

itens dos quais gostaram, informações relevantes e por vezes até sugestões de

melhorias. Nesse âmbito, as críticas positivas são mais comuns.

De igual forma, leitores de blogs já comentam entre si sobre seus blogs

preferidos e o que gostam e não gostam neles. Porém com uma estrutura online

para qualificação estas informações podem ser mensuradas. Observou-se que cada

usuário tem um perfil de acesso, que pode ser por meio de login ou pela conta do

Facebook, sendo possível a coleta de dados segmentada, como por exemplo,

descobrir qual é o gênero de filme mais assistido ou qual a categoria de blogs mais

avaliados por mulheres, na faixa etária de 20 a 30 anos.

Os sites oferecem a ferramenta de mensuração das notas, a fim de

transformar as informações qualitativas em quantitativas, facilitando a leitura dos

mecanismos de Big Data, gerando melhor veracidade nas mesmas.

A influência dos métodos de avaliação no número de usuários dos sites

avaliados gera a premissa de que o site deve estar atento às métricas de busca e

precisa estar posicionado nas páginas para garantir novos usuários e o crescimento

das avaliações por meio de um trabalho de SEO bem elaborado. O entretenimento é

um segmento que está gerando muitas buscas na rede e é imprescindível que o site

de qualificação esteja apto a aparecer nos resultados dessas buscas. Aqui, o

método de crítica influencia positivamente, pois é possível empregar palavras-chave

dos textos em tags, facilitando o posicionamento na busca e, consequentemente,

trazendo mais usuários ao site de qualificação.

Para a primeira etapa da aplicabilidade de Big Data na qualificação de

conteúdo temos a Definição do Problema que se quer solucionar, que no presente

Page 23: Big Data and Content Rate in Blogs

caso é trazer melhorias às linhas editoriais dos blogs por meio da avaliação de

conteúdo. Informações geradas pelos próprios leitores devem ser analisadas para

que os blogueiros possam melhorar sua linha editorial, pois são estes leitores quem

irão determinar o que gostam de ler ou não.

A segunda etapa da aplicabilidade refere-se à Coleta de Dados, que é feita

por meio de um site em que o usuário possa classificá-los de modo a transformar

essas informações em dados quantitativos. Essa qualificação pode ser feita por meio

de um sistema de notas dentro da plataforma BlogIn, e possibilitando, também, a

interação nas redes sociais

A terceira etapa da aplicabilidade está na Análise dos Dados. Por meio de

tecnologias de Big Data, essa análise categoriza-se na Fase de Experimentação e é

feita por empresas que fornecem soluções em softwares capazes de organizar todos

os dados colhidos na etapa anterior.

Concluiu-se então que é possível o uso das tecnologias de Big Data na

análise do conteúdo gerado no site de qualificação dos blogs por não ser possível

tratar todos os dados por meio de tecnologias convencionais, que se utilizam

somente de banco de dados, e por preencherem os 5 “Vs”: Volume, variedade,

velocidade, veracidade e valor.

Os blogs já nasceram como espaços de exposição virtual, um lugar em que a

realidade virtual é intensa, compartilhando experiências vividas online e offline a fim

de disseminar a opinião e de relacionar-se com o leitor. Essa interação faz parte do

novo modelo de comportamento que a internet trouxe, possibilitando a troca de

informações e a influência de opiniões. Na qualificação de conteúdo essa influência

dita um comportamento comum: absorve-se a opinião do outro nas decisões

pessoais mesmo sem ter formado a opinião própria. Os perfis de usuários dos sites

influenciam milhões de pessoas mesmo sem uma interação na realidade física,

basicamente a mesma função que os blogs vêm desempenhando ao longo dos

anos. Os dados gerados no uso do Big Data servirão para identificar melhorias nas

linhas editoriais destes blogs, a fim de produzir conteúdo mais relevante ao público e

aumentar a audiência.

Page 24: Big Data and Content Rate in Blogs

Como continuidade da presente pesquisa pretende-se identificar qual

tecnologia de Big Data é mais adequada aos dados que serão coletados por meio do

site de qualificação, com a intenção de avaliar o modus operandi de cada uma e

identificar qual suprirá a necessidade.

7. Referências

ALMADA, Larissa. Blogs: Portas Abertas para as marcas na cibercultura. 7 páginas. Comunicação de Moda - Universidade do Minho, Juiz de Fora, 2011. ANDERSON, Chris. A Cauda Longa: Do mercado de massa para o mercado de nicho. Rio de Janeiro: Editora Campus, 2006. BARBOSA, Mariana. O Brasil é o quarto país do mundo em nativos digitais. Disponível em: http://www1.folha.uol.com.br/mercado/2013/10/1360208-brasil-e-quarto-pais-do-mundo-em-nativos-digitais.shtml. Acesso em 19/08/2014. CASTELLS, Manuel. A sociedade em rede. São Paulo: Paz e Terra, 1999. v. 1. FILHO, Agenor Almeida. A comunicação na era da tecnologia digital: a escrita no ciberespaço. Disponível em: <http://periodicos.uesb.br/index.php/folio/article/viewFile/33/272>. Acesso em: 16 set 2013. FRANCO, Guillermo. Como Escrever para Web. Disponível em: http://lerebooks.wordpress.com/2011/01/16/ebook-gratuito-como-escrever-para-a-web/. Acesso em 19/08/2014.

JR, Thomas, Nelson JK, Silverman SJ. Métodos de pesquisa em atividade física 5 ed. Porto Alegre: Artmed; 2007.

KOTLER, Philip. Marketing 3.0: As forças que estão definindo o novo marketing centrado no ser humano. Rio de Janeiro: Editora Elsevier, 2010. PINHO, José Benedito. Publicidade e vendas na Internet: técnicas e estratégias. São Paulo: Summus, 2004. LEMOS, André. Cibercultura e mobilidade: a era da conexão. In: XXVIII Congresso Brasileiro de Ciências da Comunicação – Rio de Janeiro/RJ, 2005. Disponível em: << http://www.intercom.org.br/papers/nacionais/2005/resumos/r1465-1.pdf>> Acesso em: 03/09/2013.

MANYIKA, James; CHUI, Michael; BROWN, Brad; et al. Big Data: The next frontier for innovation, competition, and productivity. McKinsey Global Institute, 2011.

MARR, Bernard. Big Data: The 5 Vs Everyone Must Know. Disponível em: https://www.linkedin.com/pulse/article/20140306073407-64875646-big-data-the-5-vs-everyone-must-know?trk=cha-feed-art-title-206. Acesso em 19/08/2014.

MENCHER, M. Mencher’s News writing and reporting. Boston, 11th ed, McGraw-Hill Higher

Education.

NASCIMENTO, Antônio Dias; HETKOWSKI, Tânia Maria. Educação e Contemporaneidade: Pesquisas científicas e tecnológicas. SciELO, EDUFBA, 2009.

Page 25: Big Data and Content Rate in Blogs

PRENSKY, Marc. Digital Natives, Digital Immigrants. Disponível em: http://www.marcprensky.com/writing/Prensky%20-%20Digital%20Natives,%20Digital%20Immigrants%20-%20Part1.pdf. Acesso em 19/08/2014. SCHONBERGER, Victor Mayer; CUKIER, Kenneth. Big Data – Como extrair volume, variedade, velocidade e valor da avalanche de informação cotidiana. Rio de Janeiro, Ed Campus, 2013.

TAMANAHA, Paulo. Planejamento de mídia – teoria e experiências. São Paulo, Pearson, 2011, 2a ed. VERONEZZI, José Carlos. Mídia de A a Z. São Paulo, Edicon, 200.