big data and content rate in blogs
TRANSCRIPT
ASSOCIAÇÃO EDUCACIONAL LUTERANA – BOM JESUS/IELUSC CURSO DE COMUNICAÇÃO SOCIAL
FACULDADE DE PUBLICIDADE E PROPAGANDA
Débora Luise Bertling
Big Data: Uma análise por meio da qualificação de conteúdo em blogs.
JOINVILLE
2014
BIG DATA: UMA ANÁLISE POR MEIO DA QUALIFICAÇÃO DE CONTEÚDO EM
BLOGS.
Débora Luise Bertling
Associação Educacional Luterana – BOM JESUS/IELUSC Curso de Comunicação Social
Faculdade de Publicidade e Propaganda Orientador: Profº Msc. Henrique Budal Arins
Resumo
O presente artigo insere-se no contexto do Projeto Experimental Inovador
desenvolvido pelas alunas Débora Luise Bertling, Jacqueline Fernanda Goetz
Mueller e Simone Vieira como Trabalho de Conclusão do Curso de Publicidade e
Propaganda.
Traz a contextualização da aplicabilidade do Big Data para melhorar as linhas
editoriais de blogs por meio da qualificação de conteúdo e tem como objetivo
descobrir quais as formas de qualificação existentes na internet brasileira e qual é a
maneira que se pode extrair dados dos leitores para que, em cima deles, se
apliquem ferramentas de Big Data para análise.
A pesquisa foi realizada com dois sites, o Adoro Cinema e o Trip Advisor, por
meio de observação e análise em pesquisa descritiva. Os resultados obtidos
mostraram a interação dos usuários, avaliando e interagindo nos sites por meio de
notas e críticas.
Concluiu-se então, que a aplicabilidade das ferramentas de Big Data nos
dados gerados por meio da qualificação de conteúdo em blogs é válida. Essa
qualificação é feita por um site semelhante aos analisados e transforma os dados
qualitativos em quantitativos, tornando a utilização do Big Data mais assertiva.
Palavras-chave: Big Data; Qualificação; Blogs.
1. Big Data
A dicotomia entre real e virtual torna-se tênue neste novo cenário constituído
de tantos rastros e dados digitais, deixados a cada segundo por internautas.
WEISER apud LEMOS (2005, p. 5) citou como as tecnologias digitais “ (...) se
entrelaçam no tecido da vida quotidiana até se tornarem indistinguíveis”. Dessa
forma, cada vez mais os usuários fornecem dados que podem desvendar seu
comportamento e forma de pensar.
O grande desafio para as empresas é saber como desvendar e utilizar estes
dados de forma produtiva. É um enorme volume de informação, porém se não
souberem tirar valor dela, torna-se inútil. A questão é: O que é relevante e o que não
é? Qual a pergunta a ser respondia por todos estes dados?
Para responder essas perguntas surge o termo Big Data, que é o adjetivo que
se dá a um grande conjunto de dados, que, normalmente, não podem ser tratados
por tecnologias convencionais, principalmente em relação ao custo.
A partir da análise, cruzamento e interpretação dos dados começa-se a dar
sentido para essa grande cadeia de informações, as quais são capazes de agregar
valor estratégico ao mercado. Segundo MANYIKA; CHU; BROWN, (2011, p.4), “Big
Data – grandes poços de dados que são capturados, comunicados, agregados,
armazenados e analisados – é agora parte de cada setor e função da economia
global”.
O Big Data apresenta duas vertentes em sua estrutura. A primeira, que é a
definição dos objetivos do negócio, e que trabalha inicialmente com duas
estratégias: a fase da mensuração, em que os dados são medidos cientificamente e
a exatidão é o ponto chave: sabe-se exatamente qual é o objetivo. A fase de
experimentação é a que permite uma variável maior, pois parte de hipóteses e
aplicações de métodos de verificação. A segunda vertente contempla a relação entre
dados transacionais (dados coletados pela empresa através de um banco de dados
de uma estrutura) e os dados não transacionais (dados que não possuem estrutura
formal, tais como os gerados através das mídias sociais).
Numa empresa, a aplicação do Big Data, em mensuração e dados
transacionais, é possível pela compreensão do banco de dados e é chamada de
Gerenciamento de Performance. Os analistas podem filtrar e segmentar
determinados perfis de dados já cadastrados, utilizando informações do histórico da
empresa, tais como intervalo de compra de determinados clientes ou aumento de
vendas em determinadas épocas do ano. Estes dados transacionais, a princípio,
não chamam atenção pela inovação mas tem papel crucial na elaboração de
estratégias, é a partir deles que é possível achar um perfil de consumidor e explorar
datas de procura e compras, como citados no exemplo anterior. Essa exploração de
dados leva em conta o comportamento do consumidor em experiências passadas,
suas preferências e compras levam à criação de um modelo segmentado em que
são permitidas ações para grupos, tais como cross-selling (produtos
complementares) e up-selling (produtos adicionais).
Logo após, o Social Analitycs envolve o acompanhamento em tempo real de
dados não transacionais gerados em redes e mídias sociais. Essa análise se dá
através de três pilares: Audiência (exposição), engajamento (participação) e alcance
(disseminação).
E por fim há a Tomada de Decisão, processo no qual a análise de dados não
transacionais e projetos de experimentação geram respostas para as empresas.
Aqui, ferramentas como o crowdsourcing fazem parte do campo de pesquisa.
Através das respostas obtidas, os analistas conseguem gerar conceitos válidos de
valor, viabilidade e adequação de determinado produto ou serviço.
Nesse contexto, surgem dois tipos de profissionais de Big Data. O chamado
DataBase Administrator (DBA) que é responsável por gerir o banco de dados de
uma empresa, instalar o software, resolver bugs, cadastrar usuários, fazer backups
periódicos e estar envolvido com o bom funcionamento do sistema e o chamado
Estatístico que é o responsável por transformar os dados coletados em informações
estratégicas de valor.
Para o DataBase Administrator, a estrutura do Big Data é composta por
softwares capazes de realizar tudo o que já foi descrito acima como bancos de
dados NoSQL, e também sistemas colunares, como o Big Table (sistema utilizado
pelo Google), Lotus Notes, Mongo DB e o Neo4j.
Depois dessa infraestrutura estabelecida acontece a segunda etapa em que
há mensuração e análise dos dados, é o chamado Big Data Analytics. Aqui, é
possível extrair apenas as informações úteis do enorme volume de dados adquiridos
e analisados, para transformar esses dados em decisões de negócio.
O conceito de Big Data é novo, portanto muitas vezes difícil de entender e
aplicar. Para facilitar no manuseio desta ferramenta, especialistas criaram sub-
termos que são empregados para uma melhor definição e entendimento do Big
Data. São estes: Volume, variedade, velocidade, valor e veracidade.
O volume baseia-se na grande quantidade de dados e informações trocadas
a cada segundo. Aqui, não se fala sobre terabytes, mas sim sobre zettabytes
(1021 byte) ou yottabytes (1024 byte). Segundo Bernard Marr (2014), se nós
pegarmos todos os dados gerados desde o começo do mundo até o ano de 2008,
essa mesma quantidade será gerada, em breve, a cada minuto. Isso faz com que as
ferramentas que antes eram usadas para mensurar estes dados tornem-se
insuficientes. Este volume de dados vem de sistemas estruturados (banco de dados)
e sistemas não estruturados (mídias sociais), este sendo a maioria. Por minuto, são
produzidos bilhões de e-mails, mensagens no Facebook, compras online, acessos
de vídeos, etc. O grande desafio é utilizar o Big Data para mensurar quais são os
dados importantes e de que forma utilizá-los.
A velocidade está ligada a estes novos dados gerados cada vez mais
rápido, e por isso a necessidade de agir em tempo real. Nas mídias sociais,
principalmente, os chamados virais dissipam-se quase que instantaneamente e o
engajamento gera novas informações que precisam ser mensuradas. As
ferramentas de Big Data permitem analisar estes dados em tempo real, quando
ainda estão sendo gerados, antes mesmo de serem inseridos num banco de dados.
Um exemplo é a velocidade com que os dados de um cartão de crédito são
transmitidos na hora da compra.
A variedade está ligada ao fato de que 80% dos dados gerados atualmente
não provém de banco de dados estruturados, como antigamente. Agora temos fotos,
vídeos, mensagens de voz, sms, redes sociais, e-mails, conversas online, e uma
grande infinidade de dados não estruturados que contém informações valiosas. Com
a tecnologia do Big Data é possível mensurar e analisar estes dados também.
A veracidade serve para avaliar esta infinidade de dados, em que existe um
risco muito grande de informações falsas transmitidas. Torna-se necessário ter
certeza de que os dados são verídicos e que fazem sentido. A qualidade de um bom
trabalho de Big Data é justamente avaliar os dados gerados e filtrar os que, de fato,
são verdadeiros e úteis naquele determinado período e objetivo.
O valor torna a prática justificável. É imprescindível que a empresa que
adquira os serviços de Big Data tenha um retorno dos investimentos. É o que torna
tudo relevante na esfera de negócio. Gerar valor, tanto financeiro quanto na imagem
da empresa.
Dentro do universo de Big Data, pode-se definir três tipos de empresas:
as que apresentam um problema de Big Data, as que fornecem consultoria para
solucionar os problemas e as que fornecem a tecnologia que o estruturará. Para
exemplificar pode-se usar a Amazon, como empresa que apresenta um problema de
Big Data, pois precisa analisar transações e pedidos diariamente; o escritório Big
Data Corp, como empresa que oferece consultoria e solução de problemas através
do Big Data; e novamente a Amazon como empresa que fornece tecnologia, com a
Amazon Web Service, que disponibiliza ferramentas para análise de dados. Assim, o
Big Data funciona através de quatro frentes: definição de problema, coleta de dados,
tratamento de dados e escolha da tecnologia que irá trabalhar as informações
recebidas.
2. Contexto Histórico dos Blogs
Nesse momento da comunicação na internet, em que as pessoas deixam de
ser apenas leitores para tornarem-se produtores de conteúdo surgem os weblogs,
conhecidos popularmente como blogs. Em 1997, o Jornal Barger criou o termo
‘’weblog’’, que era direcionado aos sites que divulgavam links de novos sites. Em
1999 o site Pitas criou uma ferramenta para manutenção de páginas pela internet, e
logo após surgiram o Blogger e o Wordpress, plataformas em que é possível
hospedar um blog com facilidade.
[…] esses sistemas proporcionaram uma maior facilidade na publicação e manutenção dos sites, que não mais exigiam o conhecimento da linguagem HTML e, por isso, passaram a ser rapidamente adotados e apropriados para os mais diversos usos. Além disso, a posterior agregação da ferramenta de comentários aos blogs também foi fundamental para a popularização do sistema. (ALMADA, Larissa. 2009)
Com essa facilidade, muitas pessoas começaram a usar os blogs com o
suporte de diário online de seu autor, onde ele pode expor suas opiniões
abertamente, dar dicas de lugares e produtos, contar seu dia-a-dia, descobertas e
tudo aquilo que julgar ser interessante a quem lê o blog.
Os blogueiros eram figuras críticas que exerciam livremente o prazer de comunicar suas visões sobre as mais diversas questões com que se deparavam em seu dia a dia, sem terem que obedecer às regras e convenções do sistema, o limite era até onde a imaginação pudesse ir. (ALMADA, Larissa. 2011)
Dessa forma, eles são livres para comentar, opinar e expor ideias e opiniões
sem terem que se reportar à condições sistemáticas ou ao que é moralmente aceito.
Ali é o espaço deles e de seus pensamentos, sem normas.
Com a profissionalização dos blogs, eles deixaram de ser apenas diários
virtuais e passaram a ser cada vez mais comerciais, tendo, muitas vezes, mais
audiência do que um canal de TV fechada, por exemplo. São grandes formadores de
opinião e influenciam diretamente os leitores nas suas compras. Por essa razão,
podem ser considerados uma nova forma de mídia online.
A Teoria da Cauda Longa, criada por Chris Anderson (2006), diz que:
Nossa cultura e economia estão mudando do foco de um relativo pequeno número de 'hits" (produtos que vendem muito no grande mercado) no topo da curva de demanda, para um grande número de nichos na cauda. Como o custo de produção e distribuição caiu, especialmente nas transações online, agora é menos necessário massificar produtos em um único formato e tamanho para consumidores. Em uma era sem problema de espaço nas prateleiras e sem gargalos de distribuição, produtos e serviços segmentados podem ser economicamente tão atrativos quanto produtos de massa.
Por isso, é cada vez mais forte a parceria de marcas com blogueiros, em que
produtos específicos são anunciados em blogs muito bem segmentados e com
leitores assíduos. O mercado de nicho trouxe não só a queda da massificação de
produtos, mas também as novas oportunidades de utilizar os blogs como
ferramentas de mídia eficazes em suas campanhas publicitárias.
Normalmente essa parceria se dá em 4 formatos diferentes:
- Publieditorial: O blogueiro recebe uma amostra do produto/serviço e elabora
um post onde conta sobre sua experiência com o mesmo. O texto deve ser aprovado
pela marca antes de ser publicado e deve conter a tag ‘‘publicidade’’, informando
aos leitores que aquele post foi patrocinado pela marca.
- Banners: São colocados no layout do blog, normalmente na barra superior
ou no lado direito, onde o leitor ao decorrer da leitura sempre tem a marca visível.
- Citação de marca: O blogueiro no decorrer de seu texto faz a menção da
marca, sem aprofundar nos detalhes de determinado produto ou serviço, apenas a
cita e em alguns casos pode deixar o nome da marca como link direcionando ao site
da mesma.
- Eventos: O blogueiro comparece a eventos ligados diretamente a marca,
para cobrir o evento e fazer um post contando com detalhes como foi. Os gastos
com passagens e hospedagens também são por conta da marca anunciante.
2.1 Novos Modelos de Comportamento
Se as mudanças tecnológicas foram grandes, o aspecto social não fica para
trás. De fato, todas as mudanças ocorreram em prol de um objetivo: facilitar as redes
sociais (ou humanas) dentro da nova tecnologia, a internet.
Conforme Garton, Haythornthwaite e Wellman (1997):
When a computer network connects people or organizations, it is a social network. Just as a computer network is a set of machines connected by a set of cables, a social network is a set of people (or organizations or other social entities) connected by a set of social relations, such as friendships, co-working, or information exchange.
Dentre os novos modelos de comportamentos influenciados pela web, a
interação e troca de informações é a maior delas. A interação, segundo o dicionário
Aurélio, é o fenômeno que consiste no fato de que o comportamento de cada
indivíduo torna-se estímulo para o outro.
Dessa forma, constroem-se relações e comportamentos virtuais baseados na
troca. Se um determinado indivíduo produz conteúdo e posta na internet,
automaticamente poderá influenciar o comportamento de outro indivíduo. Por
exemplo : O site Reclame Aqui, em que usuários postam suas reclamações sobre
determinadas empresas ou marcas. Nele o indivíduo ‘A’ posta sua reclamação sobre
o mau atendimento de determinada empresa, então o indivíduo ‘B’ lê e apesar de
não ter nenhuma experiência com aquela empresa, forma a sua opinião baseada na
experiência do indivíduo ‘A’.
Essa facilidade na troca de informações fez com que a vida online tornasse-
se natural. É cada vez mais frequente o uso de desktops, notebooks, tablets e
smartphones para resolver assuntos do dia-a-dia, reencontrar amigos, fazer
compras, contar experiências e até mesmo achar sua alma gêmea. Essas
ferramentas, junto com a internet, já se tornaram partes do corpo do indivíduo que
antes de decidir em qual restaurante jantar, procura resenhas sobre os locais no
Foursquare. Antes de comprar determinado aparelho eletrônico pesquisa os preços
no Mercado Livre, e que, ao viajar, não curte o local sem antes tirar uma foto e
postar no Instagram.
A coletividade de arquivos digitais também é presente nesses novos
comportamentos, aqui o indivíduo não precisa mais ir à loja comprar o cd para ouvir
determinada música, ele pode simplesmente entrar no iTunes e comprar por ali. Da
mesma forma livros que já são disponibilizados em e-book, as fotos que antes eram
reveladas agora são armazenadas em site como Flickr e as enciclopédias foram
substituídas pela Wikipédia, onde cada um pode compartilhar conhecimento.
Para toda essa troca de informações, o indivíduo não precisa estar próximo
ao outro, facilitando essa relação, mas ainda distanciado das pessoas no mundo
real. Segundo Reid (1991), “a conversação mediada também proporciona um
distanciamento físico entre os interagentes, mas, funcionando, muitas vezes, como
um tipo de comunicação semelhante à face a face, mas a distância”.
Dentro dos novos modelos de comportamentos gerados pelo mundo digital,
temos dois que se destacam. Em 2001, o nova-iorquino Marc Prensky apresentou
ao mundo pela primeira vez os termos ‘’imigrantes digitais e nativos digitais”. Em seu
artigo “Digital natives, digital immigrants”, Prensky separa dois tipos de
consumidores do mundo digital. Um deles chama-se ‘’Imigrantes Digitais”, um novo
modelo de comportamento surgido da população que vivenciou a transição do
analógico para o digital, e que dia-a-dia tenta adaptar-se a esse novo estilo de vida.
São indivíduos que aprenderam a usar o computador já na fase adulta, e que
precisam adaptar-se a esse mundo. Normalmente têm dificuldades para assimilar
essas novas experiências e sempre precisarão de uma ajuda adicional. Estão
aprendendo a lidar com as novas facilidades e, por vezes, tem receio em confiar em
compras online, por exemplo.
Alguns deles, porém, conseguem lidar bem com essa transição e aos poucos
vão experimentando todo o lado bom do advento digital, porém sempre serão
considerados imigrantes.
E também os “Nativos Digitais”, que Marc Prensky (2011) cita como os
indivíduos que nasceram e cresceram dentro da grande bolha digital e que tratam
tudo com naturalidade e rapidez.
Para eles não há dificuldade como para os imigrantes digitais, pois cresceram
dentro dessa realidade. São indivíduos que podem ler e-mails, jogar, acessar suas
redes sociais e assistir televisão ao mesmo tempo e em plena consciência do que
estão fazendo. Normalmente tem maior facilidade para lidar com aparelhos
eletrônicos e não imaginam a vida sem eles, possivelmente enquadram-se na
categoria em que estes aparelhos são como que uma extensão de seu próprio
corpo.
Para Prensky:
Crianças criadas com o computador pensam diferente do resto de nós. Eles desenvolvem um espírito de hipertexto. Temos então uma nova geração com uma grande mistura de diferentes habilidades cognitivas do que seus antecessores, esses são os nativos digitais. (2001).
Em 2013, o Brasil já se encontrava no ranking como o 4º país com mais
nativos digitais do mundo, apenas atrás de países como China, EUA e Índia.
2.2 Produção de Conteúdo para Blogs
Diante da grande quantidade de informações oferecidas ao usuário
diariamente é grande também o desafio para prender a atenção do mesmo. Para
isso, faz-se necessária a criação de textos bem estruturados, compreensíveis e de
fácil leitura. Os estudos de FRANCO apud NIELSEN (1994) já remetiam a
conclusões de que os usuários preferem a linguagem objetiva, os textos concisos e
o design escaneável.
Mas antes de falar sobre o escrever, precisa-se entender como o usuário lê.
Segundo experiências do Eyetrack, existem dois tipos de leitores online: Os
escaneadores, que ao entrar em determinada página passam os olhos e captam as
palavras mais importantes, chegando a uma conclusão através destas palavras e
partindo para a próxima atividade online, e existem também os leitores que leem
palavra por palavra, estes, como já é explícito, leem com atenção e passam mais
tempo na página.
Ainda dentro destes dois grupos de leitores, pode-se categorizar mais três:
Os exploradores, que não buscam por um objetivo específico, os que tem um motivo
específico e os que coletam algo mas que não buscam por uma resposta definitiva.
Conclui-se, então, que para ambos os perfis de leitores, deve existir algo que
chame a atenção do mesmo e que o motive a continuar a leitura, porém diante do
atarefado dia-a-dia dos usuários, prender-se a um texto que não o acrescente algo é
frustrante. Para solucionar isso, Roy Peter Clark, em 2008, criou o método chamado
de Pirâmide Invertida, que vem ajudando escritores online a estruturar melhor seus
textos e assim atingir um maior número de leitores.
Este método consiste em dividir as informações do texto em etapas, sendo
elas: A informação mais importante com a conclusão logo no começo, a fim de
informar ao leitor do que se trata, e assim se houver interesse ele continuar a leitura.
O título desperta o interesse e deve ser bem construído. Depois o material que
amplia esta informação, aprofundando melhor o assunto, logo após o contexto e por
fim o material secundário. Segundo Mencher (2010):
Os leitores desejam saber o que aconteceu assim que a matéria começa a se desenvolver. Se for interessante, prestarão atenção. De outra forma, irão a outro lugar. As pessoas vivem ocupadas demais para parar sem nenhuma recompensa.
Alguns cuidados são interessantes nesta etapa, tais como cuidar para não
começar com artigos, nem expressões de ligação, utilizar palavras fortes no começo
e no final para intensificar a importância do texto e dividi-lo em blocos temáticos.
Também é válida a substituição da voz ativa pela voz passiva. Segundo Guillermo,
“Ao colocar as palavras portadoras de informações à esquerda nos títulos, nos
parágrafos que seguem e nos leads, melhora a escaneabilidade e, assim, a
efetividade do SEO”.
Algumas dicas para a construção dos textos são úteis, porém o conteúdo
ainda é o mais importante. Avaliar qual a expectativa e reação dos leitores através
dos comentários é algo valioso para entender como o texto vem sido entendido e
como pode ser melhorado.
3. Métricas de Conteúdo e Busca
Além do conteúdo de um texto e da melhor forma de escrevê-lo, é preciso
que ele esteja ao alcance do usuário. Para tanto, utilizam-se técnicas para alavancar
a posição em buscadores, tais como: Utilizar palavras semanticamente similares, e
não apenas repetir as palavras em grande quantidade, faz com que o universo
daquele assunto torne-se mais amplo e, por consequência, sua página apareça nos
resultados de buscas mais facilmente. A relação do conteúdo do corpo do texto com
as palavras-chave inseridas também tem elevada importância, mais além, as
palavras-chave em negrito tendem a se destacar no índice de importância da
página, não utilizar metáforas que confundem os buscadores, e por fim, a mais
importante ação de todas, o uso de palavras-chave no título da tag, no cabeçalho da
Page HTML.
O uso de boas tags é considerado o item mais importante no SEO para a
convergência de quem faz a busca para visitante e leitor da página. Para facilitar a
definição dessas tags, pode-se usar a hierarquização da Pirâmide Invertida,
comentada na produção de conteúdo.
Porém, deve-se lembrar que é fundamental a página apresentar conteúdo
interessante e de fácil acesso ao usuário. Estar no topo das buscas é benéfico
desde que o conteúdo encontrado no site seja interessante ao usuário. FRANCO
apud NODDLER (2007):
Matt Cutts, um dos atualizadores do algoritmo (conjunto de equações matemáticas feitas para calcular resultados) do Google, disse em 2007, numa conferência em Seattle, que a empresa vem tentando apresentar resultados de buscas que sejam relevantes para as pessoas. Por esse motivo, eles buscam codificar pela usabilidade e compreensão no algoritmo. Assim, escrever para as pessoas em vez de escrever para os buscadores é a melhor estratégia, a longo prazo, para garantir alta colocação neles.
4. Plano de Pesquisa
4.1 Problema
Qual é a aplicabilidade das tecnologias de Big Data dentro da qualificação de
conteúdo em blogs?
4.2 Objetivos
- Descobrir as diferentes maneiras de qualificação de conteúdo em sites de
avaliação;
- Verificar características que levem o usuário a ter um maior engajamento
com o site.
- Diagnosticar como essas interações fomentam estruturas do Big Data.
Universo e amostra
A pesquisa ocorrerá em ambiente digital formado por sites de qualificação de
conteúdo selecionados de acordo com os seguintes critérios:
- Segmento de entretenimento e turismo;
- Engajamento de usuários da web; medido através do número de
usuários cadastrados nos sites.
O primeiro deles é o Adoro Cinema (www.adorocinema.com), site brasileiro
lançado no ano 2000 que conta com mais de 6 milhões de visitantes/mês e mais de
600 mil usuários cadastrados. Ele traz informações sobre filmes, os bastidores,
personagens, atores, entrevistas e também premiações. Em 2003 ganhou o prêmio
Ibest como um dos três melhores sites de cinema da época. Depois de muitos anos
de jornada, inovação em design e conteúdo sempre atualizado, em julho de 2013, o
AdoroCinema se juntou com a Webedia Brasil para constituir um dos maiores grupos
de portais de entretenimento online do país. Conta com 4 milhões de vídeos vistos
por mês, segundo o Google Analytics de maio/2014, e com mais de 14 mil fichas de
avaliação de filmes, mais de 32 mil fichas de avaliação de personalidades e mais de
13 mil trailers. As avaliações feitas pelos usuários já somam mais de 1 milhão e as
críticas escritas pelos usuários ultrapassam as 80 mil.
O segundo é o TripAdvisor, que é um dos maiores sites de avaliação de
viagens e turismo do mundo. Ele foi fundado no ano de 2000 e foi financiado por
investidores privados. É um dos primeiros sites a adotar o modelo de ter o conteúdo
gerado pelos próprios usuários, e com o capital vindo de publicidade. Possui mais de
32 milhões de membros, 170 milhões de avaliações e está presente em 45 países.
4.3 Método
A pesquisa será feita através do método descritivo de casos:
O tipo de pesquisa que se classifica como "descritiva", tem por premissa buscar a resolução de problemas melhorando as práticas por meio da observação, análise e descrições objetivas (...) (THOMAS; NELSON; SILVERMAN, 2007).
Para tanto, será feito o cadastro pessoal nos sites escolhidos visando um
maior envolvimento em cada um deles. A coleta de informações ocorrerá através da
observação da estrutura, do comportamento dos demais usuários nos sites e do
sistema de qualificação de conteúdo que eles proporcionam. Cada site será avaliado
de acordo com critérios pré-estabelecidos a fim de responder aos objetivos gerados:
Quadro 1- Critérios de Avaliação
Com as informações obtidas, será feita a análise e descrição dos resultados
baseando-se nos objetivos propostos anteriormente, a fim de descrever maneiras
em que o Big Data pode ser aplicável no processo de qualificação de conteúdo em
blogs.
5. Análise de Dados
5.1 Adoro Cinema
O site Adoro Cinema é um portal de qualificação de filmes que, segundo
informações coletadas com a equipe do site via e-mail, possui 630 mil usuários
cadastrados que geram, mês a mês, 110 mil notas e 2.220 críticas. A mensuração
da participação de cada usuário não pode ser feita em virtude do número alto de
cadastros, porém através da análise pude observar que as críticas são feitas por
usuários distintos, em cada gênero de filme preferido, portanto pode-se considerar
que a média de participação é muito boa.
Figura 1- Página Inicial do Site
Fonte: adorocinema.com.br
Os usuários podem criar, organizar e compartilhar suas próprias bibliotecas
de filmes, dar notas e escrever críticas, participar de promoções e recomendar via
Facebook, Twitter e Google+.
Nele observa-se que as categorias de qualificação são divididas em três: As
críticas da equipe do próprio site, as críticas da imprensa e as críticas dos usuários
cadastrados. Elas podem ser por meio de notas (estrelas) que têm peso de 1 a 5,
sendo 5 a nota mais alta, ou por meio de críticas descrevendo a opinião do escritor
sobre o filme. O site oferece a mensuração das notas e críticas feitas pelos usuários,
apresentando uma média geral e a quantidade de críticas escritas.
Figura 2 - Página Inicial de Críticas. Continua.
Fonte: adorocinema.com.br
Fig. 3:
Fonte: adorocinema.com.br
Figura 3 - Página Inicial de Críticas. Continuação.
Figura 4 - Mensuração de Críticas
Fonte: adorocinema.com.br
Na página de cada filme aparece a crítica positiva e a crítica negativa mais úteis
dos usuários, essa qualificação é feita por meio de votação dos próprios usuários no
decorrer da leitura.
Figura 5 - Críticas Positiva e Negativa
Fonte: adorocinema.com.br
Nessas páginas ainda é possível classificar e visualizar as críticas mais úteis, as
mais recentes e também as críticas dos usuários com mais seguidores, ou dos
usuários com mais críticas escritas.
Figura 6 - Forma de Visualização das Críticas
Fonte: adorocinema.com.br
Caso o usuário não queira escrever nenhuma crítica, nem dar nenhum nota, ele
pode apenas se tornar fã de algum dele.
Figura 7 - Ícone de Fã
Fonte: adorocinema.com.br
A maioria das críticas são feitas por homens, principalmente em filmes de
aventura, terror, ação e ficção. As mulheres acabam avaliando em maior número
filmes românticos, desenhos animados e comédias. A característica que mais leva
os usuários a qualificarem os filmes é gostarem dele, a maioria das críticas vão para
filmes que foram bem avaliados, ou seja, se o usuário gostou, irá recomendar.
5.2 Trip Advisor
Parte do maior site de viagens do mundo, o Trip Advisor Brasil oferece as
opções de criar mapas de viagens, avaliar locais visitados, inserir fotos, avaliar
destinos, hotéis, restaurantes e atrações. Oferece aos usuários a possibilidade de
pesquisar preços de passagens aéreas e de compartilhar suas experiências de
viagens a fim de formar um grande acervo de avaliações.
Logo na página inicial aparecem os locais mais comentados, fotos de
viajantes, destino em destaque e uma barra de pesquisa. Em cada destino
aparecem quantas pessoas avaliaram aquele local, a previsão do tempo, guias de
viagem, melhores restaurantes e melhores atrações do local.
O sistema de qualificação é feito através de notas e críticas. As notas são
visualizadas por meio de bolinhas e podem ser do horrível (uma bolinha) ao
excelente (cinco bolinhas). As críticas cada usuário pode descrever sua experiência,
seja positiva ou negativa. O site possui opções mais amplas do que a maioria dos
sites, aqui ele pode inserir o tipo de visita (romântica, família, amigos, negócios ou
sozinho), a data da visita, fotos que tirou no local e também notas opcionais,
divididas em três: Para hotéis e pousadas são avaliados o atendimento, o custo
benefício, a qualidade do sono, a limpeza, a localização, os quartos, a piscina e a
sala de ginástica. Para restaurantes e lanchonetes são avaliados o atendimento, a
comida, o custo benefício e o ambiente. Para atrações são avaliados a duração, os
banheiros, a escada ou elevador, o guarda-volumes, o estacionamento e se a
atração é paga ou gratuita. Em cada local ou atração há um ranking de avaliações
positivas.
Figura 8 - Exemplo de Avaliação de Destino
Fonte: tripadvisor.com.br
Os usuários são pessoas que gostam de viajar e de expor suas viagens.
Grande parte deles avalia cada item de sua viagem de forma completa e
normalmente não interagem entre si. Quando não gostam de algum local ou atração,
avaliam na mesma intensidade de quando gostam, relatando a experiência negativa
que tiveram.
Figura 9 - Exemplo de Avaliação de Destino 2
Fonte: tripadvisor.com.br
No perfil de cada usuário aparecem os números de contribuições, de votos
úteis, de cidades visitadas, os quilômetros percorridos e a porcentagem do mundo
viajado. É mostrado todos os locais que foram qualificados e dentro de cada local
todas as avaliações de hotéis, restaurantes ou atrações do mesmo. Por meio do
número de avaliações os usuários ganham selos de qualificação do seu perfil,
tornando suas críticas mais confiáveis na medida em que ganham mais selos.
Figura 10 - Exemplo de Perfil de Usuário
Fonte: tripadvisor.com.br
Figura 11 - Exemplo de Perfil de Usuário 2
Fonte: tripadvisor.com.br
Percebeu-se que os dois sites aparecem na página de busca do Google
quando se procura por um filme ou local, gerando visitantes e usuários cadastrados,
ou seja, os métodos de avaliação influenciam diretamente no número de usuários.
6. Conclusão
A partir das análises feitas pode-se concluir que a qualificação de conteúdo
ocorre por meio de usuários que gostam de compartilhar informações sobre seus
filmes e viagens preferidos. E como comportamento usual, os usuários da internet o
fazem a fim de oferecer informação útil aos que buscam por determinadas opiniões.
Normalmente as críticas são feitas pelo sistema de notas, por ser um método rápido,
embora muitos realmente gostem de dedicar tempo à escrita de críticas, listando
itens dos quais gostaram, informações relevantes e por vezes até sugestões de
melhorias. Nesse âmbito, as críticas positivas são mais comuns.
De igual forma, leitores de blogs já comentam entre si sobre seus blogs
preferidos e o que gostam e não gostam neles. Porém com uma estrutura online
para qualificação estas informações podem ser mensuradas. Observou-se que cada
usuário tem um perfil de acesso, que pode ser por meio de login ou pela conta do
Facebook, sendo possível a coleta de dados segmentada, como por exemplo,
descobrir qual é o gênero de filme mais assistido ou qual a categoria de blogs mais
avaliados por mulheres, na faixa etária de 20 a 30 anos.
Os sites oferecem a ferramenta de mensuração das notas, a fim de
transformar as informações qualitativas em quantitativas, facilitando a leitura dos
mecanismos de Big Data, gerando melhor veracidade nas mesmas.
A influência dos métodos de avaliação no número de usuários dos sites
avaliados gera a premissa de que o site deve estar atento às métricas de busca e
precisa estar posicionado nas páginas para garantir novos usuários e o crescimento
das avaliações por meio de um trabalho de SEO bem elaborado. O entretenimento é
um segmento que está gerando muitas buscas na rede e é imprescindível que o site
de qualificação esteja apto a aparecer nos resultados dessas buscas. Aqui, o
método de crítica influencia positivamente, pois é possível empregar palavras-chave
dos textos em tags, facilitando o posicionamento na busca e, consequentemente,
trazendo mais usuários ao site de qualificação.
Para a primeira etapa da aplicabilidade de Big Data na qualificação de
conteúdo temos a Definição do Problema que se quer solucionar, que no presente
caso é trazer melhorias às linhas editoriais dos blogs por meio da avaliação de
conteúdo. Informações geradas pelos próprios leitores devem ser analisadas para
que os blogueiros possam melhorar sua linha editorial, pois são estes leitores quem
irão determinar o que gostam de ler ou não.
A segunda etapa da aplicabilidade refere-se à Coleta de Dados, que é feita
por meio de um site em que o usuário possa classificá-los de modo a transformar
essas informações em dados quantitativos. Essa qualificação pode ser feita por meio
de um sistema de notas dentro da plataforma BlogIn, e possibilitando, também, a
interação nas redes sociais
A terceira etapa da aplicabilidade está na Análise dos Dados. Por meio de
tecnologias de Big Data, essa análise categoriza-se na Fase de Experimentação e é
feita por empresas que fornecem soluções em softwares capazes de organizar todos
os dados colhidos na etapa anterior.
Concluiu-se então que é possível o uso das tecnologias de Big Data na
análise do conteúdo gerado no site de qualificação dos blogs por não ser possível
tratar todos os dados por meio de tecnologias convencionais, que se utilizam
somente de banco de dados, e por preencherem os 5 “Vs”: Volume, variedade,
velocidade, veracidade e valor.
Os blogs já nasceram como espaços de exposição virtual, um lugar em que a
realidade virtual é intensa, compartilhando experiências vividas online e offline a fim
de disseminar a opinião e de relacionar-se com o leitor. Essa interação faz parte do
novo modelo de comportamento que a internet trouxe, possibilitando a troca de
informações e a influência de opiniões. Na qualificação de conteúdo essa influência
dita um comportamento comum: absorve-se a opinião do outro nas decisões
pessoais mesmo sem ter formado a opinião própria. Os perfis de usuários dos sites
influenciam milhões de pessoas mesmo sem uma interação na realidade física,
basicamente a mesma função que os blogs vêm desempenhando ao longo dos
anos. Os dados gerados no uso do Big Data servirão para identificar melhorias nas
linhas editoriais destes blogs, a fim de produzir conteúdo mais relevante ao público e
aumentar a audiência.
Como continuidade da presente pesquisa pretende-se identificar qual
tecnologia de Big Data é mais adequada aos dados que serão coletados por meio do
site de qualificação, com a intenção de avaliar o modus operandi de cada uma e
identificar qual suprirá a necessidade.
7. Referências
ALMADA, Larissa. Blogs: Portas Abertas para as marcas na cibercultura. 7 páginas. Comunicação de Moda - Universidade do Minho, Juiz de Fora, 2011. ANDERSON, Chris. A Cauda Longa: Do mercado de massa para o mercado de nicho. Rio de Janeiro: Editora Campus, 2006. BARBOSA, Mariana. O Brasil é o quarto país do mundo em nativos digitais. Disponível em: http://www1.folha.uol.com.br/mercado/2013/10/1360208-brasil-e-quarto-pais-do-mundo-em-nativos-digitais.shtml. Acesso em 19/08/2014. CASTELLS, Manuel. A sociedade em rede. São Paulo: Paz e Terra, 1999. v. 1. FILHO, Agenor Almeida. A comunicação na era da tecnologia digital: a escrita no ciberespaço. Disponível em: <http://periodicos.uesb.br/index.php/folio/article/viewFile/33/272>. Acesso em: 16 set 2013. FRANCO, Guillermo. Como Escrever para Web. Disponível em: http://lerebooks.wordpress.com/2011/01/16/ebook-gratuito-como-escrever-para-a-web/. Acesso em 19/08/2014.
JR, Thomas, Nelson JK, Silverman SJ. Métodos de pesquisa em atividade física 5 ed. Porto Alegre: Artmed; 2007.
KOTLER, Philip. Marketing 3.0: As forças que estão definindo o novo marketing centrado no ser humano. Rio de Janeiro: Editora Elsevier, 2010. PINHO, José Benedito. Publicidade e vendas na Internet: técnicas e estratégias. São Paulo: Summus, 2004. LEMOS, André. Cibercultura e mobilidade: a era da conexão. In: XXVIII Congresso Brasileiro de Ciências da Comunicação – Rio de Janeiro/RJ, 2005. Disponível em: << http://www.intercom.org.br/papers/nacionais/2005/resumos/r1465-1.pdf>> Acesso em: 03/09/2013.
MANYIKA, James; CHUI, Michael; BROWN, Brad; et al. Big Data: The next frontier for innovation, competition, and productivity. McKinsey Global Institute, 2011.
MARR, Bernard. Big Data: The 5 Vs Everyone Must Know. Disponível em: https://www.linkedin.com/pulse/article/20140306073407-64875646-big-data-the-5-vs-everyone-must-know?trk=cha-feed-art-title-206. Acesso em 19/08/2014.
MENCHER, M. Mencher’s News writing and reporting. Boston, 11th ed, McGraw-Hill Higher
Education.
NASCIMENTO, Antônio Dias; HETKOWSKI, Tânia Maria. Educação e Contemporaneidade: Pesquisas científicas e tecnológicas. SciELO, EDUFBA, 2009.
PRENSKY, Marc. Digital Natives, Digital Immigrants. Disponível em: http://www.marcprensky.com/writing/Prensky%20-%20Digital%20Natives,%20Digital%20Immigrants%20-%20Part1.pdf. Acesso em 19/08/2014. SCHONBERGER, Victor Mayer; CUKIER, Kenneth. Big Data – Como extrair volume, variedade, velocidade e valor da avalanche de informação cotidiana. Rio de Janeiro, Ed Campus, 2013.
TAMANAHA, Paulo. Planejamento de mídia – teoria e experiências. São Paulo, Pearson, 2011, 2a ed. VERONEZZI, José Carlos. Mídia de A a Z. São Paulo, Edicon, 200.