inteligência competitiva na web: uma análise bibliométrica ... · destacada a relevância do...
TRANSCRIPT
1
Inteligência Competitiva na Web: uma Análise Bibliométrica do Estado da Literatura
Autoria: Maurílio Tiago Brüning Schmitt, Juliana Clementi, João Artur de Souza, Gertrudes Aparecida Dandolini, Pierry Teza, Patrícia Fernanda Dorow
Resumo: Esta pesquisa consiste numa revisão da literatura sobre a inteligência competitiva na web a partir de uma análise bibliométrica. A bibliometria é um estudo quantitativo da atividade científica. Utilizou-se as bases de dados Scopus, Engineering Village, Web of Science, EBSCO, IEEE Xplore. A partir de 968 artigos resultantes das buscas, selecionou-se 149 artigos relacionados ao tema, identificados, sobretudo pela leitura de resumos. Apresentou-se os principais artigos, os autores, países, journals, conferências que mais publicam e as palavras-chave mais utilizadas. Com base na análise dos artigos mais relevantes e citados, concluiu-se que há possibilidades de estudos na área, evidenciando-se lacunas.
2
1 Introdução
A inteligência competitiva (IC) é importante para as organizações, pode ser utilizada para antecipar mudanças no mercado, verificar ações de competidores, entender mudanças políticas, legislativas e regulatórias que podem afetar o negócio (KAHANER, 1996). Além de identificar ameaças, a IC serve para buscar oportunidades por meio do monitoramento da opinião de consumidores sobre produtos (inclusive dos concorrentes), beneficiando a geração de novas ideias.
Além das fontes usuais que a IC emprega, como entrevistas com detentores de conhecimento relevante, é possível utilizar a web para o desenvolvimento da inteligência competitiva, principalmente coletando informações em blogs, redes sociais e fóruns. Porém, verifica-se que os estudos que relacionam a IC e a web ainda são incipientes, principalmente aqueles que fazem uma ligação coerente entre os temas.
Esta pesquisa, a partir de uma análise bibliométrica, tem como objetivo identificar os principais artigos, autores com mais publicações, journals, conferências, palavras-chave relacionados ao tema IC na Web. Procura-se expandir o conhecimento na área e clarear a relação com outros temas, tais como inovação, aquisição de conhecimento e inteligência coletiva. Analisa-se os artigos mais relevantes e busca-se identificar lacunas para pesquisas futuras. O trabalho está estruturado em sete seções, incluindo esta introdução. Na próxima seção são apresentados os conceitos básicos sobre Inteligência Competitiva na Web. O método de pesquisa é explicado na terceira seção. Nas seções 4 e 5 são detalhadas as etapas de coleta de dados e de análise bibliométrica. Os artigos considerados mais relevantes são analisados na seção 6. Por fim, são apresentadas as considerações finais. 2 Inteligência competitiva na web: aspectos conceituais
Segundo Kahaner (1996, p.16), “Inteligência Competitiva é um programa sistemático
de coleta e análise da informação sobre atividades dos competidores e tendências gerais dos negócios, visando atingir as metas da empresa”. Buscam-se informações externas sobre competidores, mercado, produtos, clientes, tecnologia, ambiente, para então transformar bits em conhecimento estratégico (TYSON, 2002).
As fontes de informações da Inteligência Competitiva podem ser primárias ou secundárias. Fontes primárias são inalteradas, vêm diretamente da fonte (KAHANER, 1996), como a partir de apresentações em conferências, entrevistas com stakeholders e experts. Já as secundárias são encontradas em bancos de dados: publicações, sites, feeds, entre outros (FEHRINGER; HOHHOF; JOHNSON, 2006).
Destaca-se que “[...] um dos focos da maioria das empresas é adquirir a IC a partir da Web” (JIE; PEIQUAN, 2009, p.126). A grande dificuldade é filtrar informação relevante nesta imensa montanha de dados (TEO; CHOO, 2001). Para isso, as empresas fazem uso de técnicas como spider (CHEN; CHAU; ZENG, 2002), também chamados de crawlers, para coletar informação e utilizam a mineração de dados para a análise da informação (HEINRICHS; LIM, 2003). É importante também observar a necessidade de veículos eficazes para a disseminação da Inteligência Competitiva (MARIN; POULTER, 2004).
Ainda dentro da Web, há a possibilidade de utilizar as Redes Sociais ou Mídias Sociais como fontes de informações. Neste contexto, identifica-se o termo Sentimental Analysis (Análise Sentimental) ou também chamado de Opinion Mining (Mineração de Opinião). A “Análise Sentimental tenta identificar e analisar opiniões e emoções” (ABBASI; CHEN; SALEM, 2008, p.2); grandes oportunidades de negócio podem ser identificadas por meio da opinião das pessoas (LAU; LAI; YUEFENG, 2009).
3
Observa-se que as opiniões dos consumidores geralmente comparam os pontos fortes e fracos entre produtos com funcionalidades similares (XU et al., 2011). Desta forma, é possível utilizar estas informações para projetar produtos melhores, vender mais e aumentar a satisfação do cliente.
Destacada a relevância do tema e conceituado o termo de IC na WEB, apresenta-se a seguir o método desta pesquisa.
3 Método
O método utilizado nesta pesquisa é composto pelas etapas de coleta de dados (busca
sistemática), seleção dos artigos e análise bibliométrica. Na etapa de coleta de dados foram definidos as bases de dados, os termos de busca e
os tipos de publicações. As bases de dados utilizadas foram Scopus, Engineering Village, Web of Science, EBSCO, IEEE Xplore. Dentre os termos de busca, definiram-se os seguintes: “competitive intelligence” + web; “competitive intelligence” + internet; “competitive intelligence” + social media; “competitive intelligence” + social networks; “Intelligence 2.0”. As buscas foram realizadas nos dias 28 e 29 de fevereiro de 2012, pesquisando os termos em Títulos, Resumos e Palavras-chave. Limitou-se a artigos de journals e de conferências.
As bases de dados retornaram 1770 publicações (contando os duplicados) distribuídas da seguinte forma: Scopus (498); Engineering Village (571); Web of Science (42); EBSCO (17); IEEE Xplore (642). Após a eliminação dos duplicados, gerou-se um portfólio de 968 artigos. Na segunda etapa, foram selecionados 149 artigos relevantes sobre o assunto, com base nos Títulos, Palavras-chave e Abstracts do portfólio de 968 artigos. Foram categorizadas as palavras-chave, nome de autores, journals, nome de conferências, para então realizar a última etapa, a análise bibliométrica.
A bibliometria é “[...] um instrumento quantitativo, que permite minimizar a subjetividade inerente à indexação e recuperação das informações, produzindo conhecimento, em determinada área de assunto” (GUEDES; BORSCHIVER, 2005, p.15). Na etapa de bibliometria geraram-se gráficos relacionados à produtividade de autores, à dispersão da literatura periódica científica e dos artigos mais citados na área de inteligência competitiva na web.
Na etapa de bibliometria foram gerados gráficos relacionados à produtividade de autores, à dispersão da literatura periódica científica e dos artigos mais citados na área de inteligência competitiva na web.
Utilizando-se dessas informações, selecionou-se os artigos encontrados mais citados e relevantes para analisa-los na íntegra. Os objetivos dessa fase são o de apresentar as diferentes abordagens sobre o tema de e de identificar lacunas para futuras pesquisas. 4 Coleta de dados
Na etapa de coleta de dados foram determinados os termos de buscas (Figura 1) com
base na leitura de artigos relevantes sobre o tema Inteligência Competitiva na Web. O termo intelligence 2.0 foi buscado no intuito de verificar se ele é utilizado e está relacionado ao tema.
4
Figura 1. Palavras utilizadas na busca
As buscas foram realizadas nos dias 28 e 29 de fevereiro de 2012 nas bases Scopus, EBSCO, Engineering Village, Web of Science e IEEE Xplore. Os termos definidos na Tabela 1 foram procurados em Título de Artigos, Abstracts, Palavras-chave. Além disso, o tipo de documento foi definido como Artigo ou Conference Paper, no intuito de não perder algum conteúdo relevante que foi apresentado em conferências. A Tabela 1 apresenta o resultado das buscas realizadas nas bases de dados.
Tabela 1 Resultados das buscas
Palavra buscas \
Base
Competitive intelligence +
web
Competitive intelligence +
internet
Competitive intelligence
+ social media
Competitive intelligence
+ social
networks
Intelligence 2.0 TOTAL
SCOPUS 258 193 10 33 4 498
Engineering Village 292 223 6 42 8 571
Web of Science 23 12 1 3 3 42
EBSCO 9 5 1 2 0 17 IEEE
Explore 322 266 12 40 2 642
TOTAL 904 699 30 120 17 1770
No total foram retornados 1770 artigos, contando os duplicados. Em seguida, os
resultados de cada busca foram importados na ferramenta EndNote® para eliminação dos artigos duplicados entre bases, restando 968 publicações. Além disso, foram adicionados 2 artigos relevantes, encontrados por meio da ferramenta Google Scholar. De início, já se percebeu que o termo Intelligence 2.0 é pouco utilizado. Após esta etapa, foram identificados os artigos não relevantes sobre o assunto Inteligência Competitiva na Web. Para realizar a seleção dos artigos, foram analisados os Títulos, Palavras-chave e Abstracts. Nos casos em que se havia dúvida da pertinência de um artigo para a pesquisa, analisou-se a publicação na íntegra.
Após a seleção, montou-se um portfólio de 149 artigos e foi realizado o refinamento e padronização das referências. Com base nestes artigos é que foi feita a análise bibliométrica a seguir.
5
5 Análise bibliométrica A Tabela 2 apresenta os dados gerais das etapas de busca e seleção dos artigos.
Tabela 2 Dados gerais
Critérios Quantidade
Publicações na... Scopus 498 Engineering Village 571 Web of Science 42 EBSCO 17
IEEE Xplore 642 Total de publicações 1770 Total após eliminação dos duplicados 968 Outros artigos adicionados 2 Total após a eliminação dos não relevantes 149
Dos 149 artigos relevantes, 55 são artigos de journal (Journal Articles) e 94 de
conferência (Conference Papers). A primeira análise apresenta à frequência das palavras-chave nos 81 artigos que o
próprio autor definiu (Figura 2). Os artigos de autores que não definiram palavras-chave (68) não foram contados para o gráfico. Destes 68, 12 não foram encontrados o artigo completo. Além disso, os termos parecidos foram categorizados, como por exemplo: Decision Making Process virou apenas Decision Making e Web Searching virou apenas Web Search. Salienta-se que a busca foi gerada utilizando palavras-chave, resumo e título.
Com relação ao gráfico, pode-se ainda considerar os termos Opinion Mining e Sentiment Mining como sinônimos (LAU; LAI; YUEFENG, 2009), o que totalizaria uma frequência de 8.
Dentre os termos encontrados, destaca-se que o termo visualização (visualization) refere-se às técnicas utilizadas para facilitar a compreensão dos tomadores de decisão com relação à informação obtida. Já o termo clusterização (clustering) remete-se ao agrupamento de dados relacionados, o que é necessário para a mineração de dados (data mining).
Por sua vez, a inteligência coletiva (collective intelligence), na visão da inteligência artificial, é “definida como a capacidade de um grupo formado por agentes simples trabalhando junto para resolver problemas maiores e mais complexos, em vez da busca da solução por um único agente” (SINGH; GUPTA, 2009, p.546). O uso da inteligência coletiva tem sido cada vez mais explorado com o aumento das redes sociais virtuais, já que o poder das multidões pode ser aplicado nos negócios.
publiautor
Figura A segun
icam artigores Hsinchu
Fig
Comp
a 2. Frequên
nda análise s relacionad
un Chen e Ji
gura 3. Aut
Web u
SocS
SOp
Knowledge Informat
DeciDat
CompetitivCollective
Knowled
Dpetitive intellig
VSenti
BusinessCompetitive
012345678
Che
n, H
sinc
hun
ncia das pa
foi realizados à Inteliin Peiquan.
tores com m
usage miningWeb search
Webcial networksSocial mediaearch engineinion miningmanagementtion retrievalision makingta warehouseCompetitors
ve advantagee intelligence
Clusteringdge discovery
InternetData analysisgence systemVisualizationiment miningData miningText miningWeb mining
s intelligencee intelligence
Peiq
uan,
Jin
Vau
ghan
, L.
alavras-cha
ada com o gência Com
mais public
0 5
3333333333333334444
55
g,
Chu
ng, W
ingy
an
ave (corte d
intuito de mpetitiva na
cações (cor
10 15
67
11
Jie,
Zha
o
Bau
mga
rtner
, R.
de mínimo 3
identificar a Web (Figu
rte de no mí
5 20
17
Dey
, L.
Tan,
A. H
.
3 repetiçõe
os autoresura 3). Dest
ínimo 3)
25 30
27
6
es)
s que maistacam-se os
6
s s
UtilizNos Foramcitad
F
quan
Outra anzaram-se ascasos em qm considera
dos em duas
Figura 4. A Com bas
ntas vezes es
Figu
A
CHUNG; C
SRINIVA
012345678
nálise realizas bases de que o artigoados os arti
s bases, cons
Artigos mai
se nos gráficstes autores
ura 5. Ocor
CRIMGREGG;
PAWA
TAN
ARAYA; SILVVAUGHAN
CRHEIN
GOTPANT; SR
CHEN; NUNAJ
CHEN; CH
ASAN; MENCZHONG; JIM
Che
n, H
sinc
hun
Peiq
uan,
Jin
ada se referdados Scop
o não era enigos citadossiderou-se o
is citados (c
cos de autor apareceram
rrências do
MMINS et al.; WALCZAK
AR; SHARDATAN et al.
N; FOO; HUILIN et al.
PIKASVA; WEBER; GAO; KIPP
DOURONIN et al.
NRICHS; LIMTTLOB et al.RINIVASANAMAKER JRJINDAL; LIUHAU; ZENGTEO; CHOO
CZER; PANTMING; YIYU
Vau
ghan
, L.
Chu
ng, …
Jie
Zhao
re aos artigopus e IEEEncontrado ns no mínimoo maior núm
corte de no
res que maim (Figura 5)
os autores c
0
, 1999, 2007, 1997, 2004, 2002, 2008, 2005, 2004, 2006, 2004, 1994, 2003, 2004, 2006, 2005, 2006, 2002, 2001, 2005, 2002
Jie,
Zha
o
Bau
mga
rtner
, R.
Dey
, L.
os mais citaE Xplore panestas baseso 10 vezes emero.
o mínimo 10
is publicam).
com mais p
10 20
1010111111
1313
151516
1818
Tan,
A. H
.
ados por outara checar s, verificou-em uma das
0)
m e dos mais
ublicações
30 40
2731
3439
4141
NúmerArtigos
Ocorrêno Gradas Cit
tros autoreso número d-se a Web s bases. Par
s citados, rel
e citações
50 60
46
ro de s
ências afico tações
7
(Figura 4).de citações.of Science.a os artigos
lacionou-se
70
70
7
.
.
. s
e
do prnúme
Figu publipossu(SCIjourndefinmeno
Procurourimeiro autero de publi
ura 6. Publi
Dos 55 icações: Joui uma quMAGOLABnal; quanto nido pela CAos elevado -
0
5
10
15
20
25
30
35
40
45
Esta
dos U
nido
sC
hina
u-se tambémor (Figura 6icações.
icações por
artigos dournal of Sualificação B, 2012). maior o SJRAPES, é B5- com peso
Espa
nha
Índi
aC
anad
áSi
ngap
ura
Ale
man
ha
m verificar a6). Destaca
r país dos a
de Journal,Software e
4, o piorO SJR in
R, melhor é5, sendo quzero (CAPE
Ale
man
haR
eino
Uni
doÁ
ustri
aB
rasi
lFi
nlân
dia
as publicaçõa-se que os
rtigos selec
, examinoue Decision r na escal
ndica a influé o journal. ue o A1 é oES, 2012).
Irã
Itália
Japã
oM
alás
ia
ões por paísEstados Un
cionados (n
u-se que aSupport S
a de 1 a uência cienO estrato in
o mais eleva
Fran
çaH
ong
Kon
gH
ungr
iaR
omên
iaA
ustrá
lia
s. Foi consinidos e a C
n=149)
apenas 2 pSystems. O
4, com Sntífica médndicativo deado; A2; B
Aus
trália
Bós
nia
e …C
hile
Col
ômbi
aC
órei
a do
Sul
iderada a Unhina possue
periódicos O Journal oSJR 0,029
dia dos artie qualidade 1; B2; B3;
Cro
ácia
Din
amar
caG
réci
aIr
land
a
8
niversidadeem o maior
tiveram 3of Software
em 2011gos de umdo journal,B4; B5; C,
Portu
gal
Taiw
an
8
e r
e
m , ,
(SCICom obtiv(Figu
Figu TechComp 6 An
para no de autortema
In
Ha
Já o DeMAGOLAB
mputação (CACom bas
veram um mura 7).
ura 7. Confe
Verificouhnology, Texpetitive Inte
nálise dos a
Com basentão se reaesenvolvim
A referênres tratam das relaciona
Workshop o
nternational ST
Internati
Internation
Internat
InternationaMining a
Manag
awaii Internati
ecision SupB, 2012). OAPES, 2012se nos 94 a
maior númer
erências co
u-se que ext Mining, elligence, B
artigos
se na análisalizar uma a
mento da Intencia mais cida importânados na pers
n Intelligent IApplic
Symposium onTechnology A
ional Conferen
nal Conference
tional ConfereKnowledge
al Conferenceand their Busingement Inform
ional Confere
pport SysteO estrato C2). artigos de Cro de trabalh
om mais art
estas conferWeb Minin
Business Inte
se biblioméanálise sobreligência Coitada é a ob
ncia da webspectiva de
Information Tation
n Intelligent InApplication
nce on Web In
e on Informati
ence on Informe Managemen
e on Data, Texness Applicatimation Engine
nce on System
ems tem quCAPES é A
Conferênciahos apresen
tigos apres
rências posng, Social Melligence.
étrica, examre a abordagompetitiva.
bra dos autob para o des
negócio: w
0
Technology
nformation
ntelligence
ion Fusion
mation and t
xt and Web ions and eering
m Sciences
ualificação 1 para Inter
a, gerou-se ntados sobre
entados (co
ssuem tópiMedia, Opin
minou-se os gem utilizad
res Zhong, senvolvimenweb mining,
1
Q1, com rdisciplinar
um gráficoe Inteligênci
orte de no m
cos em Danion Mining
artigos mada por cada
Jiming e Ynto da intel, agentes w
2 3
SJR 0,054r e A2 para
o das conferia Competit
mínimo 3)
ata Miningg, Sentimen
is citados ea autor sobre
Yuyu (2002)ligência e d
web, interaçã
3 4
9
4 em 2011Ciência da
rências quetiva na Web
g, Decisionnt Analysis,
e relevantese o uso web
, na qual osdiscutem osão homem-
5
9
a
e b
n ,
s b
s s -
10
web, redes de conhecimento, infraestrutura e tecnologias emergentes, gestão da informação provinda da web, computação ubíqua, inteligência social, recuperação da informação.
Teo e Choo (2001) apresentam por meio de estudos empíricos que há uma relação entre a qualidade da informação da Inteligência Competitiva e a Internet. Os autores afirmam que “apesar das preocupações sobre a confiabilidade da informação publicada na internet, ela possui um dos melhores custos-benefícios para obtenção da informação" (TEO; CHOO, 2001, p. 80). Esta importância do uso da Internet como fonte para a inteligência competitiva é corroborada no artigo de Tan, Foo e Hui (2002). Os autores descrevem formas embrionárias do monitoramento da web, mesmo considerando que a “natureza dinâmica da web torna a tarefa de monitorar complicada e consumidora de tempo” (TAN; FOO; HUI, 2002, p. 225). Destaca-se que o potencial uso da internet para o desenvolvimento da IC já era discutido em 1994 (Cronin et al., 1994).
Neste contexto é que se identifica a importância dos crawlers para o desenvolvimento de ferramentas de inteligência competitiva, já que os crawlers facilitam a coleta de dados (SRINIVASAN; MENCZER; PANT, 2005). No artigo de Chen, Chau e Zeng (2002), por exemplo, é introduzido um crawler (também chamado de spider) específico para desenvolver a Inteligência Competitiva, permitindo a busca de páginas relevantes de acordo com as especificações do usuário. Ainda, Pant e Srinivasan (2006) examinaram os efeitos que o contexto de ligação (link context) das páginas causa nos crawlers focados na coleta de um único tópico (topical crawlers).
Um exemplo de coleta de dados é o do monitoramento de patentes que estão disponibilizadas na Internet, tratado no artigo de Dou (2004). O autor apresenta uma aplicação que permite o desenvolvimento da inteligência competitiva e do pensamento inovador por meio da busca e seleção de patentes em bancos de dados gratuitos. Além disso, essa coleta auxilia os usuários a compreenderem a relação entre os diferentes conjuntos de patentes (DOU, 2004).
No artigo de Gregg e Walczak (2007, p. 111) é apresentado um sistema de extração adaptativo que “deve ser resiliente, de modo que tenha a capacidade para continuar funcionando adequadamente, mesmo quando há mudanças nas páginas Web”. Esta solução é interessante, pois além de permitir o reuso auxilia na precisão dos dados.
Após a fase de coleta de dados na Inteligência Competitiva, é necessário que haja a mineração de dados. Heinrichs e Lim (2003, p. 104) afirmam que se “[...] podem usar estas ferramentas de inteligência e mineração de dados para oportunidades de mercado, monitorar o desempenho do produto, entender mudanças nas exigências do cliente e administrar o relacionamento com o cliente em tempo real”. Tan et al. (2004) abordam a questão da personalização, em que se define o monitoramento da informação relevante de acordo com o interesse e o perfil do usuário.
Um exemplo de framework para a descoberta de conhecimento na web apresentado é o de Chung, Chen e Nunamaker (2005). Ele incorpora as fases de coleta de dados, mineração, algoritmos de clusterização e visualização da informação. Na visão dos autores, este framework alivia o excesso de informações, permite a descoberta de inteligência de negócio a partir da web e busca melhores métodos para a visualização dessas informações.
Com relação aos artigos identificados que tratam do uso das mídias sociais (blogs, fóruns, redes sociais), destaca-se o artigo de Dey et al. (2011). Os autores afirmam que a “inteligência competitiva não está restrita apenas a coleta do conhecimento sobre o consumidor” (DEY et al., 2011, p. 1). Existem outras formas em que o conteúdo das mídias sociais pode contribuir com a inteligência competitiva, destacadas na Figura 8.
11
Figura 8. Monitoramento das mídias sociais Fonte: o autor (2012), baseado em Dey et al. (2011)
A grande dificuldade apontada por Dey et al. (2011) é lidar com o conteúdo web que
não interessa, removendo o chamado noise. Esse conteúdo caracteriza-se por propagandas, menus, links e também por elementos da linguagem que são difíceis de interpretação. Os autores ainda apresentam estudos de caso sobre a detecção de promoções de concorrentes com base no Twitter e da popularidade de marcas no Facebook.
Sobre outros artigos mais recentes (publicados no ano 2011), sobressai-se o artigo de Xu et al. (2011). Nesta publicação, os autores apontam uma lacuna de estudo, ao afirmarem que
Já existem estudos sobre a mineração das opiniões dos consumidores. Porém, estes estudos focam principalmente na identificação das polaridades do sentimento dos consumidores com relação a produtos. O problema mais importante da IC – coletar e analisar a informação sobre competidores para identificar riscos potenciais o quanto antes for possível e assim planejar estratégias - não foi tão bem estudado (XU et al., 2011, p. 743).
12
Nesse contexto, os autores propõem e aplicam um modelo que extrai opiniões de consumidores do site de vendas Amazon e exibe a partir de grafos (mapas comparativos) os resultados para a tomada de decisão do gestor (XU et al., 2011).
Outro artigo que merece destaque é o de Jie e Peiquan (2011), em que os autores apontam mais uma lacuna de estudo:
Existem poucos trabalhos focados na avaliação da credibilidade da inteligência competitiva. A maioria dos trabalhos anteriores relacionados concentra-se na credibilidade da informação. Basicamente, a inteligência competitiva deriva da informação. Mas a credibilidade da inteligência competitiva é diferente da credibilidade da informação. Existe relação entre esses dois tipos de credibilidade, que ainda é uma questão não descoberta na pesquisa sobre inteligência competitiva (JIE; PEIQUAN, 2011, p. 1515).
Os autores propõem um framework para extração da inteligência competitiva da web,
utilizando redes sociais na avaliação da credibilidade da informação e assim tentam melhorar a eficácia do processo. Como citado pelos autores, os detalhes da implementação e do experimento não são discutidos nesse artigo. 7 Considerações finais
Esta pesquisa teve como objetivo fazer uma análise bibliométrica da literatura sobre
Inteligência Competitiva na Web. Identificou-se os artigos mais citados, autores, journals e conferências com mais publicações, bem como as palavras-chave relacionadas ao tema IC na Web mais frequentes. Dentre os autores com mais publicações sobre o tema, destacaram-se os pesquisadores Hsinchun Chen (University of Arizona) e Jin Peiquan (University of Science and Technology of China). Identificou-se que a maioria dos artigos é produzida em Universidades localizadas nos Estados Unidos e China. A conferência que teve mais trabalhos apresentados foi a Hawaii International Conference on System Sciences. Esta conferência tem foco em tecnologias que apoiam a tomada de decisão (como data/web/text mining) e sistemas de conhecimento. Nesse sentido, analisando o número de publicações e eventos, pode-se considerar que os Estados Unidos são responsáveis pela maior produção de artigos sobre o tema. Com relação à frequência das palavras-chave, além dos termos inteligência competitiva (competitive intelligence) e inteligência de negócio (business inteligence), destaca-se os termos variados de mineração de dados (web, data, text, sentiment, opinion mining), descoberta de conhecimento (knowledge discovery), inteligência coletiva (collective intelligence), redes sociais (social networks), mídias sociais (social media), entre outros. Além disso, verificou-se que os journals com mais publicações são o Journal of Software e o Decision Support Systems. O journal Decision Support Systems é uma referência para estudos relacionados à atividade de apoio à decisão, considerado pela CAPES como um periódico de qualis A1 e A2 (os níveis mais altos).
Após a análise bibliométrica, os artigos mais citados e relevantes foram analisados na íntegra, no intuito de compreender a abordagem utilizada por cada autor. Destaca-se que o foco de muitos autores está na tecnologia e na elaboração de frameworks. Ainda, existem estudos que mostram a importância do uso da web para o desenvolvimento da inteligência competitiva, inclusive com a mineração da opinião dos consumidores em mídias sociais. Essas opiniões auxiliam no monitoramento das estratégias dos concorrentes, acontecimentos do mundo real e eventos promocionais.
13
Com base neste trabalho sobre inteligência competitiva na web, podem-se direcionar estudos futuros relacionando o tema com a inovação, o uso das redes sociais como fonte de informações e as técnicas de mineração de dados.
Dentre as lacunas identificadas estão a avaliação da credibilidade da inteligência competitiva desenvolvida a partir da web, o uso da opinião dos consumidores para avaliar riscos e criar estratégias, e a questão da visualização dos dados. Verificou-se que ainda existem dificuldades para filtrar as informações relevantes da web e a eliminação do chamado noise.
Referências ABBASI, A.; CHEN, H.; SALEM, A. Sentiment analysis in multiple languages: Feature selection for opinion classification in Web forums. ACM Trans. Inf. Syst. [S.I.], v. 26, n. 3, p. 1-34, 2008. ARAYA, S.; SILVA, M.; WEBER, R. A methodology for web usage mining and its application to target group identification. Fuzzy Sets and Systems [S.I.], v. 148, n. 1, p. 139-152, 2004. CAPES. WebQualis. Disponível em: <http://qualis.capes.gov.br/webqualis/>. Acesso em: 20 mar. 2012. CHEN, H.; CHAU, M.; ZENG, D. CI Spider: A tool for competitive intelligence on the Web. Decision Support Systems [S.I.], v. 34, n. 1, p. 1-17, 2002. CHUNG, W.; CHEN, H.; NUNAMAKER JR, J. F. A visual framework for knowledge discovery on the web: An empirical study of business intelligence exploration. Journal of Management Information Systems [S.I.], v. 21, n. 4, p. 57-84, 2005. CRIMMINS, F. et al. TetraFusion: information discovery on the Internet. Intelligent Systems and their Applications, IEEE [S.I.], v. 14, n. 4, p. 55-62, 1999. CRONIN, B. et al. The internet and competitive intelligence: A survey of current practice. International Journal of Information Management [S.I.], v. 14, n. 3, p. 204-222, 1994. DEY, L. et al. Acquiring competitive intelligence from social media. In: Joint Workshop on Multilingual OCR and Analytics for Noisy Unstructured Text Data, Beijing. 2011 Joint Workshop on Multilingual OCR and Analytics for Noisy Unstructured Text Data, J-MOCR-AND 2011, in Conjunction with the 11th International Conference on Document Analysis and Recognition, ICDAR 2011. DOU, H. J. M. Benchmarking R&D and companies through patent analysis using free databases and special software: A tool to improve innovative thinking. World Patent Information [S.I.], v. 26, n. 4, p. 297-309, 2004. FEHRINGER, D.; HOHHOF, B.; JOHNSON, T. State of the art: competitive intelligence. A Competitive Intelligence Foundation, Society of Competitive Intelligence Professionals, Alexandria, VA, Competitive Intelligence Foundation Research Report, 2006.
14
GOTTLOB, G. et al. The Lixto data extraction project - Back and forth between theory and practice, Paris. Proceedings of the Twenty-third ACM SIGMOD - SIGACT - SIGART Symposium on Principles of Database Systems, PODS 2004. 2004. p.1-12. GREGG, D. G.; WALCZAK, S. Exploiting the information web. IEEE Transactions on Systems, Man and Cybernetics Part C: Applications and Reviews [S.I.], v. 37, n. 1, p. 109-125, 2007. GUEDES, Vânia L. S.; BORSCHIVER, Suzana. Bibliometria: uma ferramenta estatística para a gestão da informação e do conhecimento, em sistemas de informação, de comunicação e de avaliação científica e tecnológica. In: ENCONTRO NACIONAL DE CIÊNCIA DA INFORMAÇÃO, 6, 2005, Salvador. HEINRICHS, J. H.; LIM, J. S. Integrating web-based data mining tools with business models for knowledge management. Decision Support Systems [S.I.], v. 35, n. 1, p. 103-112, 2003. JIE, Z.; PEIQUAN, J. Towards the extraction of intelligence about competitor from the web. In: World Summit on the Knowledge Society, Chania, Crete, Greece. Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics). Springer Verlag, 2009. p.118-127. _________________. Extraction and credibility evaluation of web-based competitive intelligence. Journal of Software [S.I.], v. 6, n. 8, p. 1513-1520, 2011. JINDAL, N.; LIU, B. Identifying comparative sentences in text documents, Seatttle, WA. 29th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval. 2006. p. 244-251. KAHANER, Larry. Competitive intelligence: how to gather, analyze, and use information to move your business to the top. Nova York: Simon & Schuster, 1996. LAU, R. Y. K.; LAI, C. L.; YUEFENG, L. Leveraging the web context for context-sensitive opinion mining. In: International Conference on Computer Science and Information Technology, 8-11 Ago. 2009. p. 467-471. LIN, C. Y. et al. SmallBlue: People mining for expertise search. IEEE Multimedia [S.I.], v. 15, n. 1, p. 78-84, 2008. MARIN, J.; POULTER, A. Dissemination of competitive intelligence. Journal of Information Science [S.I.], v. 30, n. 2, p. 165-180, 2004. PANT, G.; SRINIVASAN, P. Link contexts in classifier-guided topical crawlers. Knowledge and Data Engineering, IEEE Transactions on [S.I.], v. 18, n. 1, p. 107-122, 2006. PAWAR, B. S.; SHARDA, R. Obtaining business intelligence on the Internet. Long Range Planning [S.I.], v. 30, n. 1, p. 110-121, Fev. 1997. PIKAS, C. K. BLOG searching for competitive intelligence, brand image, and reputation management. Online (Wilton, Connecticut) [S.I.], v. 29, n. 4, p. 16-21, 2005.
15
SCIMAGOLAB. SCImago Journal & Country Rank. Disponível em: <http://www.scimagojr.com/>. Acesso em: 20 mar. 2012. SINGH, V. K.; GUPTA, A. K. From artificial to collective intelligence: Perspectives and implications. In: International Symposium on Applied Computational Intelligence and Informatics, 2009, p.545-550. SRINIVASAN, P.; MENCZER, F.; PANT, G. A general evaluation framework for topical crawlers. Information Retrieval [S.I.], v. 8, n. 3, p. 417-447, 2005. TAN, A. H. et al. Towards personalised web intelligence. Knowledge and Information Systems [S.I.], v. 6, n. 5, p. 595-616, Set. 2004. TAN, B.; FOO, S.; HUI, S. C. Web information monitoring for competitive intelligence. Cybernetics and Systems [S.I.], v. 33, n. 3, p. 225-251, 2002. TEO, T. S. H.; CHOO, W. Y. Assessing the impact of using the Internet for competitive intelligence. Information and Management [S.I.], v. 39, n. 1, p. 67-83, 2001. TYSON, K. Guide to competitive intelligence: gathering, analyzing, and using competitive intelligence. Chicago: Kirk Tyson, 2002. VAUGHAN, L.; GAO, Y. J.; KIPP, M. Why are hyperlinks to business Websites created? A content analysis. Scientometrics [S.I.], v. 67, n. 2, p. 291-300, Maio 2006. XU, K. et al. Mining comparative opinions from customer reviews for Competitive Intelligence. Decision Support Systems [S.I.], v. 50, n. 4, p. 743-754, 2011. ZHONG, N.; JIMING, L.; YIYU, Y. In search of the wisdom web. Computer [S.I.], v. 35, n. 11, p. 27-31, 2002.