sistema de inteligÊncia competitiva sobre hotÉis … · marketing, ou até mesmo ... (1999), o...

15
1 SISTEMA DE INTELIGÊNCIA COMPETITIVA SOBRE HOTÉIS NA WEB Silvana Lopes da Rosa <[email protected]> Stanley Loh <[email protected]> – Orientador Universidade Luterana do Brasil (Ulbra) – Curso de Ciência da Computação – Câmpus Canoas Av. Farroupilha, 8.001 – Bairro São José – CEP 92425-900 – Canoas - RS 13 de Junho de 2011 RESUMO Sistemas de Inteligência Competitiva são utilizados pelas organizações com a intenção de avaliar o ambiente competitivo de mercado, através da coleta e análise de informações anunciadas nos meios públicos de comunicação. Este artigo apresenta o desenvolvimento de um protótipo de sistema que utiliza inteligência competitiva aliado ao uso de uma ontologia de domínio para qualificar os comentários divulgados na web acerca de hotéis e classificar se estas informações são positivas ou negativas Palavras-chave: Inteligência Competitiva, Ontologia, Coleta e Análise de Informações. ABSTRACT Title: “Competitive Intelligence System for Hotels on the Web” Competitive Intelligence Systems are used by organizations with the intention of evaluating the competitive market environment through the collection and analysis of information announced in the media. This article presents the development of a prototype system that uses competitive intelligence coupled with the use of domain ontology to describe the comments published on the web about the hotel and rate information if they are positive or negative. Key-words: Competitive Intelligence, Ontology, Information Collection and Analysis. 1 INTRODUÇÃO O ambiente externo das empresas é fortemente competitivo e dinâmico, o que exige maturidade para que as mesmas se protejam de forma prévia, ética e sustentável. Logo, é importante monitorar o mercado onde a companhia se insere, de modo a aproveitar oportunidades e evitar ameaças externas. Este monitoramento é realizado por meio de coleta de informações, que podem ocorrer em diversos ambientes e meios de comunicação, dentre eles a internet, que é tida como uma fonte inesgotável de dados renováveis. Entretanto, é necessário transformar as informações coletadas em uma avaliação significativa, completa e confiável (GOMES e BRAGA, 2002). Para isso, será utilizada a inteligência competitiva, que segundo Fuld (2007), é toda a informação que se analisa até o ponto de se conseguir tomar uma decisão. É preciso tanto saber colher essas informações, quanto analisá-las de forma a tirar proveito de seu conteúdo. No ramo hoteleiro, a identificação e análise de eventos e tendências no ambiente de mercado é um desafio presente aos dirigentes destas organizações. Tanto os aspectos de influência direta no negócio, tais como hábitos e desejos dos hóspedes, práticas dos concorrentes e inovações tecnológicas aplicadas ao setor, quanto aspectos de influência indireta como condições da economia e tendências sócio-culturais precisam ser levadas em conta e conhecidas pelos meios de hospedagem (CANCELLIER, ALBERTON e SANTOS, 2007). Este trabalho tratará da criação de uma ferramenta que auxilie na avaliação desses aspectos. O sistema receberá o nome de um hotel e fará pesquisas na web para localizar páginas onde haja comentários sobre ele. Os textos encontrados serão classificados de acordo com uma ontologia de domínio, que permitirá identificar as características do hotel a qual o texto se refere, como por exemplo, acomodação, atendimento e localização. Além disso, será possível classificar se são comentários positivos ou não para cada aspecto avaliado. Desta forma, será possível saber, por exemplo, se está na hora de investir em uma nova estratégia de marketing, ou até mesmo trocar uma campanha devido ao retorno negativo ou adicionar mais recursos

Upload: hoangnhu

Post on 17-Nov-2018

213 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: SISTEMA DE INTELIGÊNCIA COMPETITIVA SOBRE HOTÉIS … · marketing, ou até mesmo ... (1999), o conceito de inteligência competitiva surgiu na década de 80, como uma disciplina

1

SISTEMA DE INTELIGÊNCIA COMPETITIVA SOBRE HOTÉIS NA WEB

Silvana Lopes da Rosa <[email protected]> Stanley Loh <[email protected]> – Orientador

Universidade Luterana do Brasil (Ulbra) – Curso de Ciência da Computação – Câmpus Canoas Av. Farroupilha, 8.001 – Bairro São José – CEP 92425-900 – Canoas - RS

13 de Junho de 2011

RESUMO Sistemas de Inteligência Competitiva são utilizados pelas organizações com a intenção de avaliar o ambiente

competitivo de mercado, através da coleta e análise de informações anunciadas nos meios públicos de comunicação. Este artigo apresenta o desenvolvimento de um protótipo de sistema que utiliza inteligência competitiva aliado ao uso de uma ontologia de domínio para qualificar os comentários divulgados na web acerca de hotéis e classificar se estas informações são positivas ou negativas

Palavras-chave: Inteligência Competitiva, Ontologia, Coleta e Análise de Informações.

ABSTRACT

Title: “Competitive Intelligence System for Hotels on the Web”

Competitive Intelligence Systems are used by organizations with the intention of evaluating the competitive

market environment through the collection and analysis of information announced in the media. This article presents

the development of a prototype system that uses competitive intelligence coupled with the use of domain ontology to

describe the comments published on the web about the hotel and rate information if they are positive or negative.

Key-words: Competitive Intelligence, Ontology, Information Collection and Analysis.

1 INTRODUÇÃO O ambiente externo das empresas é fortemente competitivo e dinâmico, o que exige maturidade para

que as mesmas se protejam de forma prévia, ética e sustentável. Logo, é importante monitorar o mercado onde a companhia se insere, de modo a aproveitar oportunidades e evitar ameaças externas.

Este monitoramento é realizado por meio de coleta de informações, que podem ocorrer em diversos ambientes e meios de comunicação, dentre eles a internet, que é tida como uma fonte inesgotável de dados renováveis.

Entretanto, é necessário transformar as informações coletadas em uma avaliação significativa, completa e confiável (GOMES e BRAGA, 2002). Para isso, será utilizada a inteligência competitiva, que segundo Fuld (2007), é toda a informação que se analisa até o ponto de se conseguir tomar uma decisão. É preciso tanto saber colher essas informações, quanto analisá-las de forma a tirar proveito de seu conteúdo.

No ramo hoteleiro, a identificação e análise de eventos e tendências no ambiente de mercado é um desafio presente aos dirigentes destas organizações. Tanto os aspectos de influência direta no negócio, tais como hábitos e desejos dos hóspedes, práticas dos concorrentes e inovações tecnológicas aplicadas ao setor, quanto aspectos de influência indireta como condições da economia e tendências sócio-culturais precisam ser levadas em conta e conhecidas pelos meios de hospedagem (CANCELLIER, ALBERTON e SANTOS, 2007).

Este trabalho tratará da criação de uma ferramenta que auxilie na avaliação desses aspectos. O sistema receberá o nome de um hotel e fará pesquisas na web para localizar páginas onde haja comentários sobre ele. Os textos encontrados serão classificados de acordo com uma ontologia de domínio, que permitirá identificar as características do hotel a qual o texto se refere, como por exemplo, acomodação, atendimento e localização. Além disso, será possível classificar se são comentários positivos ou não para cada aspecto avaliado.

Desta forma, será possível saber, por exemplo, se está na hora de investir em uma nova estratégia de marketing, ou até mesmo trocar uma campanha devido ao retorno negativo ou adicionar mais recursos

Page 2: SISTEMA DE INTELIGÊNCIA COMPETITIVA SOBRE HOTÉIS … · marketing, ou até mesmo ... (1999), o conceito de inteligência competitiva surgiu na década de 80, como uma disciplina

2

devido a um retorno positivo.

2 FUNDAMENTAÇÃO TEÓRICA Nesta seção estão apresentados os principais conceitos de inteligência competitiva. Serão abordadas

as etapas de um sistema de inteligência competitiva, a definição de ontologia e o significado do termo no contexto desse artigo.

2.1 Inteligência Competitiva

Segundo Battaglia (1999), o conceito de inteligência competitiva surgiu na década de 80, como uma disciplina capaz de integrar o planejamento estratégico, atividade de marketing e de informação, objetivando o monitoramento constante do ambiente externo, com respostas rápidas e precisas à empresa no que diz respeito aos movimentos do mercado.

Para Kahhaner (1996), trata-se de um programa institucional e sistemático para garimpar e analisar informação sobre as atividades da concorrência e as tendências do setor específico e do mercado em geral com o propósito de levar a organização a atingir seus objetivos e metas.

Como inteligência competitiva é baseada na captura de informação, questiona-se se o processo não é simplesmente espionagem corporativa. Por isso, profissionais de inteligência competitiva sempre a definem de forma a enfatizar o comportamento ético e a pesquisa em fontes de informações públicas. Segundo Passos (2003), tanto a coleta quanto a análise são conduzidas com o uso de bancos de dados e outras "fontes abertas" e por meio da investigação ética.

2.2 Sistemas de Inteligência Competitiva

A utilização de Sistemas de Inteligência Competitiva em organizações, sejam elas de pequeno, médio ou grande portes, tem os seguintes objetivos, dentre outros: antecipar mudanças no ambiente de negócios; descobrir concorrentes novos ou potenciais; antecipar as ações dos atuais concorrentes e aprender sobre mudanças políticas, regulatórias, ou legislativas que possam afetar seu negócio (GOMES E BRAGA, 2002).

São cinco as etapas que compõem um Sistema de Inteligência Competitiva: planejamento, coleta de dados, processamento e análise, disseminação e avaliação, as quais serão abordadas a seguir.

2.2.1 Planejamento

Planos de coleta devem estabelecer claramente os requisitos de inteligência em ordem de prioridade, identificar os tipos e o montante de informação necessária, adequar as fontes de informação aos requisitos e identificar os aspectos que requerem monitoramento contínuo.

2.2.2 Coleta de Dados

Nesta segunda etapa são realizadas as atividades de identificação e classificação das fontes de informação, a coleta de dados e seu tratamento (BERNHARDT, 2003).

Segundo Gomes e Braga (2002), a atividade de coleta poderá utilizar ferramentas que permitam a sua automatização, uma vez que os parâmetros de busca estejam bem definidos.

Dados relativos ao macroambiente podem ser colhidos a partir de sites de bancos, revistas e de notícias onde é possível atualizar-se sobre economia e política, além de sites de concorrentes que apresentam informações sobre novos produtos, relatórios financeiros e ações comerciais (CASTILHOS, 2005).

2.2.3 Processamento e análise

Esta etapa deveria se denominada “gerador de inteligência”. Neste pondo o analista transforma as informações coletadas em uma avaliação significativa, completa e confiável. A análise é um resumo ou síntese na qual são apresentadas conclusões sobre ao assunto que está sendo pesquisado (GOMES E BRAGA, 2002).

2.2.4 Disseminação

Disseminação envolve a distribuição da inteligência analisada, de forma coerente e convincente, para os usuários e tomadores de decisão (BERNHARDT, 2003).

Page 3: SISTEMA DE INTELIGÊNCIA COMPETITIVA SOBRE HOTÉIS … · marketing, ou até mesmo ... (1999), o conceito de inteligência competitiva surgiu na década de 80, como uma disciplina

3

Para Gomes e Braga (2002), os formatos de distribuição são definidos de acordo com as necessidades dos usuários do sistema. Podem ser relatórios customizados, apresentações, análises setoriais e boletins.

2.2.5 Avaliação

Os Sistemas de Inteligência Competitiva devem ser avaliados sob dois aspectos: o primeiro diz respeito ao desempenho de cada uma das fazes que compõem o sistema, o outro aspecto é a avaliação junto aos usuários dos sistemas de resultados práticos obtidos com o uso dos produtos gerados pelo sistema (GOMES E BRAGA, 2002). Ainda segundo as autoras, é essencial a verificação frequente da adequação do produto de inteligência competitiva disseminado com as necessidades reais de informação da organização.

2.3 Ontologia

Ontologias têm sido utilizadas para a representação de informações que veiculem um entendimento semântico comum de situações variadas do mundo real. Na Web, o uso de ontologias pode fornecer uma base de informações comum e padronizada, englobando conceitos-chave que podem ser utilizados por serviços requisitados para cada situação particular (Zavaglia et al., 2007) . Para Borst (1997), ontologia é uma especificação formal de uma conceitualização compartilhada.

Uma ontologia define os termos usados para descrever e representar uma área de conhecimento e as suas relações. Ela codifica o conhecimento do domínio e também o conhecimento que se entende do domínio expresso em um texto (OWL, 2004).

Segundo Guarino (2008), diferentes categorias de ontologia podem ser desenvolvidas de acordo com seu nível de generalidade. O autor identifica as seguintes categorias: • Ontologias de nível superior - descrevem conceitos muito genéricos, tais como espaço, tempo, matéria,

objeto, evento, ação e outros. Estes seriam, a princípio, independentes de domínio e poderiam ser reutilizados na construção de novas ontologias.

• Ontologias de domínio e de tarefa - descrevem vocabulários relativos a um domínio, uma tarefa ou uma atividade genéricos através da especialização de conceitos presentes na ontologia de nível superior.

• Ontologias de aplicação - descrevem conceitos em função tanto de um domínio quanto de uma tarefa em particular, que muitas vezes são especializações de ambas as ontologias relacionadas.

2.3.1 Criação de Ontologias

O primeiro passo para um melhor entendimento sobre a criação de ontologias é compreender os elementos básicos de uma ontologia (Quadro 1), que deverão ser considerados durante o processo da formalização do conhecimento (GRUBER, 1993).

Quadro 1 - Elementos básicos de uma ontologia Entidades Descrição Conceito É algo que se deseja representar sobre determinado domínio. O conceito

possui informações associadas a ele, que são denominadas de atributos. Os conceitos podem pertencer a um determinado tipo e podem conter várias informações associadas a eles, podendo também estar ligados a outros conceitos.

Relacionamento É a ligação existente entre os conceitos de um determinado domínio. Os relacionamentos expressam a natureza da ligação existente entre dois conceitos e podem possuir cardinalidade.

Função São como relacionamentos especiais entre os elementos. Elas designam que os vários elementos envolvidos nesse tipo de relação são dependentes um dos outros, mas cada um é único com relação ao outro.

Axioma Modelam as sentenças que são verdadeiras sobre determinada ontologia. Eles podem ser classificados como estruturais e não estruturais. Além de especificar as sentenças verdadeiras sobre uma ontologia, os axiomas especificam restrições sobre a sua interpretação

Instância Representam os elementos de uma ontologia. As instâncias são os conceitos e relações que foram criados na ontologia.

Page 4: SISTEMA DE INTELIGÊNCIA COMPETITIVA SOBRE HOTÉIS … · marketing, ou até mesmo ... (1999), o conceito de inteligência competitiva surgiu na década de 80, como uma disciplina

4

Segundo Pinto, Pereira e Burnham (2005), o modelo processual para a construção de ontologias compreende quatro fases: preparação, formalização, implementação e análise de qualidade. Abaixo são descritas cada fase do processo e a Figura 1 apresenta a esquematização deste modelo.

• Preparação - prevê a execução de três processos. Análise do domínio - detalha um domínio de conhecimento, objetivando uma melhor compreensão do mesmo. Levantamento de conceitos - são identificados e definidos os conceitos sinalizados pelo processo anterior, e como produto do processo, um vocabulário de controle é criado. Identificação de relacionamentos e funções -identifica as relações existentes entre eles, bem como a existência de funções.

• Formalização - é composta por dois processos. Definição de axiomas - é realizado tendo como suporte a lógica proposicional, uma vez que esta lógica apresenta as ferramentas necessárias para a definição dos axiomas que deverão ser criados a partir da taxonomia ou modelo conceitual elaborado na fase anterior. Mapeamento estrutural - tem por objetivo desenhar o esquema estrutural da ontologia.

• Implementação – é composta por um único processo. Prototipação - um protótipo da ontologia deverá ser criado, utilizando-se para tanto, uma ferramenta de edição.

• Análise de Qualidade - dois processos deverão ser executados. Verificação e Validação - responsável pela depuração de possíveis problemas existentes. Usabilidade - analisa o produto final (ontologia) a fim de fazer uma avaliação quanto à facilidade em aprender, à eficiência de uso, à facilidade em lembrar, ao conforto e satisfação durante o uso.

Figura 1 - Modelo processual para criação de ontologias

2.4 Trabalhos Relacionados

A seguir são apresentados alguns trabalhos acadêmicos e comerciais relacionados ao uso de sistemas de inteligência competitiva, recomendações de hotéis e uso de ontologias.

Page 5: SISTEMA DE INTELIGÊNCIA COMPETITIVA SOBRE HOTÉIS … · marketing, ou até mesmo ... (1999), o conceito de inteligência competitiva surgiu na década de 80, como uma disciplina

5

Battaglia (1999) propõe um sistema de informação de clientes pautado nos componentes da inteligência competitiva, o objetivo maior deste estudo é tornar disponíveis para a comunidade de ciência e tecnologia, informações sobre as instituições e empresas clientes da Finep, além de aumentar o grau de informações da Finep sobre o potencial de seus clientes e a possibilidade de acompanhar o movimento dos diversos setores econômicos e, ao mesmo tempo, oferecer estas informações nos vários níveis para a tomada de decisão.

O Tourism Recommender System (LOH et al., 2003) é um sistema de recomendação que ajuda agentes de viagens na descoberta de novas opções turísticas para os clientes, o objetivo é conseguido através de recomendações de cidades e suas atrações turísticas. Para isso, o sistema analisa as mensagens de texto enviadas pelos usuários (um cliente e um agente de viagens), quando interagindo em um chat privado, e identifica áreas de interesse do cliente de acordo com uma ontologia de turismo predefinidas no sistema, que contém temas e um vocabulário controlado. O sistema atua como um sistema de apoio à decisão porque não faz recomendações diretamente ao cliente, mas sim, ao agente de viagens.

Outro exemplo que aborda a aplicação de ontologia é apresentado no artigo Um Modelo Ontológico para o Contexto Turístico (LIMA e MOREIRA, 2007), que apresenta um modelo semântico para a representação de objetos turísticos baseado em três domínios complementares (temático, temporal e espacial) recorrendo a uma ontologia em OWL. É dada especial atenção à formalização dos processos para a representação de conhecimento temporal e espacial, tendo em vista facilitar a interoperabilidade entre agentes de software e aplicação posterior de processos automáticos para auxiliar a construção de itinerários turísticos.

O Hoteis.com (http://www.hoteis.com) é um sistema online de reservas de hotéis, que disponibiliza a todos os visitantes a avaliação dos clientes sobre o hotel pesquisado. Esta avaliação é realizada somente com os clientes cadastrados que efetuaram a reserva através do site. Além de visualizar os comentários feitos pelos clientes, é possível verificar as estatísticas de aprovação ou não do hotel de acordo com o tipo de viagem (negócios, família, com amigos) e também sobre os tipos de serviços oferecidos, como limpeza, localização e conforto.

O ClickHoteis.com.br (http://http://www.clickhoteis.com.br) é uma agência de viagens online que disponibiliza reserva de hotéis. No site os usuários podem visualizar a avaliação de outros hóspedes sobre o hotel de interesse. O site classifica o hotel nas seguintes categorias: estadia, serviços, condições do quarto, preço/qualidade, limpeza e conforto. Na avaliação, os hóspedes dão nota que variam de 1 a 5 para cada categoria mencionada. Além disto, é possível visualizar as mensagens que os usuários deixaram sobre o hotel.

3 APRESENTAÇÃO E DESCRIÇÃO DO SISTEMA Agradar no complexo mundo em que vivemos não é tarefa fácil. Não são só as peculiaridades

individuais, mas as geográficas, as culturais, as sociais, as de gênero e idade, em fim, uma gama muito grande de itens que se colocam para pensar e analisar quando o negócio-hotel é a preocupação (DREIZIK, 2010).

Na internet, com o crescente número de usuários em redes sociais, blogs, sites de reclamações, entre outros é cada vez mais comum expressar opiniões, queixas e compartilhar ideias com grande facilidade e rapidez. Entretanto, na medida em que esses dados crescem exponencialmente, torna-se cada vez mais complexo analisá-los. Mesmo os melhores mecanismos de busca não se mostram eficientes, pois trazem muitos resultados.

Este trabalho visa à criação de uma ferramenta para apoiar atividades de inteligência competitiva, auxiliando na tomada de decisão dos usuários quanto à pesquisa de hotéis. Para isto o sistema deverá ser capaz de realizar a sumarização de textos subjetivos encontrados em publicações na web. As informações obtidas através deste sistema serão classificadas e servirão para dar ao usuário uma visão sobre a repercussão que o hotel de interesse está tendo na internet.

3.1 Método de Funcionamento

O funcionamento do sistema consiste em receber como entrada o nome de um hotel, na sequência será pesquisado e coletado na internet todos os textos das páginas encontradas que correspondam à procura

Page 6: SISTEMA DE INTELIGÊNCIA COMPETITIVA SOBRE HOTÉIS … · marketing, ou até mesmo ... (1999), o conceito de inteligência competitiva surgiu na década de 80, como uma disciplina

6

do usuário.

A partir da inferência da ontologia de domínio sobre os textos, será possível identificar sobre quais características do hotel o conteúdo se refere. Além disto, será realizada a análise de sentimento sobre as páginas, o que fornecerá a identificação da quantidade de textos com teor de sentimento positivo e a quantidade de textos com sentimento negativo para cada característica.

A finalidade da análise de sentimento consiste em mensurar qual a tendência de retorno que um determinado atributo do hotel recebeu ou está recebendo nas opiniões publicadas. Para isso, será criada uma segunda ontologia de palavras cujo teor signifique sentimentos positivos, negativos ou neutros.

A figura 2 descreve os principais processos que irão compor o sistema. A pesquisa por hotéis se dará utilizando buscas em páginas previamente cadastradas na ferramenta e por mensagens do Twitter, estes dois tipos de pesquisa serão descritos detalhadamente a seguir.

Figura 2 – Fluxograma dos principais processos do sistema

3.1.1 Pesquisa e Coleta de Dados

A pesquisa na web terá seu campo de busca delimitado a alguns sites do ramo hoteleiro, que foram selecionados durante a pesquisa do artigo.

Abaixo está a lista dos sites que serão pesquisados:

• http://www.decolar.com/Hoteis

• http://www.booking.com/Hoteis

• http://www.hoteis.com

Page 7: SISTEMA DE INTELIGÊNCIA COMPETITIVA SOBRE HOTÉIS … · marketing, ou até mesmo ... (1999), o conceito de inteligência competitiva surgiu na década de 80, como uma disciplina

7

• http://www.hotel.com.br

• http://www.hotelinsite.com.br

• http://www.blogdohoteis.com

• http://www.vejablog.com.br/hoteis

• http://www.tripadvisor.com.br

• http://www.feriasbrasil.com.br

A pesquisa também coletará mensagens do Twitter, para isto será utilizado a API de buscas do microblog. A busca retornará as mensagens postadas pelos usuários que contenham o termo fornecido como entrada. Para o intuito da avaliação dos hotéis, estas mensagens passarão ainda por um filtro para selecionar somente as que contiverem um dos termos: “hotel”, “pousada” ou “albergue”.

Os resultados da pesquisa serão armazenados em memória em um vetor, que pode ser visto na figura 3. Este vetor irá conter o link para a página, o texto do site ou mensagem do Twitter, o atributo do hotel ao qual o texto se refere e o indicativo de sentimento. No momento em que os dados forem coletados da internet, somente o link e o texto são carregados. Os demais elementos do vetor somente serão preenchidos quando os textos passarem pela ontologia e pela análise de sentimento.

Figura 3 – Estrutura da coleta de dados

3.1.2 Criação e utilização das Ontologias

• Ontologia de Domínio sobre Hotéis

Para a criação da ontologia sobre hotéis será utilizado o software Protegé. A escolha do mesmo deve-se ao fato de haver bastante documentação sobre a criação e manutenção das ontologias. Outro fator importante é a existência de muitos trabalhos acadêmicos utilizando esta ferramenta. A figura 4 mostra a janela do programa com algumas classes que irão compor a ontologia de hotéis.

Para manipular a esta ontologia dentro da aplicação será utilizado o framework Jena, que conta com uma API específica para o tratamento de ontologias. Esta API transforma a ontologia em um modelo abstrato de dados orientado a objetos. A grande vantagem nesta transformação é que a programação orientada a objetos pode ser utilizada para manipular a ontologia.

Page 8: SISTEMA DE INTELIGÊNCIA COMPETITIVA SOBRE HOTÉIS … · marketing, ou até mesmo ... (1999), o conceito de inteligência competitiva surgiu na década de 80, como uma disciplina

8

Figura 4 – Tela do Protegé

A Figura 5 apresenta um exemplo de código em OWL, onde é demonstrado a colocação das classes e seus relacionamentos. A tag “<owl:Class rdf:ID='Quarto'/>” representa a definição da classe Quarto. Há também a presença da tag “<owl:ObjectProperty rdf:ID='tem'>”, essa tag define a existência de um relacionamento entre o domínio Quarto e a classe Banheiro.

Page 9: SISTEMA DE INTELIGÊNCIA COMPETITIVA SOBRE HOTÉIS … · marketing, ou até mesmo ... (1999), o conceito de inteligência competitiva surgiu na década de 80, como uma disciplina

9

Figura 5 – Exemplo de código da ontologia OWL

• Ontologia de Sentimentos

A ontologia de sentimentos será construída tendo como base uma lista de palavras e expressões que indiquem sentimento positivo e outra lista com sentimento negativo. Este vocabulário será armazenado em um banco de dados e irá conter uma pontuação que identificará o quão positivo ou negativo é cada termo do vocabulário. O quadro 2 exemplifica a pontuação dada ao vocabulário na ontologia.

Quadro 2 – Exemplo da ontologia

• Algoritmo de Classificação

As palavras de cada texto serão analisadas separadamente e comparadas àquelas presentes tanto na ontologia de hotéis, quanto nas categorias de sentimento armazenadas no banco de dados.

Na ontologia de hotéis, várias palavras identificam um único atributo, desta forma, quando uma das palavras presentes no texto for equivalente a um dos termos que classificam o atributo na ontologia, o texto em questão será marcado como sendo deste atributo. Neste momento o ‘Atributo’ é salvo no vetor de resultados. Por exemplo, os termos cama, colchão, lençol e televisão serão utilizados para identificar o atributo acomodação. A figura 6 demonstra esta classificação.

Positivos

Termo Pontuação

Ótimo 10

Fantástico 10

Querida 8

Legal 8

Negativos

Termo Pontuação

Vergonhoso 4

Escândalo 3

Errado 4

Gota d’água 5

Page 10: SISTEMA DE INTELIGÊNCIA COMPETITIVA SOBRE HOTÉIS … · marketing, ou até mesmo ... (1999), o conceito de inteligência competitiva surgiu na década de 80, como uma disciplina

10

Figura 6 – Identificação do atributo

De forma semelhante será realizada a análise de sentimento comparando as palavras aos termos do banco de dados, quando uma das palavras analisadas for equivalente a um termo do banco seu peso será somado ao total já encontrado para a categoria a qual pertence, sendo positivo ou negativo. Ao fim do documento as somas totais de pesos das palavras de cada categoria serão calculadas e o resultado será salvo no elemento ‘Sentimento’ do vetor de resultados. A figura 7 demonstra o preenchimento do vetor utilizando a mesma frase do exemplo acima.

Figura 7 – Identificação do sentimento

O algoritmo presente na figura 8 descreve o processo de separação dos textos de acordo com o atributo e também a análise de sentimento desenvolvida.

Page 11: SISTEMA DE INTELIGÊNCIA COMPETITIVA SOBRE HOTÉIS … · marketing, ou até mesmo ... (1999), o conceito de inteligência competitiva surgiu na década de 80, como uma disciplina

11

Figura 8 – Algoritmo de processamento do texto

3.1.3 Apresentação dos Resultados

O retorno da pesquisa será organizado de modo que os textos de mesmo atributo fiquem agrupados. Desta forma, será quantificado e exibido o número de ocorrências positivas, negativas e imparciais em cada atributo do hotel. A figura 9 mostra uma representação da tela de respostas em uma simulação de busca.

Page 12: SISTEMA DE INTELIGÊNCIA COMPETITIVA SOBRE HOTÉIS … · marketing, ou até mesmo ... (1999), o conceito de inteligência competitiva surgiu na década de 80, como uma disciplina

12

Figura 9 – Representação da tela com retorno da pesquisa

3.1.4 Experimentos e Avaliações

Para avaliar a eficiência da ferramenta de busca quanto aos resultados obtidos, serão utilizadas técnicas para medir a qualidade nos dados retornados. Inicialmente serão feitas pesquisas na ferramenta para obter uma amostra dos resultados que ela oferece, na sequência esses dados serão avaliados quanto à veracidade dos mesmos no que confere ao sentimento indicado pela ferramenta.

Após obter uma amostra dos resultados, os mesmos serão analisados utilizando as técnicas Precision

e Recall.

• Precision

Mede a exatidão de um classificador. Quanto maior for o índice de precision significa menos falsos positivos nos resultados, já um menor índice significa mais falsos positivos (STASIU, 2007). A figura 10 mostra a fórmula usada para obter este resultado.

Figura 10 – Fórmula de apuração do precision

• Recall

Mede a integralidade ou sensibilidade de um classificador. Maior recall significa menos falsos negativos, enquanto menor recall significa mais falsos negativos (BONFIN, 2009). A figura 11 mostra a fórmula usada para obter este resultado.

Figura 11 – Fórmula de apuração do recall

Page 13: SISTEMA DE INTELIGÊNCIA COMPETITIVA SOBRE HOTÉIS … · marketing, ou até mesmo ... (1999), o conceito de inteligência competitiva surgiu na década de 80, como uma disciplina

13

3.2 Informações de Implementação

Para o desenvolvimento do sistema será utilizado a linguagem de programação Java. A escolha se justifica devido a existência de classes específicas para recuperação de conteúdo de páginas na web, bem como ao suporte oferecido pela API do Twitter. Esta linguagem trabalha com uma grande variedade de bancos de dados dentre os quais se optou pela escolha do PostgreSQL.

Vale enfatizar que nas fases iniciais de implementação será analisado a viabilidade de substituir a linguagem de desenvolvimento por outras linguagens que se mostrem mais convenientes para esta aplicação.

4 CRONOGRAMA Para gerenciar a construção do projeto, a implementação foi dividida em etapas que deverão ser

executadas ao longo de 5 meses, de julho até novembro. O quadro 3 descreve as partes do projeto, e abaixo pode ser visto cada etapa detalhadamente.

1. Modelagem

a. Modelagem da interface de entrada e apresentação dos resultados.

b. Elaboração da estrutura de armazenamento das páginas.

2. Desenvolvimento

a. Recuperação dos textos: desenvolvimento dos métodos de pesquisa das páginas;

b. Ontologia: criação da ontologia sobre hotéis;

c. Análise de sentimento: criação do método de análise de sentimento dos textos;

3. Teste

a. Validação e procura de falhas.

4. Análise dos resultados

a. Analisar os resultados: verificar qual o nível de eficácia da técnica.

5. Criação do artigo

6. Preparação da apresentação

7. Defesa do Trabalho de Conclusão

Quadro 3 – Cronograma de atividades Item Julho Agosto Setembro Outubro Novembro 1 Modelagem X

2 Desenvolvimento X X X

3 Testes X

4 Análise de resultados

4 Artigo X X X X X

5 Apresentação X X

6 Defesa X

5 CONSIDERAÇÕES FINAIS Com este estudo será possível desenvolver um sistema para coleta e análise de textos publicados na

internet. Esta ferramenta fará a obtenção de indicadores que apóiem no processo de descoberta de inteligência em um ambiente competitivo, medindo a repercussão de comentários considerados relevantes para o usuário sobre hotéis.

Os indicadores que irão compor os resultados darão assistência aos usuários na escolha do hotel

Page 14: SISTEMA DE INTELIGÊNCIA COMPETITIVA SOBRE HOTÉIS … · marketing, ou até mesmo ... (1999), o conceito de inteligência competitiva surgiu na década de 80, como uma disciplina

14

desejado, também será útil para que os profissionais do ramo hoteleiro possam acompanhar a repercussão de seu próprio negócio na web, bem como avaliar as tendências e opiniões dos usuários sobre a concorrência. Com a ferramenta proposta será possível obter dados sobre a percepção que os atores responsáveis pela propagação das informações na internet têm de um determinado hotel.

A ferramenta proposta servirá para complementar outras ferramentas já existentes com foco nos processos de coleta e análise de dados da internet. A contribuição desse trabalho é também permitir a futuros estudos possibilidade de aprimoramentos, melhorias e até mesmo mudanças na forma de abordagem e aplicação dessa técnica dentro do contexto apresentado.

Tendo em vista que as ontologias podem ser exponencialmente explorados e adaptados aos mais diversos tipos de situações, muitos outros tipos de trabalhos e aplicações podem surgir contribuindo ainda mais com novas descobertas para essa área, que ainda é bastante desafiadora para o mundo virtual.

REFERÊNCIAS

BATTAGLIA, Maria da Gloria Botelho. A Inteligência Competitiva modelando o Sistema de Informação de Clientes - Finep. Ci. Inf., Brasília, v. 29, n. 2, p. 200-214, 1999.

BERNHARDT, Douglas. Competitive Intelligence: How to acquire and use corporate intelligence and counter-intelligence. Londres: Financial Times Prentice Hall, 2003.

BONFIN, Marcello Erick. Recuperação de Documentos Texto Usando Modelos Probabilísticos Estendidos. Centro Universitário de Maringá, 2009.

BORST, Willem Nico. Construction of Engineering Ontologies for Knowledge Sharing and Reuse. PhD Thesis - University of Twente, Enschede, The Netherlands, 1997.

CANCELLIER, Éverton Luis P. L.; ALBERTON, Anete; SANTOS, Luana D. R. Monitoramento de Informações Estratégicas em Pequenas Empresas: um estudo em hotéis de pequeno porte do Vale do Itajaí – SC. Análise, Porto Alegre, v. 18, n. 2, p. 139-157, 2007.

CASTILHO, Jorge Bitencourt. Coleta de Informações. Série SCIP Brazil Chapter – ESPM Sobre Inteligência Competitiva, v.3, 2005.

DREIZIK, Gladis. Hotelaria e a Diversidade. Disponível em: < http://www.hotelariadosul.com.br >. Acesso em: 22/05/ 2011.

FULD, Leonard. Adivinhe o que Pensa a Concorrência. Exame, Rio de Janeiro, p. 92-94, mar. 2007.

GOMES, Elisabeth; BRAGA, Fabiane. Inteligência Competitiva: Como transformar informação em um negócio lucrativo. 4ª ed. Rio de Janeiro: Campus, 2002.

GRUBER, Thomas R. Toward Principles for the Design of Ontologies Used for Knowledge Sharing. International Workshop on Formal Ontology. Padova, Italy. 1993.

GUARINO, Nicola. Formal Ontology in Information Systems: First International Conference on Formal Ontology in Information Systems, Trento, Italy, p. 3–15, 1998.

GUARINO, Nicola. Understanding, Building, And Using Ontologies. Padova, Italy. Disponível em: <http://ksi.cpsc.ucalgary.ca/KAW/KAW96/guarino/guarino.html>. Acesso em: 21/04/2011.

LIMA, Salvador; MOREIRA José. Um Modelo Ontológico para o Contexto Turístico. Conferência IADIS

Ibero Americana, 2007.

LOH, Stanley; LORENZI, Fabiana; SALDANA, Ramiro; LICTHNOW, Daniel. A Tourism Recommender System Based on Collaboration and text analysis. Information Technology & Tourism, v.6, n. 3, p. 157-165, 2003.

KAHANER, Larry. Competitive Intelligence: How to gather, analyse, and use information to move your business to the top. Nova York: Touchstone Books, 1998.

Page 15: SISTEMA DE INTELIGÊNCIA COMPETITIVA SOBRE HOTÉIS … · marketing, ou até mesmo ... (1999), o conceito de inteligência competitiva surgiu na década de 80, como uma disciplina

15

OWL Web Ontology Language Use Cases and Requirements. 2004. Disponível em: <http://www.w3.org/TR/webont-req/>. Acesso em: 10/04/2011.

PASSOS, Alfredo. Primeiros Passos em Inteligência Competitiva. Série SCIP Brazil Chapter – ESPM Sobre Inteligência Competitiva, v.1, 2005.

PINTO, Gabriela; PEREIRA, Hernane B. ; BURNHAM, Teresinha F. Definição de uma Ontologia para os Canais Preferenciais de Difusãpo do Conhecimento técnico-Científico: Fase de Preparação. CINFORM -

VI Encontro Nacional de Ciência de Informação. Salvador. 2005

STASIU, Raquel Kolitsk. Avaliação da Qualidade de Funções de Similaridades no Contexto de Consultas por Abrangência. Tese de Doutorado. Universidade Federal do Rio Grande do Sul. Porto Alegre, 2007.

ZAVAGLIA, Claudia; OLIVEIRA, Leandro H. M.; NUNES, Maria das Graças; ALUÍSIO Sandra Maria. Estrutura Ontológica e Unidades Lexicais: uma aplicação computacional no domínio da Ecologia. Anais

do XXVII Congresso da SBC. Rio de Janeiro, 2007