monografia final

Upload: antoniolazaro

Post on 13-Jul-2015

130 views

Category:

Documents


0 download

TRANSCRIPT

0

UNIVERSIDADE CATLICA DO SALVADOR CURSO BACHARELADO EM INFORMTICA DEPARTAMENTO DE INFORMTICA

UMA SOLUO BASEADA EM GESTO DE CONHECIMENTO PARA ARMAZENAMENTO/RECUPERAO DE PRODUES CIENTFICAS DA UCSAL

ANTONIO LZARO CARVALHO BORGES BRUNO BATISTA DE MAGALHES SILVEIRA

SALVADOR - BA JUNHO/2008

1

UNIVERSIDADE CATLICA DO SALVADOR CURSO BACHARELADO EM INFORMTICA DEPARTAMENTO DE INFORMTICA

UMA SOLUO BASEADA EM GESTO DE CONHECIMENTO PARA ARMAZENAMENTO/RECUPERAO DE PRODUES CIENTFICAS DA UCSAL

ANTONIO LZARO CARVALHO BORGES BRUNO BATISTA DE MAGALHES SILVEIRA

Monografia

apresentada

por

Antonio

Lzaro Carvalho Borges e Bruno Batista Magalhes como requisito parcial para aprovao na disciplina Projeto Final. Orientador: Prof. Osvaldo Requio Melo

SALVADOR - BA JUNHO/2008

2

BANCA EXAMINADORA

1 EXAMINADOR E ORIENTADOR

OSVALDO REQUIO MELO Bacharel em Cincia da Computao UFBA

2 EXAMINADOR

3 EXAMINADOR

3

CERTIFICADO

Certifico que a presente memria, Uma soluo baseada em gesto de conhecimento para armazenamento/recuperao de produes cientficas da UCSAL, foi realizada sob minha orientao por ANTONIO LZARO CARVALHO BORGES e BRUNO BATISTA DE MAGALHES SILVEIRA, constituindo o Projeto Final do Curso de Bacharelado em Informtica da Universidade Catlica do Salvador UCSAL.

Salvador, 07 de Junho de 2008.

Osvaldo Requio Melo Curso de Bacharelado em Informtica Universidade Catlica do Salvador

SALVADOR - BA JUNHO/2008

4

DEDICATRIA

Dedico esta monografia em primeiro lugar a Deus por ter me ajudado e guiado ao longo dessa estrada durante estes anos. minha me e amiga Esther por estar sempre do meu lado em todos os momentos de minha vida. minha tia-me Olivete por ter sido um excelente exemplo a ser seguido e pela criao que me proporcionou. minha tia Vitria pelo primeiro computador dado e por todo apoio que prestou ao longo da minha vida. minha irm Rita e minha sobrinha Lusa por estarem sempre torcendo por mim. minha namorada Renata por toda pacincia, palavras de apoio, carinho e ateno. Aos professores Osvaldo e Likiso por participarem diretamente no auxlio da construo desse projeto. Ao meu companheiro de projeto Bruno por ter sido forte e no ter desistido do projeto diante dos problemas ao longo do caminho. Antonio Lazaro Carvalho Borges

Dedico est monografia primeiro a Deus, pela fora que me deu para superar este semestre onde tantas coisas aconteceram; minha me, pela sua imensa dedicao , carinho, pelos exemplos de luta , perseverana e pela sua garra ao longo de minha criao, ao meu grande amigo-pai, Anilton que me mostrou em diversas vezes os caminhos certos a serem seguidos, a minha a namorada Joise pela compreenso e pacincia neste momento de intensa atividade, ao meu colega e amigo Antonio Lzaro pela dedicao em por fim a este trabalho, todos os amigos do Recanto das Ilhas e da Universidade Catlica que me deram sempre o apoio nos momentos de angstia e dificuldades e aqueles outros amigos que de uma forma direta ou indireta me ajudaram na concluso deste trabalho, aos professores Likiso e Osvaldo pelos seus ensinamentos de mestre e por ltimo, mas no menos importante ao meu pai (in memorian), pelas suas lies de humildade. Bruno Batista de Magalhes Silveira

5

AGRADECIMENTOS

Em primeiro lugar agradecemos a Deus, por nos ter permitido a execuo e concluso deste projeto, tornando assim nossos desejos profissionais mais prximos de serem realizados. Aos nossos pais, por toda pacincia, compreenso e carinho; por acreditar em nosso potencial, estando sempre ao nosso lado em todos os momentos difceis ao longo dessa grande jornada e pelo investimento que nos foi dado ao longo de nossas vidas. Agradecemos tambm aos membros de nossa famlia que sempre estiveram de nosso lado Em especial, agradecemos ao professor Osvaldo Requio, nosso orientador, pela pacincia, ajuda e disponibilidade; ao professor Likiso Hatori, que nos apoiou, nos aconselhou em momentos de dvidas e nos cedeu um pouco do seu tempo e tambm a todos os outros professores pelo conhecimento passado ao longo desses anos; as nossas namoradas pela pacincia e compreenso nos momentos difceis dessa jornada longa;aos nossos amigos que dedicaram alguns fins de semana para nos ajudar, em especial aos amigos Eleine de Almeida Passos e Danilo Costa pelas dicas sobre este processo de concluso de curso. Agradecemos tambm aos amigos que direta e indiretamente estiveram ao nosso lado, proporcionando momentos de distrao e alegria. No podemos esquecer dos nossos chefes e colegas de trabalho pela ajuda, compreenso e liberao em todos os momentos que houve necessidade.

6

[...] talvez no tenhamos conseguido fazer o melhor, mas lutamos para que o melhor fosse feito [...] No somos o que deveramos ser, mas somos o que iremos ser. Mas graas Deus, no somos o que ramos. (Martim Luther King)

7

RESUMO

Este trabalho apresenta um projeto para gerenciar as produes cientficas da UCSAL baseada nos princpios da gesto de conhecimento utilizando gesto de contedo para armazenamento e recuperao dos documentos e taxonomias para organizar os domnios de conhecimento em que os documentos sero inseridos. Para visualizao desses domnios e de suas estruturas hierrquicas so utilizadas rvores hiperblicas.

Palavras-chave: Gesto de conhecimento, gesto de contedo, taxonomia, rvore hiperblica.

8

ABSTRACT

This work presents a project to manage the production of scientific UCSAL founded on the principles of knowledge management, using management of content for storage and retrieval of documents and taxonomies to organize the fields of knowledge that the documents are inserted. To view these areas and their hierarchical structures are used hyperbolic trees. Key-words: Knowledge management, content management, taxonomy, hyperbolic tree.

9

SUMRIO

1. INTRODUO .............................................................. ERROR! BOOKMARK NOT DEFINED.4 1.1 Metodologia ...... 16 2. FUNDAMENTAO TERICA ................................................................................................... 20 2.1. Gesto de Conhecimento ............................................................................................................. 20 2.1.1 O Conhecimento ..................................................................................................................... 21 2.1.2 Classificao do Conhecimento ............................................................................................. 25 2.1.3 O Conhecimento Organizacional ........................................................................................... 25 2.1.4 A Gesto de Conhecimento nas Organizaes ....................................................................... 26 2.2 A Gesto de Contedo - GC ......................................................................................................... 28 2.2.1 Principais Benefcios da Gesto de Contedo........................................................................ 30 2.2.2 Ferramentas de CMS/ECM .................................................................................................... 31 2.2.2.1 Parmetros para anlise de um software CMS ..............................................................33 2.3 Taxonomia .................................................................................................................................... 34 2.3.1 Taxonomia e Metadados ........................................................................................................ 37 2.4 Visualizao de dados ................................................................................................................... 38 2.4.1. Transformao de dados em Formas visuais......................................................................... 38 2.4.2. Atributos visuais .................................................................................................................... 39 2.5 rvores Hiperblicas .................................................................................................................... 41 2.5.1. Treeebolic .............................................................................................................................. 43 3. APRESENTAO DO PROJETO ................................................................................................ 46 3.1 Motivao ..................................................................................................................................... 46 3.2 Viso geral do projeto ................................................................................................................... 46 3.3 Descrio das funcionalidades ...................................................................................................... 49 3.3.1 Mapeamento dos domnios ............................................................................................. 49 3.3.2 Publicao de documentos .............................................................................................. 55 3.3.3 Recuperao de documentos ........................................................................................... 60 3.4 Avaliao sobre a ferramenta criada ............................................................................................. 63 4. CONCLUSO ................................................................................................................................... 64 4.1 Sugestes para trabalhos futuros.65 REFERNCIAS BIBLIOGRFICAS ............................................................................................... 66

10

LISTA DE FIGURAS

Figura 1.1 Quadro comparativo entre Alfresco e OpenCMS...............................................17 Figura 2.1 Mapa Conceiual sobre Gesto de Conhecimento................................................21 Figura 2.2 Origem dos Dados...............................................................................................22 Figura 2.3 Exemplo do Conceito de dado, informao, conhecimento e ao.....................23 Figura 2.4 - Diviso do Conhecimento dentro da organizao................................................26 Figura 2.5 Realidade do operacional da gesto de contedo................................................30 Figura 2.6 - Exemplo de Taxonomia que mapeia animais.......................................................35 Figura 2.7 - Transformao de dados para uma forma visual..................................................39 Figura 2.8 Atributos Visuais.................................................................................................40 Figura 2.9 - rvore Hiperblica...............................................................................................42 Figura 2.10 Representao de uma rvore hiperblica com mudana de foco.....................42 Figura 2.11 - Exemplo da rvore gerada pela treebolic..........................................................44 Figura 3.1 - Descrio da arquitetura utilizada no desenvolvimento do projeto.....................48 Figura 3.2 Diagrama de entidade/relacionamento do projeto...............................................49 Figura 3.3 Exemplo de uma Treeview..................................................................................50 Figura 3.4 Taxonomia do exemplo de teste (domnio computao).....................................55 Figura 3.5 Tela inicial da aplicao......................................................................................56 Figura 3.6 Treebolic do exemplo de teste............................................................................57 Figura 3.7 Componente usado para mapeamento dos documentos......................................59 Figura 3.8 Incio da recuperao rvore do domnio selecionado........................................61 Figura 3.9 Formulrio de dados sobre o documento e palavras-chaves.............................61 Figura 3.10 Parte de associao de outros conceitos............................................................62 Figura 3.11 Tabela de exibio dos documentos encontrados.............................................63

11

LISTA DE LISTAGENS

Listagem 2.1 - Arquivo XML que gera uma rvore na treebolic.............................................44 Listagem 3.1 Processo de criao de um domnio: converso da rvore em objetos ConceitoModel...........................................................................................................53 Listagem 3.2 Mtodo que converte a lista de conceitos em um objeto Element que representa o arquivo XML da arvore........................................................................................53 Listagem 3.3 - Mtodo recursivo que gera o Element e insere todos os filhos de um Element......................................................................................................................................54 Listagem 3.4 Mtodo que converte o XML para string........................................................54 Listagem 3.5 - Parmetro do XML passado para a Applet......................................................57

12

LISTA DE TABELAS

Tabela 2.1 Conceitos; Dados, Informao e Conhecimento...............................................24 Tabela 2.2 As trs eras da Administrao no sculo XX....................................................27 Tabela 2.3 Classes de representaes visuais.....................................................................40

13

LISTA DE SIGLAS

API - Application Programming Interface API YUI - Yahoo! User Interface BAMON Banco de Monografias BLOD - Binary Large Object CEBACAD - Centro Baiano de Computao de Alto Desempenho CENADEM - Centro Nacional de Desenvolvimento do Gerenciamento da Informao CMS Content Management System DER Diagrama Entidade Relacionamento DTD - Document Type Defintion ECM Enterprise Content Management GC - Gesto de Contedo HTML Hyper Text Markup Language KM - Knowledge Management PDF Portable Document Format RH - Recursos Humanos TI - Tecnologia da Informao UCSAL Universidade Catlica do Salvador URL - Uniform Resource Locator XML - Extensible Markup Language WWW- World Wide Web WFMC - Workflow Management Coalition

14

1. INTRODUO

Os princpios de gesto de conhecimento, que surgiram nos finais dos anos 90, serviram de estudo para Nonaka e Takeuchi (1997), identificar o surgimento de uma nova era da administrao dentro do sculo, que at ento Chiavenato (2001, p.35) havia dividido em trs eras sendo elas; Era Clssica (de 1900 a 1950), Era Neoclssica (de 1950 a 1990) e Era da Informao (de 1990 a 1998), a Era do conhecimento (de 1998 at os dias de hoje), surgiu admitindo o conhecimento como algo de extrema relevncia para a sobrevivncia das organizaes dentro do mercado altamente competitivo que se instalou com a globalizao. Como insumo principal para esta nova fase da administrao est o conhecimento. Este algo intangvel e abstrato (se avaliado de certo ponto de vista), pois pode ser transformado em algo concreto para as organizaes atravs dos vrios documentos, registros dos processos, reunies, correios eletrnicos e etc. Com a internet e os diversos meios de comunicao existentes atualmente, o acesso a uma infinidade de informaes acaba gerando um abastamento de contedo nas organizaes. Embora exista este abastamento, muitas vezes nenhum conhecimento extrado por falta de metodologias especificas para gerir os contedos. A gesto de conhecimento uma tcnica que busca transformar as informaes captadas em conhecimento, e para melhor entendimento deste tema interessante conhecer a definio de dado, informao e conhecimento e a diferena existente entre eles. A gesto de contedo comparada com a gesto de conhecimento algo muito mais simples e fcil de ser aplicada nas organizaes porque gerenciar contedo se resume em controlar o processo de criao, disponibilizao, manuteno, arquivamento ou eliminao de uma determinada informao. Atualmente na Universidade Catlica do Salvador (UCSAL) as produes cientficas so armazenadas na biblioteca. Para o aluno que deseja buscar alguma monografia em especifico, existem as seguintes alternativas: Acessar via web o SAGRES que o sistema de gerenciamento do acervo bibliogrfico da UCSAL. Este disponibiliza como mtodos de busca as opes de consultas por ttulo, autor ou o usurio pode fornecer no mximo uma

15

combinao de trs palavras-chaves. O retorno da busca o cdigo da produo e se possui algum exemplar disponvel na biblioteca. A outra alternativa o interessado ir a biblioteca e solicitar a lista de produes cientficas. Esta lista contm a relao de todas as produes referente a cada curso, sendo que cada um possui sua prpria lista. Esta alternativa utiliza como elemento de ordenao principal o cdigo da produo cientfica. Este cdigo colocado pela Universidade de acordo com seus mtodos particulares. Porm esta estruturao no fornece nenhum mtodo para pesquisa por contedo, alm de no agregar nenhuma informao relevante sobre o documento. Existe tambm nesta lista os ttulos das produes, outro campo que s relevante quando busca-se algo em especifico, no sendo interessante para as pessoas pesquisam por algum tema, pois o titulo no fornece informao detalhada sobre o assunto tratado pela produo. Alm das dificuldades apresentadas, um outro fator que complica o processo de extrao de conhecimento na UCSAL, que as produes cientficas so podem ser manipuladas dentro da Biblioteca. Atualmente existe um projeto de armazenamento digital das produes cientficas da UCSAL, feito pelo CEBACAD (Centro Baiano de Computao de Alto Desempenho), que o BAMON (Banco de Monografias), mas este at o ltimo acesso feito em 01.06.2008 tambm no possua um mecanismo de busca por contedo. O BAMON possui os seguintes filtros: tipo de produo, curso e elementos previamente cadastrados como orientador, data da apresentao e palavras-chaves. O retorno de uma pesquisa feita atravs deste projeto similar lista da biblioteca diferindo da mesma pelo fato desta vir em ordem alfabtica, no mais pelo cdigo da produo. Este projeto resolve o grande problema da restrio ao espao fsico da Universidade, mas no possibilita a pesquisa por contedo. Na tentativa de achar uma soluo para este problema e iniciar uma poltica de gesto de conhecimento dentro da Universidade Catlica, foi proposta uma soluo para gerncia das produes cientficas criadas nesta instituio. Foi desenvolvida uma ferramenta baseada nos princpios de gesto de conhecimento e gesto de contedo. Esta ferramenta contm trs funcionalidades: mapeamento de domnios de conhecimento, construdo atravs de taxonomias [sistema utilizado para classificar e

16

facilitar o acesso s informaes, pela estruturao de conceitos TERRA(2001)], publicao e recuperao de documentos

1.1. Metodologia

1 Etapa - Delimitao do tema

A idia inicial do projeto era prover uma ferramenta que gerenciasse as produes acadmicas e fornecesse um canal de comunicao entre os estudantes atravs de um portal de monografias/artigos e um frum. Consultando alguns professores do curso de informtica e apresentando a idia como projeto de concluso de curso, os mesmos sugeriram a delimitao do escopo do projeto apenas funcionalidade de gesto de produes cientficas. Foram temas propostos minerao de dados, mapas conceituais e gesto de conhecimento. Dentre os temas propostos o que melhor representou a proposta inicial na viso dos responsveis pelo projeto foi gesto de conhecimento. Pois este um tema atual, interessante e o que apresentou ser a melhor soluo para a problemtica levantada, porque dispe de mecanismos e metodologias para todas as etapas do ciclo de vida de um documento, criando uma cultura na instituio para que o conhecimento possa ser desenvolvido e se torne cada vez mais acessvel a todos.

2 Etapa Busca de ferramentas auxiliares do processo de gesto de conhecimento Com o tema definido e o escopo delimitado a primeira idia foi buscar uma

ferramenta de gesto de conhecimento que pudesse abstrair as funcionalidades de armazenamento dos arquivos e busca do contedo dos mesmos. Foi pensado criar uma aplicao de pesquisa visual que funcionasse como uma camada de software acima de um gerenciador de conhecimento ou o uso de um CMS (Content Management System sistema gerenciador de contedo). O uso de um gerenciador de conhecimento ou CMS iria diminuir o tempo de desenvolvimento, pois este j teria embarcado os

17

servios bsicos da aplicao, focando o esforo do desenvolvimento em criar uma maneira visual, rica e eficiente de recuperao de dados. Como a linguagem escolhida para desenvolver o projeto foi Java, inicialmente se buscou descobrir quais ferramentas eram desenvolvidas nesta linguagem, e baseados em uma lista disposta na Wikipdia (WIKIPEDIA - LISTA DE CMS, 2008), que enumera algumas das solues de CMS existentes, foram selecionados alguns nomes de ferramentas feitas em Java. As ferramentas que foram estudadas foram OpenCMS e Alfresco, por serem as mais referenciadas nas bibliografias do assunto, e so feitas nesta linguagem. Ambos possuem verses pagas e comunitrias. Uma comparao foi feita em um site (http://www.cmsmatrix.org)

especializado, que oferece uma lista de vrias ferramentas CMSs e suas principais caractersticas. Essa lista apontou o Alfresco como melhor opo, pois dispe de uma aplicao para gerenciamento de documentos em sua verso gratuita, j o OpenCMS no possui esta funcionalidade. Esta anlise foi feita em cima do quadro que ilustrado na figura 1.1, onde esto relacionadas todas as principais caractersticas das duas ferramentas.

Figura 1.1 Quadro comparativo entre Alfresco e OpenCMS Fonte: http://www.cmsmatrix.org/matrix/cms-matrix

18

Aps uma semana de pesquisa, foram encontrados dois mecanismos que possibilitariam a integrao da ferramenta proposta no projeto com o Alfresco, foram eles Webscripts e Webservices. Entretanto nenhuma das duas solues possua uma documentao clara o suficiente para o desenvolvimento desta integrao dentro do tempo disponvel para o prazo de entrega do projeto.

3 Etapa Definio, projeto e implementao da soluo.

Aps a idia do uso do Alfresco ter sido descartado para o projeto, passou-se a pensar na criao de um repositrio de documentos em uma base relacional, criando uma ferramenta que mapeasse domnios com o uso de taxonomias, permitindo assim um melhor estruturao para o repositrio das produes. O primeiro passo para criao desta ferramenta foi escolha do banco de dados e a definio do diagrama de entidade /relacionamento (DER). O banco de dados escolhidos foi o MySQL 5 por ser opensource e ser um banco robusto, que atenderia a necessidade da aplicao. O escopo da ferramenta foi definido em trs funcionalidades: definio de domnio de conhecimento, publicao de documento e recuperao de documento, as etapas de publicao e recuperao foram projetadas para serem realizadas atravs de navegao dentro de uma taxonomia que seria exibida no formato de uma rvore hiperblica. Na implementao do projeto as ferramentas escolhidas para o desenvolvimento so todas software livres e gratuitas. A soluo foi projetada sobreuma arquitetura de quatro camadas, sendo elas, visualizao, controle, servio e persistncia/acesso a dados. A plataforma de desenvolvimento escolhida para o projeto foi Java devido a familiaridade dos responsveis com a linguagem e por ser uma ferramenta que prov o suporte necessrio para implementar o projeto. O ambiente de desenvolvimento utilizado foi o Eclipse (http://www.eclipse.org).

Este trabalho est disposto da seguinte maneira: Um captulo de estudo terico, dividido em sesses, onde a primeira aborda a gesto de conhecimento e seus pilares, conhecimento, informao, dado e como esta a Era do Conhecimento est impactando as organizaes. A segunda fala de gesto de contedo, seus princpios e do uso de ferramentas

19

CMS gerenciadoras de contedo, bem como critrio para avaliao dessas solues fechadas. A sesso trs aborda o uso de taxonomias, e sua influncia na gesto de conhecimento. A quarta refere-se visualizao de dados e as vantagens de se ter uma boa tcnica de visualizao. E a quinta e ltima mostra os conceitos da tcnica de visualizao de dados por rvores hiperblicas e a descrio do componente treebolic. Um captulo com a apresentao da ferramenta, este composto por quatro sesses: uma apresentando a motivao do projeto, a segunda mostrando uma viso geral, a terceira sesso descreve as principais funcionalidades da ferramenta e a quarta e ultima trazendo as consideraes sobre a ferramenta criada. E por ultimo o capitulo com as concluses sobre o projeto.

20

2. FUNDAMENTAO TERICAEste captulo aborda o estudo terico para realizao deste trabalho. Ele est disposto da seguinte maneira: A primeira seo aborda gesto de conhecimento e seus conceitos complementares. Na segunda seo apresentado os conceitos de gesto de contedo. A terceira aborda o estudo referente taxonomias e por fim, a quarta seo aborda visualizao de dados, apresentando a fundamentao sobre rvores hiperblicas.

2.1. Gesto de Conhecimento

Surgida no final dos anos 90, a gesto de conhecimento ou KM - Knowledge Management tornou-se uma questo de estratgia empresarial, muito mais que de eficincia dos processos operacionais. De acordo com Sveiby(1998), em relao perspectiva da estratgia empresarial, a lgica entre competitividade e gesto de conhecimento tem sido objeto de ateno crescente, visto que o capital intelectual, o mais estrategicamente relevante para a empresa, deve ser cultivado no ambiente em que a empresa est inserida, transaciona e se desenvolve Segundo Barclay e Murray (1997), em um ambiente de alta competitividade e turbulncia l, no qual grande o ndice de mortalidade das organizaes, o conhecimento a nica fonte de vantagem competitiva sustentvel. Probst (2002, p.33), por sua vez entende que o ambiente do conhecimento em que as empresas devem operar atualmente estruturalmente mais complexo do que aquele que existia h vrios anos. A gesto de conhecimento uma rea de estudo que engloba diversas atividades, sendo necessrio um relacionamento de diversos conceitos para seu entendimento. Na figura 2.1 mostrado um mapa conceitual, so representaes grficas para organizao e representao de um conhecimento sobre um determinado domnio. NOVAK E CAAS (2008)], que relaciona as diversas reas da gesto de conhecimento e as atividades de uma organizao.

21

Figura 2.1. Mapa Conceiual sobre a Gesto de Conhecimento. Fonte: (GAVA; CURY; MENEZES, 2002)

Pode-se notar que a gesto deconhecimento abrange praticamente todas as atividades desenvolvidas em uma organizao, e est associada s atividades que vo do nvel operacional ao nvel estratgico. Partindo especificamente para os fins a que se prope este trabalho, e compreender o conceito de gesto de conhecimento, deve-se inicialmente caracterizar os componentes fundamentais do conhecimento e sua gesto.

2.1.1 O Conhecimento

O conhecimento no mais considerado apenas como um recurso a ser somado com os tradicionais fatores de produo dentro de uma organizao, mas sim o nico recurso significativo, pois para Nonaka e Takeuchi (1997, p.14) ele que torna singular a nova sociedade. Este conduz a novas formas de trabalho, o uso de novas tecnologias e a criao de novos vnculos com os diversos agentes com os quais a organizao interage. Ele permite s empresas se auto-conhecerem.

22

No se pode discorrer sobre gesto de conhecimento sem apresentar uma definio para conhecimento, este um conceito difcil de definir com preciso e simplicidade, mas a busca do melhor entendimento conceitual do mesmo traz consigo contribuies relevantes para a compreenso da amplitude do tema. Para conceituao de conhecimento de suma importncia entender os conceitos de dado e informao. Dados podem ser definidos como registro sobre fatos. So passveis de ordenao e anlise, mas no precisam necessariamente estar armazenados de forma ordenada ou estruturada (IME UNICAMP O QUE SO DADOS). A figura 2.2 mostra que atravs de constataes e medies do mundo real que surgem os dados.

Figura 2.2 Origem dos Dados Fonte: (IME UNICAMP)

Albrecht (1999) define que A informao tambm pode ser vista como a disposio de dados de modo que estes faam sentido, criando padres e ativando significados na mente das pessoas, ou seja, existem no nvel da percepo humana

O conhecimento obtido atravs de uma inferncia realizada em cima de dados e informaes dentro de um contexto determinado, ele representa o saber o que e o porque .

Todo conhecimento consiste em conceitos, definies, informaes sobre sua histria e relacionamentos entre esses conceitos e definies. A capacidade de identificar rapidamente relacionamentos existentes e de formar novos

23

relacionamentos que se mostram teis o que caracteriza uma pessoa com um bom conhecimento.

THOMAS KOULOPOLUS(1998)

Para facilitar o entendimento da relao entre os conceitos citados acima, dado um exemplo, ilustrado na figura 2.3.

Figura 2.3 - Exemplo do conceito de Dado, Informao, Conhecimento e Ao Fonte: figura adaptada da Wikipdia (http://pt.wikipedia.org/wiki/Gest%C3%A3o_do_conhecimento)

A tabela 2.1 apresenta uma sntese de como se caracteriza; dado, informao e conhecimento.

24

DADOS Simples observao sobre o estado do mundo Facilmente estruturado Facilmente inteligvel pelas mquinas Freqentemente quantificado Facilmente disseminado

INFORMAO Dados dotados de relevncia e propsito Requer anlise Exige consenso em relao ao significado Exige necessariamente a medio humana

CONHECIMENTO Informao valiosa da mente humana Inclui reflexo, sntese e contexto De difcil estruturao De difcil transferncia Frequentemente do tipo tcito

Tabela 2.1: Conceitos; Dado, Informao e Conhecimento. Fonte: SOUZA, GORDIANO (2005) apud VIEIRA (2005).

A busca de uma definio formal para conhecimento tem ocupado a mente dos filsofos ao longo do tempo sem que se tenha chegado a qualquer consenso, no havendo nenhuma definio da palavra aceita de modo geral. Para o Sveiby (1998), a palavra pode possuir vrios significados como informao, conscientizao, saber, cognio, sapincia, percepo, cincia, experincia, qualificao, discernimento, competncia, habilidade prtica, capacidade, aprendizado, sabedoria, certeza, capacidade de agir. Segundo Barclay e Murray (1997), o conhecimento tem um sentido duplo, estando associado a um corpo de informaes que se constitui de fatos, opinies, idias, teorias, princpios e modelos e, por outro lado, podendo tambm referir-se situao ou estado de uma pessoa em relao quele conjunto de informaes. Este estado pode ser de ignorncia, conscincia, familiaridade, entendimento ou habilidade. Para Pain (2000), o conhecimento pode ser visualizado como um conjunto do saber, que, num dado momento da histria de uma comunidade, suscetvel de ser transmitido. Portanto, o domnio do conhecimento compreende todo o saber codificado pela linguagem e pelos gestos, incluindo tanto a habilidade transmitida como o conhecimento cientfico. Ferreira (2004) define o conhecimento como Substantivo masculino. Ato ou efeito de conhecer, Informao, notcia, cincia, Prtica da vida; experincia, Discernimento, critrio, apreciao, Conscincia de si mesmo; acordo, Pessoa com quem travamos relaes.

O conhecimento pode ser classificado de acordo com sua disposio ao meio externo, ou seja, o conhecimento pode ser algo implcito em cada pessoa ou ser algo palpvel por meio do registro do mesmo, registro este feito em documentos, planilhas e etc.

25

2.1.2 Classificao do Conhecimento

De acordo com Terra (2001), o conhecimento pode ser dividido em tcito e explicito: Conhecimento Tcito Tcito vem do latim tacitus, que significa no expresso por palavras, conhecimento inerente ao processo de aprendizado que ocorreu ao longo da vida de um ser humano. Geralmente difcil de ser formalizado ou explicado a outra pessoa, pois subjetivo e no mensurvel prprio das habilidades adquiridas. Conhecimento Explcito Este o conhecimento formal, claro, de fcil compartilhamento permitindo assim a criao de um novo conhecimento. Normalmente formalizado em textos, figuras, diagramas e publicado nos diversos meios de comunicao. Para CRUZ (2002) os conhecimentos tcitos e explcitos so unidades estruturais bsicas que se complementam, e a interao entre eles a principal dinmica da criao do conhecimento na organizao que busca extrair o conhecimento tcito de seus recursos humanos e transform-lo em explcito para elevar o conhecimento organizacional

2.1.3 O Conhecimento Organizacional O conhecimento organizacional, segundo Nonaka e Takeuchi (1997), alimenta a inovao, e este transportado para dentro da organizao sob a forma de produtos, servios e sistemas. Nonaka e Takeuchi (1997) fazem uma analogia entre um iceberg e o conhecimento de uma organizao, como mostra a Figura 2.4. Para eles, o conhecimento explcito de uma organizao representa apenas 10% de todo conhecimento nela armazenado, os outros 90% fazem parte do conhecimento no formalizado ou no compartilhado de seus colaboradores.

26

Figura 2.4 - Diviso do Conhecimento dentro da organizao. Fonte: (ALAVI, 1999)

Um estudo feito por Cruz (2002), mostra que a maioria das organizaes no mantm uma poltica de gesto de conhecimento, deixando assim de extrair uma srie de solues e questionamentos dos seus colaboradores, impossibilitando desta forma o aumento da produtividade e a melhora da qualidade de seus produtos e/ou servios. Com base em Santos (2003), a gesto de conhecimento o processo sistemtico de identificao, criao, renovao e aplicao dos conhecimentos que so estratgicos na vida de uma organizao. um avano da gesto da informao, uma maneira de converter informao em conhecimento. Esta gesto busca tirar proveito das informaes para produzir conhecimento explcito para as organizaes.

2.1.4 A Gesto de Conhecimento nas Organizaes

Chiavenato (2001, p. 35), havia dividido a administrao em trs eras mostradas na tabela 2.2, mas os estudo das tcnicas de gesto de conhecimento levaram Nonaka e Takeuchi (1997) a identificar uma nova era intitulada como a Era do Conhecimento onde o controle, a facilidade de acesso e o gerenciamento sobre informaes passaram a ser diferenciais para alcanar a excelncia organizacional. Atualmente, existem diversos meios de comunicao, como internet, televiso, e-mail, rdio e etc., de onde se tem informaes a cada minuto, em uma velocidade elevada, e isto acarreta em um abastamento das mesmas surgindo a necessidade de uma gesto de

27

informao, para que se possa de alguma forma tirar proveito de seu contedo na gerao de conhecimento , tendo em vista a relevncia do mesmo para o sucesso das organizaes, e da sociedade como um todo. Para CRUZ, (2002, p.33) a gesto de conhecimento pode ser definida como um conjunto de metodologias e tecnologias que propiciam condies para identificar, capturar, recuperar e compartilhar o conhecimento existente sobre algum domnio, ou assuntos pertinentes ao desenvolvimento de qualquer organizao. Ou ainda de forma mais clara um processo corporativo, focado na estratgia empresarial, envolvendo a gesto de competncias, de capital intelectual, aprendizagem organizacional, inteligncia empresarial e educao corporativa.

- Incio da industrializao ERA CLSSICA (1990 1950) - Estabilidade - Pouca Mudana - Previsibilidade - Regularidade e Certeza - Desenvolvimento Industrial ERA NEOCLSSICA (1950 1990) - Aumento da mudana - Fim da Previsibilidade - Necessidade de Inovao

- Administrao Cientfica - Teoria Clssica - Relaes Humanas - Teoria da Burocracia

- Teoria Neoclssica - Teoria Industrialista - Teoria Comportamental - Teoria de Sistemas - Teoria da Contingncia

- Tecnologia da Informao(TI) ERA DA INFORMAO Aps 1990 - Globalizao - nfase nos Servios - Acelerao da mudana - Imprevisibilidade - Instabilidade e incerteza

-nfase na: * Produtividade * Qualidade * Competitividade * Cliente * Globalizao

Tabela 2.2 As trs eras da Administrao no sculo XX. Fonte: (ALVARENGA; RAMOS 2006)

Neste sentido Terra (2000, p.63) mostra que para as organizaes que adotam a gesto de conhecimento de uma forma estrutural, so necessrias mudanas nas principais polticas, processos, ferramentas gerenciais e tecnolgicas, com a inteno de uma melhor compreenso dos processos de gerao, identificao, validao, compartilhamento e uso dos

28

conhecimentos estratgicos. Trazendo melhorias de resultados para a corporao e tambm auxiliando o enriquecimento intelectual das pessoas que a compe De acordo com Silva(2004 apud QUIIN; ALII, 1997), o uso coordenado da gesto de conhecimento nas empresas cria um diferencial competitivo e sustentvel de difcil imitao, pois est enraizado nas pessoas que nela trabalham Patrimnio Intelectual, e no como nos recursos fsicos fceis de serem imitados.O sucesso das empresas japonesas deve-se, em grande parte, sua capacidade de criar o conhecimento organizacional, ou seja, capacidade da empresa de criar novo conhecimento, difundi-lo na organizao e incorpor-lo a seus produtos, servios e sistemas (NONAKA; TAKEUCHI, 1997).

Como suporte a gesto de conhecimento atualmente usada uma srie de metodologias e tcnicas para o gerenciamento de informaes e dados. O estudo destas tcnicas e metodologias abrange o tema de Gesto de Contedo (GC).

2.2 Gesto de Contedo - GC

No comeo do uso de computadores dentro das organizaes, Oliveira e Filho (2001) afirmam que estas no tinham necessidade de gerenciar o contedo produzido, pois o volume de informao era baixo. Hoje esta realidade mudou de maneira significativa. O volume de contedo produzido pelas empresas aumentou e est presentes em manuais, vdeos, websites, documentos em geral, intranet, etc., sendo necessrio organizar o acesso e registro a este tipo de informao. A gerncia de contedo um conjunto de processos e tecnologias que visa organizar, armazenar e tornar disponvel, ou seja, controlar o ciclo de vida de todo documento digital utilizado pela organizao. Para Oliveira e Filho (2001), gerenciar contedo e conhecimento reunir as informaes disponveis da organizao e disponibiliz-las para todos os que tem necessidade de acessar quela informao. Com alto o volume de informao produzido diariamente no mundo corporativo necessrio utilizar mecanismos que as organizem para que as mesmas no se percam dentro de uma gama de dados e at mesmo para que estejam sempre disponveis para as pessoas que necessitam delas.

29

Com a finalidade de disponibilizar sempre informaes atualizadas, as empresas utilizam ferramentas gerenciadoras de contedo, como os CMS Content Management System ferramentas que sero descritas na seo 2.2.2 deste captulo. Para CRUZ (2002), no futuro, estas ferramentas tero capacidade de aprender tambm e espera-se que at l j tenhamos aprendido como gerenciar conhecimento. A disciplina Gesto de Contedo evoluiu a partir de ferramentas criadas para facilitar o trabalho de editar e gerenciar as pginas de um site na internet. Com a exploso do uso comercial da web (entre 1994 e 1995) e o grande volume de informao disponibilizada por esse instrumento, segundo Neves (2003) tornou a tarefa de gerenciar os websites cada dia mais difcil. Ainda de seguindo Neves (2003), a interiorizao da web nas empresas, as intranets, forou ainda mais a evoluo e o amadurecimento da gesto de contedo. Esta saiu de da categoria de tecnologia emergente para verdadeiramente resolver problemas do mundo real. Nos ltimos dois anos a gesto de contedo despontou como a tecnologia que ser adotada, principalmente pelas grandes empresas, e a base para diversas outras iniciativas como, por exemplo, ensino distncia, comrcio eletrnico, gesto de conhecimento etc. Comparada com a gesto de conhecimento a gesto de contedo algo muito mais simples e fcil de ser aplicada na organizao porque gerenciar contedo se resume em controlar o processo de criao, disponibilizao, manuteno, arquivamento ou eliminao de uma determinada informao. Para Cruz (2002, p.57) contedo tudo que se pode gerenciar em termos de dados e informaes e no necessariamente conhecimento, mas pelas facilidades que a gesto de contedo traz nos quesitos de criao e manuteno de contedo, as bases de conhecimento podem ser usadas de qualquer lugar, a qualquer hora, em qualquer circunstncia..

30

Figura 2.5 Realidade operacional da gesto de contedo. Fonte: (Adaptao de Cruz, 2002)

Hoje, gesto de contedo no se limita apenas este escopo de gerenciamento de contedo web, servindo tambm para gerenciar documentos e dados de uma organizao. Segundo CRUZ (2002, p.59) gerenciar contedo comea a ganhar contornos de elemento imprescindvel e que, se usado corretamente, pode vir a revolucionar a forma como a cadeia composta pelo elo fornecedor-empresa-cliente se relaciona hoje. A figura 2.5 mostra a realidade operacional da gesto de contedo nas empresas, mostrando diversas fontes de contedo, que passa por um plano de gesto de contedo e que acessado pelos diversos usurios.

2.2.1 Principais benefcios da Gesto de Contedo

Para Parreiras e Bax (2003), a gesto de contedo visa dar respostas aos seguintes problemas: Gargalos diversos que estrangulam a produo de contedos; estes devem estar organizados e disponveis para as pessoas que precisam ter acesso a ele para dar seguimento no fluxo de trabalho da organizao. Pessoas no autorizadas no podem ter acesso a estes contedos a fim de evitar alteraes inadequadas e outros tipos de problema.

31

Falta de comprometimento ou implicao dos usurios, devido a dificuldades tcnicas de publicao e uso. Excluindo-se questes motivacionais que a gesto de contedo, embora no tenha respostas diretas, pode apoiar com instrumentos; Falta de organizao mais elaborada do contedo, que apresentem, por exemplo, os itens relevantes e suas relaes na forma de links; a gesto de contedo busca estruturar hierarquicamente o contedo para facilitar obteno do conhecimento. Riscos de erros diversos e informao de baixa qualidade; a gesto de contedo visa controlar alteraes seguindo um fluxo definido dentro de um workflow, que segundo Plesums (2002), um processo de gerenciar, coordenar e controlar um fluxo de trabalho. Interfaces rgidas misturadas ao contedo, no personalizveis ou no configurveis; O contedo deve ser manipulvel de forma intuitiva para tornar o processo de produo do mesmo mais eficiente. Existem atualmente solues prontas para gesto de contedo, que so as ferramentas de CMS que um acrnimo de Content Management System.

2.2.2 Ferramentas CMS/ECM (Content Management System/Enterprise Content Management)

CMS/ECM pode ser definido como:Ferramentas para gerenciamento de informaes focado na captura, ajuste e distribuio de contedos permitindo gerenciamento dos mesmos e que possibilitam o compartilhamento de informaes que possam garantir a eficincia e eficcia dos processos de negcio de uma empresa por meio da transformao do conhecimento individual em conhecimento coletivo. (Maurcio Antonio Ferreira Diretor Tcnico do CENADEM apud CRUZ, 2002, p.65)

O contedo gerido pelo CMS pode incluir arquivos, imagens, meios de comunicao social, udio, e contedo da web. Cruz (2002), mostra que as ferramentas de CMS podem apoiar as seguintes caractersticas:

32

Identificao de todos os usurios e suas funes dentro do gerenciamento do contedo. Isso ajuda a definir o acesso de usurio ao contedo criando uma poltica de acesso para manipulao do contedo. Na capacidade de atribuir funes e responsabilidades a diferentes categorias ou tipos de contedos. Esta caracterstica til no sentido de classificar o contedo, criando uma estrutura hierrquica tornando esse contedo melhor distribudo dentro da organizao. Definio de um workflow, tarefas para criao colaborativa que muitas vezes esto associadas a mensagens a eventos de gestores de contedo, para que sejam alertados caso existam mudanas no contedo (por exemplo; em um jornal uma notcia s publicada depois da validao do editor chefe). Esta caracterstica referente capacidade que a ferramenta deve ter de controlar o acesso a manipulao do contedo para evitar problemas como alteraes indevidas, excluses acidentais, etc. A capacidade para monitorar e gerenciar mltiplas verses de uma nica instncia de contedos. A ferramenta deve ser capaz de controlar alteraes concorrentes sem sobrescrever ou invalidar o contedo j existente. Separao da camada de contedo semntico do seu layout (por exemplo, o CMS automaticamente define a cor, fontes, ou nfase do texto). Existem vrios tipos de ferramentas CMS com diversas possibilidades de uso, tamanhos e preos, a necessidade real da organizao que ditar a escolha correta da ferramenta. Existem dois tipos de CMS que so definidos quanto ao seu uso, sendo eles: Ferramentas Generalistas So as ferramentas que servem para trabalhar com o contedo em todo seu ciclo de vida. Outra caracterstica desse tipo de ferramenta a presena dos seguintes mdulos: Gerenciador de contedo, de portal, de relacionamento, de documentos, de mdias, de captura de documentos; gerao e distribuio de relatrios e de workflow. Ferramentas Especialistas So ferramentas que se dedicam a tipos determinados de conhecimento e contedo, como por exemplo, contedo multimdia.

33

2.2.2.1 Parmetros para anlise de um software CMS

Uma ferramenta de gesto de contedo pode ser uma forte aliada a qualquer empresa, mas por ser uma soluo dispendiosa, a compra desta soluo pode ser muito cara e demorada e para isto deve ser avaliada de acordo com uma srie de variveis,que servem como parmetro para a avaliao funcional de um CMS segundo as necessidades especficas de uma empresa. Em seu livro Terra (2001, p.80), aborda uma srie de perguntas que norteiam empresas a avaliarem as possveis ferramentas a serem usadas em um projeto de gesto de contedo de acordo com os quesitos de flexibilidade, escalabilidade, preo, rapidez na implementao, utilizao via web, facilidades para o uso multiusurio, fontes e destinos do contedo, suporte workflow, banco de dados suportados, requisitos tcnicos, facilidade para criao e manuteno de contedo . Ser abordado de forma mais precisa algum desses requisitos, baseado em (CRUZ, 2002, p.73): Flexibilidade necessrio saber se as ferramentas analisadas so flexveis ao ponto que permite a criao, coleta, organizao e atualizao dos contedos , sendo que estas tarefas devem ser realizadas de forma clara e simples, para que estas atividades no levem muito tempo a serem executadas. Escalabilidade As ferramentas devem permitir em suas solues a possibilidade de crescimento da rea de uso da ferramenta dentro da empresa sem maiores dificuldades, por exemplo, uma empresa usa gesto de contedo no seu RH (Recursos Humanos), mas aps um perodo experimental quer expandir essa tcnica para toda a empresa, sendo necessrio saber se a soluo comprada suportar. Utilizao via web Duas questes podem ser avaliadas nesta varivel, a primeira que com o software baseado em um ambiente web, no ser necessria a preocupao com instalao e manuteno de clientes em cada uma das mquinas usadas para acessar contedo, e a segunda de qualquer lugar este contedo poder ser acessado. Fontes e destino do contedo Neste quesito avalia-se a capacidade da ferramenta de integrar fontes de dados e mapear destinos para este contedo provendo uma estrutura flexvel e clara das bases de contedo das empresas

34

Suporte Workflow - Analisa a capacidade da ferramenta em controlar o processo de criao e validao de contedo dentro da empresa em numa forma natural ao seu fluxo no automatizado.

2.3 Taxonomia

Para organizao dos contedos de uma organizao importante a construo de uma estrutura que represente uma estrutura hierrquica de todos os conceitos relacionados com as atividades da organizao. Esta forma de estruturao conhecida como taxonomia. De acordo com Jabala (2005), podem-se destacar benefcios de uma taxonomia bem organizada: A empresa e seus diversos funcionrios falando a mesma lngua, isto , utilizando os mesmos nomes para falar das mesmas coisas; Economia no tempo de classificao das informaes, tanto em formato papel como eletrnico; Rapidez na hora da localizao seja por navegao ou busca; A empresa pode se estruturar para organizar seu futuro arquivo histrico e saber mais facilmente o que de fato precisa ficar no arquivo morto. Apesar de ainda existirem muitas restries computacionais na aplicao de taxonomias em sistemas de informao, de acordo com Campos e Gomes (2007), o seu uso permite que se estabeleam padres de alto nvel para a ordenao e classificao da informao, alm de contribuir para que as organizaes possam reconhecer e relacionar atividades que agregam valor, diminuindo esforos na produo e utilizao do conhecimento. O papel da taxonomia, neste sentido, possibilita tambm que os usurios possam interagir com estruturas de conceitos. Em resumo, a organizao das informaes atravs de taxonomia permite alocar, recuperar e comunicar informaes dentro de um sistema de maneira lgica atravs de navegao dentro da estrutura Embora recentemente esteja ganhando muito espao no mundo dos negcios, o estudo referente a taxonomias no novo. Ele esteve sempre presente na biblioteconomia e no

35

universo cientfico. Entre exemplos clssicos existe a Classificao Geral dos Seres Vivos, de Linn e a nomenclatura da Qumica, de Lavoisier e Berthod. Para Terra(2001), taxonomia um sistema usado para classificar e facilitar o acesso s informaes atravs de uma estrutura de conceito definido, e tem como objetivo agilizar a comunicao entre especialistas de um determinado domnio, propor formas de controle da diversidade de significao e oferecer um mapa de rea que servir como guia em processos de conhecimento. No mbito corporativo taxonomia poderia ser definida como a organizao peculiar de um conjunto de informao para um propsito particular. A organizao em taxonomia depende de tcnicas responsveis por nomear repositrios, classificar e organizar informaes relevantes, cujo esforo se torna ineficaz e intil se houver falta de empatia por parte de quem as constri para com aqueles que as utilizaro. Podemos inferir com Figueiredo (2006) que este processo deve identificar e definir conceitos slidos e universais de fcil entendimento para todas as pessoas envolvidas no uso da taxonomia. O uso de taxonomia tem se tornado ainda mais importante na Era do Conhecimento, na medida em que o volume e o acesso s informaes esto crescendo a nveis exponenciais e cada vez mais a necessidade de categorizao dos conceitos ganha importncia. Na figura 2.6 pode se observar uma taxonomia para classificao de animais, temos um conceito central Animais do qual parte uma srie de conceitos usados para definio e mapeamento desse domnio.

Figura 2.6 - Exemplo de Taxonomia que mapeia animais. Fonte: (TERRA FORUM, ANO, 24.04.08)

36

O estudo de taxonomias se preocupa com a escolha das diversas palavras que representam o domnio, estas devem ter significado singular e valor semntico forte, evitando que nodos diferentes abordem a mesma rea de conhecimento, passando o foco principal no s para o fato de organizar e classificar o domnio, mas ressalvando a importncia da recuperao das informaes. Para Freitas e Wagner (2001) a definio de uma taxonomia resultado de um processo de representao e classificao do conhecimento de um domnio, e representa o estado e viso do conhecimento de seus elaboradores. No existe um critrio de avaliao para definir se determinada taxonomia est certa ou errada, certamente duas pessoas podero desenvolver diferentes taxonomias para abordar um determinado assunto, mas obrigatoriamente ambas devem criar caminhos mltiplos para se encontrar uma mesma informao. Segundo Campos e Gomes (2007), para elaborar uma taxonomia so necessrias quatro etapas: 1. Captura do conhecimento Consiste em levantar junto aos especialistas da

rea de um domnio especfico, documentos existentes nas organizaes ou na academia que se deseja trabalhar, e mais outros instrumentos de formas que estes ajudem na classificao do conhecimento abordado; 2. Anlise dos documentos/informaes Define onde est cada documento/

informao dentro do seu nvel hierrquico correto; 3. Elaborao da estrutura classificatria Est relacionada estrutura

hierrquica fsica que representa a taxonomia; 4. Validao Se apia como base para a certificao da proposta classificatria,

visando atender as necessidades da comunidade para quem se destina. Atendendo as demandas de gesto de conhecimento, o uso da taxonomia para

Figueiredo (2006) interessante ao tratamento do conhecimento explcito produzido. A estrutura resultante visualmente simples de usar, navegar e facilita a correlao entre as informaes, encorajando a explorao e ajudando os usurios a visualizar as informaes que eles no sabiam que existiam.

37

2.3.1 Taxonomia e Metadados

Jabala e Michele(2004) conceituam metadados como sendo, dados descritivos que trazem consigo informao a respeito sobre outros dados. Dentro do estudo de taxonomia eles so responsveis por fornecer um contexto informacional necessrio para correlacionar estruturas hierrquicas facilitando assim a localizao dos documentos pelos mecanismos de busca independentemente de alguma informao prvia da localizao fsica. Eles tambm so usados para criar agrupamento lgico de arquivos separados fisicamente em taxonomias distintas. Para preparar este tipo de informao (metadados) necessrio um processo de cooperao entre os criadores e gestores de contedo onde os mesmos precisam atualizar e criar rtulos que so considerados como marcaes de informao sobre outro contedo (para facilitar este processo, novas ferramentas so criadas com o objetivo de minimizar a maioria das entradas manuais atravs da gerao automtica de informaes para ndices como autor, data de criao, etc., ferramentas estas que possuem a finalidade de extrair metadados do contedo). Para Alexaki(2001) o ideal que a insero dos metadados acontea de forma paralela seno seqencial a criao do contedo. Isso tem ocorrido cada vez mais atravs da combinao de processos automticos (tipicamente autor, nome, data, etc.) e manuais (palavras-chave, categorias, etc.). Os metadados mais importantes, no entanto, so aqueles usualmente fornecidos pelos prprios autores e incluem informaes detalhadas dos documentos com exemplo; resumo, contexto na criao, objetivo, outros autores que tenham contribudo. Em um ambiente no qual exista uma taxonomia definida e compartilhada, os metadados so armazenados de forma organizada e padronizada, e o trabalho tanto de quem publica informao, como de quem a pesquisa otimizada . Em geral, so os novatos e os agentes externos (clientes, parceiros, etc.) que necessitam de ajuda para compreender como um determinado campo do conhecimento organizado e se relaciona com outros campos do conhecimento. Os metadados podem fornecer informaes que auxiliem essas pessoas a se localizarem de uma maneira mais natural a taxonomia e acesso ao contedo armazenado na mesma.

38

2.4. Visualizao de Dados

O mundo externo tem bastante influncia no raciocnio e na imaginao do ser humano, e necessrio o entrosamento neste quesito para se entender melhor o que h por trs da visualizao da informao. fcil para um humano fazer de cabea uma simples conta de multiplicar, mas se ao invs disso fosse pedido de cabea a resoluo de uma equao do terceiro grau, sua dificuldade aumentaria significativamente, isso ocorre porque o crebro do ser humano tem dificuldade de memorizar os resultados parciais at o momento de serem de fato usados. Porm se fosse permitido o uso de lpis e papel com certeza ficaria mais fcil a resoluo da equao. Desta forma, a manipulao com o mundo externo e interaes fsicas amplificam o desempenho do crebro humano. Assim de acordo com Fayad(2002),o mesmo acontece com a visualizao de dados. Neste caso usa-se a capacidade do crebro de processar informaes visuais para auxili-lo na extrao de conhecimento a partir de volumes de dados abstratos. Segundo Freitas (1995),visualizao pode ser entendida como um processo de mapeamento dos dados para uma forma visual, so representaes grficas que correspondem s figuras ou imagens empregadas para representar o conjunto (ou subconjunto) de dados sob anlise.

2.4.1. Transformao de Dados em Formas visuais

Branco (2003) mostra que desde os primrdios da humanidade com os homens das cavernas - as representaes grficas so utilizadas como um importante instrumento de comunicao. Estas representaes so geralmente utilizadas para representar ou apresentar uma idia que j existe, ou melhor, representar dados do mundo real.

39

Figura 2.7 - Transformao de dados para uma forma visual. Fonte: CARAPI, JORDAN (2007) apud CARD; MACKINNLAY; SHNEIDERMAN, (1999)

A visualizao de dados um processo de mapeamento de dados para uma forma visual, tornando-os mais atraentes e compreensveis para quem l. A figura 2.7 exibe graficamente este mapeamento permitindo simplificar a discusso sobre sistemas de visualizao. De acordo figura 2.7, as setas que partem da esquerda para direita representam as etapas de transformao de dados brutos e cenas visuais para interpretao humana. E as setas que partem da direita para esquerda representam ajustes destas transformaes pelo ser humano. As transformaes de dados mapeiam os dados brutos em um formato adequado e particular s ferramentas que sero usadas para construir estruturas visuais, resultando em dados tabulados.

2.4.2. Atributos Visuais

Para mostrar uma informao necessrio ter a preocupao de como esta ser exibida, por exemplo, como as pessoas podem rapidamente localizar pontos em um mapa, estes tem que estar representados de forma diferente. As imagens da figura 2.8 mostram algumas formas de representar uma informao, possibilitando que elas se destaquem entre as outras presentes..

40

Figura 2.8 Atributos Visuais. Fonte: (MENDONA, 2001)

Existem alm de grficos tradicionalmente utilizados para apresentao de dados, os de pontos, linhas, barras, tortas e histogramas de freqncia, que permitem observar relaes entre atributos, uma srie de representaes grficas mais ou menos complexas empregadas para codificar atravs de elementos visuais (cores ou smbolos geomtricos) tanto valores como relacionamentos entre entidades ou elementos de dados, assim exemplificado na tabela 2.3.

Tabela 2.3: Classes de representaes visuais. Fonte: CARAPI, Jordan (2007)

Diversas linguagens, tcnicas e ferramentas tm sido propostas para a organizao do conhecimento e sua visualizao.

41

2.5. rvores Hiperblicas

rvores hiperblicas em sua concepo possibilitam a organizao do contedo de forma visual, permitindo alm de tudo uma maior interao e percepo do usurio sobre o contedo disponibilizado, evitando uma perda de tempo enorme na busca de informaes. Como mostra Freitas (2001), comparando este mtodo aos convencionais, via browser, palavras-chave, ou uma estrutura de diretrios, pode-se concluir o quo vantajosa esta tcnica de visualizao. Nota-se que no uso de browsers a navegao se da pgina por pgina, sendo despendido muito tempo e pacincia. No caso dos mecanismos tradicionais necessria ao usurio uma estratgia de busca eficiente para a descoberta do conhecimento. De acordo com um estudo feito pela E-BIZ Solues (2006), comparando-se rvore hiperblica com uma rvore de duas dimenses (ex: Microsoft Windows Explorer), em janelas de 600 x 600 pixels, a arvore hiperblica capaz de exibir dez vezes mais pontos de informaes do que a rvore em 2d. Sua navegao mais rpida, assim como o elemento procurado achado em menos tempo. E tambm de acordo com um estudo realizado pelo Xeros Palo Alto Research Center citado pelo Inxigth Software Incorporatade (2004), a tcnica rvore hiperblica para navegao e visualizao de colees de informao hierrquica muito grande mostrou ser 62% (sessenta e dois por cento) mais eficiente do que os mtodos convencionais.Arvore hiperblica uma rede de ns que contm informaes e se desdobram em suas componentes hierarquicamente dependentes, representadas por seus ns filhos, aliada a mecanismo simples de navegao pela indicao de um n de interesse, que exibido no centro, cujo contexto mantido pela exibio do restante da estrutura da taxonomia que contm todos os ns do modelo a ser mapeado. A abordagem do plano hiperblico pode manipular uma estrutura em rvore usando o conceito de foco e contexto. (ALENCAR; PIEROZI, 2002)

A idia apresentar toda a informao (ou a maior quantidade possvel) enquanto o usurio processa algum subconjunto desta informao. O foco do contexto alterado por meio de uma translao na estrutura do plano hiperblico. O usurio pode clicar em qualquer ponto visvel para traz-lo ao foco e a partir da navegar pela estrutura segundo sua

42

necessidade, esse recurso permite grande flexibilidade e agilidade na busca por contedo ou mesmo documento. A figura 2.9 mostra um exemplo de rvore hiperblica, com um n central e seus ns filhos.

Figura 2.9 - rvore Hiperblica Fonte: (TELECETRO, 24.05.08)

A figura 2.10 mostra a mesma rvore da figura 2.9 com a mudana do foco para o tema financiamento.

Figura 2.10 - Representao de uma rvore hiperblica com mudana de foco Fonte: (TELECENTRO, 24.05.08)

43

2.5.1 TreebolicO Treebolic um componente feito em Java que renderiza uma rvore hiperblica a partir de um arquivo XML - EXtensible Markup Language especfico. Esse componente disponibiliza os dados de maneira hierrquica seguindo uma ordem de disposies do n dessa rvore criando um mecanismo de navegao dinmico e visualmente rico. Este um projeto opensource e suas fontes, bem como seu cdigo executvel encontram-se disponveis em http://treebolic.sourceforge.net/en/home.htm. Segundo o site do projeto (referenciado acima), essa API composta de trs mdulos que so estes: Treebolic: O componente em si que gera a rvore. Um arquivo jar (arquivo executvel da linguagem Java) que contm a applet que renderiza o componente. Applets so softwares que so executados no contexto de outro programa, em Java os applets so programas feitos na linguagem que podem ser includos em pginas HTML - HyperText Markup Language (Sun). Treebolic Generator: Este mdulo inclui uma aplicao que permite que o a descrio XML para gerar o componente seja criado. Essa aplicao visual, a medida que a pessoa vai customizando a rvore a ferramenta gera um XML equivalente para aquela visualizao criada. Treebolic Browser: Uma aplicao que hospeda um treebolic engine e que pode ser acessado por vrios provedores de dados. Como se fosse um repositrio que interpreta os dados e renderiza uma rvore equivalente. A figura 2.11 mostra a renderizao de uma rvore pela Treebolic:

44

Figura 2.11 - Exemplo da rvore gerada pela treebolic. Fonte: (Arquivos de exemplos do projeto treebolic)

O arquivo XML que esse componente interpreta estruturado da seguinte maneira: Treebolic: Elemento responsvel por configurar a treebolic, neste ira conter a definio ser a treebolic a ser renderizada possuir atributos como barra de ferramentas, barra de status, menu, e outros. Suportado sob este elemento so os atributos tree e tools Tree: Elemento responsvel por definir o layout da rvore como cor de fundo, tipo de expanso, tipo e tamanho da fonte dos ns. Este elemento suporta img, nodes e edges como seus filhos. Img: Elemento responsvel por atribuir uma imagem a um n ou a rvore Nodes: Elemento que representa a disposio de todos os ns e configuraes de layout referentes aos mesmos. Esse atributo composto de um conjunto de nodes. Node: Elemento que configura cada n da rvore individualmente. Suporta label e content e outros elementos node. Com isso consegue-se mapear a hierarquia dos ns. Label: Contm o label referente a um determinado n. Content: Contedo visualizado na barra de status quando o mouse posicionado sobre este. Edges: Este elemento configura o comportamento das linhas de ligaes entre os ns de uma maneira geral. Edge: Define parmetros de cada ligao individualmente, suporta label e content como parmetros.

45

Tools: Permite a criao de menus Menu: Permite a criao de itens de menu MenuItem: Define as aes que podem ser executadas durante a exibio da rvore. A listagem 2.12 exibe um arquivo XML usado pelo treebolic para renderizar uma rvore exibida logo em seguida.

Listagem 2.1 - Arquivo XML que gera uma rvore na treebolic Fonte: (Arquivos de exemplos do projeto treebolic)

46

3. A FERRAMENTANeste captulo apresentado tudo referente a ferramenta criada como proposta para soluo da problemtica levantada. Ele captulo composto por quatro sees. A primeira seo contm a motivao para o desenvolvimento do projeto. A segunda seo fornece uma viso geral da ferramenta, o DER (Diagrama de Entidade/Relacionamento), arquitetura e a descrio de cada camada desta arquitetura. A terceira seo apresenta a descrio de cada funcionalidade da ferramenta com detalhes da construo de cada uma. E a quarta seo uma avaliao sobre a ferramenta construda.

3.1 MotivaoAs motivaes para construo desta ferramenta foram dificuldade de extrao de conhecimento do acervo da Universidade Catlica, utilizando os mtodos fornecidos por ela, mtodos estes que foram apresentados no capitulo de introduo e o fato do BAMON no possuir filtros de busca que possibilite a pesquisa por contedo. Devido a estas dificuldades pensou-se em uma ferramenta que possibilitasse uma busca feita por elementos referentes ao contedo do texto. A possibilidade de extenso do BAMON foi descartada porque seria necessria uma reestruturao completa da arquitetura do projeto, o que tornou invivel a complementao do mesmo.

3.2 Viso geral da ferramenta

Diante da problemtica apresentada na motivao, o uso da gesto de conhecimento uma soluo interessante para resoluo da mesma, pois esta tem como objetivo mapear conhecimento para produzir novos ou melhorar conceitos j existentes e isto um dos objetivos de uma instituio de ensino. A gesto de conhecimento pode utilizar como alicerce para estruturar sua base de conhecimento, a gesto de contedo, porque uma das funes desta gerenciar o ciclo de vida dos documentos. Este ciclo foi apresentado na seo 2.2, e as etapas implementadas pela ferramenta so publicao e recuperao de documentos.

47

Alm destas etapas da gesto de contedo, o projeto tambm prov o uso de uma estrutura hierrquica para mapeamento de domnios de conhecimento, utilizando taxonomias. Estas estruturas servem para criar uma separao lgica dos documentos por conceitos dentro de um determinado domnio. Para melhor a navegao nesta estrutura o projeto permite a visualizao destes domnios atravs de rvores hiperblicas. A ferramenta no abrange toda gesto de conhecimento, ela prov as etapas de mapeamento do conhecimento (definio de um domnio que represente este conhecimento, que consiste na construo de uma taxonomia), publicao de contedo e recuperao de documentos. Para realizaes de testes foram utilizados alguns arquivos obtidos da base de documentos da rea de informtica do BAMON e o domnio de conhecimento representado foi computao. A taxonomia que representa o domnio foi definida pelos estudantes envolvidos no projeto. A figura 3.1 sintetiza como a arquitetura desta ferramenta est montada e as interaes entre as camadas da mesma. Existem quatro camadas na arquitetura da ferramenta que so apresentao, controle, servio e persistncia.

48

Usurios

Controle (Struts 2)

Apresentao (HTML, JavaScript, Applet, Tags, Struts 2.0,Treebolic)

Servios (Spring 2.5)

Persistncia (Hibernate 3.2, Hibernate Search 3.0)

MySql 5.0Figura 3.1- Descrio da arquitetura utilizada no desenvolvimento do projeto

Para camada de apresentao foram usados recursos de HTML, Java Script, o Treebolic para gerao da rvore hiperblica e tags do Struts 2. A camada de controle utiliza o framework Struts 2. Esta camada responsvel por definir o fluxo de navegao da aplicao, bem como definir o processo de comunicao entre a camada de visualizao e a base de dados, tornando-se o link do usurio da aplicao com o banco de dados. Framework, segundo JAQUES (2005), um software que serve como pilar para o desenvolvimento de outros softwares, criando abstraes de funcionalidade para auxiliar no processo de produo de software. Na camada de servio foram utilizados recursos do framework Spring 2.5. O papel deste no projeto gerenciar as transaes com o banco de dados e criar uma camada de abstrao para o acesso a dados pela camada de controle atravs de templates. Foram utilizados os templates que o Spring fornece para o Hibernate. Templates, no caso do Spring Framework, segundo Spring (2008), so abstraes de funcionalidades para recursos de um determinado framework, neste caso o Hibernate.

49

Para camada de persistncia foi utilizado o Hibernate 3.2 (http://www.hibernate.org/). O Hibernate um framework de acesso a dados que faz o mapeamento objeto/relacional e abstrai operaes de persistncia e recuperao de dados. Para indexar o contedo dos documentos e realizar a busca pelo contedo do texto da produo foi utilizada uma extenso do Hibernate, o Hibernate Search. A figura 3.2 ilustra o diagrama de entidades/relacionamento da aplicao.

Figura 3.2 DER da ferramenta.

A tabela documento a mais relevante da ferramenta. Nesta tabela ser armazenado o contedo texto do documento, o mesmo fisicamente e as informaes sobre ele, como autor, instituio, domnio ao qual pertence, data de produo, etc. Para a publicao/recuperao do documento ainda so relevantes as tabelas conceito_documento, que mapeia os conceitos que o documento tem associados, e autor_documento, que mapeia quem so os autores do mesmo.

3.3 Descrio de Funcionalidades 3.3.1 Mapeamento de DomniosEsta funcionalidade serve para criao de uma estrutura hierrquica que representa um domnio de conhecimento e os conceitos existentes dentro deste domnio. A construo da taxonomia feita utilizando o componente TreeView da API YUI (Yahoo! User Interface).

50

Este componente oferece a possibilidade de criao de rvores dispostas de forma hierrquica onde um n s possui um nico pai e cada pai pode ter n filhos. Para a realidade do projeto o n raiz da rvore equivalente ao domnio que aquela taxonomia representa e os ns filhos da raiz so os conceitos que forma aquele domnio. A figura 3.3 mostra um exemplo de uma taxonomia utilizando o componente Treeview.

Figura 3.3 exemplo de uma taxonomia utilizando o componente treeview. Fonte:http://developer.yahoo.com/yui/examples/treeview/default_tree_clean.html

Este componente foi customizado utilizando Java Script e a prpria API da TreeView a fim de atender a necessidade do projeto de construo dinmica de taxonomias. Adicionouse a este componente as funcionalidades de inserir, editar e excluir ns, com isso o usurio pode definir um domnio e criar os conceitos pertencentes a este atravs da construo de uma taxonomia. Um ContextMenu um objeto fornecido pela API YUI que serve para criao de menu. Este composto por objetos ItemData que representam os itens de um menu. Foram criados trs itens para o menu da TreeView customizada que contm as funcionalidades de inserir, editar e excluir um n. Associadas a cada item do menu est uma funo Java Script que opera sobre a rvore que est sendo definida no momento do cadastro. Ao item adicionar est associada a funo addNode que adiciona um novo n a arvore. Para criar um novo n deve-se clicar com o boto direito do mouse sobre o n que ser pai deste. O item editar tem a funo editNodeLabel associada a ele e edita o label de um determinado n. A funo deleteNode est associada ao item apagar e ela serve para remover um determinado n da rvore. Se esse n contm filhos, todos os filhos deste n sero removidos.

51

Ao entrar na tela, o usurio deve renomear o n raiz da rvore com o nome do domnio que aquela taxonomia representa. Sob o n raiz ficaro todos os conceitos que pertencem aquele domnio proposto. Para criar, editar ou apagar um n o usurio deve clicar com o boto direito em cima do mesmo. Aps definir a taxonomia, o usurio deve clicar no boto enviar para persistir a mesma. Na ao de cadastro de taxonomia a Treeview convertida uma string que possui o seguinte formato: pai#pai@filho$pai@filho2@filho@filho3 O n que aparece antes do smbolo # o raiz, todos os outros que aparecem aps # so identificados como ns que representam os conceitos do domnio e eles so separados pelo smbolo @, que indica que a string que aparece anteriormente ao smbolo o n pai daquele n. Os ns so separados entre si pelo smbolo $. Existe uma classe utilitria TreeUtil que tem a responsabilidade de converter a string com o contedo da arvore em uma coleo de objetos ConceitoModel, que representam os conceitos que foram definidos na rvore. Essa classe gera uma coleo de conceitos a partir de expresses regulares que separam os conceitos um do outro e separa um conceito de seu conceito pai. Expresses regulares, segundo Jargas (2006) consistem em mtodos formais de se especificar um padro de texto. A listagem 3.1 ilustra o processo de definio de domnio por completo

52

Listagem 3.1 Processo de criao de um domnio: converso da rvore em objetos ConceitoModel

O processo de persistncia da taxonomia inicia com a coleo de conceitos gerados a partir da string da Treeview na classe de servio de Taxonomia (TaxonomiaServiceImpl). A classe utilitria ConceitosUtil define a partir desta coleo qual o n raiz e com isso a taxonomia pode ser persistida pois o conceito raiz que representa o domnio. Aps persistir a taxonomia cada conceito ser armazenado individualmente no banco de dados. Somente aps esta etapa ser registrado atravs de uma operao de atualizao o pai de cada n. Este processo necessrio pelo fato de que quando os conceitos so construdos, eles ainda no possuem uma chave primria, ento necessrio inserir todos gerando a chave primria de todos os conceitos, para atravs do mtodo getIdConceitoPai da classe ConceitosUtil descobrir qual a chave do conceito pai de um determinado conceito. A operao de cadastro de taxonomia e cadastro de conceitos est dentro da mesma transao com o banco de dados e esta gerenciada pelo Spring Framework, com isso qualquer tipo de erro na operao de persistncia faz com que os conceitos no sejam armazenados sem uma taxonomia definida, e no ser definida taxonomia sem conceitos. Aps este processo de cadastro, criada uma lista de conceitos que possui id e descrio e indicao de cada conceito e o conceito pai deste dentro da hierarquia definida. Aps esta

53

etapa iniciada a fase mais importante dessa funcionalidade que a gerao do contedo do arquivo XML que ir servir para renderizar a rvore hiperblica daquela taxonomia. A classe GenerateTreeXML faz o papel de parse,ou seja ele pega uma lista de conceitos gerados como entrada e converte em uma estrutura gramatical que ser armazenada de acordo com o DTD- Document Type Definition, do arquivo XML da treebolic. Um DTD segundo Macorrati (2007) um conjunto de regras que definem a estrutura do documento indicando os elementos que podem ser usados e onde podem ser aplicados. Para realizar essa converso foi utilizado uma API - Application Programming Interface Java, chamada JDOM que segundo o site do projeto uma API que serve para converter objetos Java em arquivos XML e tambm para manipular e tratar arquivos XML atravs desta linguagem. As listagens 3.2 e 3.3 mostram os mtodos responsveis por este processo de converso de objetos Conceito em um arquivo XML.

Listagem 3.2 Mtodo que converte a lista de conceitos em um objeto Element que representa o arquivo XML da arvore.

Na listagem 3.2 o mtodo apresentado recebe a lista de conceitos gerada e converte em um objeto Element da API JDOM que nada mais que um objeto que equivale a um tag de um arquivo XML. Uma tag uma marcao de um arquivo XML.

54

Listagem 3.3

- Mtodo recursivo que gera o Element e insere todos os filhos de um Element.

Na listagem 3.3 o mtodo recursivo buildChildrenNodes converte uma lista de conceitos em objetos Element, ele pega cria um objeto Element e associa como filho todos objetos filhos daquele conceito. A listagem 3.4 mostra o XML que ser convertido na string para o armazenamento no banco.

Listagem 3.4 Mtodo que converte o XML para string.

Para customizar a rvore a fim de atender a necessidade do projeto foi necessrio alterar o cdigo-fonte da mesma, pois ela somente aceitava um arquivo XML que estivesse localizada no mesmo local fsico. O ambiente onde o projeto foi construdo no permitiria isso porque o arquivo onde a aplicao reside um arquivo war, que uma forma da plataforma Java de empacotar uma aplicao web e colocar todos arquivos necessrios para

55

aquela aplicao executar dentro de um nico arquivo. Devido a esta limitao seria impossvel e tambm invivel a cada novo domnio mapeado gerar um arquivo XML. Pensando nisto foi definido na tabela taxonomia um campo, taxonomia_XML, que serve para armazenar a representao do contedo do XML para a rvore daquele domnio. A figura 3.4 exibe o primeiro nvel de conceitos utilizado para definir o domnio computao que ser utilizado no caso de teste da ferramenta.

Figura 3.4 Taxonomia do exemplo de teste (domnio computao)

3.3.2 Publicao de documentos

Esta funcionalidade tem o objetivo de alimentar a base de contedo com as produes acadmicas. A publicao sob anlise da gesto de contedo a etapa que disponibiliza para os usurios o contedo j editado. Com o mapeamento de domnios definido de acordo com cada rea de conhecimento, atravs das taxonomias, necessrio alimentar a base de conhecimento com os documentos relacionados a este domnio, os documentos esto associados aos conceitos da taxonomia.

56

Para iniciar o processo de publicao o usurio precisa definir qual o domnio que ele deseja publicar o documento, no projeto ele faz isso atravs do combobox de seleo de domnios. A figura 3.5 exibe a tela inicial da publicao de contedos.

Figura 3.5 tela inicial da aplicao

Aps selecionar um domnio ele ter acesso rvore hiperblica que representa a taxonomia que representa o mesmo. Essa estrutura recuperada da tabela de Taxonomia que foi previamente cadastrada utilizando a funcionalidade anteriormente descrita. A figura 3.6 ilustra a seleo do domnio computao utilizado como base de testes do projeto.

57

Figura 3.6 Treebolic gerado para o domnio computao

Quando o domnio escolhido o contedo do XML necessrio para gerar a rvore do mesmo recuperado da tabela de taxonomia e passado como parmetro para a Applet do Treebolic. A listagem 3.5 mostra o cdigo da chamada do Treebolic e como o parmetro do XML passado para a Applet.

Listagem 3.5 Cdigo que contm a chamada para a treebolic.

Atravs desta definio indica-se qual o arquivo que contm o executvel da treebolic e qual a classe que ser executada quando a Applet for inicializada. No caso do projeto a

58

classe que executa a Applet a Treebolic. O parmetro passado com o nome XML a propriedade que tem o contedo do XML que ser passado para a Applet gerar a rvore daquele domnio. A alterao fundamental no cdigo-fonte do Treebolic foi modificar o parmetro para renderizao da rvore para que a mesma aceitasse o contedo do arquivo XML necessrio para renderizao ao invs de utilizar a URL (Uniform Resource Locator), que nada mais que o endereo fsico do arquivo dentro dos sistemas de arquivos. A implementao da Treebolic estudada utiliza a URL para buscar o arquivo apontado por ela, e a partir deste, ela converte o arquivo xml em um inputstream e inicia o processo de gerao da rvore. A modificao faz com que no seja mais necessrio passar a URL e passado diretamente o inputstream a partir contedo do XML. Um inputstream um vetor de bytes. Com o domnio j selecionado, o usurio deve navegar atravs da rvore hiperblica para selecionar qual o conceito (rea dentro do domnio) que o documento buscado trata, por exemplo, se um usurio dentro do domnio de computao possui um documento que tem como tema principal a rea de minerao visual, ele deve localizar esse conceito dentro do domnio e com um duplo clique selecionar este, para associar o conceito ao documento de forma definitiva ele deve clicar no boto Selecionar Domnio. Aps este procedimento o usurio deve preencher o formulrio de publicao de documentos, onde ele informar os dados referentes ao arquivo. O recurso diferencial dessa funcionalidade a capacidade que o usurio tem de associar seu documento a outros domnios e conceitos, diferente do domnio principal, porque pode existir um trabalho que seja multi ou interdisciplinar, por exemplo, um trabalho que seja da rea de redes, mas que envolva no seu contedo, pesquisa sobre sistemas operacionais, ou um trabalho de medicina que tenha relao com informtica. A fim de atender essa realidade a tela de publicao de documentos possui um componente que prov essa soluo. Como mostra a figura 3.7 esse componente possibilita o usurio selecionar os conceitos dos diversos domnios que possuem algum mapeamento registrado, permitindo assim uma caracterizao mista do documento em relao ao seu contedo, associando este a mais de um conceito.

59

Figura 3.7 Componente utilizado para mapeamento dos outros conceitos relacionados com o documento

Alm de associar outros conceitos ao documento, o usurio fornece informaes bsicas a respeito do documento, em campos previamente definidos como autor, orientador, data de apresentao, etc. Existe um processo que vale a pena ser ressaltado nesta etapa . a tarefa da indexao do contedo texto do arquivo digital que feita utilizando o Hibernate Search, o que ir permitir a busca pelo contedo do arquivo. Quando um documento publicado existe um processo de converso do arquivo em um vetor de bytes e de extrao do texto do arquivo que foi submetido. Existem dois campos na tabela documento que devem ser destacados. O primeiro campo o arquivo_fsico que ir armazenar em um campo BLOB (Binary Large Object), que serve para armazenar os bytes de um arquivo, o documento fisicamente. O outro campo texto_monografia que armazena em um campo text o contedo texto do documento. Essa extrao feita atravs da classe utilitria DocumentosUtil. Essa classe tambm responsvel por converter o arquivo em um vetor de bytes para ser armazenado no campo BLOB citado anteriormente. Todas as vezes que o campo texto_monografia atualizado ou persistido o Hibernate Search atualiza o ndice para aquele contedo. Os outros possveis conceitos associados ao documento so armazenados na tabela conceito_documento.

60

Caso o documento possua mais de um autor, o usurio deve separar o nome do autor por; (ponto e vrgula) e o nome desses autores sero armazenados na tabela autor_documento. Caso o nome do autor j exista armazenado na base de dados, apenas recuperada a chave que representa aquele autor no banco, caso no exista o id de um novo autor gerado. Vale ressaltar que o documento armazenado sempre dentro do domnio ao qual ele pertence e esse domnio mapeado atravs do atributo domnio_id da tabela documento.

3.3.3 Recuperao de documentos

O processo de recuperao de documentos pode acontecer de duas maneiras que no so excludentes, pelo contrrio so complementares. O usurio tem a opo de selecionar um domnio de conhecimento e com isso ele conseguir visualizar a rvore hiperblica que representa a taxonomia daquele domnio, com isso ele tem a opo de navegar pelos conceitos daquele domnio a fim de delimitar o escopo da sua busca ou ele pode apenas selecionar o domnio e o escopo da busca ser todos os documentos existentes naquele domnio. A visualizao da taxonomia por rvore hiperblica importante porque auxilia o usurio na delimitao do escopo de sua busca, trazendo o benefcio de apresentar de maneira visual a organizao dos conceitos de um domnio. A outra parte do processo de recuperao atravs do fornecimento de informaes pr-conhecidas a respeito do documento. Esto disponveis como opo de filtro os campos autor, ttulo, orientador, perodo de apresentao, tipo de documento, instituio, curso, palavras-chave e outros conceitos/domnios relacionados. Esta tela detalhada nas figuras 3.8, 3.9 e 3.10. Nesta parte da tela o domnio selecionado e invocada a Applet que renderizar a rvore para aquele domnio.

61

Figura 3.8 Incio da recuperao rvore do domnio selecionado

Nesta parte da tela o usurio fornece os parmetros do filtro de busca.

Figura 3.9 Formulrio de dados sobre o documento e palavras-chaves

62

Nesta parte da tela feita associao de outros conceitos do documento.

Figura 3.10 Parte de associao de outros conceitos

Quando o interessado na busca ainda no conhece detalhes completos sobre o documento que ele procura, e sabe apenas quais conceitos ele trata, o uso da rvore hiperblica em conjunto com o documento de associao de outros conceitos poder fornecer uma busca com escopo fechado apenas naqueles conceitos o que acarreta em uma reduo na possibilidade de retornos para aquela busca, haja vista que existem muito mais documentos cadastrados em um domnio completo do que em um subconjunto deste. Por outro lado, se conhecido um pouco mais de informaes sobre documentos os campos de busca textuais auxiliam no processo de recuperao ainda mais. Quando algum tipo de informao procurada, quanto maior o nvel de informaes que temos a respeito da mesma, auxiliar no processo de recuperao. No uso da ferramenta a situao no diferente. Quando existem documentos que atendem o filtro da busca. Uma tabela montada na tela de recuperao de documentos que exibe todos que atenderam os critrios da busca em uma tabela onde sero exibidos os campos ttulo, autor(es), orientador, data de apresentao, domnio, instituio, curso e os conceitos relacionados a este documento. Para visualizar um determinado documento o usurio deve clicar no ttulo que contm um link para acessar o documento.

63

A figura 3.11 exibe a tabela exibida como retorno de uma pesquisa realizada.

Figura 3.11 Tabela de exibio dos documentos encontrados

3.4 Avaliaes sobre a ferramenta criadaA soluo construda resolve o problema da limitao da busca pelo contedo do documento, entretanto ela possui algumas limitaes que vale a pena serem ressaltadas. Os benefcios conseguidos com o uso da soluo so os seguintes: Navegao pela rvore hiperblica do domnio de conhecimento, permitindo que o usurio conhea como a rea de conhecimento, que o mesmo busca algum documento, est organizada; Possvel associao do documento com outros conceitos, alm de um conceito principal, porque em geral um documento tem um tema central e assuntos relacionados, com a soluo possvel mapear esta situao; Atravs da busca por domnio e conceitos associados possvel buscar documentos pelo assunto ao qual eles tratam, no apenas pelo ttulo ou autor; Possibilidade de busca por palavras chaves existente no texto do documento e no palavras chaves previamente cadastradas como acontece no BAMON ou SAGRES; Ainda como uma soluo baseada em gesto de contedo, essa ferramenta poderia controlar todo o ciclo de vida dos documentos, o que no faz, controlando apenas duas fases do ciclo de vida de um documento a publicao e a recuperao.

4. CONCLUSO

64

As produes cientficas de uma instituio de ensino representam seu conhecimento explcito, por isso importante a existncia de polticas de gesto de conhecimento para que o conhecimento gerado seja renovado, melhorado, dando continuidade ao processo de aprendizagem e construo do mesmo. necessria para gerenciar estas produes uma estrutura de armazenamento especial, que permita mapear os domnios de conhecimento onde estas produes sero inseridas. Esta estrutura propicia subsdios para uma busca mais detalhada em torno dos conceitos que as produes abordam. Foi concludo que o uso de taxonomia uma maneira de criar este tipo de estrutura, definindo com esta, um modelo que pode representar domnios de conhecimento, como foi apresentado no projeto. Uma estrutura de arquivamento bem elaborada possibilita uma recuperao dos documentos de uma forma mais simples e intuitiva. As limitaes na recuperao de documentos que motivaram o incio do projeto so ultrapassadas, uma vez que foi criado um mecanismo que consegue mapear os documentos em reas de conhecimento e, alm disso, fazer busca sobre o contedo do texto, entretanto ao longo da jornada de pesquisa deste trabalho, novos conceitos e maneiras de se projetar gesto de contedo e gesto de conhecimento foram apresentados, com isso foi concludo que seria interessante para a UCSAL possuir uma poltica de gesto de conhecimento e que a mesma utilizasse uma ferramenta completa de gesto de contedo para administrar suas produes acadmicas, para oferecer um acesso simples aos documentos produzidos na universidade. Isto pode significar um avano na maneira como produzido e difundido o conhecimento e a forma simplificada de acesso s produes, estimulando a criao de novos conhecimentos a partir dos j existentes. O objetivo deste estudo de criar uma ferramenta completa no foi atingido, pois se conclui que as funcionalidades implementadas no proporcionam uma soluo completa de fazer gesto de conhecimento e gesto de contedo. Entretanto, um passo inicial foi dado com este projeto que pode ser continuado em futuras implementaes.

4.1 Sugestes de trabalhos futuros

65

Para se tornar uma soluo mais completa sob a tica da gesto de conhecimento/conte