topic maps como instrumentos de representa o e … 8: tópico puccini – software ontopia omnigator...
Post on 14-Mar-2018
215 Views
Preview:
TRANSCRIPT
Universidade de São Paulo
Escola de Comunicações e Artes
Departamento de Biblioteconomia e Documentação
Emerson Issa Kamiya
Topic maps como instrumentos de representação e recuperação da informação
São Paulo
2005
Emerson Issa Kamiya
Topic maps como instrumentos de representação e recuperação da informação
Trabalho de conclusão de curso apresentado ao Departamento de Biblioteconomia e
Documentação da Escola de Comunicações e Artes da Universidade de São Paulo como requisito parcial à obtenção do título de
Bacharel em Biblioteconomia
Orientadora: Profª. Drª. Marilda Lopes Ginez de Lara
São Paulo
2005
Autorizo a divulgação total ou parcial deste trabalho, por qualquer meio convencional ou eletrônico, para fins de estudo e pesquisa, desde que citada a fonte. Críticas podem ser enviadas para o e-mail emersonik@yahoo.com.br.
Pequenas correções foram feitas em dezembro de 2008. Porém, o conteúdo do texto permanece inalterado.
KAMIYA, Emerson Issa
Topic maps como instrumentos de representação e recuperação da informação / Emerson Issa Kamiya ; orientadora Marilda Lopes Ginez de Lara. – São Paulo, 2005.
63 p. il.
Monografia (Bacharelado em Biblioteconomia) – Departamento de Biblioteconomia e Documentação, Escola de Comunicações e Artes, Universidade de São Paulo.
Topic maps; Linguagem documentária; Representação da informação; Recuperação da informação; Mapa de conhecimento.
Folha de aprovação
Emerson Issa Kamiya.
Topic maps como instrumentos de representação e recuperação da informação.
Trabalho de conclusão de curso apresentado ao Departamento de Biblioteconomia e
Documentação da Escola de Comunicações e Artes da Universidade de São Paulo como requisito parcial à obtenção do título de
Bacharel em Biblioteconomia.
Aprovado em: 19/12/2005.
Nota: 10.
Banca examinadora:
Profª. Drª. Marilda Lopes Ginez de Lara
Instituição: Universidade de São Paulo
Assinatura: _____________________________________________________________________
Profª. Drª. Nair Yumiko Kobashi
Instituição: Universidade de São Paulo
Assinatura: _____________________________________________________________________
Profª. Mª. Cibele Araujo Camargo Marques dos Santos
Instituição: Fundação Escola de Sociologia e Política de São Paulo.
Assinatura: _____________________________________________________________________
Para
Walter e Mitiko
Agradecimentos
Nesses quatro anos de curso aprendi muito e conheci pessoas admiráveis. Reconheço que, graças a elas, pude crescer em várias “facetas”.
Para a construção desse trabalho, devo muito a Marilda, minha querida orientadora. Tive preciosa ajuda da María Jesús Colmenero Ruiz, da Universidad Carlos III, de Madri, expert em topic maps, e da Nair Yumiko Kobashi, querida professora.
Pude conhecer diversas organizações, pessoas e realidades. Isso contribuiu enormemente para minha formação.
Tive a companhia e o apoio da minha família. Sou muito grato à tia Yoshiko.
Lucia, obrigado por ser minha companheira.
Não vemos as coisas como elas são,
mas como nós somos.
Anaïs Nin
Resumo
KAMIYA, Emerson Issa. Topic maps como instrumentos de representação e recuperação da informação. 2005. 63 p. Monografia (Bacharelado em Biblioteconomia) - Departamento de Biblioteconomia e Documentação, Escola de Comunicações e Artes, Universidade de São Paulo, São Paulo, 2005.
Topic maps são instrumentos de representação de estruturas conceituais e
visualização na forma de mapas de conhecimento. Sua estrutura está formalizada
como norma (ISO 13250) e especificação (XML Topic Maps). Seus principais conceitos
são: tópicos, associações (entre os tópicos), ocorrências (documentos relacionados aos
tópicos), published subject indicators (referências aos assuntos representados nos
tópicos), fusão (entre vários topic maps) e escopo (contextualização dos tópicos,
associações e ocorrências). Sua estrutura é simples, porém, poderosa para lidar com
vastas quantidades de informação. A separação entre a camada conceitual (tópicos) e a
camada de recursos (ocorrências) permite o intercâmbio entre topic maps e seu uso em
diversos repositórios de recursos. Sua estrutura, centrada na informação e não nos
documentos, pode contribuir para uma nova abordagem na Ciência da Informação
voltada para a representação e o acesso à informação.
Palavras-chave: Topic maps; Linguagem documentária; Representação da informação; Recuperação da informação; Mapa de conhecimento.
Abstract
KAMIYA, Emerson Issa Using topic maps as tools for information representation and retrieval. 2005. 63 p. Monograph (Bachelor's degree in Library Science) - Departamento de Biblioteconomia e Documentação, Escola de Comunicações e Artes, Universidade de São Paulo, São Paulo, 2005.
Topic maps are instruments designed to represent conceptual structures and
visualization in the form of knowledge maps. The structure of topic maps is normalized
by ISO 13250 and specified by the XML Topic Maps and their core elements are:
topics, associations (between topics), occurrences (documents related to topics),
published subject indicators (references to the subjects represented in the topics),
merge (between a variety of topic maps) and scope (contextualization of topics,
associations and occurrences). Although structured in a simple way, this tool can
manage large amounts of information with ease. The division into a conceptual layer
(topics) and a resource layer (occurrences) allows the interchange between topic maps
and its use in many resource repositories. Their structure focused on the information,
instead of the documents may contribute to a new approach to information access
within Information Science.
Keywords: Topic maps; Documentary language; Information representation; Information retrieval; Knowledge map.
Translation: Asael Costa da Silva.
Ilustrações
Figura 1: Semiose ilimitada 16
Figura 2: Signo artificial 18
Figura 3: Mapa conceitual 27
Figura 4: Mapa mental 28
Figura 5: Grafo conceitual (rede semântica proposicional) 28
Figura 6: DeCS – descritor "Dor Abdominal" 34
Figura 7: DeCS – "Dor Abdominal" na hierarquia do sistema 34
Figura 8: Tópico Puccini – software Ontopia Omnigator 44
Figura 9: Grafo – Software Ontopia Ominigator 45
Figura 10: Grafo hiperbólico – Web page da Highware Press 46
Figura 11: Grafo tridimensional 46
Abreviaturas e siglas
ABNT – Associação Brasileira de Normas Técnicas
CApH – Conventions for the Application of HyTime
CC – Colon Classification
CRG – Classification Research Group
DDC – Dewey Decimal Classification
DeCS – Descritores em Ciências da Saúde
DTD – Document Type Definition
GPS – Global Positioning System
HTML – HyperText Markup Language
HyTime – Hypermedia/Time-Based Structuring Language
HyTM – HyTime Topic Maps
ISO - International Standards Organization
LCC – Library of Congress Classification
LCSH – Library of Congress Subject Headings
LD – Linguagem Documentária
OWL – Web Ontology Language
PSI – Published Subject Indicator
RDF – Resource Description Framework
SGML – Standard Generalised Markup Language
SKOS – Simple Knowledge Organisation System
SRI – Sistema de Recuperação da Informação
TMCL – Topic Map Constraint Language
TMQL – Topic Map Query Language
URI – Universal Resource Identifier
W3C – World Wide Web Consortium
Web – World Wide Web
WWW – ver Web
XML – eXtensible Markup Language
XTM – XML Topic Maps
Sumário
1 Introdução 11
1.1 Objetivos 13
1.2 Metodologia 13
2 Representação da informação 14
2.1 Signo 14
2.2 Expressão e interpretação dos signos nas ciências especializadas 17
2.3 Signo documentário 17
2.3.1 Signo documentário como representação 19
2.4 Representação como construção 23
2.5 Instrumentos de representação documentária 24
2.6 Mapas de conhecimento 26
2.7 Conclusões 31
3 Sistemas de recuperação da informação 32
4 Topic maps 36
4.1 Histórico 37
4.2 Principais conceitos 38
4.2.1 Tópico (topic) 39
4.2.2 Ocorrência (occurrence) 40
4.2.3 Associação (association) 41
4.2.4 Published subject indicators 42
4.2.5 Fusão (merge) 43
4.2.6 Escopo (scope) 43
4.3 Visualização 44
4.4 Características 47
4.5 Aplicações 48
4.5.1 Integração dos topic maps à Web Semântica 49
5 Considerações finais 51
Referências 53
Apêndice 56
Elementos da XTM 1.0 56
Elementos na estrutura da XTM 1.0 59
Índice 60
Topic maps como instrumentos de representação e recuperação da informação 11
1 Introdução
Ouvimos falar ad nauseam que vivemos numa sociedade saturada de informação, e
que isso traz grandes desafios e questões: temos condições de absorver toda a
informação produzida no mundo? Deveríamos começar a produzir menos informação?
Como saber se uma informação existe e como localizá-la?
A preocupação com a recuperação da informação provavelmente surgiu juntamente
com a preocupação com o registro da informação. Milhares de anos atrás, os homens
registravam e recuperavam informações em suas cabeças e o conhecimento coletivo
era transmitido oralmente. Mais tarde, a escrita possibilitou que se ultrapassassem os
limites da memória humana, com o registro da informação em suportes físicos, que
foram mudando com o tempo (tabletes de barro, madeira, seda, papiro, papel...). Com
os suportes físicos surgiram as bibliotecas e as técnicas de organização e localização
dos documentos (esquemas de ordenação e classificação, catálogos) e da informação
contida nesses documentos (sumários, índices). A revolução da imprensa na Europa,
no séc. XV, deu suporte ao aumento da produção escrita e da demanda criada por um
número cada vez maior de leitores.
A produção do conhecimento científico e o número de leitores, crescendo num ritmo
cada vez maior, fizeram com que se produzisse um número cada vez maior de
documentos. As telecomunicações quebraram barreiras espaciais e temporais
(telégrafo, telefone, rádio-difusão). A chamada explosão da informação, em meados do
séc. XX, foi corroborada pelos computadores, máquinas com capacidade de
processamento e armazenamento de informação muito superior à humana. A Ciência
da Informação tentou acompanhar esse fenômeno, desenvolvendo técnicas e
Topic maps como instrumentos de representação e recuperação da informação 12
ferramentas para a recuperação de quantidades imensas de informação (classificações
especializadas, tesauros, catálogos legíveis por computador etc.).
Mas, outra revolução viria em meados da década de 1990, chamada Internet. Ela é
uma rede de redes de computadores que não somente aumentou o poder de
comunicação entre as pessoas, mas também a capacidade de produção e disseminação
da informação.
Infelizmente, ainda não conseguimos recuperar as informações tão facilmente como
elas são produzidas. M. Kapor afirma: “Tirar informação da Internet é como beber água
de um hidrante”1. J. Naisbitt, fazendo outra analogia, diz: “Estamos nos afogando em
informações, mas sedentos de conhecimento” (NAISBITT apud BAX e SOUZA, 2001, p.
1). Logo, o grande desafio é desenvolver métodos e ferramentas capazes de gerenciar de
forma eficiente quantidades enormes de informação, não somente na Internet, mas
também dentro de organizações e unidades de informação.
Os topic maps são uma ferramenta que traz conceitos dos antigos (porém
utilíssimos) índices de livro, e é comparada ao GPS2 ao guiar uma pessoa pelo espaço
informacional. Como um índice, os topic maps permitem encontrar com mais exatidão
as informações dentro de um domínio do conhecimento. Uma de suas vantagens é que
as informações aparecem de forma gráfica, possibilitando uma interação muito mais
intuitiva.
1 “Getting information off the Internet is like taking a drink from a fire hydrant.” (KAPOR, 2005).
2 Global Positioning System. Esse sistema permite que uma pessoa, utilizando um aparelho localizador, saiba onde se encontra por meio de coordenadas geográficas (latitude, longitude e altitude).
Topic maps como instrumentos de representação e recuperação da informação 13
As técnicas utilizadas pela Ciência da Informação, como os tesauros e
classificações, podem ser apresentados como topic maps. Nesse sentido, essa nova
ferramenta pode ser utilizada para o aprimoramento de sistemas de organização e
recuperação da informação.
1.1 Objetivos
Este trabalho é de cunho exploratório, cujo objetivo principal é vislumbrar o
potencial dos topic maps como instrumentos de representação e recuperação da
informação.
Os objetivos específicos são:
• Discutir os conceitos de representação da informação, signo documentário e
recuperação da informação;
• Analisar os conceitos e as características dos topic maps;
• Discutir as possíveis contribuições dos topic maps à Ciência da Informação.
1.2 Metodologia
As etapas para o desenvolvimento do trabalho foram:
• Revisão da literatura;
• Leitura das especificações sobre topic maps;
• Uso do software Ontopia Omnigator3, que manipula topic maps;
• Redação da monografia.
3 Software e demonstração online disponíveis em http://www.ontopia.net/.
Topic maps como instrumentos de representação e recuperação da informação 14
2 Representação da informação
A necessidade de sistemas de representação e recuperação da informação decorre
de uma característica humana essencial: a linguagem simbólica. Para se
comunicarem, as pessoas utilizam a linguagem, simbólica por natureza, para
transmitir e receber informações. Os elementos da comunicação humana são: uma
realidade, os interlocutores (emissor e receptor), as mensagens (conteúdo), os signos
que representam as mensagens (código), e os meios para a transmissão dos signos
(BORDENAVE, 1984). Para haver comunicação é necessário que os interlocutores
usem um código comum (ECO, 1990), ou seja, um conjunto de signos que ambos
compreendam. Porém, essa comunicação não é “perfeita”, no sentido que nem sempre
o receptor interpreta de forma inequívoca a mensagem que o emissor transmite.
Um sistema de recuperação da informação (SRI) atua como interface entre os
documentos e os usuários do sistema. Ele é simultaneamente receptor (das mensagens
contidas nos documentos) e emissor (das representações dos documentos). Veremos a
seguir as características dos signos e sua importância na representação e recuperação
da informação.
2.1 Signo
A linguagem dos animais, que se dá por sinais, é herdada geneticamente e tem por
característica a invariabilidade. Mais propriamente, a linguagem dos animais não é
simbólica. Em contraste, a linguagem humana, construída por signos, tem de ser
aprendida pelos indivíduos, pois o signo é uma construção arbitrária e convencionada
(LOPES, 1995).
O signo, segundo C.S. Peirce, possui três partes:
Topic maps como instrumentos de representação e recuperação da informação 15
a) Signo4 (ou representamen): expressão; ele representa, está no lugar do objeto;
b) Objeto (imediato): segmentação do objeto dinâmico, do continuum da realidade.
c) Interpretante: significado; signo/expressão que substitui o signo.
A relação signo/objeto é convencionada e é por esse motivo que não há uma, mas
milhares de línguas faladas no mundo. Um objeto pode ter infinitos nomes ou signos.
Um livro, por exemplo, também é chamado de book (inglês), libro (italiano)…
Além disso, cada língua ou dialeto faz um recorte particular da realidade (objeto
dinâmico). Um exemplo clássico é o das cores do arco-íris, sete em português e dois na
língua bassa (LOPES, 1995). Isso não significa que as pessoas que falam o bassa
enxergam apenas duas cores, mas que a língua faz um recorte da realidade diverso do
recorte que o português faz. Assim, hui corresponde ao espectro que vai do roxo ao
verde, e ziza corresponde ao espectro do amarelo ao vermelho.
Por sua vez, a relação signo/interpretante se dá por um processo de interpretação.
Isso explica a característica plástica do signo, que se amolda aos contextos em que é
usado. Assim, não temos somente um interpretante, mas inúmeros interpretantes
associados ao mesmo signo. A interpretação “apropriada” do signo depende do
4 A palavra signo tem significados diferentes na semiótica de corrente peirceana e na semiologia de Saussure. Para este, o signo é uma entidade que possui dois elementos: o significante (correspondendo ao que Peirce denomina signo) e o significado (que corresponde ao interpretante). A divisão triádica, formulada já na Grécia Antiga pelos estóicos, admite mais um elemento, o referente (objeto imediato). O signo é uma matéria fascinante e, ao mesmo tempo, controversa. Há vários textos que discutem o tema com mais detalhes (ECO, 1984, 1990; EPSTEIN, 1991; GRANGER, 1974; LOPES, 1995; et al.).
Topic maps como instrumentos de representação e recuperação da informação 16
contexto de comunicação e da experiência anterior (background knowledge) do
indivíduo5.
Quando falamos sobre algo (signo), em vez de ter contato direto com esse algo
(objeto dinâmico), estamos num processo contínuo chamado por Peirce de semiose
ilimitada. Eco (1984) dá um exemplo de semiose ilimitada, ao descrever um abacaxi
por meio dos seus vários interpretantes: 1) é um fitomorfo; 2) é mais parecido com uma
laranja do que com um elefante; 3) tem um gosto de laranja com grapefruit, porém
mais doce; 4) é o que se chama na Itália de ananas. (…) Esse processo só acaba
quando o indivíduo tem contato direto com o objeto dinâmico (quando come o abacaxi).
Figura 1: Semiose ilimitada6
O processo de comunicação humana é, como vimos, muito complexo. A plasticidade
do signo, que lhe confere uma grande capacidade de expressividade, adaptação e
economia, por outro lado, traz o risco do não-entendimento ou da interpretação
inadequada do receptor.
5 Para Eco (1998 apud LARA 2002), o texto (mensagem) possui muitas lacunas que o receptor deve preencher. ECO, Umberto. Marco Polo e o unicórnio. In: Kant e o ornitorrinco. Rio de Janeiro: Record, 1998.
6 Fonte: Granger (1974). S (signo), O (objeto), I (interpretante). Essa figura é uma variante do triângulo semiótico, cuja diferença está nos vários interpretantes, que ilustram o processo de semiose ilimitada.
Topic maps como instrumentos de representação e recuperação da informação 17
2.2 Expressão e interpretação dos signos nas ciências especializadas
A problemática da expressão e interpretação dos signos interessa à Lingüística,
Semiótica, Terminologia e Ciência da Informação. Sager (1993) critica a dissociação
entre o ensino de uma língua (materna ou estrangeira) e o ensino do conhecimento
especializado. Como resultado, as pessoas que aprendem uma língua não conseguem
aplicá-la e as pessoas que aprendem uma matéria especializada não conseguem
expressar de forma satisfatória o que aprenderam.
A Terminologia surgiu como uma necessidade de comunicação efetiva entre
especialistas e entre especialistas e leigos. Além das comunidades dos especialistas e
dos leigos, há uma terceira comunidade, a dos mediadores da comunicação, formada
por tradutores, terminólogos e documentalistas (SAGER, 1993). A mediação feita por
essa comunidade é expressa num nível de linguagem diferente da linguagem do
especialista. Os mediadores compreendem a linguagem especializada a ponto de
poderem re-expressá-la em outra linguagem, mas isso não significa que eles possuem
o mesmo conhecimento do especialista. Saber falar sobre a construção de uma ponte
não significa saber construir uma ponte7.
2.3 Signo documentário
Os signos verbais ou lingüísticos são os únicos que conseguem traduzir quaisquer
outros signos. Eles são meta-signos universais (LOPES, 1995). É por esse motivo que
existem textos que tratam da música e da pintura, mas não sinfonias ou quadros que
7 “Saber una lengua es un saber diferente a saber construir un puente.” (SAGER, 1993, p. 15)
Topic maps como instrumentos de representação e recuperação da informação 18
falam sobre literatura. Essa característica dos signos lingüísticos talvez se explique
pela dificuldade em se admitir a existência do pensamento sem a mediação da
linguagem verbal8.
Os signos artificiais, por sua vez, servem a propósitos específicos, como a linguagem
da ciência ou da lógica. A notação matemática (+, -, =, >) ou dos elementos químicos
(H2O, Na) são exemplos de signos artificiais. Na linguagem artificial, há um rígido
controle da interpretação dos signos.
Figura 2: Signo artificial9
A Linguagem Documentária (LD) que, segundo Lara (2005), possui um caráter
intermediário entre as línguas naturais e as linguagens artificiais, se apropria dos
signos lingüísticos para construir seus vocabulários controlados. Porém, na linguagem
documentária os signos lingüísticos não funcionam como nas línguas naturais. Os
8 Para Ervin (1966, p. 57), “considerar a linguagem como um instrumento, um canal, semelhante a um fio telefônico, destinado à transmissão, é adotar uma visão simplista. As palavras que pronunciamos apenas em parte são influenciadas pelo que sabemos e sentimos. A questão a ser examinada mais profundamente é o fato de que as coisas que pensamos e sentimos podem ser influenciadas pelo que dizemos, o que nos faz entrever um efeito inesperado e sutil da linguagem.”
9 Modificação da figura “Semiose ilimitada”, feita pelo autor deste trabalho. Nesse caso, o signo artificial possui um interpretante único. O signo documentário, apesar de se aproximar desse modelo, geralmente não o alcança, pois não é interpretado por uma comunidade homogênea.
Topic maps como instrumentos de representação e recuperação da informação 19
signos documentários, cujos interpretantes são controlados, possuem significados
fixados dentro de uma estrutura formal que os relacionam com outros signos do
mesmo conjunto. Com esse mecanismo, pode-se dizer que os interpretantes são
determinados por referências da estrutura relacional das próprias linguagens
documentárias sendo, assim, razoavelmente unívocos. Apesar de se objetivar uma
identidade única entre signo e interpretante, como nas linguagens artificiais, pelo fato
de a LD utilizar signos lingüísticos, não se pode falar na univocidade estrita dos signos
documentários (LARA, 2005).
A arte da representação da informação (contida nos documentos) não é uma
simples rotulação definitiva ou simples atribuição de assuntos e palavras-chave. A
representação envolve escolhas, pois o signo permite infinitas aproximações do objeto.
Por exemplo, a luz pode ser descrita como onda ou partícula, depende de qual aspecto
está sendo tratado.
“O continuum é muito mais rico que as nossas formas do conteúdo. Para outras
porções do continuum é preciso elaborar outras formas do conteúdo que possam ser complementares, assim como na física a luz pode ser explicada como onda ou como corpúsculo. O que são a onda e o corpúsculo? São duas unidades de forma
do conteúdo que procuram explicar alguma coisa que acontece no continuum, isto é, no objeto dinâmico. E, na teoria da complementaridade, certos fenômenos são
bem explicados como onda e certos fenômenos são bem explicados como corpúsculos. Isso significa que a forma global do conteúdo é uma utopia, é uma hipótese reguladora. Na realidade, formalizamos o conteúdo somente quanto a
pequenas porções e, quanto mais aprofundássemos essas porções formalizadas, tanto mais perceberíamos que são contraditórias relativamente a outras
modalidades de formalização de conteúdo.” (ECO, 1984, p. 40)
2.3.1 Signo documentário como representação
A necessidade de comunicar, de compreender e ser compreendido é ilustrada por
Eco na história do Sr. Sigma e um médico:
Suponhamos que o senhor Sigma, durante uma estadia em Paris, começa a sentir dores na “barriga”. Usei um termo genérico porque o senhor Sigma tem
ainda uma sensação confusa. Agora repara melhor e procura definir a dor: ardores
Topic maps como instrumentos de representação e recuperação da informação 20
no estômago? Espasmos? Dores viscerais? Tenta dar um nome a estímulos imprecisos: dando-lhes um nome, culturaliza-o, isto é, resume aquilo que era um fenómeno natural em precisas rubricas “codificadas”, tenta assim dar a uma sua [sic] experiência pessoal uma qualificação que a torne semelhante a outras
experiências já denominadas nos livros de medicina ou nos artigos de jornal.
Agora encontrou a palavra que lhe parece certa: esta palavra está pela dor que ele sente. Visto que tenciona comunicar as suas dores a um médico, ele sabe que poderá usar a palavra (que o médico está à altura de compreender) em lugar da
dor (que o médico não sente e talvez jamais tenha sentido). […]
Está finalmente sentado diante do médico, e tenta explicar-lhe o que compreendeu naquela manhã: “J’ai mal au ventre”.
O médico compreendeu as palavras, mas não se fia: não está seguro de que
Sigma tenha indicado com as palavras certas a sensação precisa. Faz perguntas, nasce uma troca verbal, Sigma é levado a precisar o tipo de dor, a posição. O
médico agora apalpa o estômago e o fígado de Sigma: algumas experiências tácteis têm para ele um significado que para outros não têm, porque estudou em livros que explicam como a uma certa experiência táctil deve corresponder uma dada
alteração orgânica. O médico interpreta as sensações que Sigma teve (e que ele não sente) e compara-as às sensações tácteis que está a ter. Se os seus códigos de semiótica médica estão certos, as duas ordens de sensações deveriam
corresponder. Mas as sensações de Sigma chegam ao médico através da língua francesa; o médico tem de estabelecer se as palavras que se manifestam sob a
forma de sons são coerentes segundo os usos verbais correntes, com as sensações de Sigma; mas duvida de que Sigma use as palavras precisas, não porque tenha sensações imprecisas, mas porque traduz mal do italiano para o francês. Sigma
diz “ventre”, mas quer talvez dizer “foie” (e por outro lado pode acontecer que Sigma seja um inculto, e que para ele também em italiano fígado e barriga sejam
uma certa entidade indiferenciada). (ECO, 1990, p. 7-10)
Temos aqui uma situação de comunicação. O Sr. Sigma, um italiano em Paris,
sente dores na barriga e sabe que deve expressar corretamente a dor que sente para
que o médico faça um diagnóstico correto. A linguagem utilizada pelos dois é o francês.
Mas, temos alguns problemas: o francês não é a língua materna de Sigma (por isso o
médico desconfia da exatidão das palavras do paciente); a diferença de linguagem
(geral e especializada) usada pelos dois só é compensada pelos exames realizados pelo
médico (“códigos de semiótica médica”, ou seja, uma outra linguagem).
Imaginemos outra situação: O Sr. Sigma sente dores na barriga e vai à biblioteca
para encontrar informações sobre essas dores e decidir entre se automedicar ou ir ao
Topic maps como instrumentos de representação e recuperação da informação 21
médico. Ele vai ao terminal onde há uma base de dados bibliográfica. Neste ponto
podemos ter várias situações:
A) Se as palavras-chave do campo assunto forem retiradas dos documentos, Sigma
terá muitos problemas, pois os documentos que tratam de dores na barriga podem
expressar esse sintoma de várias formas por causa das diferenças de linguagem
(língua, nível de especialidade, público-alvo, abordagem, época etc.). Teremos várias
palavras-chave que designam o mesmo conceito, ou uma palavra-chave que
designa vários conceitos.
B) Se as palavras-chave do campo assunto forem retiradas de um tesauro, mas ainda
apresentadas como metadados, Sigma ainda terá problemas: o sistema não
indicará as relações entre as palavras-chave. Portanto, a estrutura do tesauro
formada pelas relações entre os descritores se perde na interface com o usuário;
C) Se as palavras-chave forem apresentadas na forma de um vocabulário estruturado,
Sigma terá mais facilidade em encontrar os documentos úteis a ele, pois as
palavras “não preferidas pelo sistema” remeterão aos termos “preferidos” (relação
USE/UF), assuntos mais específicos, genéricos ou correlatos poderão ser
encontrados com facilidade (relação TG/TE/TR), e cada termo terá uma explicação
sobre seu uso, às vezes, uma definição (NE).
Na situação A descrita acima, as palavras-chave estão “soltas”, não há um princípio
organizador que as estruture como uma linguagem documentária de fato. Assim, não
há nenhum controle sobre os signos e seus interpretantes. E, como não há um
contexto explicativo para cada palavra-chave (esse contexto está nos documentos de
onde foram retiradas), o Sr. Sigma ou qualquer outra pessoa terá de bancar o
adivinho, tentando inferir o que os autores poderão ter escrito sobre “dor de barriga”
Topic maps como instrumentos de representação e recuperação da informação 22
(alguns podem ter falado sobre “dor de barriga”, outros sobre “dor abdominal” e outros
sobre “cólica”. Pior, os autores podem ter se referido a essas palavras de forma
indiscriminada, isto é, um pode ter tratado da dor abdominal querendo dizer cólica,
outro pode ter dito o contrário).
A situação B não melhora muito (talvez até piore) a vida do Sr. Sigma. Ainda não há
contexto (o contexto do tesauro cujos descritores foram extraídos). Ele ainda terá de ter
poderes de adivinhação para descobrir qual é o termo utilizado para todas as
ocorrências de “dor de barriga” (essa situação patética ainda existe em muitas
bibliotecas). O Sr. Sigma terá melhores chances se um solícito bibliotecário de
referência (que tenha um razoável conhecimento do tesauro) se dispuser a auxiliá-lo na
busca. Porém, nem sempre há um bibliotecário solícito nesses momentos (e se Sigma
estiver utilizando a base de dados remotamente, pela Internet, na sua casa?). Além
disso, até o bibliotecário pode ter dúvidas…
Nas situações A e B ainda não temos uma linguagem mediadora entre a população
de documentos e a população de usuários, apenas metadados ou rótulos temáticos. Os
metadados apenas relacionam assuntos a documentos, não os assuntos entre si. Na
situação B, os descritores do tesauro, que formavam um sistema estruturado, quando
aplicados viram simples metadados. Fazendo uma analogia com a localização
geográfica, a situação A é como se indicássemos a casa a um forasteiro dizendo "ela
fica perto do posto de gasolina, em frente à farmácia". A situação B é como se
indicássemos a casa pelo seu endereço (descritores), mas sem mostrar o mapa da
região. Na situação C, indicaremos o endereço da casa (descritores) e o mapa da região
(tesauro).
Topic maps como instrumentos de representação e recuperação da informação 23
2.4 Representação como construção
A representação da informação é uma tarefa complexa, pois os signos que usamos
para representar a realidade não são a própria realidade. Quando há uma
representação, implicitamente há um recorte, um ponto de vista em relação ao
continuum da realidade.
Assim, temos de descartar a hipótese da informação como dado (ou reprodução):
Essa crença está fundada na preocupação com a busca da essência ou, dito de
outro modo, da informação objetiva. Tal procedimento remeteria ao polimento do espelho, já que a informação estaria dada aprioristicamente, requerendo um esforço para resgatá-la do documento (LARA, 2002, p. 132).
De acordo com essa hipótese, teríamos uma classificação universal válida para
todos os contextos, cujos signos documentários seriam pedaços da própria realidade.
Porém, a informação não é reprodução, mas uma construção (LARA, 2002). A
representação não é um espelho que reflete a realidade sem distorções, mas um
prisma que privilegia certo espectro dessa realidade.
Além disso, a informação é sempre compartilhada, no sentido de que seu
significado não é definido somente pelo emissor e pela linguagem, mas pelo usuário
dessa informação.
Portanto, a linguagem de interface entre documentos e usuários, em vez de buscar
uma representação única e perfeita do conhecimento, deve mostrar ao usuário sua
estrutura interna, permitindo-o entrever sua “construção”. A representação
documentária tem um objetivo pragmático (ou seja, preocupa-se com um fim, que é a
recuperação de documentos) e não metafísico.
Topic maps como instrumentos de representação e recuperação da informação 24
2.5 Instrumentos de representação documentária
Os variados instrumentos de representação documentária utilizam o signo
documentário sob diferentes abordagens.
As classificações enciclopédicas, como a Dewey Decimal Classification (DDC), cujo
escopo abrange todo o conhecimento humano, possuem uma hierarquia rígida, onde
um termo deve necessariamente se enquadrar numa estrutura de
superordenação/subordinação. Por isso, apresentam dificuldades para acomodar
novas categorias e formas de representação da realidade. São sistemas engessados,
identificando-se com o paradigma da informação como reprodução.10
As classificações facetadas, originalmente idealizadas por S.R. Ranganathan nos
anos 1930, em vez de descrever os termos de forma unidimensional, os analisam nas
suas várias facetas ou perspectivas. As cinco categorias da Colon Classification (CC) de
Ranganathan são cinco: Personalidade (faceta principal), Matéria (substância ou
material), Energia (processos ou ações), Espaço e Tempo. O esquema classificatório de
Ranganathan não vingou, mas seus conceitos serviram como base teórica para os
especialistas em classificação. O Classification Research Group (CRG) tem desenvolvido
diversos esquemas facetados para áreas específicas do conhecimento.
10 As classificações enciclopédicas geralmente são usadas com a finalidade de indicar a localização física dos documentos por meio de notações codificadas. Os documentos são organizados segundo a lógica classificatória do esquema utilizado. Porém, a lógica desses esquemas tem sido contestada, principalmente a dos sistemas excessivamente pragmáticos, como a Library of Congress Classification (LCC). As críticas recaem sobre a falta de flexibilidade e interpretações datadas e tendenciosas (por exemplo, na DDC, 90% da classe Religião está reservada ao cristianismo). Entretanto, não defendemos a organização ad hoc dos documentos físicos, apenas criticamos o uso dogmático desses esquemas como se fossem bíblias.
Topic maps como instrumentos de representação e recuperação da informação 25
As listas de cabeçalhos de assunto, como a Library of Congress Subject Headings
(LCSH), são construídas de forma empírica, pela ocorrência de termos na literatura, o
que não permite a formalização de sistemas coesos, cujos elementos se relacionem
entre si. São sistemas de bricolagem, não se caracterizando como linguagem num
sentido estrito.
Os tesauros são linguagens estruturadas cujas unidades (descritores) são
relacionadas de acordo com princípios lógico-semânticos. A interpretação de um termo
se dá pela sua relação com outros termos (relações de equivalência, hierarquia e
associação). Há um rigor maior na explicitação das relações entre os termos, porém,
segundo Lara (2002), as normas de construção de tesauros não fornecem diretrizes
para o processo de identificação e escolha dos termos. O trabalho terminológico pode
contribuir para a sistematização do processo de escolha dos termos.
[…] Embora nem todos os trabalhos terminológicos cheguem efetivamente a apresentar mapas conceituais dos domínios (muitas vezes o trabalho se encerra na
elaboração de um dicionário ou de um glossário), é a partir do processo definicional que são criadas as condições para se estabelecer redes de relações entre os
termos.
Os dicionários terminológicos constituem, assim, uma ferramenta imprescindível para a construção da linguagem documentária, já que permitem conferir referência aos descritores. Se antes a biblioteconomia e a documentação
trabalhavam empiricamente a partir de referências da classificação filosófica (enfatizando apenas a segmentação, mas não sua expressão lingüística) e, em
seguida, para dar conta das formas significantes, a partir de palavras (através dos processos de extração baseados em freqüência ou ocorrência) ou da seleção empírica de unidades significativas (sem a definição daquilo que poderia
caracterizar uma unidade significativa), a partir da Terminologia ela passa a contar com instrumentos que trabalham com o termo, unidade que representa o conceito dentro de um domínio ou área de atividade. (LARA, 2002, p. 136)
Nas classificações e nos tesauros, o controle dos interpretantes dos signos é feito
basicamente pelas relações entre os signos. Porém, isso muitas vezes não é suficiente.
Topic maps como instrumentos de representação e recuperação da informação 26
As ontologias, foram desenvolvidas na área da Inteligência Artificial, sendo só
recentemente utilizadas para a recuperação da informação. Na Ciência da
Computação, são definidas como um modelo para a descrição do mundo, consistindo
em um conjunto de tipos (types), propriedades (properties) e relacionamentos
(relationships). Possuem uma linguagem de vocabulário aberta (ao contrário dos
sistemas anteriores), que pode ser definida livremente. Para Garshol (2004), um
tesauro pode ser considerado uma ontologia limitada, possuindo um único tipo
(termo), uma propriedade (nota de escopo) e três relacionamentos (de equivalência,
hierarquia e associação).
2.6 Mapas de conhecimento
O mapeamento do conhecimento11 (knowledge mapping) é uma técnica recente,
muito menos desenvolvida do que o mapeamento geográfico. As especificações
formalizadas nos topic maps são um passo adiante no desenvolvimento dessa técnica
(FISHER, 2002).
Há muitos tipos de mapas de conhecimento, entre eles:
• Mapa conceitual (conceptual map): desenvolvido por Joseph D. Novak e seus
discípulos, nos anos 1960, como ferramenta para um tipo de aprendizado chamado
construtivista, em que um conhecimento anterior é usado para a aquisição de um
novo conhecimento (meta-aprendizado, “aprendendo a aprender”);
11 Não discutiremos aqui a noção de conhecimento, adotaremos a tradução literal da denominação na literatura.
Topic maps como instrumentos de representação e recuperação da informação 27
Figura 3: Mapa conceitual12
• Mapa mental (mind map): sua criação é atribuída a Tony Buzan, na década de
1970. Sua estrutura é radial, onde, de um tema central surgem várias ramificações.
É utilizado para sumarização, revisão e memorização de idéias;
12 Disponível em http://en.wikipedia.org/wiki/Image:Conceptmap.gif.
Topic maps como instrumentos de representação e recuperação da informação 28
Figura 4: Mapa mental13
• Rede semântica (semantic network) : desenvolvido na área de Inteligência Artificial,
que lida com tipos de relacionamento como transitividade (se A é descendente de B
e B é descendente de C, então A é descendente de C), reflexão e simetria (se A é
casado com B, então B é casado com A).
Figura 5: Grafo conceitual (rede semântica proposicional)14
Lima (2004) define o mapa conceitual como uma representação das características
de certos objetos ou idéias e como uma ferramenta para a organização do
13 Disponível em http://en.wikipedia.org/wiki/Image:Guru_Mindmap.jpg.
14 Disponível em http://en.wikipedia.org/wiki/Conceptual_graphs.
Topic maps como instrumentos de representação e recuperação da informação 29
conhecimento, “[...] procurando refletir a organização da estrutura cognitiva do
indivíduo sobre um dado assunto” (LIMA, 2004, p. 92). Segundo a autora, os mapas
conceituais podem ser usados para:
• Gerar idéias por meio do brainstorming;
• Facilitar o entendimento de estruturas complexas;
• Possibilitar o aprendizado construtivista por meio da agregação de idéias novas
às idéias já existentes;
• Identificar e comparar idéias conflitantes.
O processo de comunicação e a transferência de informação entre os indivíduos é
um processo complexo. Os mapas de conhecimento se propõem a facilitar essa
transferência.
O conhecimento individual muitas vezes é difícil de ser externalizado. Fisher (2002)
nos dá alguns exemplos: foi pedido a uma classe de estudantes que fosse definido o
conceito de tempo. Ninguém conseguiu dar uma definição satisfatória; um grupo de
geneticistas que iria participar na produção de um programa de TV não chegava a um
acordo quanto à definição de gene (!). Podemos viver confortavelmente com conceitos
vagos na mente, até o momento que temos de externalizar esses conceitos. Os mapas
de conhecimento auxiliam na externalização do conhecimento pessoal ao fazer com
que o indivíduo organize seus pensamentos na forma de conceitos estruturados
(FISHER, 2002).
Os mapas de conhecimento também auxiliam na internalização do conhecimento.
Fisher (2002) relata pesquisas em que o uso de redes semânticas nas salas de aula
Topic maps como instrumentos de representação e recuperação da informação 30
permite aos estudantes inferir com mais facilidade o modelo mental dos seu
professores, além de obterem melhores notas nas avaliações.
Uma das vantagens dos mapas de conhecimento é que a informação visual é
vinculada à informação verbal. Fisher (2002) interpreta a valorização da linguagem
visual para a transferência da informação como uma mudança de paradigma.
Standing and colleagues [1970]15 found, for example, that a five-second
exposure to each of a series of more than 2,500 pictures, followed by a recall test, produced more than 90 percent correct recall. Visuals are thus wonderful memory aids (“a picture is worth a thousand words”). Visuals in science typically require clear labels and supporting verbal explanations in order to be understood [Bottrill and Lock 1993]16. A key advantage to such presentations is that the learner can encode information in two distinct information processing systems, one that
represents information verbally (the internal semantic network) and one that represents information visually [Mayer and Sims 1994]17. […] Thus dual coding both increases the amount of information available about an idea and facilitates recall of that idea by providing two separate storage and retrieval systems (FISHER, 2002, p. 499).
O mapa conceitual também apresenta vantagens em relação ao texto linear no
processamento de informações.
Todo conhecimento é processado e organizado pela interação da memória de curta duração com a memória de longa duração. Existe um limite para o processamento da memória de curta duração que nos permite processar de cinco a nove unidades de informação por vez, sendo que cada conceito pode combinar
duas ou três unidades de informação. Assim, podemos processar somente a relação entre dois ou três conceitos de cada vez. O mapa conceitual, com sua característica gráfica, é um instrumento poderoso para permitir a compreensão das
relações entre os conceitos e do conhecimento no todo. Para o cientista da informação, que lida com a análise de assunto para estruturação de uma área do
15 STANDING, L.; CONEZIO, J; HABER, R.N. Perception and memory for pictures: single trial learning of 2500 visual stimuli. Psychonomic Science, n. 19, p. 73-84, 1970.
16 BOTTRILL, J.; LOCK, R. Do students learn from pictures or from text? Science Review, n. 74, p. 109-112, 1993.
17 MAYER, R.E.; SIMS, V.K. For whom is a picture worth a thousand words?: extensions of the dual-coding theory of multimedia learning. Journal of Educational Psychology. N. 46, p. 389-401, 1994.
Topic maps como instrumentos de representação e recuperação da informação 31
conhecimento, o mapa conceitual pode se tornar um instrumento importante para ajudá-lo a entender e a lidar com complexos informacionais (LIMA, 2004, p. 95).
2.7 Conclusões
As LDs são instrumentos que estabelecem a mediação entre documentos e
usuários. O processo de semiose é controlado para se evitar problemas de ambigüidade
e não entendimento dos descritores.
Os topic maps apresentam outros mecanismos para o controle dos signos (como o
public subject indicator) e, ao mesmo tempo, oferecem maior flexibilidade para a
representação desses signos (variant names, scope). Esses mecanismos serão descritos
no capítulo Topic maps.
Topic maps como instrumentos de representação e recuperação da informação 32
3 Sistemas de recuperação da informação
Os sistemas de recuperação da informação (SRI) têm por objetivo recuperar
documentos relevantes às necessidades de cada pessoa. Lancaster (1979) descreve
esse sistema, que possui numa ponta a “população” de documentos e em outra a
“população” de usuários do sistema. Uma base de dados (cujos dados representam os
documentos) serve de interface entre essas populações. O que garante a eficiência do
sistema é o seu vocabulário, que traduz a linguagem de cada população (usuários e
documentos) para uma linguagem comum.
As pessoas geralmente exploram o SRI de duas formas: por meio da “busca”
(searching) e, quando é possível, da “exploração” ou “navegação” (browsing).
A busca por palavras lida com metadados. Tanto a descrição dos documentos
(autoria, título, data, tamanho etc.) quanto os assuntos tratados neles são
armazenados em campos específicos da base de dados. A recuperação se dá pelo
confronto das palavras inseridas no campo de busca com os campos descritivos dos
documentos. Esse método é eficaz quando o usuário do sistema sabe quais
documentos são relevantes a ele.
Quando o usuário quer encontrar documentos que tratam de determinados
assuntos, mas não sabe quais são, a busca isolada se revela ineficaz. Isso ocorre
porque muitos SRI, nesse contexto, se parecem com uma caixa hermética. Se o
usuário emprega palavras que não estão no sistema, este não fornece os documentos
potencialmente úteis a ele.
A exploração pode tornar a busca muito mais eficiente. Se a linguagem de
indexação, em vez de ser apresentada como metadados, for apresentada como
Topic maps como instrumentos de representação e recuperação da informação 33
vocabulário estruturado, o SRI permitirá ao usuário interagir com o sistema, refinando
a busca.
Vamos a um exemplo. Os Descritores em Ciências da Saúde18 (DeCS) são um
vocabulário usado para indexar diversas bases de dados especializados na área da
saúde. Quando pesquisamos nessa base de dados, formulamos uma equação de busca
para recuperarmos os documentos potencialmente úteis. Porém, quando não temos
sucesso na busca, podemos consultar o DeCS para descobrirmos os descritores
possivelmente úteis. Voltando à triste história do Sr. Sigma, nós queremos ajudá-lo,
então procuramos por “dor de barriga” no vocabulário. Infelizmente, não obtemos
resultado. Essa expressão não existe no sistema. Desta vez, procuramos por “dor”,
navegamos pelos descritores recuperados e encontramos o descritor “dor abdominal”.
O sistema fornece uma definição, termos equivalentes em espanhol e inglês, uma nota
de escopo, um termo relacionado e sua localização na estrutura do tesauro. O sistema
ainda indica a posição do descritor na hierarquia do tesauro, embora não indique
termos relacionados.
18 Disponível em: http://decs.bvs.br/.
Topic maps como instrumentos de representação e recuperação da informação 34
Figura 6: DeCS – descritor "Dor Abdominal"
Figura 7: DeCS – "Dor Abdominal" na hierarquia do sistema
Se não tivéssemos acesso ao DeCS, teríamos de adivinhar que “dor de barriga”
naquela base de dados é representada por “dor abdominal”. Além de descobrirmos os
termos utilizados pelo sistema, aprendemos um pouco mais mesmo antes de consultar
qualquer documento.
Topic maps como instrumentos de representação e recuperação da informação 35
A exploração de um vocabulário controlado é similar à leitura de um texto. Para
Eco,
O texto é uma máquina preguiçosa que solicita a participação do leitor na compreensão dos ditos e no preenchimento dos não ditos e, conseqüentemente, toda leitura é parcial e dependente da experiência anterior do leitor, sua motivação
e objetivos de leitura, mais seu estoque prévio de conhecimento. (ECO, 199819 apud LARA, 2002, p. 127)
Quanto mais “obscuro” for o texto, mais requisitada será a participação do leitor
para o seu entendimento.
De forma análoga, os descritores são como um texto, pois requerem o conhecimento
anterior do leitor para que ele faça inferências a respeito de que espécies de
documentos são representados por eles. Quanto mais estruturado for o vocabulário
controlado, menores serão as lacunas a serem preenchidas pelo usuário. Nos casos de
vocabulários extremamente desestruturados, as inferências feitas serão como saltos no
escuro, o usuário não terá a mínima idéia do que encontrará pela frente.
Os topic maps oferecem mecanismos de estruturação dos tópicos (termos) que
podem ajudar a diminuir as “lacunas textuais” e auxiliar o usuário em sua
investigação. Esses mecanismos serão descritos e analisados a seguir.
19 ECO, Umberto. Marco Polo e o unicórnio. In: Kant e o ornitorrinco. Rio de Janeiro: Record, 1998.
Topic maps como instrumentos de representação e recuperação da informação 36
4 Topic maps
Topic maps são ferramentas de representação de universos informacionais em
forma de grafos. Sua estrutura está formalizada como norma (ISO/IEC 13250) e
especificação (XTM 1.0). Sua unidade é o tópico (topic), nó que representa um conceito
ou um elemento, que se relaciona com outros tópicos por meio de associações
(associations). O nó também pode estar conectado a documentos ou recursos externos
ao topic map, denominados ocorrências (occurrences). Apesar de se assemelharem a
um mapa conceitual, seus conceitos foram baseados nos índices de livros.
Pepper compara o índice de um livro ao mapa geográfico: “someone once said that ‘a
book without an index is like a country without a map’” (PEPPER, 2000, p. 1). Um índice
é um mapa, uma réplica em miniatura de um livro, que revela sua estrutura e
conteúdo.
No entanto, um índice eletrônico deve se adaptar às características próprias dos
documentos eletrônicos. Nesse contexto, onde a distinção entre documentos
individuais se torna mais tênue e os agrupamentos de informação se tornam
gigantescos, os índices eletrônicos não podem ser simples réplicas de seus primos de
papel. Por outro lado, a indexação de textos completos hoje praticada se mostra muito
ineficiente (basta checar o desempenho dos mecanismos de busca na Web). Na
verdade, a indexação de textos completos se compara a um índice que elenca todas as
palavras de um livro, e ninguém em sã consciência consultaria um índice desses (mas
achamos o Google o máximo).
Topic maps como instrumentos de representação e recuperação da informação 37
4.1 Histórico
O conceito de topic map surgiu no Davenport Group, fundado em 1991 por
fornecedores de sistemas UNIX para encontrar possíveis soluções (como o uso de
índices, glossários e tesauros) para as inconsistências das documentações e
publicações sobre sistemas (software). Em 1993 foi criado o grupo Conventions for the
Application of HyTime (CApH) para a aplicação dos conceitos do padrão HyTime20 (ISO
10744), que provê à linguagem SGML21 sofisticados recursos de multimídia e
hiperlinking.
Em 2000 foi publicada a ISO 13250, que utiliza a notação HyTime. Por isso a
norma também é conhecida como HyTime Topic Maps (HyTM). Logo depois da
publicação da norma ISO, foi fundado o TopicMaps.org para a criação da XML Topic
Maps (XTM), publicada em 2001. A XTM foi criada para ser utilizada mais facilmente
em ambiente Web e as diferenças básicas em relação à ISO 13250 são a notação em
XML22 (linguagem amplamente aceita para uso na Web, menos complexa do que a
SGML) e o uso de uma DTD23 em vez de formas arquiteturais24, que dá uma estrutura
única aos topic maps, facilitando seu intercâmbio.
20 Hypermedia/Time-based Structuring Language.
21 Standard Generalized Markup Language.
22 eXtended Markup Language.
23 Document Type Definition, define parâmetros para aplicações em XML.
24 Architectural forms, oferecem mais flexibilidade aos desenvolvedores, porém, são mais complexas do que a DTD.
Topic maps como instrumentos de representação e recuperação da informação 38
Estão em processo de padronização a Topic Map Constraint Language (TMCL),
linguagem que trará parâmetros de validação e consistência à XTM, e a Topic Map
Query Language (TMQL), linguagem de consulta aos dados contidos em topic maps.
4.2 Principais conceitos
Os principais conceitos dos topic maps25 podem ser exemplificados pelos índices de
livros. Vejamos um exemplo dado por Pepper (2000, p. 4):
La Bohème, 10, 70, 197-198, 326
Cavalleria Rusticana, 71, 203-204
The Girl of the Golden West, see La fanciulla del West
Leoncavallo, Ruggiero
I Pagliacci, 71-72, 122, 247-249, 326
Madama Butterfly, 70-71, 234-236, 326
Manon Lescaut, 294
Mascagni, Pietro
Cavalleria Rusticana, 71, 203-204
Puccini, Giacomo, 69-71
La Bohème, 10, 70, 197-198, 326
La fanciulla del West, 291
Madama Butterfly, 70-71, 234-236, 326
Manon Lescaut, 294
Tosca, 26, 70, 274-276, 326
Turandot, 70, 282-284, 326
Rustic Chivalry, see Cavalleria Rusticana
singers, 39-52,
See also individual names
baritone, 46
bass, 46-47
soprano, 41-42, 337
tenor, 44-45
25 Os conceitos estão baseados na XTM e não na ISO 13250.
Topic maps como instrumentos de representação e recuperação da informação 39
Tosca, 26, 70, 274-276, 326
Turandot, 70, 282-284, 326
Podemos apontar as seguintes características:
• Cada entrada do índice corresponde a um tópico;
• O ver (see) corresponde aos nomes variantes de um mesmo tópico (não está
representado no exemplo).
• Os números de páginas correspondem às ocorrências;
• O ver também (see also) e as subentradas correspondem às associações;
• As convenções tipográficas (negrito, itálico) e os modificadores (ou qualificadores)
correspondem às diversas classes de tópicos e associações. No exemplo, os nomes
em itálico são as óperas, os números em negrito se referem às sinopses.
Além disso, num topic map os tópicos podem conter definições assim como os
termos de um glossário. As associações entre tópicos podem ser definidas, como num
tesauro.
Os topic maps possuem um pequeno número de conceitos (há somente 19
elementos no XTM26), porém, sua combinação permite estruturar vastas quantidades
de informação.
4.2.1 Tópico (topic)
O tópico é a unidade principal de um topic map. Um tópico representa um assunto
que, segundo a ISO 13250, pode ser qualquer coisa, seja ela o que for (conceito,
26 Esses elementos são descritos no apêndice.
Topic maps como instrumentos de representação e recuperação da informação 40
pessoa, entidade etc.). Em outras palavras, o tópico é um objeto (object) que reifica um
assunto (subject)27.
Um tópico pode pertencer a uma ou mais categorias, os topic types, que, por sua
vez, também são tópicos. Por exemplo, Puccini pode pertencer à categoria/tópico
Compositor.
Os tópicos têm 3 características: possuem nomes, ligam-se a ocorrências e
desempenham funções nas associações.
É desejável que um tópico tenha um ou mais nomes para poder ser melhor
entendido e manipulado. Ele pode ser apresentado com um nome ou outro
dependendo do contexto (escopo) definido. Por exemplo, a ópera La fanciulla del West,
no escopo “Inglês”, terá o nome The girl of the Golden West.
4.2.2 Ocorrência (occurrence)
Ocorrência é a indicação para um recurso informacional de qualquer natureza
(documento, comentário, citação etc.) ligado a um tópico. A ocorrência pode ser interna
(por exemplo, as datas e os locais de nascimento e morte de uma pessoa) ou externa ao
topic map (qualquer recurso referente ao tópico: documento, citação etc.).
A ocorrência interna é uma referência dentro do próprio topic map. A ocorrência
externa é a indicação para um recurso externo por meio de uma URI28.
27 Objeto corresponde ao significante/signo. Assunto corresponde ao referente/objeto imediato.
28 Universal Resource Identifier, indicador de recurso que funciona como um link de uma página Web.
Topic maps como instrumentos de representação e recuperação da informação 41
A vantagem da ocorrência externa é que se mantém a separação entre o topic map e
a fonte de informação. Em outras palavras, os tópicos e as ocorrências ficam em
“camadas” distintas. Dessa forma, um topic map pode ser aplicado a diversos
conjuntos de documentos, e um desses conjuntos, por sua vez, pode estar ligado a
vários topic maps. Além disso, um topic map, mesmo sem possuir ocorrências, tem
valor por si só, já que oferece a representação de uma ontologia29.
As ocorrências também podem pertencer a classes (occurrence types), tais como
livros, teses, fotos, músicas, web sites etc. Porém, a especificação não prescreve o uso
de metadados para descrever essas ocorrências, ou seja, não é possível descrever os
recursos (autor, título, data de publicação etc.)30.
4.2.3 Associação (association)
Uma associação descreve relações entre um ou mais tópicos. Numa associação
podemos identificar o tipo de associação (association type) e a função (association role)
desempenhada por cada tópico. Por exemplo, na associação entre Puccini e Tosca,
teremos a association type composição (ou obra composta por), onde Puccini tem o
“papel” de o compositor, e Tosca, desempenha o “papel” de ópera (note que, às vezes, a
association role se confunde com o topic type). São as associações que formam a
estrutura do topic map, estabelecendo conexões entre os diversos tópicos.
29 Representação simbólica do conhecimento humano num sistema lógico-formal (VICKERY, 1997).
30 É possível atribuir metadados aos recursos 1) transformando os recursos em tópicos e atribuindo ocorrências internas; 2) acoplando o topic map a um sistema de metadados, como uma base de dados relacional.
Topic maps como instrumentos de representação e recuperação da informação 42
4.2.4 Published subject indicators
O elemento subject identity tem por função identificar o conceito de um tópico e
diferenciá-lo dos outros. Isso pode ser feito referenciando um tópico a outro tópico (que
compartilha o mesmo conceito) ou a um URI (que representa o conceito do tópico).
Published subject indicator (PSI) é um URI publicado e reconhecido por uma ampla
comunidade. Segundo Vatant (2002), os PSI devem cumprir três requisitos: a)
Estabilidade (o URI deve ser permanente); b) Autoridade (a definição do PSI deve ter o
respaldo de uma autoridade no assunto); c) Confiança (conseqüência dos itens
anteriores). Por exemplo, um bom PSI para o tópico “topic maps” é o
http://www.topicmaps.org, pois o endereço é estável e os conceitos são discutidos
pelos próprios especialistas no assunto. Isso não significa que os conceitos publicados
num PSI sejam estáveis e definitivos. Pelo contrário, os conceitos são continuamente
debatidos e questionados por especialistas interessados no assunto. O significado dos
signos se modifica com o tempo. Conseqüentemente, os conceitos representados pelos
tópicos, que são signos, também se modificam, e os PSI devem acompanhar essas
mudanças.
This leads us to a sweet paradox. The best PSI is the one that is most likely to
change its content because it is maintained at the core of the community questioning the subject, and most subjects are moving targets (VATANT, 2002, p. 77).
Os PSI são mecanismos poderosos que transformam recursos eletrônicos em
indicadores confiáveis, permitindo a criação, compartilhamento e fusão de vastos
repositórios.
Topic maps como instrumentos de representação e recuperação da informação 43
4.2.5 Fusão (merge)
Dois ou mais topic maps podem ser fundidos, formando um só. No processo de
fusão, tópicos iguais presentes nos topic maps são fundidos, acumulando as
características singulares de cada um e eliminando as redundâncias. Há duas
situações em que os tópicos são fundidos:
• Quando os tópicos possuem o mesmo nome usado dentro do mesmo escopo. Por
exemplo, dois tópicos com nome manga dentro do escopo fruta deverão ser
fundidos;
• Quando os tópicos se referirem ao mesmo subject identity. Por exemplo, os tópicos
mandioca e macaxeira, apontando para o mesmo subject identity, serão fundidos.
Essa característica permite o compartilhamento de topic maps criados por diversos
desenvolvedores e organizações, e é um aspecto essencial para a manutenção de
vastos repositórios projetados para o uso na Web.
4.2.6 Escopo (scope)
Se o subject identity identifica o assunto representado por um tópico, o escopo
(scope) identifica o contexto no qual um nome é válido. Desse modo, tópicos diferentes
que possuem o mesmo nome serão diferenciados por meio dos seus respectivos
escopos. Por exemplo, tópicos com o nome manga podem ser diferenciados pelos
escopos fruta e vestuário.
Diferentes nomes dentro de um mesmo tópico são apresentados dentro dos escopos
que os definem. Por exemplo, se eu quero que o topic map seja apresentado em
português e não em italiano, verei os tópicos Brasil, macarrão e futebol, em vez de
Topic maps como instrumentos de representação e recuperação da informação 44
Brasile, pasta e calcio. Um biólogo talvez prefira identificar os seres vivos pelos nomes
científicos e não pelos nomes vulgares.
Figura 8: Tópico Puccini – software Ontopia Omnigator
Na figura acima estão exemplificados os conceitos tópico (names), topic type
(composer), scope (normal form; short name), subject identifier (URI remetendo ao
verbete “Puccini” na Wikipedia), occurrence, occurrence type (bibliography, article etc.),
association e association type (born in, composed, died in).
4.3 Visualização
A visualização de um topic map pode ser variada. Como as especificações não
prescrevem os tipos de apresentação, isso fica por conta dos aplicativos. Le Grand
(2002), Le Grand e Soto (2000) e Lima (2004) descrevem alguns tipos de visualização
que podem ser aplicados aos topic maps.
Topic maps como instrumentos de representação e recuperação da informação 45
Para fins de busca (search), a apresentação em forma de listas (ver figura acima)
pode ser suficiente. A apresentação gráfica é útil para a navegação (browsing). Há
várias técnicas de visualização gráfica:
• Grafo: apresentação em forma de nós e arcos, úteis para a apresentação da
estrutura global do topic map;
Figura 9: Grafo – Software Ontopia Ominigator
• Grafo hiperbólico: possui uma curvatura que privilegia o detalhe no centro e o
contexto na periferia;
Topic maps como instrumentos de representação e recuperação da informação 46
Figura 10: Grafo hiperbólico – Web page da Highware Press31
• Grafo tridimensional: diversas camadas (classes e objetos, ou tópicos e ocorrências)
são apresentadas simultaneamente;
Figura 11: Grafo tridimensional32
31 Disponível em http://highwire.stanford.edu/help/hbt/.
32 Fonte: Le Grand e Soto (2000, p. 8).
Topic maps como instrumentos de representação e recuperação da informação 47
• Mapa: apresentação semelhante a um mapa geográfico. A topografia, por exemplo,
pode simular a quantidade de documentos ligados aos tópicos;
• Realidade virtual: topic maps podem ser apresentados, por exemplo, como cidades,
com edifícios (tópicos) interligados por ruas e avenidas (associações).
“Representing topic maps as populated virtual worlds may help users work collectively. Virtual reality techniques include interactivity and the use of different
levels of detail. […] Immersion in virtual worlds makes users feel more involved in the visualization. They may explore the world and interact with data” (LE GRAND, 2002, p. 280).
Apesar de essa última técnica parecer um exagero, ela mostra que as técnicas e os
instrumentos de visualização de mapas de conhecimento ainda podem evoluir muito e
permitir melhor acesso às informações.
Alguns procedimentos podem ser úteis, independentemente da técnica utilizada. A
distância entre os nós pode refletir a proximidade semântica dos tópicos. Cores e
formas podem diferenciar os tipos de nós, associações e ocorrências. A quantidade e o
detalhamento dos elementos devem se ajustar às necessidades de uso. A navegação
deve ser eficiente e intuitiva, além de se ajustar ao tipo de usuário (por exemplo, não
oferecer técnicas complexas aos iniciantes).
4.4 Características
Os topic maps apresentam as seguintes características:
• Equilíbrio entre simplicidade e complexidade: os topic maps possuem um pequeno
número de elementos que, combinados, podem descrever estruturas complexas33;
33 A TMCN (em desenvolvimento) restringe a sintaxe dos topic maps, evitando que os topic maps se tornem muito complexas ou inconsistentes (COLMENERO, 2005).
Topic maps como instrumentos de representação e recuperação da informação 48
• Neutralidade e estabilidade: as especificações são desenvolvidas por organizações
independentes, como a ISO, e utilizam uma linguagem aberta (não proprietária) e
amplamente aceita. Isso impede o monopólio das corporações e garante o
desenvolvimento das especificações livre de interesses puramente comerciais;
• Compartilhamento: as especificações possuem mecanismos (cujo principal é a noção
de published subject) que facilitam o compartilhamento de informações entre
diversos topic maps, que podem até ser fundidos.
• Camada conceitual separada da camada recursos: uma das características que
diferencia um topic map dos outros tipos de representação por grafos, como as
redes semânticas, é a existência da camada de ocorrências submetida à camada de
tópicos, que contém os nós e arcos. Dessa forma, uma camada, que é conceitual,
ontológica, se sobrepõe a uma outra camada, formada por elementos que podemos
chamar de recursos, objetos ou documentos.
• Estrutura voltada para conceitos: o conceito (tópico) é a principal unidade. Os
recursos (ocorrências) existem em função dos conceitos (pode haver tópicos sem
ocorrências, mas não o contrário). Ou seja, o modelo é centrado na informação e
não nos recursos (NEWCOMB, 2002).
4.5 Aplicações
Os topic maps podem ser usados para: a) representação de conceitos; b) navegação
hipertextual; c) recuperação da informação (COLMENERO, 2005). Dessa forma, os
topic maps podem ser aplicados na organização de recursos eletrônicos (portais,
enciclopédias, intranets etc.), como instrumento de aprendizado em salas de aula e
como vocabulários estruturados para recuperação da informação.
Topic maps como instrumentos de representação e recuperação da informação 49
Garshol (2004) faz uma comparação entre diversos tipos de vocabulários
estruturados (taxonomia, tesauro, classificação facetada, ontologia). Todos esses
vocabulários podem ser representados como topic maps. Os topic maps evidenciam a
potencialidade (e também as limitações) dos diversos vocabulários estruturados, dando
suporte à estruturação, definição e apresentação dos descritores.
4.5.1 Integração dos topic maps à Web Semântica
A Web Semântica (Semantic Web) é um projeto da World Wide Web Consortium
(W3C) para a estruturação da World Wide Web (WWW ou Web, um dos principais
protocolos da Internet), de forma que as informações contidas nessa rede possam ser
organizadas e recuperadas mais facilmente. A primeira linguagem usada para a
construção de web sites foi o HTML34, derivada da SGML, voltada mais para a
apresentação visual e do que para a estruturação do conteúdo. Dessa forma, as
informações contidas num site podem fazer sentido para as pessoas, mas não para as
máquinas35. Por exemplo, a frase “o livro XML Topic Maps, editado por Jack Park,
custa R$ 160,00” é, para a máquina, uma simples cadeia de palavras (ou bits), não
haverá distinção entre livro, autor e preço.
Por esse motivo, foi criada a linguagem XML), subconjunto da SGML, simplificada e
orientada para a Web, cuja ênfase é permitir a interpretação do conteúdo por
máquinas por meio de marcas (tags) de conteúdo. A W3C desenvolveu ferramentas
baseadas em XML, como a RDF36, a OWL37 e o SKOS38 para a construção de esquemas
34 Hypertext Markup Language.
35 A “interpretação” das máquinas se dá em termos de processamento, não tem nada a ver com a interpretação humana.
36 Resource Description Framework.
Topic maps como instrumentos de representação e recuperação da informação 50
de metadados e vocabulários, que permitirão aos agentes automatizados interpretarem
dados estruturados.
Os topic maps, apesar de não serem um produto da W3C, podem ser usados em
conjunto com a RDF e a OWL, já que, apesar de esses instrumentos terem aspectos em
comum, são complementares (FREESE, 2002; VATANT, 2004).
37 Web Ontology Language.
38 Simple Knowledge Organisation System.
Topic maps como instrumentos de representação e recuperação da informação 51
5 Considerações finais
Está na moda falar em mudança de paradigma. Na Ciência da Informação não é
diferente. Do paradigma da conservação do acervo passamos para o paradigma do
acesso do usuário à informação. Com muito custo começamos a perceber que mais
vale um livro na mão do que dois mofando.
Os topic maps representam de fato uma mudança de paradigma. As bases de dados
bibliográficas baseiam-se em metadados, ou seja, na representação dos documentos
por meio de seus atributos. Essa abordagem se mostra eficiente quando damos
importância aos documentos e não às informações contidas neles. É possível
realizarmos buscas insólitas por livros que tenham entre 150 e 170 páginas, que foram
editados em São Paulo ou que tenham índices e sumários. Isso não é o paradigma do
acervo?
Os topic maps baseiam-se na representação de estruturas conceituais aos quais os
documentos são relacionados. Representam um modelo centrado na informação, não
nos documentos. Esse modelo permite filtragem de informações para a apresentação
somente de aspectos relevantes. Também pode oferecer modelos sofisticados de busca.
The topic maps paradigm recognizes that everything and anything can be a subject of conversation, and that every subject of conversation can be a hub around which data resources can orbit. Unlike the resource-centric view in which metadata orbits data resources, in the subject-centric view, data orbits subjects […]
(NEWCOMB, 2002, p. 43)
Com os topic maps podemos efetivamente abandonar o paradigma do acervo e
adotar o paradigma da informação.
Topic maps como instrumentos de representação e recuperação da informação 52
A Web é, provavelmente, o maior repositório de informação jamais criado, porém,
ela é ainda muito desestruturada (CHISLENKO, 199739 apud PARK, 2002). Em
contraste, as bibliotecas e unidades de informação possuem acervos limitados (em
comparação com a Web), porém, altamente estruturados. A Ciência da Informação,
naturalmente, pode contribuir (e já contribui) para a estruturação do conteúdo na
Web. Porém, o movimento contrário também pode ocorrer. Os topic maps, concebidos
para a organização da Web, oferecem uma nova perspectiva às bibliotecas.
39 CHISLENKO, Alexander. Semantic Web vision paper [online]. 1997. Disponível em: http://lucifer.com/~sasha/articles/SemanticWeb.html. Acesso em: 2 dez. 2005.
Topic maps como instrumentos de representação e recuperação da informação
53
Referências40
ADAMS, Katherine. The Semantic Web. Online, Weston, Conn., v. 26, n. 4, p. 20-3, July/Aug. 2002.
BAX, Marcelo P.; SOUZA, Renato R. Uma Proposta de Uso de Agentes e Mapas Conceituais para Representação de Conhecimentos Altamente Contextualizados [online] In: SIMPÓSIO INTERNACIONAL DE GESTÃO DO CONHECIMENTO/GESTÃO DE DOCUMENTOS - ISKM/DM, 4., 2001, Curitiba. Disponível em: <http://www.bax.com.br/research/publications/agentes>. Acesso em: 21 abr. 2005.
BORDENAVE, Juan. O que é comunicação. São Paulo: Brasiliense, 1984.
BOTTRILL, J.; LOCK, R. Do students learn from pictures or from text? Science Review, n. 74, p. 109-112, 1993.
CASTELLS, Manuel. Internet e sociedade em rede. In: MORAES, Denis de (org). Por uma outra comunicação. Rio de Janeiro: Record, 2003. p. 255-287.
CHISLENKO, Alexander. Semantic Web vision paper [online]. 1997. Disponível em: http://lucifer.com/~sasha/articles/SemanticWeb.html. Acesso em: 2 dez. 2005.
COLMENERO RUIZ, María Jesús. Introducción al modelo Topic Maps (ISO/IEC13250:2003). Revista Digital de Biblioteconomia e Ciência da Informação, v. 3, n. 1, 2005.
ECO, Umberto. Conceito de texto. São Paulo: T.A. Queiroz; Edusp, 1984.
ECO, Umberto. Marco Polo e o unicórnio. In: Kant e o ornitorrinco. Rio de Janeiro: Record, 1998.
ECO, Umberto. O signo. 4ª ed. Lisboa: Presença, 1990.
EPSTEIN, Isaac. O signo. 4. ed. São Paulo: Ática, 1991.
ERVIN, Susan. A linguagem na psicologia humana. In: Tax, S. (org.) Panorama da Antropologia. Rio de Janeiro: Fundo de Cultura, 1966. p. 55-65.
FISHER, Kathleen M. Prediction: a profound paradigm shift. In: PARK, Jack; HUNTING, Sam (ed.). XML Topic Maps: creating and using topic maps for the Web. Boston: Addison-Wesley, 2002. cap. 16, p. 477-506.
FREESE, Eric. Topic maps and RDF. In: PARK, Jack; HUNTING, Sam (ed.). XML Topic Maps: creating and using topic maps for the Web. Boston: Addison-Wesley, 2002. cap. 12, p. 283-325.
40 Norma utilizada: ABNT. NBR 6023: Informação e documentação: Referências: Elaboração. Rio de Janeiro, 2002.
Topic maps como instrumentos de representação e recuperação da informação
54
GARSHOL, Lars M. Metadata? Thesauri? Taxonomies? Topic Maps!: Making sense of it all [online]. 26 Oct. 2004. Disponível em: <http://www.ontopia.net/topicmaps/materials/tm-vs-thesauri.html>. Acesso em: 25 abr. 2005.
GRANGER, Gilles G. Filosofia do estilo. São Paulo: Perspectiva, 1974.
ISO; IEC. ISO/IEC 13250: Topic maps [online]. 2nd ed. 2002. Disponível em: <http://y12web2.y12.doe.gov/sgml/sc34/document/0322_files/iso13250-2nd-ed-v2.pdf>. Acesso em: 28 nov. 2005.
KAPOR, Mitchell. Mitchell Kapor quotes. In: BrainyQuote [online]. Disponível em: <http://www.brainyquote.com/quotes/quotes/m/mitchellka163583.html>. Acesso em: 24 nov. 2005.
LANCASTER, F.W. Information retrieval systems: characteristics, testing and evaluation. New York: John Wiley & Sons, 1979.
LARA, Marilda L.G. É possível falar em signo e semiose documentária? Encontros Bibli, n. 21, 2005. No prelo.
LARA, Marilda L.G. O processo de construção da informação documentária e o processo de conhecimento. Perspectivas em Ciência da Informação, Belo Horizonte, v. 7, n. 2, p. 127-139, jul./dez. 2002.
LE GRAND, Bénédicte. Topic map visualization. In: PARK, Jack; HUNTING, Sam (ed.). XML Topic Maps : creating and using topic maps for the Web. Boston: Addison-Wesley, 2002. cap. 11, p. 267-282.
LE GRAND, Bénédicte; SOTO, Michel. Information management - Topic Maps visualization. In: XML Europe 2000 [online], 2000, Paris. 11 p. Disponível em: <http://www.gca.org/papers/xmleurope2000/pdf/s29-03.pdf>. Acesso em: 21 abr. 2005.
LIMA, Gercina A.B.O. Mapa hipertextual (MHTX): um modelo para organização hipertextual de documentos. 2004. 199 f. Tese (Doutorado em Ciência da Informação) – Escola de Ciência da Informação, Universidade Federal de Minas Gerais, Belo Horizonte, 2004.
LOPES, Edward. Fundamentos da Lingüística contemporânea. São Paulo: Cultrix, 1995.
MARCONDES, Carlos H. Representação e economia da informação. Ciência da Informação [online], Brasília, v. 30, n. 1, p. 61-70, jan./abr. 2001. Disponível em: <http://www.ibict.br/cienciadainformacao/viewarticle.php?id=260&layout=abstract>. Acesso em 28 nov. 2005.
MAYER, R.E.; SIMS, V.K. For whom is a picture worth a thousand words?: extensions of the dual-coding theory of multimedia learning. Journal of Educational Psychology, n. 46, p. 389-401, 1994.
Topic maps como instrumentos de representação e recuperação da informação
55
MOREIRO GONZÁLEZ, José; et al. De los tesauros a los topic maps: nuevo estándar para la representación y la organización de la información [online]. Encontros Bibli, Florianópolis, n. 18, 2. sem. 2004. Disponível em: <http://www.encontros-bibli.ufsc.br/Edicao_18/1_De_los_tesauros.pdf>. Acesso em: 07 maio 2005.
NEWCOMB, Steven R. A perspective on the quest for global knowledge interchange. In: PARK, Jack; HUNTING, Sam (ed.). XML Topic Maps : creating and using topic maps for the Web. Boston: Addison-Wesley, 2002. cap. 3, p. 31-50.
PARK, Jack. Topic maps, the Semantic Web, and education. In: PARK, Jack; HUNTING, Sam (ed.). XML Topic Maps : creating and using topic maps for the Web. Boston: Addison-Wesley, 2002. cap. 17, p. 507-529.
PEPPER, Steve. The TAO of Topic Maps: finding the way in the age of infoglut [online]. 11 Apr. 2000. Disponível em: <http://www.gca.org/papers/xmleurope2000/pdf/s11-01.pdf>. Acesso em: 20 abr. 2005.
RATH, H.H. The topic maps handbook [online]. Version 1.1. Gütersloh, Germany: Empolis, 2003. Disponível em: <http://www.empolis.com/downloads/empolis_TopicMaps_Whitepaper20030206.pdf>. Acesso em: 21 jun. 2005.
SAGER, Juan C. Prólogo: la terminología, puente entre varios mundos. In: CABRÉ, M.T. La terminología: teoría, metodología, aplicaciones. Barcelona: Antártida; Empúres, 1993. p. 11-17.
STANDING, L.; CONEZIO, J; HABER, R.N. Perception and memory for pictures: single trial learning of 2500 visual stimuli. Psychonomic Science, n. 19, p. 73-84, 1970.
TOPICMAPS.ORG. XML Topic Maps (XTM) [online]. Version 1.0. 2001. Disponível em: <http://topicmaps.org/xtm/>. Acesso em: 28 nov. 2005.
VALENCIA, Asdrúbal. El libro e su futuro. Revista Interamericana de Bibliotecología, Medellín, v. 21, n. 1, p. 15-47, ene./jun. 1998.
VATANT, Bernard. Ontology-driven topic maps [online]. 2004. Disponível em: <http://www.idealliance.org/europe/04/call/xmlpapers/03-03-03.91/.03-03-03.html>. Acesso em: 18 nov. 2005.
VATANT, Bernard. Topic maps from representation to identity: conversation, names, and published subject indicators. In: PARK, Jack; HUNTING, Sam (ed.). XML Topic Maps : creating and using topic maps for the Web. Boston: Addison-Wesley, 2002. cap. 5, p. 67-79.
VICKERY, B.C. Ontologies. Journal of Information Science, v. 23, n. 4, p. 277-286, 1997.
WIKIPEDIA [online]. Disponível em: <http://wikipedia.org/>. Acesso em 21 jun. 2005.
Topic maps como instrumentos de representação e recuperação da informação
56
Apêndice
Elementos da XTM 1.0
Breve descrição dos 19 elementos do XTM. “Sub-elementos” indica os elementos
subordinados ao elemento descrito. “Ocorre em” indica os elementos superordenados
onde o elemento descrito pode aparecer.
<association>
Estabelece uma relação entre topics.
Subelementos: <instanceOf>, <scope>, <member>.
Ocorre em: <topicMap>.
<baseName>
Nome base de um topic.
Sub-elementos: <scope>, <baseNameString>, <variant>.
Ocorre em: <topic>.
<baseNameString>
Cadeia de caracteres que representa o base name de um topic.
Ocorre em: <baseName>.
<instanceOf>
Aponta para um topic ou subject indicator que representa uma classe (topic type/association type/occurrence type).
Sub-elementos: <topicRef>, <subjectIndicatorRef>.
Ocorre em: <topic>, <occurrence>, <association>.
<member>
Aponta para um ou mais topics que possuem uma determinada função (role) numa association.
Sub-elementos: <roleSpec>, <topicRef>, <resourceRef>, <subjectIndicatorRef>.
Ocorre em: <association>.
<mergeMap>
Aponta para um topic map externo para fins de fusão (merge).
Sub-elementos: <topicRef>, <resourceRef>, <subjectIndicatorRef>.
Ocorre em: <topicMap>.
Topic maps como instrumentos de representação e recuperação da informação
57
<occurrence>
Aponta para informações e recursos considerados relevantes a um topic.
Sub-elementos: <instanceOf>, <scope>, <resourceRef>, <resourceData>.
Ocorre em: <topic>.
<parameters>
Parâmetros para a exibição do variant name.
Sub-elementos: <topicRef>, <subjectIndicatorRef>.
Ocorre em: <variant>.
<resourceData>
Cadeia de caracteres que representa uma occurrence ou um variant name.
Ocorre em: <occurrence>, <variantName>.
<resourceRef>
Referencia um recurso endereçável (addressable resource).
Ocorre em: <member>, <mergeMap>, <occurrence>, <scope>, <subjectIdentity>, <variantName>.
<roleSpec>
Especifica a função (role) de um ou mais topics numa association.
Sub-elementos: <topicRef>, <subjectIndicatorRef>.
Ocorre em: <member>.
<scope>
Referencia topics, addressable resources e subject indicators que definem(m) o escopo.
Sub-elementos: <topicRef>, <resourceRef>, <subjectIndicatorRef>.
Ocorre em: <baseName>, <occurrence>, <association>.
<subjectIdentity>
Assunto ou conceito reificado (representado) por um topic por meio de um addressable resource, subject indicator ou outro topic.
Sub-elementos: <resourceRef>, <topicRef>, <subjectIndicatorRef>.
Ocorre em: <topic>.
<subjectIndicatorRef>
Referencia um subject indicator.
Ocorre em: <instanceOf>, <member>, <mergeMap>, <parameters>, <roleSpec>, <scope>, <subjectIdentity>.
Topic maps como instrumentos de representação e recuperação da informação
58
<topic>
Tópico (topic).
Sub-elementos: <instanceOf>, <subjectIdentity>, <baseName>, <occurrence>.
Ocorre em: <topicMap>.
<topicMap>
Documento topic map.
Sub-elementos: <topic>, <association>, <mergeMap>.
<topicRef>
Referencia um topic.
Ocorre em: <instanceOf>, <member>, <mergeMap>, <parameters>, <roleSpec>, <scope>, <subjectIdentity>.
<variant>
Forma variante de um base name que serve a propósitos específicos, como ordenação (sort) e exibição (display) em dispositivos específicos (como handhelds).
Sub-elementos: <parameters>, <variantName>, <variant>.
Ocorre em: <baseName>.
<variantName>
Cadeia de caracteres ou referência a elementos externos (imagens, sons etc.) que representa um variant name.
Sub-elementos: <resourceRef>, <resourceData>.
Ocorre em: <variant>.
Topic maps como instrumentos de representação e recuperação da informação
59
Elementos na estrutura da XTM 1.0
<topicMap>
<topic>
<instanceOf>
<subjectIdentity>
<resourceRef>
<topicRef>
<subjectIndicatorRef>
<baseName>
<scope>
<baseNameString>
<variant>
<parameters>
<variantName>
<resourceRef>
<resourceData>
<variant>
<occurrence>
<instanceOf>
<scope>
<resourceRef>
<resourceData>
<association>
<instanceOf>
<scope>
<member>
<roleSpec>
<topicRef>
<subjectIndicatorRef>
<topicRef>
<resourceRef>
<subjectIndicatorRef>
<mergeMap>
<topicRef>
<resourceRef>
<subjectIndicatorRef>
Topic maps como instrumentos de representação e recuperação da informação
60
Índice
associação (topic map), 42
cabeçalho de assunto, 26
Ciência da Informação
paradigmas, 52–53
classificação enciclopédica, 25
classificação facetada, 25
conhecimento
externalização, 30
internalização, 30
continuum. ver objeto dinâmico
DeCS, 34
Document Type Definition. ver DTD
DTD, 38
escopo (topic map), 44–45
fusão (topic map), 44
GPS, 13
grafo, 46
grafo hiperbólico, 46
grafo tridimensional, 47
HTML, 50
HyperText Markup Language. ver HTML
HyTime, 38
índice, 37, 39
informação
como construção, 24
como reprodução, 24, 25
interpretação, 36
produção, 12
recuperação, 12, 13, 22–24
representação, 15–32
Internet, 13
interpretante, 16, 20
ISO 13250, 38
linguagem simbólica, 15
mapa, 26, 48
mapa conceitual, 26, 27
mapa de conhecimento, 27–31
mapa mental, 28
metadado, 23, 33, 51, 52
objeto dinâmico, 16, 20
objeto imediato, 16
ocorrência (topic map), 41–42
ontologia, 27
OWL, 51
published subject indicator, 43
RDF, 51
realidade virtual (visualização), 48
recuperação da informação, 12, 13, 22–24
rede semântica, 29
representação da informação, 15–32
Resource Description Framework. ver RDF
Semantic Web. ver Web Semântica
SGML, 38
signo, 15–24
signo artificial, 19
signo documentário, 19–25
Simple Knowledge Organisation System. ver SKOS
sistema de recuperação da informação. ver SRI
SKOS, 51
SRI, 15, 33–36
subject identity (topic map), 43
Topic maps como instrumentos de representação e recuperação da informação
61
Terminologia, 26
tesauro, 26, 27
TMCL, 39
TMQL, 39
topic map, 13, 37–51
aplicações, 49
association, 42
conceitos, 39–45
histórico, 38–39
merge, 44
occurrence, 41–42
published subject indicator, 43
scope, 44–45
topic, 40–41
visualização, 45–48
Topic Map Constraint Language. ver TMCL
Topic Map Query Language. ver TMQL
tópico (topic map), 40–41
triângulo semiótico, 15
visualização (topic map), 45–48
vocabulário estruturado, 25–27, 34, 50
Web, 44, 50
Web Ontology Language. ver OWL
Web Semântica, 50–51
World Wide Web. ver Web
XML, 51
XML Topic Maps. ver XTM
XTM, 38
top related