indexacao margarida frois
DESCRIPTION
Workshop BTRANSCRIPT
Indexação
� principal objectivo da indexação é assegurar a recuperação de qualquer documento ou informação no momento em que o utilizador procura um assunto num catálogo bibliográfico.
� A indexação de assuntos envolve duas etapas principais: a análise do documento para definir que assuntos são tratados e fazer a transposição desses assuntos para
conceitos e em seguida transformar estes conceitos em linguagem documental de termos controlados.
Processo de Indexação
� Fazer a abordagem do documento, determinar o seu assunto principal,
reconhecer os elementos essenciais que devem ser realçados e descritos, extrair os
conceitos, estabelecer a sua correspondência em linguagem documental e verificar a
pertinência dessa representação, são as etapas sucessivas para transmitir, de forma
inequívoca, o conteúdo do documento com o objectivo final da difusão correcta da
informação.
Normalização
As normas em que nos apoiamos: NP 3715, de 1989, e a NP
4036, de 1992 são pouco claras.
Estas normas são mais um corpo metodológico de
acompanhamento no processo de indexação.
Tipos de Linguagens
� Linguagem Categorial � Linguagem Combinatória
1 - Utiliza palavras
2 - Os termos podem não estar dependentes de uma estrutura hierárquica previamente estabelecida
3 - Ordenação alfabética dos termos
4 - Os termos podem ser usados “soltos”, combinando-se livremente entre si. (pós coordenação)
1 - Utiliza notações
2 - As notações integram-se num plano pré-estabelecido (pré-coordenação)
3 - Ordenação sistemática
4 - As notações estão localizadas num ponto especifico do plano
(tabela)
Linguagem Categorial
A linguagem categorial estrutura-se no que vulgarmente se designapor classificações.
As classificações não utilizam termos da linguagem natural, masum código (notação), que pode ser composto por algarismos,
letras e outros símbolos gramaticais.Elaborada no início do século XX, a CDU apresenta-se como um
plano destinado à classificação do conjunto do conhecimento humano.
Permite reagrupar todas as referências relativas a um determinado assunto e, posteriormente, localizar rapidamente essa
documentação. Graças à sua notação normalizada facilmente utilizável é aplicada
universalmente, embora com maior relevância na Europa.
Classificação Decimal Universal
Partindo do conceito considerado o mais geral, considera que lheestão subordinados outros conceitos mais restritivos e
específicos. O conceito mais geral determina a classe principal à qual pertence o documento, podendo-se acrescentar tantas subclasses quantas o documento assim o permitir e o perfil do
utilizador assim o determinar.
Linguagem Combinatória
� É uma linguagem pós-coordenada, expressa em thesaurus ou listas estruturadas de termos, cujo princípio repousa na
combinação entre os termos.
� As palavras (conceitos) não estão dependentes de umaestrutura hierárquica previamente estabelecida, podendo ser
combinados livremente entre si (pós coordenação).
Dentro deste grupo de linguagens documentais encontram-se:· Listas de encabeçamentos de assuntos;
· Thesaurus (no plural Thesauri)
Thesaurus
Numa definição sucinta, poder-se-ia dizer que o thesaurus é composto por uma lista alfabética de descritores que evidenciam as diferentes
relações existentes entre si.
Para além dos descritores o thesaurus contém também identificadores, na sua maior parte constituídos por nomes próprios, nomes de lugares
e instituições.
Listas de termos
A lista de termos controlados constrói-se à medida que os conceitos vão sendo transformados em pontos de acesso para
a recuperação da informação.
Vocabulário controlado
o vocabulário controlado estabelece a forma de representar os assuntos que compõem uma área limitada do conhecimento, tornando possível
maior coerência entre os termos indexados.
A partir do conteúdo real do documento o indexador deverá decidir:
– a parte desse conteúdo que será susceptível de responder realmente às necessidades dos utilizadores;– os conceitos importantes que devem ser conservados para representar este conteúdo;– os descritores definidos para representar esses conceitos
Regras de Indexação
a) Número de palavras por descritor
Os descritores podem ser formados por uma ou mais palavras, sendo importante que expressem adequadamente o conceito.
Entretanto, recomenda-se que esse número de palavras seja o menor possível.
Regras de Indexação� b) Uso de singular e do plural
Os termos do vocabulário controlado devem ser usados no singular, mas o plural é admitido em determinadas circunstâncias.
A norma NP 4036 determina:� Quando os termos são enumeráveis (quantos) aplica-se o
plural.� Quando os termos não são enumeráveis (quanto) aplica-se o
singular
Regras de Indexação
� c) SinónimosQuando um conceito pode ser expresso por dois ou mais termos diferentes, escolhe-se um deles como descritor, fazendo-se remissiva dos demais. O descritor mais conhecido pelo utilizador deve ser
escolhido como termo indexador. � Ex.: arte sacra
e não
� arte religiosa
Regras de Indexação
� d) Descritores compostosNos descritores compostos as palavras são apresentadas na sua ordem natural.
� Ex.: ensino em grupoe não � grupo, ensino em
Regras de Indexação
e) Termos homógrafos ou inconsistentes
� Os termos homógrafos ou inconsistentes podem ser definidos pelo acréscimo de palavras elucidativas. Esse acréscimo pode ser feito colocando-se palavras elucidativas após o termo principal, que identifica o assunto de um documento separando os descritores por dois pontos ( : )
� Ex.: surrealismo : arte � surrealismo : literatura