indexacao margarida frois

19
Tratamento Documental Indexação / Classificação Margarida Custódio Fróis 2011

Upload: encontro-bibliotecas

Post on 05-Jun-2015

1.128 views

Category:

Education


3 download

DESCRIPTION

Workshop B

TRANSCRIPT

Tratamento Documental

Indexação / Classificação

Margarida Custódio Fróis2011

Indexação

� principal objectivo da indexação é assegurar a recuperação de qualquer documento ou informação no momento em que o utilizador procura um assunto num catálogo bibliográfico.

� A indexação de assuntos envolve duas etapas principais: a análise do documento para definir que assuntos são tratados e fazer a transposição desses assuntos para

conceitos e em seguida transformar estes conceitos em linguagem documental de termos controlados.

Linguagem natural

� Comunicação imediata

� Ambígua

� Equívoca

� Arbitrária

� Livre

Linguagem documental

• Comunicação diferida• Precisa• Unívoca

• Controlada

Processo de Indexação

� Fazer a abordagem do documento, determinar o seu assunto principal,

reconhecer os elementos essenciais que devem ser realçados e descritos, extrair os

conceitos, estabelecer a sua correspondência em linguagem documental e verificar a

pertinência dessa representação, são as etapas sucessivas para transmitir, de forma

inequívoca, o conteúdo do documento com o objectivo final da difusão correcta da

informação.

Normalização

As normas em que nos apoiamos: NP 3715, de 1989, e a NP

4036, de 1992 são pouco claras.

Estas normas são mais um corpo metodológico de

acompanhamento no processo de indexação.

Tipos de Linguagens

� Linguagem Categorial � Linguagem Combinatória

1 - Utiliza palavras

2 - Os termos podem não estar dependentes de uma estrutura hierárquica previamente estabelecida

3 - Ordenação alfabética dos termos

4 - Os termos podem ser usados “soltos”, combinando-se livremente entre si. (pós coordenação)

1 - Utiliza notações

2 - As notações integram-se num plano pré-estabelecido (pré-coordenação)

3 - Ordenação sistemática

4 - As notações estão localizadas num ponto especifico do plano

(tabela)

Linguagem Categorial

A linguagem categorial estrutura-se no que vulgarmente se designapor classificações.

As classificações não utilizam termos da linguagem natural, masum código (notação), que pode ser composto por algarismos,

letras e outros símbolos gramaticais.Elaborada no início do século XX, a CDU apresenta-se como um

plano destinado à classificação do conjunto do conhecimento humano.

Permite reagrupar todas as referências relativas a um determinado assunto e, posteriormente, localizar rapidamente essa

documentação. Graças à sua notação normalizada facilmente utilizável é aplicada

universalmente, embora com maior relevância na Europa.

Classificação Decimal Universal

Partindo do conceito considerado o mais geral, considera que lheestão subordinados outros conceitos mais restritivos e

específicos. O conceito mais geral determina a classe principal à qual pertence o documento, podendo-se acrescentar tantas subclasses quantas o documento assim o permitir e o perfil do

utilizador assim o determinar.

Linguagem Combinatória

� É uma linguagem pós-coordenada, expressa em thesaurus ou listas estruturadas de termos, cujo princípio repousa na

combinação entre os termos.

� As palavras (conceitos) não estão dependentes de umaestrutura hierárquica previamente estabelecida, podendo ser

combinados livremente entre si (pós coordenação).

Dentro deste grupo de linguagens documentais encontram-se:· Listas de encabeçamentos de assuntos;

· Thesaurus (no plural Thesauri)

Thesaurus

Numa definição sucinta, poder-se-ia dizer que o thesaurus é composto por uma lista alfabética de descritores que evidenciam as diferentes

relações existentes entre si.

Para além dos descritores o thesaurus contém também identificadores, na sua maior parte constituídos por nomes próprios, nomes de lugares

e instituições.

Listas de termos

A lista de termos controlados constrói-se à medida que os conceitos vão sendo transformados em pontos de acesso para

a recuperação da informação.

Vocabulário controlado

o vocabulário controlado estabelece a forma de representar os assuntos que compõem uma área limitada do conhecimento, tornando possível

maior coerência entre os termos indexados.

A partir do conteúdo real do documento o indexador deverá decidir:

– a parte desse conteúdo que será susceptível de responder realmente às necessidades dos utilizadores;– os conceitos importantes que devem ser conservados para representar este conteúdo;– os descritores definidos para representar esses conceitos

Regras de Indexação

a) Número de palavras por descritor

Os descritores podem ser formados por uma ou mais palavras, sendo importante que expressem adequadamente o conceito.

Entretanto, recomenda-se que esse número de palavras seja o menor possível.

Regras de Indexação� b) Uso de singular e do plural

Os termos do vocabulário controlado devem ser usados no singular, mas o plural é admitido em determinadas circunstâncias.

A norma NP 4036 determina:� Quando os termos são enumeráveis (quantos) aplica-se o

plural.� Quando os termos não são enumeráveis (quanto) aplica-se o

singular

Regras de Indexação

� c) SinónimosQuando um conceito pode ser expresso por dois ou mais termos diferentes, escolhe-se um deles como descritor, fazendo-se remissiva dos demais. O descritor mais conhecido pelo utilizador deve ser

escolhido como termo indexador. � Ex.: arte sacra

e não

� arte religiosa

Regras de Indexação

� d) Descritores compostosNos descritores compostos as palavras são apresentadas na sua ordem natural.

� Ex.: ensino em grupoe não � grupo, ensino em

Regras de Indexação

e) Termos homógrafos ou inconsistentes

� Os termos homógrafos ou inconsistentes podem ser definidos pelo acréscimo de palavras elucidativas. Esse acréscimo pode ser feito colocando-se palavras elucidativas após o termo principal, que identifica o assunto de um documento separando os descritores por dois pontos ( : )

� Ex.: surrealismo : arte � surrealismo : literatura

Regras de Indexação

� f) Identificadores geográficosOs descritores geográficos associados a um outro assunto devem ser representados em ordem indirecta, excepto no caso de estarem relacionados com a literatura.

� Ex.: filosofia : ocidente � pintura renascentista : Itália mas� literatura alemã