elin k. jacob - classificação e categorização

Classificação e Categorização: Uma diferença que faz a diferença

ELIN K. JACOB*

Traduzido por Isadora Garrido, 27.05.2011 [[email protected]]

RESUMO

O EXAME DAS PROPRIEDADES SISTÊMICAS E MODOS de interação que caracterizam a classificação e categorização revelam diferenças sintáticas fundamentais entre as estruturas de sistemas de classificação e categorização. Essas distinções levam à diferenças significantes nos contextos os quais a informação pode ser apreendida e pode influenciar a informação semântica disponível para as pessoas. Diferenças estruturais e semânticas entre a classificação e categorização são diferenças que fazem a diferença no ambiente informacional influenciando as atividades funcionais de um sistema de informação e contribuindo para sua constituição como ambiente informacional. INTRODUÇÃO

Várias respostas diferentes e às vezes conflitantes podem ser feitas à pergunta "O

que é informação?" Floridi (impresso) identifica três categorias amplas que pretendem elucidar

as abordagens predominantes à compreensão do ambíguo fenômeno chamado informação: informação como realidade (ou informação ecológica), informação para realidade (ou

informação instrucional), e informação sobre a realidade (ou informação semântica). A

Elin K. Jacob, Escola de Biblioteconomia e Ciência da Informação, Indiana University-Bloomington, 1320 E. 10th St., Bloomington, IN 47405-1801 LIBRARY TRENDS, Vol. 52, N. 3, Winter 2004, p. 515-540 © 2004 The Board of Trustees, University of Illinois

abordagem adotada aqui é que a informação é "a diferença que faz a diferença" (Bateson, 1979,

p. 99). É uma propriedade emergente - o resultado de diferenças significantes – inerentemente

semântica e portanto sobre a realidade. Uma análise das diferenças sintáticas que distinguem sistemas de classificação e

categorização podem contribuir para uma filosofia da informação (FI) por que essas distinções

predizem conseqüências significantes para os processos que contribuem com o que Floridi (2002) descreve como as "dinâmicas da informação": "(i) a constituição e modelação de

ambientes de informação, incluindo suas propriedades sistêmicas, formas de interação, desenvolvimentos interiores, etc.; (ii) os ciclos de vida da informação, por exemplo, as séries de várias etapas em forma e atividades funcionais através das quais a informação pode passar... e

(iii) computação, tanto no sentido Turing-machine de processamento de algoritmos e no

sentido mais amplo de processamento de informação" (p. 15. ênfase no original). Um exame das propriedades sistêmicas e modos de interação que caracterizam a classificação e categorização revelam diferenças fundamentais em suas respectivas estruturas organizacionais – diferenças

que influenciam as atividades funcionais de um sistema de informação e contribuem para sua

constituição enquanto ambiente informacional. O argumento elaborado aqui é que existem distinções sintáticas fundamentais entre

a estrutura de sistemas de classificação e categorização; que essas distinções nos levam a

diferenças significantes nos contextos dentro dos quais a informação pode ser apreendida; e que essas diferenças, por sua vez, influenciam a informação semântica - a informação sobre a realidade - que está disponível para as pessoas.

SISTEMAS DE INFORMAÇÃO

Shera (1960/1965) observou que a recuperação da informação deve ser o foco de

uma teoria da biblioteconomia e Ciência da Informação (CI) e ainda "o fim para qual todos os nossos esforços são direcionados" (p. 136). Infelizmente, a recuperação geralmente também é

vista não como um componente em um sistema de informação, mas como um processo

autônomo e independente. Essa ênfase no produto final – a recuperação de fontes – tende a ser obscura ao fato de que a recuperação efetiva depende tanto da representação e organização de uma coleção de fontes de informação.

Soergel (1985) aponta que, uma vez que a informação é usada para a solução de

problemas, os sistemas de informação são desenvolvidos e estendidos em resposta aos problemas que a sociedade confronta. Embora essa definição de informação não seja universalmente aceita, é útil na compreensão do complexo conjunto de processos que

contribuem para a eficácia máxima de um sistema de informação. Tal sistema identifica fontes de informação que podem ser úteis na solução de um problema específico; representa os

atributos de fontes que são relevantes a área do problema; organiza essas representações de fontes ou as próprias fontes para um acesso eficiente; e finalmente recupera um conjunto de recursos em resposta a questões apresentadas ao sistema pelas pessoas. Parece-nos que, então,

uma abordagem mais produtiva ao problema de recuperação seria enxergar um sistema de

informação como um todo multidimensional composto de vários processos inter-relacionados,

incluindo, no mínimo, desenvolvimento de coleção, representação, organização e recuperação.

A recuperação é o processo final e entretanto o mais óbvio dos processos que contribuem para um sistema de informação. Uma vez que ele é o único processo no qual uma pessoa participa ativamente, é frequentemente o único processo ao qual ela dá uma maior

consideração. Quando o indivíduo está buscando informação sobre um assunto específico, sua atenção está focada no conjunto de fontes recuperadas pelo sistema de informação. Se essas

fontes parecem ser pertinentes ao problema imediato, ela pode não ter um segundo pensamento quanto à propriedade dos termos usados para questionar o sistema de informação. Não obstante, são os processos de seleção, representação e organização que fornecem a

fundação sem a qual a recuperação da informação (RI) é menos efetiva, se não for impossível. O

modo que as fontes são representadas restringe as estruturas organizacionais que podem ser impostas a uma coleção de fontes de informação; a estrutura organizacional de uma coleção dita as estratégias de busca que podem ser usadas para recuperação; e a representações por si

só determinam o conjunto de fontes que serão recuperadas pelo sistema.

Shera (1956/1965) afirma os papéis críticos da representação e organização quando observa que a recuperação efetiva requere um acordo entre a organização cognitiva imposta

sobre a informação pelos indivíduos e a organização formal imposta sobre as representações

pelo sistema. O argumento de Shera para acordo entre o indivíduo e o sistema de recuperação apóia-se em três premissas básicas: que existem certas estruturas cognitivas que podem ser identificadas e descritas; que pode ser demonstrado que essas estruturas são compartilhadas

entre indivíduos; e que a identificação dessas estruturas partilhadas proverão a base para uma teoria de organização.

Que um acordo cognitivo pode ser alcançado entre indivíduos é uma premissa fundamental da restrição de shareability (compartibilidade) proposta por Freyd (1983). Ela argumentou que a intenção de comunicar sem perda de informação faz com que o indivíduo

modifique suas representações conceituais internas para refletir a organização cognitiva

assumida pelos outros participantes no processo comunicativo. Se a participação em um ato intencional de comunicação promove a normalização de representações conceituais entre indivíduos, como Freyd (1983) argumenta, segue-se que um ato intencional de comunicação

entre indivíduos como inteligência natural e o sistema de informação estariam sujeitos a

restrições de compartilhamento similares. Assumindo que os processos de representação, organização e recuperação são necessariamente interdependentes, o fracasso em solucionar a comunicação entre o indivíduo e o sistema de informação, da perspectiva do sistema é uma

omissão significante. Assim, uma prestação de contas sobre a dinâmica da informação deveria abordar o papel da representação e organização na criação e comunicação de informação

significante. Mais importante, ela deve contabilizar as implicações semânticas ocasionadas por diferenças nos modos de organização que podem ser usados para estruturar um sistema de informação.

A necessidade de comunicação efetiva entre o sistema de informação e o indivíduo

aponta para cinco áreas de pesquisa: (i) A comunicação entre o sistema de informação e o indivíduo é influenciada pela representação de fontes? (ii) A estrutura organizacional do sistema

de informação faz com que o indivíduo ajuste suas estruturas cognitivas internas? (iii) A

organização de fontes contribui para a criação de um contexto significativo para a informação?

(iv) O significado da informação é influenciado pela estrutura organizacional do sistema de

informação? e (v) Quais serão as conseqüências das diferentes estruturas organizacionais que podem ser aplicadas a um conjunto de recursos de informação?

Uma compreensão dos diferentes modos de estruturas organizacionais e as

implicações que cada uma possui para a criação de um contexto significativo para informação é primordial e deve, entretanto preceder qualquer discussão do papel que a representação e

organização têm na dinâmica da informação. Assim, o foco aqui está nas ramificações da estrutura organizacional para comunicação entre o sistema de informação e o indivíduo, enquanto inteligência natural. Mais especificamente, o argumento apresentado aqui aborda as

diferenças estruturais e semânticas fundamentais entre a classificação e categorização e em

como essas diferenças fazem uma diferença no ambiente informacional.

CATEGORIZAÇÃO

Categorização é o processo de dividir o mundo em grupos de entidades onde os

membros são de algum modo similares uns aos outros. Reconhecimento de semelhança entre entidades e a agregação subseqüente de entidades parecidas em categorias levam o indivíduo a

descobrir a ordem em um ambiente complexo. Sem a habilidade de agrupar entidades baseadas

em similaridades percebidas, a experiência do indivíduo de qualquer entidade seria totalmente única e não poderia estender-se para encontros subseqüentes com entidades similares no ambiente. Considere uma situação na qual cada entidade separada – cada árvore, cada flor, ou

cada gota de chuva – fosse distinta de todas as outras entidades e carregasse seu próprio conjunto único de características de definição. Como Markman (1989) observa, o indivíduo não

seria capaz de lidar com a variedade e complexidade de suas interações do dia a dia com o

ambiente. Reduzindo a carga na memória e facilitando o armazenamento eficiente e a recuperação da informação, a categorização serve como um mecanismo cognitivo fundamental

que simplifica a experiência do ambiente do indivíduo.

A categorização divide o mundo da experiência em grupos ou categorias nos quais os membros compartilham algumas similaridades perceptíveis dentro de um contexto. Que esse contexto pode variar e com ele a composição de categoria é a própria base tanto para a

flexibilidade e o poder da categorização cognitiva. Zerubavel (1993) sustenta que o indivíduo

encontra ordem e o significado no ambiente impondo fronteiras - por dividir e agregar objetos de experiência, bem como para criar distintas "ilhas de significado" (p. 5). A forma que uma entidade é categorizada cria um contexto ou quadro conceitual que não apenas provê

informação sobre a entidade mas também dá forma à interação do indivíduo com ela. Por exemplo, o período histórico conhecido como a Renascença Inglesa (1500-1650) é percebido

como fundamentalmente diferente da Idade Média Inglesa mesmo que a Inglaterra no século XVI estivesse, em vários aspectos, muito similar à Inglaterra no século XV. Separar o século XVI do século XV por rotulá-los como pertencendo a dois períodos históricos distintos foca a

atenção nas diferenças entre eles ao invés de suas similaridades e fornece a informação de que,

na Inglaterra, essas diferenças eram de maior importância do que as diferenças entre os séculos

XIV e XV.

Barsalou (1987) aponta que essa habilidade de manipular o ambiente através da criação de categorias permite que o indivíduo crie novos relacionamentos e ainda crie nova informação onde os valores excedem o simples agrupamento de objetos no ambiente. Ele

propõe que, uma vez que características diferentes ou propriedades são usadas para representar a mesma categoria em tempos diferentes e em diferentes contextos, a informação associada

com uma categoria particular varia de acordo com indivíduos e contextos. Assim, o conjunto de características associadas com uma categoria em qualquer dada ocasião é composta de informação dependente e independente de contexto. Informação dependente de contexto é

relevante apenas dentro de um contexto particular. Por exemplo, uma alta temperatura de 50

graus Fahrenheit pode ser descrita como fria num dia de verão na Indiana do sul, mas morna ou até mesmo quente em um dia de inverno no mesmo local. Dizer que está frio lá fora transmite informação dependente de contexto que é significante apenas em relação ao contexto sazonal.

Ao contrário disso, informação independente de contexto provê informação sobre uma

categoria que é relevante em vários contextos. Mesmo quando usada metaforicamente, por exemplo, a palavra "fogo" conota calor, luz e energia. A aparente instabilidade de categorias é

entretanto uma reflexão da flexibilidade e plasticidade que são o poder do processo cognitivo

de categorização e da habilidade individual de criar e modificar o conteúdo informacional de uma categoria como uma função de contexto imediato, objetivos pessoais ou experiência do passado.

A aquisição e transmissão de informação são dependentes não apenas na habilidade cognitiva de criar novas categorias – e ainda nova informação – através da descoberta de novos

padrões de similaridade entre entidades, mas também na habilidade de capturar informação sobre esses padrões através do meio da linguagem. Com o acúmulo de conhecimento mais especializado e a criação de domínios disciplinares, entretanto, essas categorias e as relações

entre elas tem uma tendência a se formalizarem (Jacob, 1994). A necessidade de assegurar que o

conhecimento disciplinar é consistente entre indivíduos e através do tempo privilegia a estabilidade da referência fornecida por classes bem-definidas. Uma vez que categorias baseadas experimentalmente evoluem para classes bem-definidas de domínio específico que

facilitam o compartilhamento de conhecimento sem perda de informação, eles perdem sua

flexibilidade original e plasticidade bem como a habilidade de responder a novos padrões de similaridade.

A TEORIA CLÁSSICA DAS CATEGORIAS

Até a publicação de Rosch nos anos 70 de seu trabalho principal sobre categorias e categorização (Rosch, 1973, 1975), a pesquisa na área de categorização se focou no conceito de

formação não como processo de criação mas como processo de reconhecimento. Assumiu-se que o mundo da experiência consistia de um conjunto de categorias pré-determinadas, cada uma definida por um conjunto de características essenciais representadas por um rótulo de

categoria; e assumiu-se que todos os membros de uma determinada categoria compartilhavam

um conjunto de características essenciais que foi identificado pelo rótulo da categoria e poderia

ser apreendido por todos os membros da comunidade lingüística. Assim Hull (1920) escreveu

sobre a descoberta da criança do significado da palavra "cão" como o reconhecimento gradual de um conceito pré-existente e invariável: "As experiências 'cão' aparecem em intervalos regulares. ... Finalmente chega o momento em que a criança tem um 'significado' para a palavra

cão. Após exame descobre-se que este significado é na verdade uma característica mais ou menos comum a todos os cachorros e não é comum a gatos, bonecas e ursos de pelúcia'" (Hull,

1920, p. 5-6; citado por Brown, 1979, p. 188). A premissa de que uma categoria é determinada por um conjunto de critérios

definidos é conhecido como "a teoria clássica de categorias". Essa é uma teoria simples mas

poderosa que se apóia em três proposições básicas (Smith & Medin, 1981; ver também Taylor,

1989):

1. A intenção de uma categoria é uma representação resumida de uma categoria inteira de

entidades.

2. As características essenciais que incluem a intenção de uma categoria são individualmente necessárias e conjuntamente suficientes para determinar a associação

dentro da categoria.

3. Se uma categoria (A) é colocada dentro de uma categoria supra-ordenada (B), as características que definem a categoria (B) estão contidas dentro do conjunto de características que definem a categoria (A).

A proposição I afirma que a definição (intenção) de uma categoria é a união das

características essenciais que identificam a associação (extensão) daquela categoria. Além disso, uma vez que todos os membros de uma única categoria podem compartilhar esse conjunto de características essenciais, cada membro é igualmente representativo da categoria como um

todo. Por esse motivo, a estrutura interna de uma categoria é considerada não-seriada, ou sem

ranking, porque nenhum membro pode ser mais típico ou mais representativo de uma categoria que qualquer outro membro.

A proposição II afirma que, uma vez que cada membro da categoria deve exibir todas

as características essenciais que incluem a intenção de categoria, a posse do conjunto de

características que define a categoria é suficiente para determinar a associação na categoria. E, uma vez que existe um relacionamento binário e/ou que existe entre uma entidade e uma categoria de modo que uma entidade ou é ou não é membro de uma categoria particular, os

limites de uma categoria são considerados fixos e rígidos. A proposição III identifica o relacionamento de herança que existe entre categorias

em estrutura hierárquica: qualquer membro de uma categoria que é um subconjunto de uma categoria super-ordenada deve exibir não apenas o conjunto de características essenciais que determinam associação no subconjunto mas também o conjunto de características essenciais

que determinam associação em qualquer categoria supra-ordenada dentro do qual o

subconjunto está retido. Em sua forma mais rudimentar, a categorização pode ser definida como a atribuição

de entidades em grupos os quais os membros portam alguma similaridade com os outros.

Dentro do quadro da teoria clássica de categorias, entretanto, a categorização é o processo de

dividir sistematicamente o mundo da experiência em uma estrutura formalizada e

potencialmente hierárquica de categorias, cada qual definida por um conjunto único de características essenciais. Uma vez que a intenção de uma categoria define o conjunto de características essenciais que cada membro deve exibir, a teoria clássica mantém que a intenção

é igual a extensão - que a associação dentro de uma categoria particular (extensão) implica a posse de características essenciais e definidoras (intenção) da categoria. Por exemplo, se a

intenção da categoria "pássaro" consiste de características "bota ovos", "tem asas", "voa" e "cria ninhos em lugares altos", cada membro da categoria deve exemplificar o conjunto completo de características de definição. Se uma entidade não voa, não pode se associar na categoria

"pássaro", mesmo que ponha ovos, tenha asas e crie ninhos em lugares altos. E, por que todos os

membros da categoria são definidos pelo mesmo conjunto de características, nenhum pássaro pode ser mais típico ou mais representativo da categoria do que nenhum outro pássaro. Assim, de acordo com a teoria clássica, um papagaio, uma pomba e uma gaivota seriam igualmente

representativos da categoria "pássaro".

Brown (1979) observa que dentro da organização formalizada e rigidamente restrita da realidade estabelecida pela teoria clássica, a associação de categoria é absoluta: "... qualquer

coisa está dentro ou fora do conjunto" (p. 189). É esta estipulação que é a fonte do poder

explicativo da teoria clássica: uma vez que requere que a intenção seja igual a extensão - que a associação de uma categoria demonstra posse de um conjunto de características essenciais que definam a categoria - a teoria clássica de categorias proveria uma explicação simples porém

elegante para a estrutura interna de representações cognitivas e para o significado semântico das palavras.

Até recentemente, a teoria clássica das categorias exemplificava "o 'jeito certo' de pensar sobre categorias, conceitos, e classificações" (Gardner, 1987, p. 340). Mas pesquisas empíricas conduzidas nos últimos trinta anos desafiaram a validade das afirmações nas quais

esta teoria é fundamentada. Críticos da teoria clássica argumentam que a incapacidade de

assuntos identificarem características de definição de uma entidade (Hampton, 1979; Rosch & Mervis, 1975) não apenas acaba com a afirmação de que o conjunto de características essenciais que determinam a associação de categoria é absoluto, mas também traz em questão a noção de

que essas características estão disponíveis para e podem ser especificadas por todos os

membros de uma comunidade lingüística. Demonstração de efeitos seriados de tipicidade – a observação de que assuntos julgam de fato certos membros a serem mais representativos de uma categoria que outros (McCloskey & Glucksberg, 1978; Rips, Shoben & Smith, 1973; Rosch,

1973, 1975) – contesta a afirmação de que a estrutura de categoria é não-seriada porque todos os membros são igualmente representativos da categoria. Há evidência também que assuntos

são capazes tanto de fazer um ranking tanto os membros quanto de não-membros de uma categoria, num único continuum de representatividade. Por exemplo, Barsalou (1987) demonstrou que assuntos poderiam fazer o ranking de um rouxinol, uma pomba, uma ema,

uma borboleta e uma cadeira em um único continuum de representatividade para a categoria

"pássaro" - um continuum estendendo-se do membro mais típico da categoria (rouxinol) ao seu membro mais atípico (cadeira). A evidência para uma estrutura seriada de categorias aponta

para a falta de limites fixados e determinados separando membros de uma categoria dos não-

membros; e, sustentada como é por demonstrações de associação de categoria com base na

semelhança de família (Rosch & Mervis, 1975), a estrutura em série nos deixa dúvida sobre a

afirmação clássica de que há um relacionamento explícito de inclusão/exclusão entre uma entidade e uma categoria.

CLASSIFICAÇÃO

Na Biblioteconomia e Ciência da Informação, o termo "classificação" é usado para

referir-se a três conceitos distintos e relacionados: um sistema de classes, ordenado de acordo com um conjunto pré-determinado de princípios e utilizado para organizar um conjunto de entidades; um grupo ou classe em um sistema de classificação; e o processo de atribuição de

entidades em classes de um sistema de classificação. O foco aqui está no primeiro destes – no

sistema de classificação como uma ferramenta representacional usada para organizar uma coleção de fontes de informação – mas uma ampla apreciação das implicações de classificação

para ambientes de informação requere uma compreensão básica do processo de classificação

em si.

A classificação como processo envolve a atribuição ordenada e sistemática de cada entidade a uma e apenas uma classe dentro de um sistema de classes mutuamente exclusivas e

não-sobrepostas. Esse processo é legítimo e sistemático: legítimo porque é realizado de acordo

com um conjunto estabelecido de princípios que governam a estrutura de classes e relacionamento de classes; e sistemático porque requere aplicação consistente destes princípios no âmbito de uma determinada ordenação da realidade. O esquema em si é artificial e arbitrário:

artificial porque é uma ferramenta criada para expressar o propósito de estabelecer uma organização significante; e arbitrária porque os critérios utilizados para definir as classes no

esquema refletem uma única perspectiva do domínio em detrimento de todas outras

perspectivas.

Classificação Taxonômica

A classificação seja talvez melhor exemplificada pela disciplina de taxonomia.

Amplamente definida, a taxonomia é a ciência da classificação, ou, como Mayr (1982) define "a

teoria e prática de delimitar tipos de organismos" (p. 146). Os objetivos da investigação taxonômica devem prover uma organização ordenada e sistemática do conhecimento sobre o mundo biológico; identificar e definir características que distinguem uma entidade biológica; e,

baseado nessas características, colocar a entidade dentro de um ordenamento hierárquico de classes super-ordenadas e subordinadas mutuamente exclusivas de acordo com um conjunto de

princípios estabelecidos e amplamente aceitos. A classificação taxonômica fornece estabilidade de nomenclatura através da

proteção de uma linguagem formalizada e universalmente aceita que facilita a transmissão de

conhecimento ao longo do tempo e barreiras de linguagem natural. A cada classe no esquema

taxonômico é dado um nome único que é usado para referir-se a todas as entidades que exibem

o conjunto completo de características definindo a classe. E, por que é universalmente

empregado para identificar todos os membros de uma determinada classe, esse rótulo fornece acesso ao conhecimento acumulado sobre essas entidades, não enquanto indivíduos, mas como membros de uma classe particular. O nome taxonômico estabelece um relacionamento de

equivalência entre o conjunto de características que definem a classe (sua intenção) e o conjunto de entidades que são membros da classe (sua extensão). Usando o nome taxonômico,

um membro de uma classe biológica é reconhecível onde quer que ocorra, independente da linguagem natural ou dos nomes locais por quais pode ser conhecido.

Através da herança de critérios de definição possíveis que impõem uma estrutura de

princípios de classes super-ordenadas e subordinadas, a classificação taxonômica também serve

como um andaime cognitivo (Clark, 1997; Jacob 2001, 2002) que provê o armazenamento econômico e recuperação da informação sobre uma classe de entidades. Por exemplo, a observação de que Bleu é um poodle fornece informação sobre Bleu que é associado à classe

"poodle". Mais importantemente, no entanto, também provê informação sobre Bleu que é

disponível a partir da estrutura hierárquica onde a classe "poodle" reside - informação associada com as classes super-ordenadas cão, mamífero, vertebrado, etc.

A observação essencial, entretanto, é que a prática de taxonomia é realizada dentro

do quadro arbitrário estabelecido por um conjunto de princípios universais. Por exemplo, enquanto o naturalista Adanson, um contemporâneo de Lineu, propôs um método de organização de fenômenos botânicos baseados na identificação de diferenças entre espécies

individuais (Foucault, 1970), Lineu advogou uma abordagem sistemática baseada na similaridade da estrutura reprodutiva. Para o naturalista seguindo a ideia de Lineu, qualquer

diferença física entre duas espécies não relacionadas diretamente ao processo de reprodução seria irrelevante: por exemplo, diferenças de folha, caule ou estrutura de raiz que podem ser usadas para distinguir entre duas plantas seriam ignoradas se as plantas exibissem estruturas

reprodutivas similares.

A classificação taxonômica apóia o armazenamento eficiente e recuperação da informação sobre uma classe de entidades, mas a confiança em uma abordagem sistemática tal como a advogada por Lineu restringe o contexto de informação por limitar a identificação de

associações portadoras de conhecimento a relacionamentos hierárquicos entre classes. Além

disso, as definições de classe baseadas em uma única característica tal como estrutura reprodutiva efetivamente reduz a quantidade de informação significante que pode ser representada sobre cada classe na taxonomia.

Esquemas de Classificação

Um esquema de classificação é um conjunto de classes mutuamente exclusivas e não

sobrepostas organizadas dentro de uma estrutura hierárquica que refletem uma ordenação pré-

determinada da realidade. Uma vez que um esquema de classificação ordena que uma entidade

pode ser um membro de uma e apenas uma classe, ela fornece para a comunicação de informação relevante através da sistemática e ordenação de classes baseada em princípios. Além

disso, estabelece e reforça a estabilidade de referência fornecendo a cada classe uma etiqueta

única que liga membros individuais da classe à definição da classe.

Shera (1951/1965) observa que, ao longo da história, tentativas de classificar o conhecimento basearam-se em quatro premissas básicas: ordem universal, unidade de conhecimento, similaridade de membros de classe e essência intrínseca. A premissa de ordem

universal postula uma concepção imutável de realidade que serve como um quadro unificador para todo o conhecimento. A premissa de unidade de conhecimento pressupõe que

conhecimento passado, presente e futuro podem ser representados dentro de uma única hierarquia inclusiva de classes super-ordenadas e subordinadas. A premissa de similaridade de membros de classe assegura que uma classe pode ser definida por um conjunto de

características essenciais e que essas características são compartilhadas por todos os membros

da classe e distinguem esta classe de todas as outras classes na estrutura. E a premissa de essência intrínseca mantém que há um conjunto de características individualmente necessárias e conjuntamente suficientes que são intrínsecas a todos os membros de uma classe e que estas

características constituem a essência da classe.

Com a possível exceção da ordem universal, a exposição de Shera das premissas que apóiam esforços para organização do conhecimento podem ser interpretadas em termos de três

proposições que constituem a teoria clássica de categorias: a afirmação de que uma categoria é

definida por uma representação sumária (Proposição I) é uma declaração da similaridade essencial de membros de uma classe; a afirmação de que uma categoria é definida por um conjunto de características essenciais (Proposição II) é uma declaração da essência intrínseca de

uma classe; e a afirmação de que características definitórias são herdadas em uma estrutura hierárquica de categorias (Proposição III) é uma declaração da unidade de todo o conhecimento.

É instrutivo que, embora a teoria clássica de categorias seja incapaz de explicar a variabilidade e flexibilidade da categorização cognitiva, ela provê uma explicação elegante para os pressupostos fundamentais nos quais os esquemas de classificação tem sido historicamente

construídos.

Esquemas de Classificação Bibliográfica

Tradicionalmente, as classificações bibliográficas tem sido dedutivas, esquemas top-

down (hierárquicos) que enumeram um conjunto de classes que se excluem mutuamente. Um esquema de classificação enumerativo inicia com um universo de conhecimento e uma teoria de organização ou conjunto de princípios que estabelecem a estrutura conceitual do esquema. Se o

universo abrange todos os conhecimentos ou é limitado a um domínio específico, a construção do esquema envolve o processo lógico de divisão e subdivisão do universo original tal que cada

classe, ou cada nível de classes na estrutura, é diferenciado por uma característica ou propriedade particular (por exemplo, a propriedade "cor" ou "forma"). O resultado é uma estrutura hierárquica de relacionamentos genéricos (gênero/espécie) em que cada classe

subordinada é, teoricamente, uma espécie verdadeira da super-ordenada na qual ela está

aninhada. Sistemas de classificação facetada (analítico-sintética) são esquemas bottom-up

(descentralizados) indutivos gerados através de um processo de análise e síntese. A construção

da estrutura facetada começa com a análise de um universo de conhecimento para identificar os

elementos individuais - propriedades e características - do universo. Esses elementos são então

organizados em grupos mutuamente exclusivos na base da similaridade conceitual, e esses grupos são, por sua vez, organizados em agrupamentos sucessivamente maiores para formarem facetas (aspectos) que podem ser usados para representar entidades no universo. Deste modo,

relacionamentos significantes são estabelecidos não apenas entre os elementos em um grupo mas entre os grupos em si. O resultado não é um esquema de classificação mas um controle de

vocabulário de conceitos e suas etiquetas associadas que podem ser usadas, em associação com uma notação e uma ordem de citação prescrita, para sintetizar as classes que irão popular o esquema de classificação. Um vocabulário facetado para a classificação de carros pode incluir

facetas mutuamente exclusivas para "cor" (vermelho, azul, preto), "forma" (sedan, conversível,

minivan) e "transmissão" (manual, automático). Seguindo a ordem de citação forma - transmissão - cor, as classes seriam construídas selecionando um único valor, ou isolado, de cada faceta. Exemplos das classes que poderiam ser construídas neste esquema facetado seriam

mutáveis - manual - vermelho e minivan - automático-azul.

Uma vez que o esquema de classificação facetada adere a uma ordem de citação fixadas durante a construção de classes individuais, a estrutura resultante, como um esquema

enumerativo, é necessariamente hierárquica. Na verdade, é a natureza hierárquica dos

esquemas de classificação bibliográfica que permite que o arranjo de fontes físicas nas estantes da biblioteca. "Ler" um esquema de classificação envolve mover-se para baixo da hierarquia, do super-ordenado para o subordinado e da esquerda para a direita, para gerar uma série de

relacionamentos entre as classes que podem ser traduzidas na própria ordem linear da estante da biblioteca. É apenas esta estrutura linear que Ranganathan capturou na noção de APUPA (ou

Alien – Penumbral – Umbral – Penumbral – Alien). A classe umbral (U) representa o tópico central; as classes penumbra (P) são as mais próximas relacionadas com o tópico central; e as classes estrangeiras (A) são aquelas removidas do tópico central e no entanto, não relacionadas

a ele. Quando o indivíduo revisa uma coleção de fontes arranjadas na ordem classificada, ela

geralmente começa com a classe mais relevante de tópico central (U); movendo-se seja para a direita ou esquerda, ela progride de fontes no tópico central através de materiais relacionados (P) a estas fontes que não são relacionadas (A). Desta forma, a linearidade inerente na estrutura

hierárquica de um esquema de classificação é usada par criar um contexto significativo por

trazer para proximidade essas classes dentro da estrutura hierárquica que são teoricamente mais proximamente relacionadas.

Classificação como Linguagem Disciplinaria

Uma estrutura classificatória frequentemente inerente em uma linguagem disciplinaria quando é usada para estabelecer um contexto conceitual específico que tanto define e organiza o domínio de investigação (Foucault, 1970; Jacob, 1994). A linguagem serve

para prescrever os limites do domínio; para determinar tanto o assunto do domínio e os

relacionamentos que obtém entre fenômeno de investigação; para legitimizar conceitos específicos e metodologias; para assegurar transmissão efetiva de conhecimento por estabilizar

o vocabulário; e para promover uma perspectiva específica de domínio ou episteme

disciplinaria. Uma vez que uma linguagem disciplinaria reflete a estrutura classificatória

subjacente do domínio, o significado de qualquer termo da classe pode ser apenas apreendido

dentro do contexto conceitual estabelecido pela estrutura classificatória.

A DIFERENÇA ENTRE CLASSIFICAÇÃO E CATEGORIZAÇÃO

Embora não existam similaridades óbvias entre classificação e categorização, as diferenças entre elas têm implicações significantes para a constituição de um ambiente de

informação. O fracasso em distinguir entre esses dois sistemas de organização parece resultar do equívoco de que eles são, na verdade, sinônimos - um equívoco que pode ser reforçado pelo fato de que ambos são mecanismos de organização da informação.

A literatura em categorização é crivada com passagens onde os termos

"classificação" e "categorização" são usados indiscriminadamente para referirem-se ao mesmo processo. Rosch et al (1976) fornecem um exemplo ilustrativo de como esses dois termos são

usados indiscriminadamente:

... um propósito da categorização é reduzir as infinitas diferenças entre estímulos para proporções comportamentalmente e cognitivamente utilizáveis. É vantagem para o organismo não diferenciar um estímulo de outros quando essa diferenciação é irrelevante para os propósitos em questão. O nível básico de classificação, o nível primário no qual cortes são feitos no ambiente, parece resultar da combinação desses dois princípios; a categorização básica é o nível mais geral e inclusivo nos quais categorias podem delinear estruturas correlacionais do mundo real (Rosch et al, 1976, p. 384. Grifo nosso)

Esta falta de distinção entre categoria/categorização e classe/classificação é

frequentemente composta pelo uso de conceito como ainda um outro sinônimo para categoria

(por exemplo, Gardner, 1987, p. 340). Infelizmente, essa imprecisão terminológica obscurece o

fato de que pesquisadores estão de fato lidando com duas abordagens de organização similares mas não obstante distintas.

Embora sistemas de classificação e categorização sejam tantos mecanismos para

estabelecer ordem através do agrupamento de fenômenos relacionados, diferenças fundamentais entre eles influenciam em como esta ordem é efetuada - diferenças que fazem uma diferença no contexto de informação estabelecido por cada um desses sistemas. Enquanto

a classificação tradicional é rigorosa na medida em que determina que uma entidade é ou não é um membro de uma classe particular, o processo de categorização é flexível e criativo e desenha

associações não-vinculantes entre entidades - associações que são baseadas não em um conjunto de princípios pré-determinados mas no simples reconhecimento de similaridades que

existem através de um conjunto de entidades. Classificação divide um universo de entidades em um sistema arbitrário de classes mutuamente exclusivas e não-sobrepostas que são arranjadas

dentro do contexto conceitual estabelecido por um conjunto de princípios estabelecidos. O fato de que nem o contexto nem a composição dessas classes varia é a base para a estabilidade de

referência fornecida por um sistema de classificação. Ao contrário, categorização divide o

mundo da experiência em grupos de categorias nos quais os membros portam alguma

similaridade imediata dentro de um dado contexto. Que este contexto pode variar - e com ele a composição da categoria - é a base tanto para a flexibilidade e o poder de categorização cognitiva (Jacob, 1992).

A Figura 1 identifica seis propriedades sistêmicas que servem como um ponto de partida para comparar sistemas de classificação e categorização: (i) processo, (ii) limites, (iii)

associação, (iv) critérios de atribuição, (v) tipologia e (vi) estrutura. (i) O processo de classificação envolve um arranjo sistemático de classes de

entidades baseados na análise do conjunto de características individualmente necessárias e

conjuntamente suficientes que definem cada classe. Em contraste, o processo de categorização

é geralmente não-sistemático mas inerentemente criativo para que então não precise basear-se em definições pré-determinadas, sendo capaz de responder a avaliações de similaridade baseadas em contexto imediato, objetivos pessoais ou experiência individual.

(ii) Sistemas de classificação e categorização também são distinguidos pelos limites impostos em agrupamentos. Uma vez que as classes em um sistema de classificação são rigidamente circunscritas pela intenção da classe e mais tarde restritas pelo requerimento que

sejam mutuamente exclusivas e não sobrepostas, os limites entre classes são fixados,

Figura 1. Comparação de Categorização e Classificação

Categorização Classificação Processo

Síntese criativa de entidades baseadas em contexto ou

similaridade percebida

Arranjos sistemáticos de entidades baseados na análise de características suficientes e

necessárias Fronteiras

Uma vez que a associação em qualquer grupo é não-

vinculativa, as fronteiras são “imprecisas”

Uma vez que classes são mutuamente exclusivas e não se sobrepõem, fronteiras são

fixas Associação

Flexível: associação de categorias é baseada em

conhecimento generalizado e/ou contexto imediato

Rigoroso: uma entidade ou é ou não é um membro de uma classe em particular baseada

na intenção de uma classe Critérios para

Atribuição

Critérios dependentes e independentes de contexto

Critérios são orientações ou princípios pré-determinados

Tipicidade Membros individuais podem ser

ordenados em ranking por tipicidade (estrutura seriada)

Todos os membros são igualmente representativos

(estrutura não-seriada)

Estrutura Clusters de entidades; podem formar estrutura hierárquica

Estrutura hierárquica de classes fixadas

determinados e persistentes. Em um sistema de categorização, no entanto, a associação de uma

entidade em qualquer categoria é não-vinculativa e não proíbe a associação em nenhuma outra

categoria. Portanto a associação de qualquer duas ou mais categorias em um sistema de categorização pode sobrepor-se ou variar ao longo do tempo em reposta à contextos mutantes. Isso é possível porque os limites da categoria não são simplesmente imprecisos mas são, na

verdade, mutáveis e potencialmente fluídos. (iii) e (iv) Associação e critério para atribuição são duas características proximamente

relacionadas que distinguem sistemas de classificação de sistemas de categorização. Em um sistema de classificação, critério para atribuição de classe - o conjunto de características necessárias e suficientes que constituem a intenção de uma classe - é governado por princípios

que estabelecem o quadro conceitual do sistema. Associação em uma classe é rigorosa na

medida em que é determinada pela intenção da classe: uma entidade ou é ou não é um membro de qualquer classe no sistema. Mais importante, entretanto, a associação em uma classe é absoluta simplesmente porque uma entidade pode pertencer a uma e apenas uma classe. Ao

contrário, o critério para atribuição de categoria empregado por um sistema de categorização é

potencialmente variável, pertencendo a associação de uma categoria para responder às demandas do contexto no qual é usado. Deste modo, a associação de uma categoria pode variar

de acordo com o tempo baseado na combinação de informação dependente e independente de

contexto que é usada para definir associação de categoria. Diferenças no critério para atribuição enfatizam uma distinção importante entre

classificação e categorização. Em sistemas de classificação, atribuição de classes se baseia em

definições que são "idealizações" ou "abstrações teóricas" (Barsalou, 1987) para determinar associação de classe. Em sistemas de categorização, entretanto, a atribuição de categoria é

flexível e dinâmica, refletindo a habilidade do indivíduo de modificar definições de categoria em resposta à variações no ambiente imediato. Entretanto Barsalou argumenta que

... os conceitos de que teóricos "descobrem" para categorias podem nunca ser idênticos a um conceito real que alguém usa. Ao invés disso, eles podem ser ficções analíticas que são tendências centrais ou idealizações de conceitos reais.

Embora tais abstrações teóricas possam ser úteis ou suficientes para certos propósitos científicos, pode ser mais frutífero e exato descrever a variedade de conceitos que pode ser construído para uma categoria e entender o processo que os gera. (Barsalou, 1987, p. 120)

(v) Tipicidade é intimamente relacionada com as características de associação e

critério para atribuição. Entretanto, a tipicidade é potencialmente ambígua: por um lado, é

utilizada como uma indicação de avaliação individual do quão representativo um membro é de sua classe ou categoria particular; e, por outro, é usado como um reflexo das afirmações a

respeito de associação e critérios de associação que governam um sistema de classificação ou categorização. Uma vez que pesquisa empírica indica que assuntos são capazes de fazer

rankings de membros de acordo com a tipicidade mesmo quando se trabalha com classes bem definidas ou/ou tais como número ímpar ou número par (Armstrong, Gleitman, & Gleitman,

1983), a tentativa de distinguir entre classificação e categorização tendo por base julgamentos

de tipicidade individuais seria um exercício de futilidade. Ao contrário disso, pressupostos

sistêmicos que governam a associação fornecem de fato um importante ponto de distinção

entre classificação e categorização. Em um sistema de classificação, todos os membros de uma classe devem exibir o

conjunto completo de características essenciais prescritas pela definição da classe (veja a

Proposição I da teoria clássica). Segue-se então, que todos os membros são considerados iguais e entretanto igualmente representativos da classe. Por essa razão, a estrutura interna de uma

classe é considerada não-seriada porque nenhuma entidade pode ser um membro "melhor" da classe do que qualquer outro membro. Entretanto, em um sistema de categorização, não há pressuposto de igualdade de associação. O fato de que indivíduos possam identificar membros

em particular como mais típicos de uma categoria reflete a natureza dinâmica de definições de

categorias e a variabilidade correspondente de associação de categoria como uma reflexão de contexto imediato. A estrutura interna de uma categoria é considerada não-seriada porque é possível fazer o ranking de membros da categoria como em quão típicos e representativos são

da categoria como um todo.

(vi) A estrutura é talvez a única característica mais importante que pode ser usada para discriminar entre sistemas de classificação e categorização porque é influenciada por

distinções baseadas em processo, limites, associação e critério de atribuição. Um sistema de

classificação é geralmente uma estrutura hierárquica de classes bem definidas, mutuamente exclusivas e não sobrepostas aninhadas em uma série de relacionamentos super-ordenados - subordinados ou gênero-espécie. A estrutura de um sistema de classificação fornece uma

poderosa ferramenta cognitiva - uma armação externa (Clark, 1997; Jacob, 2001, 2002) - que minimiza a carga cognitiva no indivíduo por incorporar informação sobre a realidade através da

organização de classes dentro do sistema. Por exemplo, porque uma entidade é ou não é um membro de uma classe particular num sistema de classificação, ela fornece para a determinação de uma associação de classe como uma atividade relativamente simples de combinação ou

complemento de padrão.

Em um nível mais complexo, a estrutura do sistema de classificação estabelece relacionamentos portadores de informação entre classes: relacionamentos verticais entre classes super-ordenadas e subordinadas que são sujeitas ao mecanismo de herança ilustrado acima no

exemplo do poodle Bleu; e relacionamentos laterais entre classes coordenadas que ocorre no

mesmo nível de hierarquia e, quando tomadas em conjunto, constituem a classe imediatamente super-ordenada dentro da qual elas estão aninhadas. Desta forma, a estrutura de um sistema de classificação serve como um meio para acúmulo, armazenamento e comunicação da informação

associada com cada classe na estrutura; e, por capitalizar nos relacionamentos hierárquicos e laterais entre classes, ele minimiza a informação que pode ser armazenada com cada classe e

reduz a carga na memória. Ao contrário disso, a estrutura de um sistema de categorização consiste de clusters variáveis de entidades que podem ou não ser organizados em estrutura hierárquica.

Uma vez que categorias não são restritas por um requerimento de exclusividade

mútua, associação em uma categoria não proíbe associação em qualquer outra categoria. Mais importante, entretanto, a própria plasticidade que é o poder criativo de categorias pode na

verdade proibir o uso de categorização como uma estrutura persistente de informação. A

natureza potencialmente transitória e sobreposta das categorias fornece que quaisquer

relacionamentos estabelecidos entre categorias são em si mesmo mutáveis. Ainda, um sistema

de categorização cria um quadro conceitual do qual significado pode ser de vida curta e efêmera - um quadro conceitual que não pode funcionar como armação cognitiva e do qual a habilidade para servir como meio para a acumulação, armazenamento e comunicação de informação é

limitada.

ORDENAÇÃO, AGRUPAMENTO E ORGANIZAÇÃO

Um sistema para ordenação (Jacob & Loehrlein, 2003) fornece acesso a fontes por

arranjá-las de algum modo reconhecível. Tipicamente, esses sistemas empregarão seqüências

alfanuméricas ou cronológicas porque esses arranjos geram padrões sintáticos que são

familiares a uma maioria de indivíduos. Embora tal sistema se destine a apoiar acesso a itens conhecidos, ele pode parecer criar agrupamentos de fontes similares (por exemplo, todos os

indivíduos com o sobrenome Smith ou alunos que se graduaram no ano 2000), mas a imposição

de ordem seqüencial é não obstante um dispositivo que não pode criar relacionamentos

significantes seja entre entidades individuais ou entre grupos de entidades. Ao contrário disso, um sistema de organização (Jacob & Loehrlein, 2003) é uma

estrutura unificada que estabelece uma rede de relacionamentos entre as classes ou categorias

que compõem o sistema. Esses relacionamentos são significantes e portadores de informação porque especificam conexões baseadas em princípios entre dois ou mais grupos dentro do mesmo sistema. Deste modo, com uma única exceção possível, sistemas de classificação são

sistemas de organização porque eles fornecem ao arranjo conceitual um conjunto de classes mutuamente exclusivas e não-sobrepostas dentro de uma estrutura sistemática de

relacionamentos hierárquicos e de gênero-espécie.

A exceção é uma classificação constitutiva (Jacob, Mostafa & Quiroga, 1997) consistindo de um conjunto de classes mutuamente exclusivas que compõem a totalidade de

um dado universo mas tem falta de relacionamentos super-ordenados e subordinados. Por

exemplo, as classes calouro, sophomore1, junior2 e veterano compõem o universo dos alunos de graduação na universidade. Essas classes parecem evidenciar uma ordenação hierárquica (por exemplo, de calouro a veterano), mas falham em demonstrar relacionamentos significantes e

portadores de informação: embora um veterano possa ter sido junior em algum momento, a

classe junior não é uma verdadeira espécie de seu pretenso super-ordenado veterano. Ainda assim, uma classificação constitutiva não qualifica como um sistema de organização porque, mesmo que esteja composta de um conjunto de classes não sobrepostas e mutuamente

exclusivas que constituem a totalidade de um universo particular, ela fracassa em estabelecer relacionamentos significantes entre suas classes constituintes. É interessante também que nem

uma classificação hierárquica e nem constitutiva podem servir como sistema para ordenamento: uma vez que as distinções entre classes são conceituais, as classes não podem conformar-se a

1 Aluno de segundo ano na universidade. 2 Aluno de terceiro ano na universidade.

um padrão de arranjo reconhecível e sintático. Além disso, tanto sistemas hierárquicos como

constitutivos de classificação requerem um índice ou outro mecanismo auxiliar para apoiar o

acesso, seja a fontes únicas ou classes individuais na estrutura. Um sistema de categorização pode ou não ser um sistema de organização. Embora

um sistema de categorização agrupe entidades baseado na similaridade, o exemplo de uma

classificação constitutiva demonstra que a simples identificação de um conjunto de categorias sem o estabelecimento de relacionamentos significantes e portadores de informação não

constituem um sistema de organização. Mas, mesmo que um sistema de categorização não indique relacionamentos significantes, não é um sistema de ordenamento: o simples fato de agrupar entidades em categorias não apóia o acesso. Uma vez que a categorização reflete

distinções conceituais entre grupos de entidade, ela também requere um mecanismo auxiliar

para prover acesso, seja a categorias individuais ou a membros únicos de categoria. Se um sistema de categorização não impõe uma ordem sistemática sintática em

membros de categorias e se não estabelece relacionamentos entre categorias, então é

simplesmente um mecanismo de agrupamento. Por exemplo, dividir os itens de uma lista de

compras em categorias definidas por compras (por exemplo, mercado, posto de gasolina e loja de 1,99) é um mecanismo de agrupamento que simplifica a interação individual com o seu

ambiente mas não cria relacionamentos significantes entre categorias, nem impõe qualquer

ordem reconhecível a elas. Uma classificação constitutiva também é um exemplo de um simples mecanismo de agrupamento: neste caso por dividir um universo de entidades em um conjunto de grupos bem definidos e mutuamente exclusivos sem a identificação de qualquer

relacionamento significante entre eles.

IMPLICAÇÔES DE ESTRUTURAS

O papel funcional da estrutura na criação e melhoria de contextos de informação pode ser abordado através da análise de quatro abordagens à organização e recuperação de

fontes: busca em texto livre, indexação pós-coordenada, indexação pré-coordenada e

classificação (ver Figura 2). Embora a categorização cognitiva sirva como linha de base para esta análise, é desconsiderada enquanto sistema de organização não por sua falta de fundação semântica ou estrutura relacional, mas porque, ao contrário dos argumentos proferidos por

Shera (1956/1965) a organização imposta em categorias cognitivas é tão dinâmica e suscetível a

mudanças em contexto que não pode estabelecer relacionamentos persistentes e portadores de conhecimento entre categorias.

Das quatro abordagens gerais à organização, a busca em texto livre é a menos

restrita. Embora ela compartilhe com sistemas de classificação a criação de classes mutuamente exclusivas, não sobrepostas e rigidamente delimitadas cuja adesão está condicionada por um

critério explícito de atribuição (por exemplo, a seqüência de pesquisa alfanumérica usado para consultar o sistema), a busca em texto livre carece de um conjunto estabelecido de princípios que governem a estrutura de classes e seus relacionamentos. Pode ser descrita como um

sistema de categorização em seu sentido mais amplo, mas é, no máximo, um mecanismo muito

elementar para agrupamento. Mesmo como mecanismo de agrupamento, no entanto, tem duas

falhas significativas. Em primeiro lugar, a base para agrupamento é puramente sintática: porque

o critério para atribuição de grupos envolve a simples combinação de seqüências alfanuméricas, grupos produzidos por esse processo partilham uma similaridade superficial sem implicações semânticas mais profundas. Em segundo lugar, o processo de agrupamento em texto livre é

binário e nisso gera apenas dois grupos de entidades - aqueles que combinam com a seqüência de consulta e aqueles que não combinam. Entretanto, uma vez que buscas em texto livre não

têm base semântica, não podem apoiar distinções significantes entre essas duas classes, e, porque exemplifica a mais simples das estruturas (exemplo, duas classes antônimas), um sistema de recuperação em texto livre não pode contribuir para um ambiente de informação que irá

apoiar ou melhorar o valor da saída do sistema através da criação de contexto significativo.

Diferente de busca em texto livre, sistemas pós-coordenados, pré-coordenados e sistemas de classificação são todos sistemas de indexação onde cada um implica a atribuição a uma fonte de um ou mais descritores que devem representar o conteúdo intelectual desta fonte.

Esses descritores são geralmente desenhados de um vocabulário controlado ou linguagem de

indexação que normaliza o vocabulário usado na representação e recuperação pela criação de uma correspondência de índice, de um para um entre um descritor e o conceito para o qual ele

aponta. A linguagem de indexação também fornece para comunicação entre o sistema e o

indivíduo por especificando o conjunto de termos autorizados ou seqüências de assunto que

Figura 2. Sistemas de Organização

podem ser usadas para colocar questões de buscas ao sistema. Embora um descritor possa ser

um rótulo da classe, um cabeçalho de assunto ou um único termo ou frase, dependendo da

natureza do sistema, cada descritor serve para identificar ou descrever o conteúdo intelectual de um grupo de fontes. Diferente de um ponto de acesso em um sistema para organização que apóia a recuperação de uma entidade única, um descritor é um substituto para (ou um

apontador para) o conteúdo intelectual compartilhado por um grupo de fontes. De fato, a indexação, assim como a categorização, seria impossível se cada fonte fosse tratada como

entidade única. Na progressão de sistemas de indexação pós-coordenados através de sistemas pré-

coordenados para sistemas de classificação, estrutura organizacional se torna cada vez mais

restrita (ver Figura 2). É apropriado então, começar essa análise com classificação, o mais

altamente restrito desses três sistemas, e trabalhar de volta através dos sistemas menos restritos em direção à linha de base de categorização cognitiva.

Teoricamente, uma estrutura classificatória exemplifica um sistema de organização

porque cria uma estrutura de princípios de classes bem definidas que são ligadas por um

sistema de relacionamentos hierárquicos de gênero-espécie. Embora a prática nem sempre irá aderir à teoria no desenvolvimento de esquemas de classificação, a classificação é não obstante

o sistema organizacional mais rígido porque sua estrutura de classes mutuamente exclusivas e

não sobrepostas exigem um relacionamento absoluto entre uma fonte e sua classe: cada fonte pode ser atribuída a uma e apenas uma classe na estrutura. Assim, o processo de classificação é inerentemente sistemático porque é regido por um conjunto de princípios que serve como

quadro conceitual persistente para a criação de relacionamentos estruturais significantes entre classes.

Embora a estrutura bem-definida de um sistema de classificação forneça a criação de relacionamentos significantes portadores de informação entre classes – relacionamentos que facilitam o uso da classificação como uma estrutura cognitiva externa – coloca poderosas

limitações na comunicação entre indivíduos e o sistema de informação. Em um sistema de

informação em que as estruturas de classe são pré-determinadas, o conjunto de recuperação retornado para qualquer questionamento colocado ao sistema é necessariamente limitado a associação de uma única classe. Embora a estrutura do sistema de classificação restrinja as

questões que possam ser apresentadas ao sistema, prescrevendo o conjunto de possíveis

respostas antes que um questionamento seja realmente colocado. Dentro de uma estrutura classificatória, então, a comunicação é apenas de um caminho – do sistema para o indivíduo – e o indivíduo deve se basear na sua compreensão ou intuições sobre os relacionamentos

estruturais entre classes de modo a interagir com o sistema de modo efetivo e significativo. Sistemas de informação são identificados como pré-coordenados quando as

categorias ou classes que fazem parte do sistema são ou atribuídas ou construídas pelo indexador no momento da indexação. Um sistema de classificação é obviamente um sistema pré-coordenado porque suas classes são ou estabelecidas pelo classificador durante a geração

do esquema ou construídas pelo classificador ao mesmo tempo da atribuição de classe usando

um vocabulário facetado e uma ordem de citação fixa. Um sistema de cabeçalhos de assunto também é um sistema pré-coordenado mas é geralmente menos restrito – e menos restritivo –

do que um sistema de classificação. Considerando que a classificação demanda atribuição de

uma fonte a uma e apenas uma classe, um sistema pré-coordenado de cabeçalhos de assunto

não requere que grupos individuais sejam mutuamente exclusivos. Ao invés disso, sistemas de

cabeçalho de assunto permitem a atribuição de descritores múltiplos a uma única fonte, fornecendo assim múltiplos pontos de acesso para cada entidade ao invés do único ponto de acesso (o único rótulo de classe) prescrito por um sistema de classificação.

Uma vez que não demanda um relacionamento bem definido e absoluto entre uma fonte e um cabeçalho de assunto – porque não requere que os grupos de entidades associadas

com os cabeçalhos de assunto individuais sejam necessariamente mutuamente exclusivos – um cabeçalho de assunto pré-coordenado é, na verdade, um sistema de categorização. Categorias formadas pelo sistema de cabeçalhos de assunto não são ligados rigidamente mas geralmente

sobrepõem-se, com membros individuais transbordando em categorias de penumbra e até

mesmo categorias exóticas. Embora permitir que vários descritores para uma única fonte forneçam uma grande variabilidade na gama de fontes que podem ser recuperadas com uma única questão, as questões que podem ser colocadas para o sistema de informação no entanto

são limitadas, uma vez que estão em um sistema de classificação, pelo conjunto autorizado de

seqüências de cabeçalhos de assunto que fazem parte do sistema. E, como em um sistema de classificação, o conjunto recuperado gerado em resposta a uma questão é determinado pelo

indexador: a atribuição de cabeçalhos de assunto como descritores não apenas restringe as

questões que podem ser colocadas para o sistema mas serve para estabelecer o conjunto específico de fontes que podem ser recuperadas em resposta à cada questão colocada para o sistema.

Diferentemente da estrutura de princípios e sistemática de um sistema de classificação, a estrutura de um cabeçalho de assunto é frequentemente sem princípios,

assistemática e poli-hierárquica. E, diferente dos relacionamentos estabelecidos entre classes bem definidas e mutuamente exclusivas em uma classificação, quaisquer relacionamentos criados entre as categorias de um sistema de cabeçalhos de assunto não pode ser considerada

significante ou portadora de informação. Como exemplo o Cabeçalho de Assunto para Escolas e

Bibliotecas Públicas (Subject Headings for Schools and Public Libraries) (Fountain, 2001) ilustra a falta de relacionamentos portadores de conhecimento que caracterizam vários sistemas de cabeçalho de assunto. O cabeçalho “Rats as carriers of disease” (“Ratos como carregadores de

doenças”) combina dois conceitos mais amplos: “ratos” e “doença”. Embora seja óbvio que

“Ratos como carregadores de doenças” seja de alguma forma relacionado tanto a ratos quanto doenças, esse cabeçalho não é um tipo de “Rato” nem um tipo de “Doença”. Uma vez que o valor específico de qualquer relacionamento que pode ligar esse cabeçalho aos seus conceitos mais

amplos não seja identificado, o relacionamento deve ser fornecido pelo indivíduo se o cabeçalho for ligado de modo significante a outros conceitos no sistema de cabeçalho de

assunto. Embora sistemas de cabeçalho de assunto pareçam criar relacionamentos entre

cabeçalhos, esses relacionamentos são geralmente descritivos, idiossincráticos, e, às vezes,

potencialmente sem significado. Por exemplo o Cabeçalho de Assunto da Biblioteca do

Congresso [Library of Congress Subject Headings] (Library of Congress. Cataloging Policy and Support Office, Library Services, 2002) identifica o assunto “Humanidades” como o termo mais

amplo para o cabeçalho “Filosofia”. Ele então passa a listar “Humanismo” como o termo mais

amplo para “Humanidades” e “Filosofia” como o termo mais amplo para “Humanismo”. Assim, a

suposta estrutura aninhada é circular: “Filosofia” > “Humanidades” > “Humanismo” > “Filosofia”.

Obviamente a ausência de tanto uma linguagem de indexação bem definida ou de relacionamentos significantes e de princípios entre os cabeçalhos de assunto dificulta a habilidade do sistema de estabelecer um contexto que possa contribuir para a apreensão da

informação. Tal como acontece com a classificação, a comunicação entre o indivíduo e um

cabeçalho de assunto tende a ser de apenas um caminho – do sistema para o indivíduo – mas a estrutura sem princípios de vários sistemas de cabeçalhos de assunto e a ausência geral de uma estrutura conceitual prescritiva que pode apoiar as relações portadoras de informação, dificulta

o potencial para comunicação com significado entre o usuário e o sistema. Essa é uma distinção

importante entre sistemas de cabeçalho de assunto e o mais estruturado sistema de classificação que pode ser explicado, em parte, como uma diferença entre os processos de identificação e predicação. A classificação envolve um processo de identificação (ou definição)

de modo a afirmar um relacionamento significante, de um para um entre uma entidade e sua

classe, mas um sistema pré-coordenado de cabeçalhos de assunto envolve um processo de predicação (ou descrição) que permite múltiplas afirmações atribuídas a uma única fonte.

Enquanto o sistema baseado em predicação demonstra maior criatividade, flexibilidade e

hospitalidade do que a estrutura bem definida de um sistema baseado em identificação, a própria rigidez do último na verdade apóia a criação e persistência de relacionamentos portadores de informação que são simplesmente impossíveis de existir na estrutura mais solta

do primeiro. Sistemas pré-coordenados restringem a comunicação entre o indivíduo e o sistema

através do estabelecimento de uma coleção finita de rótulos de classe ou cabeçalhos de assunto que servem como o conjunto completo de possíveis perguntas de busca e predeterminam a composição de conjuntos de recuperação. Ao contrário disso, sistemas pós-coordenados não

predeterminam nem as questões nem os conjuntos recuperados mas permitem que o indivíduo

construa suas próprias definições de categorias que podem ser apresentadas ao sistema como questões de busca no tempo da recuperação. Descritores representando o conteúdo intelectual de uma fonte são atribuídos pelo indexador no momento da indexação. Durante a recuperação,

o indivíduo constrói suas próprias categorias de busca combinando os descritores com lógica

Booleana. Permitindo que o indivíduo crie suas próprias questões, o sistema pós-coordenado

apóia uma forma de comunicação mais interativa entre o pesquisador e o sistema. Na maioria

dos sistemas pós-coordenados, descritores são atribuídos a partir de vocabulários controlados. Em outros, no entanto, a comunicação entre o indivíduo e o sistema de informação é

complicada pelo fato da linguagem de indexação não existir como vocabulário controlado, mas ser extraída pelo indexador de termos que ocorrem na fonte que está sendo indexada. Geralmente, entretanto, a geração de definições de categoria como questões de buscas pós-

coordenadas são limitadas apenas pelo conjunto de termos individuais que fazem parte da

linguagem de indexação. Embora as fontes que participem em um conjunto de recuperação sejam determinadas pela atribuição de descritores do indexador, a comunicação entre o sistema

e o indivíduo é muito maior pela sua habilidade de criar suas próprias questões que irão capturar

sua necessidade de informação imediata.

Infelizmente, entretanto, a flexibilidade da criação de categoria, como o processo cognitivo de categorização, caminha lado a lado com a ausência de relações significativas. Como acontece com qualquer sistema de informação em texto livre, colocar uma questão a um

sistema pós-coordenado simplesmente divide a coleção em dois grupos: o conjunto de fontes no qual os descritores atribuídos que correspondem à consulta e as fontes remanescentes dos

quais os descritores não correspondem à consulta. Obviamente, sistemas pós-coordenados, como sistemas de texto livre são simplesmente mecanismos para agrupamento, não sistemas de organização. Diferentemente de sistemas de texto livre, entretanto, a base para agrupamento

em um sistema pós-coordenado é semântica, não sintática. Embora o sistema pós-coordenado

esteja simplesmente combinando seqüências, o indexador impõe certo nível de controle conceitual por atribuir simples descritores de uma linguagem de indexação que estabelece relacionamento de índice, de um para um entre um descritor e seu referente.

O indivíduo está habilitado a criar categorias de busca únicas e potencialmente

idiossincráticas precisamente porque o sistema em si não estabelece nada além das categorias mais simples – estas definidas pelos descritores individuais atribuídos por um indexador. Uma

vez que o sistema não consegue estabelecer um quadro de princípios que prevê o

estabelecimento de relações de portadores de informações entre as categorias, o sistema pós-coordenado pode nem criar nem contribuir para um contexto de informação exatamente porque não há uma estrutura persistente de que poderia apoiar relações significativas entre as

categorias.

CONCLUSÃO

Essa revisão preliminar das propriedades e características das diferentes abordagens para a organização, ordenamento ou simplesmente agrupamento das fontes de informação é

insuficiente no que tange a distinções estruturais entre os sistemas de classificação e

categorização e em como essas distinções afetam a interação com os sistemas como um ambiente de informação.

Por exemplo, em um nível muito superficial, a força da classificação é sua habilidade

de estabelecer relacionamentos entre classes que são estáveis e significantes. Mas a rigidez da

estrutura que suporta esses relacionamentos tem suas desvantagens correspondentes. Em particular, sistemas de classificação tradicionais são independentes de contexto: porque os relacionamentos estabelecidos por classificação são invariantes e persistem ao longo do tempo

e espaço, esses sistemas são resilientes ao contexto de uso e restringem severamente a habilidade individual de comunicação com o sistema de modo significativo e produtivo. Ao

contrário disso, sistemas de categorização e especialmente sistemas pós-coordenados, são altamente suscetíveis a - até mesmo dependentes de - contexto imediato. A utilidade desses sistemas como ambientes de informação dependem em última instância de disposições para

comunicação efetiva com o indivíduo. Mas a susceptibilidade e flexibilidade do sistema pós-

coordenado efetivamente proíbem o estabelecimento de relacionamentos significantes porque

as categorias são criadas pelo indivíduo, não pelo sistema, e são portanto passageiras e

efêmeras. É importante para filósofos, teóricos e desenvolvedores trabalharem para um

entendimento mais aprofundado e abrangente de como a estrutura de um sistema de

informação contribui para o estabelecimento de contexto semântico; como diferentes formas de organização apóiam a comunicação entre o pesquisador e o sistema; e como estruturas

organizacionais concretas e tipos específicos de relacionamentos contribuem para a produção de ambientes de informação significante. A busca por explicações adequadas dessas questões irá contribuir para um entendimento mais profundo das "dinâmicas de informação" (Floridi,

2002) e as implicações que a estrutura dos sistemas de informação tem para a composição e

interação com os ambientes de informação.

AGRADECIMENTOS

Gostaria de agradecer a Aaron Loehrlein por sua leitura atenta e comentários nos

rascunhos preliminares deste artigo e pelas várias conversas que contribuíram tão ricamente a este conteúdo teórico. Eu também gostaria de agradecer a Ken Herold por sua leitura muito

cuidadosa e perspicaz do rascunho final. Esta exploração do papel da estrutura na geração de

um ambiente semanticamente significativo de informação está em seus estágios iniciais, e eu gostaria de agradecer ao Ken pela oportunidade de desenvolver estar ideias para apresentação aqui.

REFERÊNCIAS Armstrong, S. L., Gleitman, L. R., & Gleitman, H. (1983). What some concepts might not be. Cognition, 13, 263–308. Barsalou, L. W. (1987). The instability of graded structure: Implications for the nature of concepts. In U. Neisser (Ed.), Concepts and conceptual development: The ecological and intellectual factors in categorization (pp. 101–140). Cambridge: Cambridge University Press. Bateson, G. (1979). Mind and nature: A necessary unity. New York: Dutton. Brown, R. (1979). Cognitive categories. In R. A. Kasschau & C. N. Cofer (Eds.), Psychology’s second century: Enduring issues (pp. 188–217). New York: Praeger. Clark, A. (1997). Being there: Putting brain, body, and world together again. Cambridge, MA: MIT Press. Floridi, L. (2002). What is the philosophy of information? Metaphilosophy, 33(1/2). Retrieved August 20, 2003, from http://www.wolfson.ox.ac.uk/~floridi/pdf/wipi.pdf Floridi, L. (in press). Open problems in the philosophy of information. Metaphilosophy. Retrieved August 20, 2003, from http://www.wolfson.ox.ac.uk/~floridi/pdf/oppi.pdf.

Foucault, M. (1970). The order of things: An archaeology of the human sciences. New York: Vintage Books. Fountain, J. F. (2001). Subject headings for school and public libraries: An LCSH/Sears companion (3rd ed.). Englewood, CO: Libraries Unlimited. Freyd, J. J. (1983). Shareability: The social psychology of epistemology. Cognitive Science, 7, 191–210. Gardner, H. (1987). The mind’s new science: A history of the cognitive revolution. New York: Basic Books. Hampton, J. A. (1979). Polymorphous concepts in semantic memory. Journal of Verbal Learning and Verbal Behavior, 18, 441–461. Hull, C. L. (1920). Quantitative aspects of the evolution of concepts. Psychological Monographs, 28, Whole No. 123. [Cited in Brown, 1979] Jacob, E. K. (1992). Classification and categorization: Drawing the line. In B. H. Kwasnik & R. Fidel (Eds.), Advances in classification research, Vol. 2. Proceedings of the 2nd ASIS SIG/CR Classification Workshop: Held at the 54th ASIS Annual Meeting, Washington, DC, October 27–31, 1991 (pp. 67–83). Medford, NJ: Learned Information. Jacob, E. K. (1994). Classification and crossdisciplinary communication: Breaching the boundaries imposed by classificatory structure. In H. Albrechtson & S. Oernager (Eds.), Knowledge organization and quality management: Advances in knowledge organization, vol. 4 (pp. 101– 108). Frankfurt/Main: Indeks Verlag. Jacob, E. K. (2001). The everyday world of work: Two approaches to the investigation of classification in context. Journal of Documentation, 57(1), 76–99. Jacob, E. K. (2002). Augmenting human capabilities: Classification as cognitive scaffolding. In M. J. López-Huertas & F. J. Muñoz-Fernández (Eds.), Challenges in knowledge representation and organization for the 21st century. Integration of knowledge across boundaries: Proceedings of the Seventh International ISKO Conference, 10–13 July 2002, Granada, Spain (pp. 38–44). Würzburg, Germany: Ergon Verlag. Jacob, E. K., & Loehrlein, A. (2003). What ontologies are not: A [draft] theoretical framework for the analysis of representational systems. Paper presented in the SLIS Colloquium 540 library trends/winter 2004 Series, School of Library and Information Science, Indiana University-Bloomington. Retrieved August 20, 2003, from http://ella.slis.indiana.edu/~aloehrle/repsys.ppt. Jacob, E. K., Mostafa, J., & Quiroga, L. M. (1997). An approach to the evaluation of automatically generated classification schemes. In P. Solomon (Ed.), Advances in classification research, Vol. 7. Proceedings of the 7th ASIS SIG/CR Classification Workshop: Held at the 59th ASIS Annual Meeting, Baltimore, MD, October 20, 1996 (pp. 78–98). Medford, NJ: Information Today. Library of Congress. Cataloging Policy and Support Office. (2002). Library of Congress Subject Headings (25th ed.). Washington, DC: Library of Congress, Cataloging Distribution Service. Markman, E. M. (1989). Categorization and naming in children: Problems of induction. Cambridge, MA: MIT Press. Mayr, E. (1982). The growth of biological thought: Diversity, evolution, and inheritance. Cambridge, MA: Harvard University Press. McCloskey, M. E., & Glucksberg, S. (1978). Natural categories: Well defined or fuzzy sets? Memory and Cognition, 6(4), 462–472. Rips, L. J., Shoben, E. J., & Smith, E. E. (1973). Semantic distance and the verification of semantic relations. Journal of Verbal Learning and Verbal Behavior, 12, 1–20.

Rosch, E. (1973). Natural categories. Cognitive Psychology, 4(3), 328–350. Rosch, E. (1975). Cognitive representations of semantic categories. Journal of Experimental Psychology: General, 104, 192–233. Rosch, E., & Mervis, C. B. (1975). Family resemblances: Studies in the internal structure of categories. Cognitive Psychology, 7(4), 573–605. Rosch, E., Mervis, C. B., Gray, W., Johnson, D., & Boyes-Braem, P. (1976). Basic objects in natural categories. Cognitive Psychology, 8(4), 382–439. Shera, J. H. (1951/1965). Classification as the basis of bibliographic organization. In Libraries and the organization of knowledge (pp. 77–96). Hamden, CT: Archon. (Reprinted from Bibliographic organization, pp. 72–93, 1951, Chicago, IL: University of Chicago Press) Shera, J. H. (1953/1965). Classification: Current functions and applications to the subject analysis of library materials. In Libraries and the organization of knowledge (pp. 97–111). Hamden, CT: Archon. (Reprinted from The subject analysis of library materials, pp. 29–42, by M. F. Tauber, Ed., 1953, New York: Columbia School of Library Science) Shera, J. H. (1956/1965). Putting knowledge to work. In Libraries and the organization of knowledge (pp. 51–62). Hamden, CT: Archon. (Reprinted from Special Libraries, 47, pp. 322– 326, 1956) Shera, J. H. (1960/1965). What lies ahead in classification. In Libraries and the organization of knowledge (pp. 129–142). Hamden, CT: Archon. (Reprinted from Proceedings of the Allerton Park Institute, pp. 116–128, 1960, Champaign: University of Illinois Bookstore) Smith, E., & Medin, D. (1981). Categories and concepts. Cambridge, MA: Harvard University Press. Soergel, D. (1985). Organizing information: Principles of data base and retrieval systems. Orlando, FL: Academic Press. Taylor, J. R. (1989). Linguistic categorization: Prototypes in linguistic theory. Oxford: Clarendon Press. Zerubavel, E. (1993). The fine line: Making distinctions in everyday life. Chicago, IL: University of Chicago Press. Referência do artigo: JACOB, E. K. Classification and Categorization: a Difference that Makes a Difference. Library Trends, V. 52, n. 3, 2004. p. 515-540.

elin k. jacob - classificação e categorização

Education