fabiano ferreira de castro - unesp - faculdade de ... · de filosofia e ciências – universidade...

203
1 unesp UNIVERSIDADE ESTADUAL PAULISTA “JÚLIO DE MESQUITA FILHO” Faculdade de Filosofia e Ciências, Campus de Marília – SP Programa de Pós-Graduação em Ciência da Informação FABIANO FERREIRA DE CASTRO Padrões de representação e descrição de recursos informacionais em bibliotecas digitais na perspectiva da Ciência da Informação: uma abordagem do MarcOnt Initiative na era da Web Semântica Marília 2008

Upload: others

Post on 04-Jul-2020

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

1

unesp UNIVERSIDADE ESTADUAL PAULISTA “JÚLIO DE MESQUITA FILHO”

Faculdade de Filosofia e Ciências, Campus de Marília – SP

Programa de Pós-Graduação em Ciência da Informação

FABIANO FERREIRA DE CASTRO

Padrões de representação e descrição de recursos informacionais em

bibliotecas digitais na perspectiva da Ciência da Informação:

uma abordagem do MarcOnt Initiative na era da Web Semântica

Marília 2008

Page 2: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

2

FABIANO FERREIRA DE CASTRO

Padrões de representação e descrição de recursos informacionais em bibliotecas

digitais na perspectiva da Ciência da Informação:

uma abordagem do MarcOnt Initiative na era da Web Semântica

Dissertação apresentada ao Programa de Pós-Graduação em Ciência da Informação, como parte das exigências para a obtenção do título de mestre em Ciência da Informação, da Faculdade de Filosofia e Ciências – Universidade Estadual Paulista - UNESP, Campus de Marília. Área: Informação, Tecnologia e Conhecimento. Linha: Informação e Tecnologia Orientador: Dra. Plácida Leopoldina Ventura Amorim da Costa Santos Pesquisa financiada pela CAPES

Marília 2008

Page 3: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

3

Castro, Fabiano Ferreira de. C353p Padrões de representação e descrição de recursos informacionais

em bibliotecas digitais na perspectiva da ciência da informação : uma abordagem do MarcOnt initiative na era da web semântica / Fabiano Ferreira de Castro. - - Marília, 2008.

201 f. : il. ; 30 cm Dissertação (Mestrado em Ciência da Informação) – Faculdade de Filosofia e Ciências – Universidade Estadual Paulista, 2008. Bibliografia: f. 166-183. Orientadora: Dra. Plácida Leopoldina Ventura Amorim da Costa Santos 1. MarcOnt Initiative. 2. MARC21. 3. Web Semântica. 4. Bibliotecas digitais. I. Autor. II. Título.

CDD 025.316

Page 4: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

4

FABIANO FERREIRA DE CASTRO

Padrões de representação e descrição de recursos informacionais em bibliotecas

digitais na perspectiva da Ciência da Informação:

uma abordagem do MarcOnt Initiative na era da Web Semântica

BANCA EXAMINADORA: ___________________________________________________________________________ Nome: Dra. Plácida Leopoldina Ventura Amorim da Costa Santos. Titulação: Profa. do Programa de Pós-Graduação em Ciência da Informação – Faculdade de Filosofia e Ciências – Universidade Estadual Paulista – UNESP, Campus de Marília. (Orientadora). ___________________________________________________________________________ Nome: Dra. Silvana Aparecida B. Gregorio Vidotti. Titulação: Profa. do Programa de Pós-Graduação em Ciência da Informação – Faculdade de Filosofia e Ciências – Universidade Estadual Paulista – UNESP, Campus de Marília. ___________________________________________________________________________ Nome: Profa. Dra. Lídia Alvarenga. Titulação: Profa. do Programa de Pós-Graduação em Ciência da Informação – Escola de Ciência da Informação – Universidade Federal de Minas Gerais – UFMG, Campus de Belo Horizonte.

Data da defesa: 29/02/2008

Local: Faculdade de Filosofia e Ciências – UNESP/Marília.

Page 5: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

5

Dedicatória...

À Deus, por me conceder esse presente.

Aos meus pais Alaor e Ana, com muito amor e carinho.

Page 6: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

6

AGRADECIMENTOS

Essa é uma das partes mais fáceis e prazerosas que perpassam o trabalho, mas ao

mesmo tempo difícil, pois são tantas as pessoas que passaram em nossas vidas e que direta ou

indiretamente contribuíram para a concretização de mais uma etapa alcançada. Sendo assim,

vamos tentar...

Quero agradecer primeiramente e de maneira especial àquele que me ensina a cada dia

a aprender a viver melhor, o Mestre dos Mestres, o qual não estaria agora aqui, firme, de pé, é

só por Ele... Deus. Assim como diz o grande livro: “Tudo posso naquele que me fortalece”.

Sinto-me feliz, por ser tão agraciado com a dádiva da vida e ter tido a oportunidade de realizar

algo que mais do que eu quisera Deus já o sonhara para mim. Assim como diz a canção: “[...]

vou perseguir tudo aquilo que Deus já escolheu pra mim [...] realizar o sonho mais lindo que

Deus sonhou...”.

Agradeço também à minha família que mesmo distantes, me apoiaram, oraram e me

deram condições, no sentido lato do termo, de concretizar mais esta etapa da minha vida: meu

pai Alaor, minha mãe Ana Maria, minha irmã Tatiane e meu irmão Júnior. Amo muito todos

vocês, obrigado por fazerem parte da minha vida, da minha história. Aos meus pais, por me

ensinarem, educarem e, sobretudo, a ser gente – proporcionando-me condições de chegar até

aqui.

Essas pessoas que falarei um pouco agora entraram na minha vida de mansinho, mas

fizeram uma revolução que ninguém faz idéia, nem mesmo eu. Estou falando do casal Carlão

e Teresa (mais conhecida como Mi), posso considerá-los a “segunda” família. Posso dizer que

foram peças principais nesta etapa, pois me acolheram em sua casa, como se fosse um filho

mesmo.

O Carlão, o que falar dele: pai, amigo, psicólogo, companheiro, com um grande

coração, esse cara é ouro. Desde o tempo do GOU (Grupo de Oração Universitário) pudemos

conviver como família. Obrigado pelas preciosas conversas, especialmente por me ajudar no

campo da Psicologia. Não tenho nem palavras para expressar a minha gratidão, meu carinho,

simplesmente muito obrigado por tudo...

Page 7: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

7

Agora vamos falar dessa figura a Mi, essa “grande” japonesa é como minha mãe

mesmo, carinhosa, meiga, amiga, companheira, ótima pessoa, sem falar das comidas que ela

faz, que tempero maravilhoso. Obrigado por tudo, pela paciência. Vocês moram no meu

coração e que o Senhor possa a cada dia abençoá-los abundantemente.

A pessoa que eu falarei agora é uma pessoa que eu tenho muita admiração, que eu a

conheço desde 1999, período o qual ingressei no curso de Biblioteconomia dessa mesma

universidade; lembra Dra. Plácida Leopoldina Ventura Amorim da Costa Santos, do primeiro

dia de aula: “o que é informação?”, “falta de informação mata?” “o que é catalogação?”

Perguntas e questionamentos que nortearam a minha vida profissional e acadêmica até o

presente momento. Não é por nada não, ela é simplesmente a minha orientadora sempre ética

e muito zelosa com o que faz, um exemplo de profissional e pessoa. Muito obrigado por tudo,

pela dedicação, amizade, orientação, carinho, pela confiança depositada, em especial por ter

tido o privilégio de ser seu orientando em mais este trabalho, desfrutando do seu

conhecimento e competência. Muito obrigado por me ajudar a descobrir “os maiores

diamantes espalhados pelos campos”. Será que encontrarei mais algum (s)?

À Profa. Silvana Vidotti, por sua participação na banca de qualificação e agora na

defesa deste trabalho, pelos apontamentos e contribuições. O que dizer sobre ela: uma pessoa

amiga, competente e que vem acompanhando meu crescimento acadêmico desde minha

graduação. Muito obrigado por fazer parte da minha vida.

À Profa. Lídia Alvarenga, por sua participação na banca de qualificação, por suas

valiosas contribuições que me fizeram refletir e a concretizar essa pesquisa. Muito obrigado

por tudo, por permitir-me partilhar um pouco do seu conhecimento e, sobretudo, da sua

simplicidade embutida na sua competência profissional.

Gostaria de agradecer aos funcionários da Pós-Graduação em Ciência da Informação

que prontamente sempre me atenderam com muito profissionalismo, de maneira especial

Carol, Aline, Andréia, Márcia e Douglas.

Aos funcionários da Universidade Estadual Paulista – Campus de Marília pela

dedicação, pelos serviços prestados, sempre atenciosos em suas atribuições. De maneira

Page 8: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

8

especial à Luzinete, bibliotecária e companheira do mestrado, muito obrigado por tudo, pela

amizade, carinho e boas conversas. Obrigado por compartilhar um pouco de sua experiência.

Aos meus colegas da Pós-Graduação em Ciência da Informação os quais passamos

bons e agradáveis momentos juntos e trocas de conhecimentos constantes. Em particular:

Ângela, Rachel, Juliane, Deise, Roberta, Aldinar, Liriane, Maria Carolina, Carlos, Luana,

Silvia, Milena, Rogério, Elvis e Maria José.

Aos professores do Programa de Pós-Graduação em Ciência da Informação, por toda

minha formação acadêmica e profissional.

Agradeço a CAPES pelo suporte financeiro desta pesquisa durante o período do

mestrado.

Aos meus amigos que sempre me apoiaram nesta etapa da minha vida, por

compreenderem os momentos de ausência: Hellen, Roberta, Marcinho, Lucilene, Kamila,

Denise, Milena, Viviane, Danielle, Marcos, Elza, Adriana Eugênio, Cassiane, Cláudia, Nina,

Kléber, Christiane, Estela, Comunidade El Shaddai e Vanessa.

A todas as pessoas, que com seu modo de ser, contribuíram e me apoiaram.

Simplesmente muito obrigado, vocês moram no meu coração.

Page 9: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

9

FOLHA EM BRANCO

A vida segue seu rumo

Vou escrevendo minha história

A cada dia eu recebo

Uma folha em branco do Criador!

Vou escrever o HOJE

Sem me preocupar com o AMANHÃ

Sim, já passou o ONTEM

Só quero ficar com o que é bom!

Eu não tenho medo de tentar!

Parar! Pensar! Mudar!

(Diego Fernandes)

Page 10: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

10

No bonde, antigamente…

No trem, no navio, em movimento

um não-lugar concreto.

E na Internet, atualmente.

O bonde trilhando

O avião voando

O navio...

Existe um lugar em movimento?

(Um-lugar-de-momento).

(MIRANDA; SIMEÃO, 2005)

Page 11: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

11

"Renda-se, como eu me rendi. Mergulhe no que você não conhece como eu mergulhei.

Não se preocupe em entender, viver ultrapassa qualquer entendimento". (Clarice Lispector)

Page 12: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

12

RESUMO

A relevância tanto da Web quanto das bibliotecas digitais para os diversos ramos da ciência, tem impulsionado pesquisadores e comunidades científicas a buscar soluções de integração, intercâmbio e entendimento semântico sobre os conteúdos que nelas circulam. Verifica-se, no cenário atual, uma forte tendência para a disponibilização de conteúdos digitais e a falta de uso de padrões adequados para a representação e a descrição desses recursos em ambientes digitais, o que é apontado pela literatura como uma grande preocupação para a comunidade científica e focado neste trabalho enquanto problema da pesquisa. Nesse contexto, a proposição desta pesquisa é verificar na literatura científica a aplicabilidade e a funcionalidade das tecnologias e instrumentos disponíveis como padrões de representação e descrição de conteúdo e forma, no âmbito das bibliotecas digitais, com o objetivo de identificar e de caracterizar o uso e a aplicação do MarcOnt enquanto ferramenta para a construção de formas de representação da informação para bibliotecas digitais na atualidade, destacando-o como instrumento para descrição dos aspectos semânticos dos conteúdos digitais nestas ambiências. Como metodologia, o presente trabalho caracteriza-se por ser uma pesquisa de análise exploratória e descritiva do tema, com o qual é possível obter subsídios para um maior entendimento e compreensão mais detalhados do MarcOnt e as tecnologias que estão abarcadas no âmbito das bibliotecas digitais para a construção Web Semântica. Como resultado, procurou-se demonstrar a aplicação da ferramenta MarcOnt em um ambiente informacional específico, a Biblioteca Digital Semântica JeromeDL, para analisar nos fundamentos da Catalogação as formas de representação dos recursos informacionais. O que nos levou a definir categorias para análise futura do sistema em comparação com o padrão de metadados MARC21. Além disso, foi possível demonstrar a existência de um ambiente colaborativo, o Portal MarcOnt, o qual se apresenta como um espaço para a construção de descrições bibliográficas semânticas. Assim, o padrão de descrição bibliográfica semântica MarcOnt, oferece a possibilidade de garantir uma melhora na performance de interoperabilidade, não somente entre padrões de metadados, mas também entre sistemas e ambientes informacionais digitais. Palavras-chave: MarcOnt. MARC21. Web Semântica. Bibliotecas digitais. Representação da informação. Catalogação automatizada. Padrões de metadados. Informação e Tecnologia.

Page 13: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

13

ABSTRACT

The relevancy of not only the Web but also the digital libraries for the diverse branches of Science has stimulated researchers and scientific communities to search for integration solutions, interchange and semantic understanding about the contents that circulate in them. In the present scenary, a strong tendency is verified for the availability of digital contents and the lack of use of adequate patterns for the representation and description of those resources in digital environments, what is pointed by literature as a great concern for the scientific community and focused on this work as a problem of the research. In this context, the proposal of this research is to verify, in the scientific literature, the applicability and functionality of the technologies and instruments available as patterns of representation and description of content and form, in the ambit of digital libraries, with the objective of identifying and characterizing the use and the application of MarcOnt as a tool for the construction of forms of information representation for digital libraries at the present time, highlighting it as an instrument for describing the semantic aspects of the digital contents in these environments. As a methodology, the present work is characterized by being an exploratory and descriptive analysis of the subject, with which it is possible to obtain subsidies for a better and more detailed understanding and comprehension of MarcOnt and the technologies that are included in the ambit of digital libraries for the Semantic Web construction. As a result, it was attempted to demonstrate the application of the MarcOnt tool in a specific informational environment, the JeromeDL Semantic Digital Library, to analyze the fundamentals of Cataloguing the forms of representation of informational resources. That made us define the categories for the future analysis of the system comparing to the MARC21 metadata pattern. Besides, it was possible to demonstrate the existence of a cooperative environment, the MarcOnt Gateway, which presents itself as a space for the construction of semantic bibliographic descriptions. Therefore, the MarcOnt semantic bibliographic description pattern offers the possibility of assuring an improvement in the interoperability performance, not only among metadata patterns, but also among digital informational systems and environments. Keywords: MarcOnt. MARC21. Semantic Web. Digital libraries. Representation of information. Automatized cataloguing. Metadata patterns. Information and Technology.

Page 14: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

14

LISTA DE ILUSTRAÇÕES

FIGURA 1: Memex (Memory Extension) ................................................................................33

FIGURA 2: Evolução das bibliotecas com a presença das TICs .............................................45

FIGURA 3: Elementos básicos do acervo digital.....................................................................60

FIGURA 4: Tipos de informação segundo o Modelo de referência Open Archival Information

System (OAIS)..........................................................................................................................62

FIGURA 5: Entidades do Grupo 1 e Relações Bibliográficas Primárias.................................83

FIGURA 6: Estrutura do código RDA .....................................................................................86

FIGURA 7: Exemplo de registro bibliográfico em formato MARC21 comentado pelo autor..

..................................................................................................................................................91

FIGURA 8: Estrutura de um registro em formato MARCXML ..............................................93

FIGURA 9: Elementos contemplados no padrão de metadados Dublin Core .........................96

FIGURA 10: Estrutura de registro em formato Dublin Core...................................................97

FIGURA 11: Estrutura de um registro no padrão de metadados BibTeX...............................100

FIGURA 12: Exemplo de documento livro em XML............................................................103

FIGURA 13: Arquitetura RDF simples..................................................................................107

FIGURA 14: Declaração RDF utilizando a sintaxe XML .....................................................108

FIGURA 15: Estrutura da arquitetura RDF Schema..............................................................109

FIGURA 16: Arquitetura da Web Semântica proposta em 2005 comentada pelo autor ........118

FIGURA 17: Arquitetura de serviços de mediação MarcOnt ...............................................128

FIGURA 18: Estrutura de representação em MarcOnt..........................................................130

FIGURA 19: Regras para construção de descrição semântica de MARC21 para MarcOnt

............................................................................................................................................. ...133

FIGURA 20: Estrutura básica do MarcOnt ...........................................................................134

FIGURA 21: Arquitetura da Biblioteca Digital Semântica JeromeDL..................................138

FIGURA 22: Interface de apresentação da Biblioteca Digital Semântica JeromeDL............141

FIGURA 23: Formas de busca e tipos documentais ..............................................................142

FIGURA 24: Interface de busca avançada .............................................................................143

FIGURA 25: Interface de Busca semântica ...........................................................................144

FIGURA 26: Recurso informacional Livro............................................................................145

FIGURA 27: Formas de apresentação dos recursos informacionais......................................146

FIGURA 28: Representação de um recurso informacional em MarcOnt..............................147

FIGURA 29: Interface de entrada no Portal MarcOnt...........................................................150

Page 15: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

15

FIGURA 30: Principais ferramentas para a construção de descrições semânticas ................150

FIGURA 31: Ambiente das regras gerais de transformação ..................................................151

FIGURA 32: Criação de múltiplas descrições .......................................................................152

FIGURA 33: Apresentação do recurso em forma de tripla....................................................152

FIGURA 34: Submissão da criação da descrição do recurso ao comitê de avaliação ...........153

FIGURA 35: Verificação das normas exigidas para construção da descrição.......................154

FIGURA 36: Acesso aos recursos informacionais .................................................................155

Page 16: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

16

LISTA DE SIGLAS AACR - Anglo-American cataloging rules AACR

AACR3 - Anglo-American Cataloging Rules 3. ed

ACL - Access Control List

ALA - American Library Association

ARPA - Advanced Research Projects Agency

CALCO – CAtalogação Legível por COmputador

CBU - Controle Bibliográfico Universal

CCSDS - Consultive Committee for Space Data Systems

CDD - Classificação Decimal de Dewey

CDNL - Conferência de Diretores das Bibliotecas Nacionais

CDU - Classificação Decimal Universal

COLIS - International Conference on Conceptions of Library and Information Science

DC - Dublin Core

DERI - Entreprise Research Institute

DTD - Document Type Definition

ELP - Extensible Library Protocol

FID - Federação Internacional de Documentação

FRBR - Functional Requirements of Bibliographic Records

GUT - Gdańsk University of Technology

HTML - Hypertext Markup Language

HTTP - Hypertext Transfer Protocol

IBBD - Instituto Brasileiro de Bibliografia e Documentação

IBICT - Instituto Brasileiro de Informação Científica e Tecnológica

IFLA - International Federation of Library Association and Institutions

IIB - Instituto Internacional de Bibliografia

IID – Instituto Internacional de Documentação

ISBD - International Standard Bibliographic Description

LC - Library of Congress

MARC - Machine Readable Cataloging

MEMEX - Memory Extension

METS - Metadata Encoding and Transmission Standard

MIT - Massachussets Institute of Technology

Page 17: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

17

OAI-PMH - Open Archives Initiative Protocol for Metadata Harvesting

OAIS - Open Archival Information System

OCLC - OnLine Computer Library Center

OWL - Web Ontology Language

RBU - Repertório Bibliográfico Universal

RDA - Resource Description and Access

RDF - Resource Description Framework

RDFS - Resource Description Framework Schema

RI - Repositórios Institucionais

RIEC - Reunião Internacional de Especialistas em Catalogação

RMI - Remote Method Invocation

SGML - Standard Generalized Markup Language

TICs - Tecnologias da Informação e Comunicação

UFRJ – Universidade Federal do Rio de Janeiro

UNESP - Universidade Estadual Paulista “Júlio de Mesquita Filho”

URI - Uniform Resource Identifier

W3C - World Wide Web Consortium

XHTML - eXtensible Hypertext Markup Language

XML - Extensible Markup Language

XSL - Extensible Stylesheet Language

Page 18: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

18

SUMÁRIO

1 INTRODUÇÃO ...................................................................................................................18

1.1 Definição do problema .....................................................................................................20

1.2 Proposição .........................................................................................................................21

1.3 Objetivos............................................................................................................................21

1.3.1 Objetivo geral.................................................................................................................21

1.3.2 Objetivos específicos......................................................................................................22

1.4 Metodologia.......................................................................................................................22

1.4.1 Forma de análise dos resultados...................................................................................24

1.5 Justificativa .......................................................................................................................24

2 UMA ABORDAGEM REVISITADA DAS TECNOLOGIAS DA INFOR MAÇÃO E

COMUNICAÇÃO NO ÂMBITO DA CIÊNCIA DA INFORMAÇÃO ..... .......................28

3 BIBLIOTECAS DIGITAIS: GÊNESE E CONTEMPORANEIDADE. ........................44

3.1 Dimensão contextual acerca das Bibliotecas Digitais....................................................46

3.2 Pontuações sobre os Websites ..........................................................................................52

3.3 Paradigma da Preservação digital na perspectiva das Bibliotecas Digitais................58

3.3.1 Modelo de Referência Open Archival Information System (OAIS)............................61

3.3.2 O papel dos metadados na preservação digital...........................................................66

3.4 Elementos éticos no contexto das Bibliotecas Digitais...................................................68

4 FORMAS DE REPRESENTAÇÃO DA INFORMAÇÃO: UM DIÁLOGO

INTERSUBJETIVO...............................................................................................................73

4.1 Representação da informação .........................................................................................74

4.2 Breves considerações sobre os catálogos, as regras e os códigos de catalogação:

marcos de formas de representação na perspectiva da Biblioteconomia e da Ciência da

Informação ..............................................................................................................................79

4.3 Catalogação ou metadados... “eis a questão”: paradigmas e transformações no

cenário atual............................................................................................................................87

4.3.1 Padrão de metadados MARC21...................................................................................90

4.3.2 Padrão de metadados MARCXML .............................................................................92

4.3.3 Padrão de metadados Dublin Core ..............................................................................95

Page 19: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

19

4.3.4 Padrão de metadados BibTeX......................................................................................98

4.4 XML (Extensible Markup Language)............................................................................102

4.5 Arquitetura de metadados RDF....................................................................................105

4.5.1 RDF Schema.................................................................................................................108

4.6 Apontamentos sobre as formas de representação da informação..............................111

5 MARCONT INITIATIVE: UMA PROPOSTA PARA A REPRESENTAÇÃO E A

DESCRIÇÃO DE RECURSOS INFORMACIONAIS NA WEB ....................................114

5.1 Web Semântica: novos olhares para a representação e a descrição de recursos

informacionais.......................................................................................................................115

5.2 Descrição bibliográfica na era da Web Semântica.......................................................121

5.3 Arquitetura MarcOnt ....................................................................................................128

5.4 Biblioteca Digital Semântica JeromeDL .......................................................................136

5.4.1 Formas de representação dos recursos informacionais na Biblioteca Digital

Semântica JeromeDL............................................................................................................141

5.5 Portal Colaborativo MarcOnt : um modelo de aplicação para recursos

informacionais.......................................................................................................................149

5.6 À guisa de resultados......................................................................................................156

6 CONSIDERAÇÕES FINAIS............................................................................................158

REFERÊNCIAS ...................................................................................................................166

BIBLIOGRAFIA CONSULTADA......................................................................................180

ANEXOS. ..............................................................................................................................184

ANEXO A – Regras de transformação entre os padrões de metadados..........................185

Page 20: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

18

Capítulo 1Capítulo 1Capítulo 1Capítulo 1

INTRODUÇÃOINTRODUÇÃOINTRODUÇÃOINTRODUÇÃO

Page 21: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

19

1 INTRODUÇÃO

“Conhecimento é a capacidade de atuar num contexto”

(Karl-Erik Sveiby)

Esta pesquisa insere-se na linha de pesquisa Informação e Tecnologia do Programa de

Pós-Graduação em Ciência da Informação da Universidade Estadual Paulista “Júlio de

Mesquita Filho” – UNESP - campus de Marília. Tem como tema MarcOnt Initiative1 no

âmbito das bibliotecas digitais na era da Web Semântica, ferramenta tecnológica considerada

um padrão de representação e de descrição da informação que contempla forma e conteúdo do

recurso informacional, no âmbito das bibliotecas digitais.

A pesquisa é integrante do projeto financiado pelo CNPq intitulado “Da Catalogação

ao uso de recursos informacionais digitais: questões sobre a interoperabilidade em ambientes

informacionais”, sob a coordenação da Dra. Plácida Leopoldina Ventura Amorim da Costa

Santos, junto ao Grupo de Pesquisa Novas Tecnologias em Informação da UNESP/Marília e

conta com o apoio financeiro da Coordenação de Aperfeiçoamento de Pessoal de Nível

Superior (CAPES).

Vivenciamos atualmente constantes mudanças nos mais variados segmentos de nossa

sociedade, uma delas de cunho tecnológico, no contexto que conhecemos hoje por Sociedade

da Informação. Percebe-se que nos últimos tempos houve um aumento desordenado e caótico

na quantidade de informações produzidas e disponibilizadas em meio digital, requerendo uma

mudança e um repensar nas formas de armazenamento, de representação, de descrição e de

preservação dos recursos informacionais digitais.

1 As informações concernentes ao projeto MarcOnt Initiative © 2005 MARCONT.org estão disponibilizadas no Portal MarcOnt. Disponível em: <http://portal.marcont.org>. Acesso em: 04 jan. 2008. Vale destacar que os estudos referentes ao projeto MarcOnt Initiative contam com a parceria da National University of Ireland- Galway, Leopold Franzens University-Innsbruck, Gdansk University of Technology e Digital Enterprise Research Institute (DERI).

Page 22: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

20

A Web atual, caracterizada como um espaço “aberto” e de fácil socialização do

conhecimento vem enfrentando mudanças significativas em sua estrutura e na sua forma de

representar e apresentar os recursos informacionais digitais, o que exige e pressupõe um novo

olhar de diversos profissionais, especialmente os da área de Ciência da Informação e de

Biblioteconomia que têm um papel sine qua non, enquanto agentes transformadores no século

XXI.

Nesse contexto, temos o papel das bibliotecas que atuam como segmentos na Internet

e que passam a ser totalmente dependentes de tecnologias e precisam se adaptar às novas

perspectivas tecnológicas na constituição de ambientes informacionais digitais e novos

formatos de armazenamento, descrição e representação das informações.

A relevância tanto da Web quanto das bibliotecas digitais para os diversos ramos da

ciência tem impulsionado pesquisadores e comunidades científicas a buscar soluções de

integração, intercâmbio e entendimento semântico sobre os conteúdos que nelas circulam, a

fim de proporcionar uma recuperação mais precisa, relevante e significativa para o usuário

final.

1.1 Definição do problema

As bibliotecas digitais se caracterizam como ambientes facilitadores de acesso às

informações, sem a limitação de espaço e tempo, uma vez que nessas o tratamento dado ao

recurso informacional requer uma descrição de forma e de conteúdo legível por máquinas

com resultados compreensíveis aos humanos. Desse modo, destaca-se a necessidade de um

tratamento de forma e conteúdo adequado para a representação e para a apresentação de

informações, visando uma recuperação mais eficiente.

Verifica-se, no cenário atual, uma forte tendência para a disponibilização de conteúdos

digitais e a falta de uso de padrões adequados para a representação e a descrição destes

recursos em ambientes digitais, e que garanta a sua apresentação para o uso, a preservação e o

reuso das informações para os usuários.

Page 23: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

21

1.2 Proposição

Na tentativa de encontrar caminhos para a solução do problema, Kruk, Decker e

Zieborak (2005), apontam o MarcOnt Initiative, que apresenta instrumentos subjacentes à

Web Semântica, tais como as ontologias e o uso de padrões de metadados, contemplando

parâmetros que vão ao encontro dos objetivos das bibliotecas digitais e propiciam meios mais

adequados de representar e organizar os recursos informacionais digitais, atrelados aos

aspectos semânticos de seus conteúdos.

Nesse contexto, a proposição desta pesquisa é verificar na literatura científica a

aplicabilidade e a funcionalidade de tais tecnologias e instrumentos como padrões de

representação e descrição de conteúdo e forma, no âmbito das bibliotecas digitais e no

ambiente Web de um modo geral.

1.3 Objetivos

A Ciência da Informação como uma área que tem como objeto de estudo a

informação, desde a sua geração até o seu uso, pautada nos processos de representação,

descrição, organização, acesso e recuperação de recursos informacionais, busca identificar

algumas ferramentas para a construção de formas de representação de recursos em bibliotecas

digitais. Nesse sentido, a presente pesquisa tem como objetivos:

1.3.1 Objetivo geral

De acordo com os novos cenários, tais como, Web Semântica, Web 2.0 etc. e

caracterizados por novas perspectivas tecnológicas, a pesquisa tem como objetivos a

identificação e o estudo de métodos e ferramentas tecnológicas disponíveis para a

representação e a descrição de recursos informacionais bem como de seu conteúdo, no

contexto das bibliotecas digitais e da Web, na tentativa de identificar o embasamento

conceitual subjacente às ferramentas para a padronização da descrição dos aspectos de forma

Page 24: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

22

e do conteúdo dos recursos informacionais nestas ambiências, na abordagem da Ciência da

Informação.

1.3.2 Objetivos específicos

Nesse sentido, os objetivos específicos elencados para uma abordagem mais

aprofundada da pesquisa, são os seguintes:

• Identificar e caracterizar o MarcOnt Initiative, como um padrão de representação da

informação (forma e conteúdo) em bibliotecas digitais e na Web na atualidade;

• Justificar a adoção da ferramenta MarcOnt como possibilidade de proporcionar a

interoperabilidade semântica entre bibliotecas digitais e outros sistemas de

informação.

1.4 Metodologia

Na busca de um conhecimento teórico sobre as ferramentas tecnológicas disponíveis

para a construção de formas de representação de recursos informacionais, no âmbito das

bibliotecas digitais, o presente trabalho caracteriza-se por ser uma pesquisa de análise

exploratória e descritiva do tema (CERVO; BERVIAN, 2003).

Os estudos exploratórios, segundo Dencker e Viá (2001, p. 41),

São investigações de pesquisa empírica que tem por finalidade formular ou esclarecer questões para desenvolver hipóteses. O estudo exploratório aumenta a familiaridade do pesquisador com o fenômeno ou com o ambiente que pretende investigar, servindo de base para uma pesquisa futura mais precisa. São também utilizados para esclarecer ou modificar conceitos. As descrições, nesse caso, tanto podem ser qualitativas quanto quantitativas. Os métodos de coleta de dados também podem variar da pesquisa bibliográfica e documental ao uso de questionário, entrevista ou observação.

Page 25: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

23

Assim, no referencial teórico publicado sobre o tema, foi possível identificar

elementos para responder aos principais objetivos estabelecidos neste trabalho.

A adoção dessa metodologia permitiu abordar os aspectos envolvidos nos objetivos

específicos definidos anteriormente e a proporcionar a compreensão e a concretização do

objetivo geral proposto. O método de coleta de dados escolhido é a pesquisa bibliográfica e

documental.

Os procedimentos metodológicos podem ser assim delineados:

• Levantamento bibliográfico em níveis nacional e internacional, em fontes

bibliográficas primárias (livros, periódicos, anais de congressos, teses e

documentos eletrônicos da Internet, entre outros documentos congêneres),

secundárias (Bases de dados textuais e referenciais como: Lisa, Scielo, Current

Contents, Web Spirs, Periódicos Capes, Web of Science, entre outras) e terciárias

(bibliografias, índices, catálogos coletivos, diretórios e outros) da área de Ciência

da Informação.

• Seleção dos documentos, constantes nas referências e bibliografia consultada deste

trabalho, a partir dos critérios de pertinência com relação aos assuntos principais

desta pesquisa, com os termos: MarcOnt, MARC21, Web Semântica, Bibliotecas

digitais, Representação da informação, Catalogação automatizada, Informação e

Tecnologia nos idiomas português, inglês e espanhol, com período de publicação

limitado aos últimos dez anos, apenas como abordagem inicial, não havendo

limitação cronológica para referências citadas nos documentos selecionados.

• Leituras e documentação dos textos selecionados, que possibilitaram a criação de

um referencial teórico com o qual será possível obter subsídios para um maior

entendimento e compreensão mais detalhados do MarcOnt e as metodologias para

a descrição de recursos informacionais, no âmbito das bibliotecas digitais na

abordagem da Ciência da Informação.

Page 26: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

24

1.4.1 Forma de análise dos resultados

Para que os objetivos propostos pela pesquisa fossem alcançados, os resultados

obtidos foram sistematizados sob os focos:

1. Identificação de categorias de análise para avaliação sistemática do MarcOnt.

2. Identificação e caracterização do MarcOnt Initiative no âmbito da Ciência da Informação,

a fim de contextualizar o objeto de estudo da pesquisa e sua relevância e contribuição

científica para a área;

3. Possibilidade de aplicação do MarcOnt Initiative, enquanto padrão de representação e de

descrição (forma e conteúdo) na perspectiva das bibliotecas digitais e da Web.

1.5 Justificativa

Um dos aspectos que motivaram o desenvolvimento da pesquisa foi a familiaridade do

autor desde a pesquisa na graduação em Biblioteconomia no ano de 2002 no tema

Catalogação Automatizada e formato de intercâmbio MARC21, o que impulsionou um estudo

mais aprofundado sobre a temática aqui tratada. Em 2005, no curso de especialização Uso

Estratégico das Tecnologias em Informação oferecido pela Universidade Estadual Paulista

“Júlio de Mesquita Filho” – UNESP/Marília, o autor se deparou com questões relacionadas às

novas abordagens da representação e da descrição de recursos informacionais em ambientes

informacionais digitais, tais como a Web Semântica e as Bibliotecas Digitais e os novos

rumos da Catalogação aplicada a essas ambiências, culminando assim, na presente pesquisa.

Partindo do princípio que cada vez mais informações são produzidas, principalmente

no meio digital, tais ambientes passam requerer métodos mais adequados que possibilitem a

representação e a organização de seus conteúdos de modo mais eficiente e preciso.

Page 27: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

25

Há na comunidade científica várias pesquisas neste sentido, principalmente no âmbito

das bibliotecas digitais, na tentativa de estabelecer formas mais eficazes de recuperação e

comunicação entre estes ambientes. Tal cenário requer uma preocupação com a identificação

e o desenvolvimento de normas e padrões para a representação das informações que facilitem

a sua descrição e localização, e ainda que proporcionem a interoperabilidade entre os sistemas

informacionais.

Uma dessas iniciativas é o desenvolvimento do padrão MarcOnt que possui uma

arquitetura baseada no modelo RDF (Resource Description Framework), proposta por

Berners-Lee para a Web Semântica e com algumas aplicações preliminares em bibliotecas

digitais semânticas específicas, tais como a JeromeDL, que será abordada posteriormente no

capítulo 5.

Ainda que amplamente discutido em nível internacional, como por exemplo, na

Biblioteca Digital Semântica JeromeDL, na Polônia, no Brasil não existem relatos de

discussão a respeito do MarcOnt Initiative, no processo de recuperação da informação e

identificação do recurso informacional em ambientes digitais.

Pensando nisso, acredita-se que esta seja uma pesquisa de relevância por contribuir

para o desenvolvimento de referencial teórico e metodológico na disciplina de Catalogação da

área de Biblioteconomia.

A atualidade do assunto e sua repercussão na comunidade científica, atrelado ao

desejo e a necessidade de uma investigação científica de forma mais aprofundada no tema

MARC e formas de representação no âmbito das bibliotecas digitais na era da Web Semântica,

também é levado em consideração.

Verifica-se, preliminarmente, a falta de publicações do assunto em língua portuguesa,

destacando dessa forma, a relevância da pesquisa por contribuir como uma fonte de

informação bibliográfica; além disso, a relevância social na realização desta pesquisa está em

fornecer subsídios teóricos para que profissionais da área de Ciência da Informação possam

desenvolver métodos e técnicas mais eficazes de representação para a localização e a

recuperação da informação em ambientes informacionais digitais.

Page 28: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

26

Justifica-se seu desenvolvimento no que tange em acompanhar os avanços da área de

Ciência da Informação sobre a temática abordada e a questão da padronização da

representação e da descrição dos recursos informacionais e seus conteúdos em bibliotecas

digitais e no ambiente Web.

O presente capítulo compreende a Introdução e aborda questões iniciais, bem como o

contexto que esta se insere, tais como o problema da pesquisa, a hipótese, a proposição, os

objetivos (geral e específico), a metodologia, a justificativa, a relevância social, a relevância

para a área de Ciência da Informação. As demais partes desta dissertação são:

CAPÍTULO 2 - UMA ABORDAGEM REVISITADA DAS TECNOLOGIAS DA

INFORMAÇÃO E COMUNICAÇÃO NO ÂMBITO DA CIÊNCIA DA INFORMAÇÃO – Nesse

capítulo procura-se mostrar como as Tecnologias da Informação e Comunicação – TICs vêem

permeando os ambientes informacionais, desde o pensamento de alguns renomados autores da

área da Ciência da Informação, dentre os quais, Paul Otlet e Vannevar Bush, e a preocupação

da comunidade em criar ferramentas e metodologias para a padronização dos processos

informacionais e o percurso do campo científico da Ciência da Informação, assim como as

novas perspectivas tecnológicas apontadas pela literatura, tais como, Web Semântica, Web 2.0

etc.

CAPÍTULO 3 – BIBLIOTECAS DIGITAIS: GÊNESE E CONTEMPORANEIDADE – Esse

capítulo trata do surgimento das bibliotecas digitais até como estas se apresentam

hodiernamente, apontando que estas se encontram como ambiências específicas e

padronizadas e que podem auxiliar, com suas metodologias e tecnologias advindas da

Biblioteconomia e da Ciência da Informação a construção e a efetivação da Web Semântica,

no que diz respeito à descrição e à representação dos recursos informacionais, promovendo

uma sinergia e a possibilidade de um trabalho colaborativo entre ambientes informacionais

digitais.

Page 29: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

27

CAPÍTULO 4 – FORMAS DE REPRESENTAÇÃO DA INFORMAÇÃO: UM DIÁLOGO

INTERSUBJETIVO – Nesse capítulo destacou-se a necessidade de se criar e ter estruturas

padronizadas para a construção de formas de representação da informação registrada,

destacando que as metodologias da Biblioteconomia e da Ciência da Informação

proporcionam e dão respaldo para qualquer tipo de representação do recurso informacional.

Além disso, propõe-se a construção da forma de representação de um recurso informacional,

destacando as novas perspectivas tecnológicas e as aspirações do cenário atual, tais como:

Bibliotecas Digitais e Web Semântica, a fim de promover e possibilitar a interoperabilidade

semântica entre ambientes informacionais digitais.

CAPÍTULO 5 - MARCONT INITIATIVE: UMA PROPOSTA PARA A REPRESENTAÇÃO E

A DESCRIÇÃO DE RECURSOS INFORMACIONAIS NA WEB – Com o intuito de analisar e

verificar as formas de representação e de descrição de recursos informacionais na Web,

procurou-se destacar as tendências e os novos olhares para os ambientes informacionais

digitais com os cenários conhecidos hoje, como Web Semântica, Web 2.0 etc. Nesse contexto,

apontamos como umas das possíveis soluções para as questões de padronização dos recursos

informacionais na rede, o desenvolvimento de um novo padrão de descrição semântica

indicado pela literatura científica como MarcOnt Initiative. Além disso, mostramos os

ambientes e o aparecimento das primeiras bibliotecas digitais semânticas, com destaque para a

Biblioteca Digital Semântica JeromeDL, ambiência na qual procurou-se testar as

potencialidades e as funcionalidades do padrão MarcOnt, no que diz respeito às questões de

busca e de recuperação dos recursos informacionis no âmbito digital.

CAPÍTULO 6 - CONSIDERAÇÕES FINAIS – Esse capítulo apresenta os resultados,

observações e reflexões acerca do padrão de descrição bibliográfica semântica MarcOnt, bem

como os novos rumos da Catalogação e o impacto na evolução de ambientes informacionais

digitais na perspectiva da Ciência da Informação.

REFERÊNCIAS – São apresentadas as referências que constituem e formam o corpus teórico

dessa pesquisa.

Page 30: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

28

Capítulo 2Capítulo 2Capítulo 2Capítulo 2

Uma abordagem revisitada das Tecnologias da Informação Uma abordagem revisitada das Tecnologias da Informação Uma abordagem revisitada das Tecnologias da Informação Uma abordagem revisitada das Tecnologias da Informação

e Comunicação no âmbito da Ciência da Informaçãoe Comunicação no âmbito da Ciência da Informaçãoe Comunicação no âmbito da Ciência da Informaçãoe Comunicação no âmbito da Ciência da Informação

Page 31: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

29

2 UMA ABORDAGEM REVISITADA DAS TECNOLOGIAS DA INFOR MAÇÃO E COMUNICAÇÃO NO ÂMBITO DA CIÊNCIA DA INFORMAÇÃO

“Nenhuma ciência goza do privilégio de uma imaculada concepção”.

Paul Ricouer

Para se contextualizar a questão de pesquisa, torna-se importante afirmar que esta

insere-se na linha de pesquisa Informação e Tecnologia do Programa de Pós-Graduação em

Ciência da Informação da Universidade Estadual Paulista “Júlio de Mesquita Filho” – UNESP

- do campus de Marília. Neste sentido, por estar contemplada em tal linha, tornou-se relevante

traçar um panorama sobre como as Tecnologias da Informação e Comunicação (TICs2) foram

se desenvolvendo ao longo dos tempos, atuando significamente no campo da Ciência da

Informação enquanto instrumentos na facilitação dos processos informacionais.

Serão revisitados os pensamentos de autores e conceitos que contribuíram com a

emergência da Ciência da Informação.

A Ciência da Informação tem como dos um dos seus principais precursores Paul Otlet,

que contribuiu de forma marcante na evolução das práticas bibliotecárias e documentais. Ele

desenvolveu uma nova classificação que foi considerada como o ponto de partida para o

lançamento do Repertório Bibliográfico Universal (RBU), durante a Conferência

Bibliográfica Internacional celebrada em Bruxelas em 1895.

Em 1907, o termo documentação foi formulado por Otlet para expressar uma

abordagem mais ampla à organização de fontes de conhecimento do que tradicionalmente

associada ao termo bibliografia, ou seja, era considerada uma atividade complementar à

educação e à pesquisa. Nesse sentido, Otlet destaca o que no seu entendimento, seriam as

fontes da documentação: documentos escritos (livros, periódicos, jornais e manuscritos), as

ilustrações (gravuras, desenhos, fotografias etc.), os ideogramas (mapas, plantas, quadros

2 Para este estudo adotaremos a sigla (TICs) para nos referirmos às Tecnologias da Informação e Comunicação.

Page 32: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

30

sinópticos, diagramas etc.) e a música. (RAYWARD, 1997). Pode-se dizer que o

entendimento de Otlet sobre documentação, bem como sua organização, como sendo um

campo de estudo e pesquisa, pode ser traduzido em nosso termo de Ciência da Informação.

Durante o período compreendido entre as duas grandes guerras mundiais, exatamente

em 1924, foi reorganizado o Instituto Internacional de Bibliografia (IIB) que se constituiu na

Federação de Organizações de Documentação. O IIB em suas finalidades foi criado com o

intuito de criar ferramentas para registrar, de forma sistemática e padronizada, as referências

dos documentos. As primeiras preocupações do IIB era a de desenvolver um sistema de

classificação único, com o propósito de ser adotado por todos, na indexação dos documentos.

Em 1925, Otlet desenvolve uma biblioteca portátil de microfichas, o que pode ser

considerado como uma iniciativa da preocupação de armazenar o conhecimento em algum

suporte informacional para posterior acesso e uso. Nesse contexto, surge a Classificação

Decimal Universal (CDU) que possibilitava o tratamento temático de outros tipos de

documentos além do livro e de outros produtos impressos. A CDU era um sistema de

gerenciamento de banco de dados (entendidos nesse contexto, como arquivos impressos,

classificados por título, autor e assunto) extremamente complexo, descrita no contexto de um

sistema de armazenamento e recuperação de informação de hipertexto: um mecanismo de

recuperação para acesso e gerenciamento efetivos de banco de dados. (RAYWARD, 1997).

Segundo Otlet (1934) a criação e a organização de sistemas de acesso a banco de dados,

precisava de uma tecnologia da informação especial, que foi denominada de tecnologia de

ficha e arquivo, cujo padrão era de 3” X 5” para fins de uso bibliográfico. Ao separar o

conteúdo de um livro de seu autor e de sua intenção autoral, Otlet imaginava que seria capaz

de extrair sistematicamente dos livros tudo o que representasse uma nova contribuição para o

conhecimento. Essas informações poderiam ser armazenadas em fichas, de modo que elas

refletissem as afinidades envolvidas em cada assunto. Dessa forma, as fichas foram

consideradas como instrumentos fundamentais para o sistema tecnológico idealizado por

Otlet. (RAYWARD, 1997).

Já em 1931 o antigo instituto passa a ser o IID – Instituto Internacional de

Documentação. O fato mais marcante desse período é a publicação do monumental Traité de

Documentation de autoria de Otlet (1934), que expõe as noções relativas ao livro e ao

documento, ao emprego separado dos elementos que constituem a documentação, além de

Page 33: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

31

destacar o valor de vínculo necessário entre os homens e lembrar o fenômeno da explosão dos

documentos. (ROBREDO, 2003).

A necessidade de tornar acessível o enorme acúmulo de documentação gerada dia a

dia foi sempre expressada por Otlet. Em 1935 a realização em Copenhague do 3º Congresso

Internacional promovido pelo Instituto Internacional de Documentação foi muito

significativa, principalmente pelas discussões sobre a tecnologia da informação, ou seja, a

preocupação no desenvolvimento de instrumentos para representar de forma padronizada os

documentos, na garantia do acesso mais efetivo às informações.

Paul Otlet era um homem com imensa curiosidade em relação às inovações

tecnológicas que pudessem ser úteis no processo documentário. Ele realizou diversas

experimentações com a microfilmagem e previu um futuro promissor para uma invenção

surgida na época: a televisão, além de antevir o desenvolvimento de diferentes equipamentos

tecnológicos como o fax, os microcomputadores, o hipertexto. Otlet, de certa forma, sempre

procurou meios para estabelecer o armazenamento e a padronização de informações,

principalmente com o avanço do conhecimento tecnológico e o uso de dispositivos mecânicos

que possibilitariam o acesso remoto às informações previamente armazenadas.

Outra contribuição importante trata-se de Mooers (1951), que cunha o termo

recuperação da informação numa perspectiva em que ela engloba os aspectos intelectuais da

descrição de informações e suas especificidades para a busca, além de quaisquer sistemas,

técnicas ou máquinas empregadas para o desempenho da operação. A recuperação da

informação assumiu um papel decisivo no surgimento da Ciência da Informação, trazendo em

seu bojo suas associações com a tecnologia da informação. (OLIVEIRA, 2005).

A prática profissional é indissociável dos processos tecnológicos. Os anos de 1950

foram considerados um período significativo devido ao crescimento da informação científica,

em diferentes formatos, sobretudo sob a forma de relatórios técnicos, e por um rápido

desenvolvimento dos sistemas automáticos de armazenamento e de recuperação da

informação, com especial destaque para recuperação por assunto. (ROBREDO, 2003).

De meados ao final da década de 1960, a UNESCO em consonância com outros

órgãos internacionais voltados para informação científica, discutem as bases da informação

Page 34: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

32

científica voltadas para o desenvolvimento científico, tecnológico, econômico, social e

cultural, como “bem da humanidade”, atrelada aos princípios da Federação Internacional de

Documentação - FID. (GOMES; ZAHER, 1972). A documentação da FID era considerada,

em seu sentido mais cooperativo, uma forma de garantir o intercâmbio bibliográfico

internacional, ligado à concepção do conhecimento como “bem da humanidade”.

O surgimento da documentação é confirmado, despertando um grande interesse pelas

atividades de ciência e tecnologia, ocasionando o fenômeno da explosão da informação,

caracterizado por um crescimento exponencial de registros de conhecimento. Estudos sobre a

evolução da Ciência da Informação e sobre a diversidade considerável de profissionais da

informação, bem como a atividade técnico-profissional são realizados.

A necessidade de encontrar uma forma de organizar a gama de informações geradas

durante a Segunda Guerra, foi expressa por Vannevar Bush em 1945. Após a Segunda Guerra,

define-se o problema do gerenciamento da informação e é proposta uma máquina,

denominada Memex (Memory Extension), que agregava as mais modernas tecnologias da

informação existentes na época. O Memex pode ser comparado ao princípio de funcionamento

de um computador conectado a Internet com a finalidade de contribuir para a criação e a

distribuição do conhecimento adquirido em pesquisas, facilitando o compartilhamento e a

busca de informações. Pode-se de acordo com a figura 1, visualizar o que seria o Memex.

Page 35: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

33

FIGURA 1: Memex (Memory Extension) Fonte: Disponível em: <http://www.unicamp.br/~hans/mh/memex.html>.

Acesso em: 23 mar. 2007

O funcionamento do Memex pode ser assim representado:

Estoque: multimídia de documentos, abrangendo ao mesmo tempo imagens, sons

e textos;

Dispositivos periféricos: facilitariam a integração rápida de novas informações,

outros permitiriam transformar automaticamente a palavra em texto escrito;

Miniaturização desta massa de documentos: microfilme e fita magnética, que

acabavam de ser descobertos naquela época. Tudo isso deveria caber em um ou

dois metros cúbicos, o equivalente ao volume de um móvel de escritório;

Acesso às informações seria feito através de uma tela de televisão munida de alto-

falantes. Além dos acessos clássicos por indexação, um comando simples

permitiria criar ligações independentes de qualquer classificação hierárquica entre

uma dada informação e outra;

Manipulação: estabelecida a conexão, cada vez que determinado item fosse

visualizado, todos os outros que tivessem sido ligados a ele poderiam ser

instantaneamente recuperados, através de um simples toque em botões e

alavancas. (TÁLAMO, 2006).

Page 36: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

34

O Memex pode ser considerado em suas funções como um dispositivo mecânico de

classificação e seleção por associação, paralelo ao princípio da indexação clássica, ou seja,

uma máquina considerada visionária para auxiliar a memória e guardar conhecimentos. O

Memex nunca foi construído, mas as idéias que inspiraram sua idealização ainda fazem parte

das aspirações de pesquisadores e cientistas da atualidade. (TÁLAMO, 2006). Vale destacar

que enfrentamos hoje, talvez em maior escala, os mesmos problemas apontados por Otlet e

Bush, buscando-se nas tecnologias da informação e comunicação a solução de tais problemas.

A criação de novas tecnologias para tratamento e recuperação da informação, tais

como os cartões perfurados para a recuperação da informação por assunto, foi largamente

acelerada em agências de inteligência governamentais, sendo transpostos para os serviços de

documentação científica e tecnológica no pós-guerra. (SHERA; CLEVELAND, 1977).

Em 1960, foi utilizado o termo hipertexto cunhando por Theodore Nelson considerado

discípulo de Bush, na tentativa de exprimir a idéia de leitura/escrita não linear em um sistema

de informática. Nelson vislumbrava uma imensa rede de informações que pudessem ser

acessíveis em tempo real pelos usuários num processo interativo utilizando-se de todos os

recursos disponíveis em diferentes mídias (texto, imagem, som etc.).

O que diferencia o conceito de hipertexto das outras formas de armazenamento eletrônico da informação é a estrutura associativa que reproduz, muito de perto, a estrutura da memória humana e pode tornar-se seu complemento íntimo e ampliado. Permite substituir as estruturas clássicas arborescentes da informação por estruturas mais ricas e mais complexas, organizadas em redes, mostrando um número infinito de caminhos, abertos a todas as navegações e interligando múltiplos objetos. (LE-COADIC, 2004, p. 59-60).

A partir da década de 1960 começa a surgir o que conhecemos hoje como Internet,

uma tecnologia que causou impactos sociais, pois trouxe assuntos relativos, que alteraram o

modo de vida dos indivíduos e da sociedade, como: democratização da informação,

globalização, sociedade da informação, velocidade de disseminação da informação, novo

papel do bibliotecário e do profissional da informação, entre outros.

A Internet nasce com iniciativa do Departamento de Defesa dos Estados Unidos –

ARPA (Advanced Research Projects Agency) - como estratégia militar. Seu grande objetivo

era

Page 37: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

35

[...] projetar um sistema de comunicação invulnerável a ataque nuclear. Com base na tecnologia de comunicação por comutação de pacotes, o sistema tornou a rede independente de centros de comando e controle, de modo que as unidades de mensagens encontrariam suas rotas ao longo da rede, sendo remontadas com sentido coerente em qualquer ponto dela. (CASTELLS, 2000, p. 375).

A Internet é uma rede que, em uma visão simples, pode ser vista como sistemas que se

apresentam como um conjunto de partes interagentes e interdependentes que formam um todo

unitário, com determinado objetivo e efetuam determinada função. Possui como elementos

principais a conectividade e a coerência. Suas principais características são: transmissão de

informações na forma eletrônica com velocidade e confiabilidade; dependência aos seus

usuários; crescimento dos servidores; popularização das homepages pessoais; interesses

econômicos; e atividades de lazer. (ROBREDO, 2003). A Internet tem contribuído na

construção da maneira de ver e de processar a informação, visto que a informação em tempo

real tem ganhado espaço não só na rede, mas também em outros meios de informação e

comunicação.

A moderna tecnologia da informação baseada em computador e nas telecomunicações

reduziu o impacto dos problemas nos serviços atuais de banco de dados bibliográficos e

textuais. Notadamente caracterizada como a era da difusão do computador, transformando o

processamento e armazenamento de dados centralizados em um sistema compartilhado e

interativo de computadores em rede, tal fato ocasionou mudanças nas interações sociais e

organizacionais onde tempo e espaço são regidos pela velocidade, ou seja, do imediatismo das

informações estabelecidas nos processos de comunicação.

A idéia elementar de rede é bem simples e antecede a utilização efetiva das tecnologias de informática. Trata-se de uma articulação entre diversas unidades que, através de certas ligações, trocam elementos entre si, fortalecendo-se reciprocamente, e podem se multiplicar em novas unidades, as quais, por sua vez, fortalecem todo o conjunto à medida que são fortalecidas por ele, permitindo-lhe expandir-se em novas unidades ou manter o equilíbrio sustentável. Cada nó na rede representa uma unidade, e cada fio um canal por onde essas unidades se articulam através de diversos fluxos. (SANTOS, 2002, p. 104).

Além da grande quantidade de informação, a morosidade em um processo de

recuperação de informação se torna preocupante; em meados da década de 1960 foi gerado

um modelo, ou seja, um dispositivo que pudesse representar as informações armazenadas pelo

computador e interpretadas por sistemas inteligentes. Este princípio se baseia na organização

Page 38: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

36

prévia das informações, criando meios de acesso para agilizar o fornecimento ou indicação de

respostas. Esse modelo, tradicionalmente utilizado por bibliotecas e centros de documentação,

tem como princípio fundamental a geração de respostas antes de receber os estímulos. Esse

processo consiste na geração de meios de respostas (classificação da informação e geração de

catálogos ou índices) com base na previsão das perguntas mais freqüentes a que o sistema

estará sujeito. (ROBREDO, 2003).

A comprovada capacidade do computador na simulação dos mecanismos mentais de

processamento de informações foram fatores que levaram a um novo modelo de sistema. Para

a alimentação desse novo sistema, não se requer o processamento prévio das informações. As

rotinas de comparação, associação, classificação, ordenação e geração de meios, obrigatórias

na fase de alimentação do sistema tradicional deixam de existir como rotinas de alimentação

do sistema artificial, dando lugar à rotina de descrição da informação a ser referenciada ou

armazenada (metadados3). Essa rotina consiste no fornecimento de dados que representem

fielmente a informação, permitindo ao computador interpretá-los, processá-los e fornecê-los

de acordo com os parâmetros impostos na pergunta pelo usuário. (ROBREDO, 2003).

Fundamentados no modelo tradicional de processamento de informação e com os

novos recursos tecnológicos advindos com o computador, surgiram técnicas até então

inaplicáveis sem os recursos da informática. O computador, com suas qualidades

comprovadas na simulação de processos, gradativamente foi sendo alvo de atenção daqueles

encarregados dos serviços de tratamento de informações. Sua grande capacidade em executar

tarefas repetitivas, exigidas pelos sistemas tradicionais de processamento, desviou a atenção

de alguns quanto a sua capacidade no processamento de informações. A elaboração de

catálogos classificados, índices numéricos ou alfabéticos, controles estatísticos e controles

burocráticos foi o grande alvo de aplicação da máquina. (OLIVEIRA, 1998).

Já em 1961 e 1962 surge a primeira formulação do que seria a Ciência da Informação

nas conferências do Geórgia Institute of Technology. Uma das definições clássicas, de acordo

com a literatura científica é a de Borko (1968), que define Ciência da Informação: “ciência

interdisciplinar que estuda as propriedades e o comportamento da informação, as forças que

3 Os metadados serão tratados de forma específica no capítulo 4.

Page 39: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

37

dirigem o fluxo e o uso da informação e as técnicas, tanto manuais quanto mecânicas de

processar a informação visando sua armazenagem, recuperação e disseminação”.

Ampliando tal definição e aplicando-se nos dias atuais, e com base nos autores Shera e

Cleveland (1977), Robredo (2003, p. 55) apresenta a Ciência da Informação nos seguintes

termos:

Ciência da Informação é a que investiga as propriedades e comportamento da informação, as forças que regem o fluxo da informação e os meios de processamento da informação para um máximo de acessibilidade e uso. O processo inclui a origem, disseminação, coleta, organização, armazenamento, recuperação, interpretação e uso da informação. O campo deriva ou relaciona-se com a matemática, a lógica, a lingüística, a psicologia, a tecnologia computacional, as operações de pesquisa, as artes gráficas, as comunicações, a biblioteconomia, a gestão e alguns outros campos.

Capurro (2003), no que tange às origens históricas da Ciência da Informação,

descreve-a como um campo que possui duas raízes: a primeira está relacionada à

Biblioteconomia clássica, mais especificamente ao estudo dos problemas referentes com a

transmissão de mensagens, enquanto a segunda está atrelada à computação digital.

Em 1966, discutem-se os aspectos profissionais da ciência e tecnologia da informação

e no mesmo ano Ingwersen (1992) publica um artigo intitulado “Perspectivas cognitivas da

interação na recuperação da informação: elementos de uma teoria cognitiva da recuperação

da informação”, no qual enfatiza a importância do estudo do comportamento humano no

processo de recuperação da informação.

Nesse momento é pertinente destacar a preocupação da comunidade científica nos

tempos hodiernos em estudos voltados principalmente para a usabilidade e a acessibilidade de

recursos informacionais, notadamente em ambientes informacionais digitais, retomando as

perspectivas cognitivas de Ingwersen (1992), Popper (1974), Borlund (2000), Buckland

(1991), Brookes (1977), Maturana e Varela (1980), Saracevic (1995), Hjørland (2002),

Capurro e Hjørland (2007), destacando não somente o uso de tecnologias, mas também o

usuário (sujeitos cognoscentes) enquanto protagonista na participação efetiva dos sistemas de

recuperação da informação.

Page 40: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

38

As novas tecnologias da informação difundiram-se de maneira global em menos de

duas décadas, entre meados dos anos de 1970 e 1990, por meio de uma lógica que é

caracterizada pela aplicação imediata no próprio desenvolvimento da tecnologia gerada,

conectando o mundo através da tecnologia da informação.

[...] esse período de transformações tecnológicas em aceleração marca uma descontinuidade histórica irreversível na base material da espécie humana. O repentino aumento de aplicações tecnológicas transformou os processos de produção e distribuição, criou uma grande quantidade de novos produtos e mudou de maneira decisiva a localização das riquezas e do poder no mundo, que ficou ao alcance dos países e elites capazes de comandar esse sistema tecnológico. (CASTELLS, 2000, p. 53)

Le Coadic (2004, p. 84, grifo nosso) ao se reportar às tecnologias da informação,

elucida que,

Se as técnicas de informação são conjuntos de processos metódicos, baseados ou não em conhecimentos científicos, empregados na produção, tratamento, comunicação, uso e armazenamento de informações, a tecnologia da informação é, se nela reconhecemos uma dignidade científica, o estudo científico dessas técnicas. Mais prosaicamente, ela tem por objetivo a concepção de produtos, sistemas e serviços que permitem a construção, comunicação, armazenamento e uso da informação.

Na década de 1970 as novas tecnologias da informação difundiram-se amplamente,

acelerando seu desenvolvimento sinérgico e convergindo em um novo paradigma. A

microeletrônica mudou tudo isso, causando uma “revolução dentro da revolução”,

principalmente com o microprocessador e uso de chips. (CASTELLS, 2000). Em suma, o

paradigma da tecnologia da informação não evolui para seu fechamento como um sistema,

mas rumo à abertura como uma rede de acessos múltiplos.

De acordo com Le Coadic (2004, p. 20) “[...] o surgimento das tecnologias eletrônicas

(analógicas ou digitais) e fotônicas da informação (microcomputadores, telas de monitor

sensíveis ao toque, discos laser, fibras ópticas, dispositivos de multimídia, videodiscos,

programas de gerenciamento de acervos etc.)” ocasionaram transformações nas unidades de

informação4 deixando de ser depósitos para se tornarem centros de informação. Nessa

perspectiva é possível evidenciar o impacto das tecnologias, em especial as TICs na

transformação das unidades de informação e no surgimento da Ciência da Informação

4 Para este estudo a terminologia Unidades de Informação refere-se à biblioteca.

Page 41: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

39

alicerçada nas tecnologias de processamento de dados e nas técnicas de controle da

informação.

Na década de 1990, Hawkins (2001) sugere a conservação do termo ‘information

retrieval’ e observa a tendência para associar ‘library’ a ‘information science’, retratando os

serviços bibliográficos, departamentos das universidades e também de alguns títulos de

publicações.

Numa abordagem mais contemporânea e outro marco para a Ciência da Informação é

Saracevic (1995), ao afirmar que a Ciência da Informação é interdisciplinar por natureza,

estando relacionada com a tecnologia da informação, possuindo forte dimensão social e

humana. O autor ainda afirma que a Ciência da Informação tem se desenvolvido a partir de

três idéias principais: recuperação da informação, relevância e interação. Ele ainda recomenda

três áreas emergentes para serem incluídas no atual conceito de Ciência da Informação:

estudos de interação, recuperação da informação multimídia e multilíngua, bibliotecas virtuais

e buscas na Internet.

Wersing (1993) destaca que a Ciência da Informação não pode ser vista como uma

disciplina clássica, mas como um protótipo de um novo tipo de ciência, que nesse contexto,

rompe com as percepções tradicionais sobre o conhecimento, sobre o prisma de que tal

disciplina visa apenas o estudo da constituição de sistemas de informação.

Em 1991, foi realizada a Primeira International Conference on Conceptions of Library

and Information Science – CoLIS 1 e buscaram-se reflexões sobre o conceito de Ciência da

Informação. Saracevic (1995) estabeleceu a diferença entre a Biblioteconomia ao dizer que

esta possui atribuições mais culturais e tecnicistas nos ambientes de bibliotecas, enquanto a

Ciência da Informação possui uma natureza tecnológica.

No Brasil, a partir da década de 1970 inicia-se um processo de transformações no

âmbito do Instituto Brasileiro de Bibliografia e Documentação (IBBD) que em 1976 se

transforma em Instituto Brasileiro de Informação Científica e Tecnológica (IBICT). Em 1970

nascia o Curso de Mestrado em Ciência da Informação, em convênio do IBBD com a UFRJ –

Universidade Federal do Rio de Janeiro, com uma forte orientação para a formação dos

Page 42: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

40

profissionais da informação, privilegiando as atividades de informação e documentação

científica e o uso das emergentes tecnologias da informação. (ROBREDO, 2003).

A Ciência da Informação em sua gênese assume um papel importante na resolução de

problemas que podem ser elencados como: reunir, organizar e tornar acessível o

conhecimento cultural, científico e tecnológico produzido em todo o mundo, que podem

também ser contemplados na Documentação e na Recuperação da Informação.

Numa visão mais sucinta, desde a época de Otlet (1934) havia uma preocupação na

recuperação da informação com o apoio de tecnologias, principalmente com relação ao

armazenamento e tratamento informacional; em seguida houve a preocupação de tecnologias

para apoiar as práticas profissionais que estavam sendo desenvolvidas. Posteriormente, com a

iniciativa de Bush (1945), surge a idéia de desenvolver uma máquina, o Memex, para auxiliar

no processamento da informação. Na década de 1960 é cunhando o termo hipertexto por

Nelson e também o surgimento da Internet, que impactou decisivamente a forma de

tratamento da informação. Nessa mesma década, o conceito do que pode ser Ciência da

Informação é definido, e nesse conceito está claramente identificada a relação da tecnologia

com a área. Em 1966, Ingwersen (1992) constrói um artigo falando sobre os sujeitos

cognoscentes e formas de interação com os sistemas informacionais numa perspectiva sobre a

recuperação das informações. Mais recentemente, Saracevic (1995), destaca a tecnologia da

informação como fator fundamental na área e apresenta três áreas emergentes, ao mencionar

que a Ciência da Informação é interdisciplinar por natureza, estando relacionadas com estudos

de interação, recuperação da informação de diversos tipos de conteúdos e estratégias e

ferramentas de buscas em ambientes de informação digital.

A partir desse contexto, pode-se constatar que desde os instrumentos e ferramentas

vislumbradas por Otlet (1934), há uma presença marcante da tecnologia da informação e

comunicação durante a evolução da Ciência da Informação, bem como o investimento no

desenvolvimento e estudo das mesmas, visando aos benefícios que as tecnologias podem

proporcionar à sociedade de um modo geral e em especial aos profissionais da informação.

Page 43: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

41

Santos (2002, p. 107; 114) afirma que

As tecnologias são instrumentos de infinitas possibilidades, que precisam ser explorados na formação do profissional da informação de maneira a gerar condições de uso estratégico, especialmente na prática não-discursiva de atuação desse profissional [...]. Todavia, as tecnologias não são nada além de um recurso instrumental à disposição dos sujeitos institucionais, e para utilizar estrategicamente a plenitude de sua capacidade devem-se conhecer suas potencialidades e seus limites.

Atualmente, é possível notar com os avanços tecnológicos, mudanças significativas

nos modelos de tratamento documentário e o desenvolvimento de ferramentas que

possibilitam formas mais eficazes de interação e colaboração dos sujeitos/usuários com os

novos ambientes informacionais digitais. Podemos destacar dentre esses avanços, o que a

literatura aponta como Web Semântica, proposta por Berners-Lee (2001), que tem em seus

objetivos, embutir um maior nível semântico nos conteúdos informacionais, de modo a

permitir que as informações possam ser interpretadas de forma “inteligente”, pelos agentes de

software e que será tratada detalhadamente, no capítulo 5.

Além disso, destaca-se também, o paradigma da Web 2.0, criada por Tim O’Reilly

(2005), considerada como a próxima geração da World Wide Web. Trata-se, portanto, da

construção de ambientes colaborativos, interativos e de compartilhamento de recursos

informacionais, com a participação mais efetiva da comunidade (usuários).

É preciso um olhar da Ciência da Informação, bem como dos profissionais envolvidos

nos processos informacionais, da transposição para o novo, ou seja, têm-se novas ambiências

e recursos disponíveis que precisam ser analisados e revisitados constantemente, a fim de

propiciar o uso e o reuso estratégico das informações e suas potencialidades. Podemos

encontrar na Ciência da Informação, respaldo indispensável, no que tange à representação

(forma e conteúdo) e à descrição dos recursos informacionais na potencialização dos

ambientes informacionais.

Ao nos reportarmos às abordagens epistemológicas da área, a literatura disponível

aponta que a Ciência da Informação, enquanto campo específico e disciplina do campo das

Ciências Sociais Aplicadas carece de construção conceitual, ou seja, não tem uma base

epistemológica bem delineada, constituindo-se, portanto, de um campo ou disciplina em

Page 44: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

42

desenvolvimento/constituição, que utiliza aportes teóricos e metodológicos de outros campos

científicos em busca de cientificidade.

Pinheiro (1997, p. 6) reforça que

Mesmo os teóricos da área reconhecem a ausência de um sólido terreno teórico, essência do estágio científico de qualquer área, na visão tradicionalista. Este parece ser um problema não exclusivo da Ciência da Informação, mas de campos do conhecimento mais recentes, surgidos no limiar dos anos 50 e 60 e que marcam a era da sociedade da informação.

Podemos dizer, nessa perspectiva, que a Ciência da Informação atua como adjuvante

da Sociedade da Informação, enquanto um campo disciplinar constituído de interfaces que

trabalha com problemas informacionais usando a interdisciplinaridade para resolvê-los.

“Assim, uma disciplina científica que pretenda alcançar o status de ciência, como é o caso da

Ciência da Informação, classificada na área de ciências sociais aplicadas, necessita tanto de

teorias quanto de práticas”. (ANDRADE; OLIVEIRA, 2005, p. 45).

O desenvolvimento tecnológico, principalmente com o impacto dos computadores e

das telecomunicações no gerenciamento da informação, deu-se de tal forma, que podemos

apontar hoje, que a Ciência da Informação atrelada às tecnologias da informação e

comunicação é tema de estudos, pesquisas e discussões acerca do percurso do campo

científico, o que vem sendo discutido em âmbito mundial.

Nesse sentido, faz-se necessário o entendimento das tecnologias da informação e

comunicação para saber como usá-las estrategicamente como instrumentos pautados em

processos, metodologias que atuam e norteiam o fazer profissional de qualquer área, em

especial, dos profissionais da Ciência da Informação, levando em consideração o contexto

sócio-cultural, que determinará o uso efetivo das tecnologias em diferentes ambiências

informacionais na potencialização dos processos relacionados à geração, à transferência, à

utilização e à preservação da informação e de documentos.

O campo da Biblioteconomia e da Ciência da Informação já detém um corpo de

conhecimento e ferramentas para se trabalhar com o conteúdo dos documentos visando sua

recuperação. Verificou-se que as “tecnologias” usadas de Otlet (1934), passando por Bush

(1945) e Nelson (1960) sempre buscaram gerenciar conceitos, assuntos dispersos nos

Page 45: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

43

documentos, de forma a possibilitar a recuperação de partes de documentos dos mais variados

tipos e suportes.

Portanto, pode-se considerar que as tecnologias da informação e comunicação, vêm

permeando e potencializando o âmbito informacional. Assim, pode-se dizer que as TICs

possibilitam os ensaios idealizados por Otlet (1934) e por Bush (1945) de forma mais efetiva,

principalmente no que tange à construção de formas de representação da informação para sua

identificação, localização e uso, e sua aplicação em ambiências específicas, tais como as

bibliotecas digitais, que serão objeto de análise do próximo capítulo.

Page 46: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

44

Capítulo Capítulo Capítulo Capítulo 3333

Bibliotecas digitais:Bibliotecas digitais:Bibliotecas digitais:Bibliotecas digitais:

gênese e contemporaneidade gênese e contemporaneidade gênese e contemporaneidade gênese e contemporaneidade

Page 47: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

45

3 BIBLIOTECAS DIGITAIS: GÊNESE E CONTEMPORANEIDADE

“Às bibliotecas está reservado o papel de repensar suas atividades e funções, adaptando-se

aos novos modelos organizacionais e extraindo das tecnologias disponíveis o substrato para

a melhoria na prestação de serviços e na utilização eficaz de informações”.

Luiz Atílio Vicentini

Dando continuidade aos assuntos tratados no capítulo anterior, antes de embarcarmos

ao universo da pesquisa propriamente dito, procura-se contextualizar a evolução das

bibliotecas com os avanços tecnológicos, caracterizado principalmente pela presença

marcante das Tecnologias da Informação e Comunicação nos variados estágios desse processo

evolutivo. Vale frisar que esta pesquisa tem como ponto focal as bibliotecas digitais, que

estão sendo apontadas de acordo com a figura 2, a seguir.

FIGURA 2: Evolução das bibliotecas com a presença das TICs.

Fonte: Cunha (2000, p. 75)

Page 48: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

46

De acordo com Cunha (2000), tal como apresenta a figura 2, podemos verificar que a

biblioteca passou e continua passando por uma série de transformações à medida que são

desenvolvidas novas tecnologias visando a agilização dos processos informacionais em cada

momento.

Era I - compreendida como Biblioteca Tradicional moderna - têm-se as bibliotecas

caracterizadas por seu espaço físico bem delimitado, cujo acervo é constituído por

documentos em papel.

Era II – compreendida como Biblioteca Automatizada – caracterizada pela utilização

dos computadores nos processos e serviços da biblioteca, por exemplo, organização do

acervo, catalogação, indexação etc.

Era III – compreendida como Biblioteca Eletrônica – caracterizada pela formação de

bancos de dados eletrônicos, cujo acesso era realizado via rede de computadores de

forma on-line.

Era IV – compreendida como Biblioteca Digital e Virtual

o Biblioteca Digital – formada por documentos em formato digital, com acesso

via rede de computadores.

o Biblioteca Virtual – formada por um conjunto de bibliotecas digitais. Destaca-

se ainda, nesse caso, a Biblioteca Virtual com realidade virtual.

Nosso interesse de pesquisa está voltado principalmente para as questões de

representação e de descrição dos recursos informacionais no âmbito das bibliotecas digitais, o

que tem se tornado alvo de investigação e estudos pela comunidade científica atualmente.

Para melhor compreendermos o desenvolvimento das bibliotecas digitais, vejamos sua

dimensão contextual a fim de subsidiar uma discussão de forma mais aprofundada sobre a

forma em que elas são apresentadas contemporaneamente.

3.1 Dimensão contextual acerca das Bibliotecas Digitais

Bem antes do desenvolvimento da imprensa de Gutenberg, o homem procura de

alguma forma armazenar o conhecimento registrado em algum suporte informacional a fim de

Page 49: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

47

assegurar a guarda e a memória de sua história. Pode-se verificar essa evolução, desde as

bibliotecas da Antiguidade, com os tabletes de argila, o papiro, o pergaminho, até o papel,

destacando que cada período é marcado por características próprias determinadas pelas

tecnologias vigentes em cada época.

Como ponto de partida, temos num primeiro momento o estabelecimento das

bibliotecas convencionais ou tradicionais caracterizadas por seus espaços físicos bem

delimitados, com suas coleções, bem como seus catálogos em suporte papel para registro das

informações. “O objetivo principal, a razão de ser das bibliotecas, consiste no atendimento às

demandas do público quanto aos registros do conhecimento, ou seja, quanto ao conteúdo dos

itens, suportes físicos do conhecimento”. (MEY, 1995, p. 1).

As bibliotecas tradicionais têm em suas funções o tratamento, o armazenamento, a

disseminação e a disponibilização dos seus documentos de forma convencional, independendo

de seu suporte físico que é apresentado, caracterizadas como espaços de preservação do

conhecimento acumulados pela humanidade.

Segundo Houaiss, Villar e Franco (2001, p. 58) a biblioteca seria uma “coleção de

livros; um lugar [espaço] que guarda, cataloga e empresta livros e outros impressos ao

público”. A biblioteca, inicialmente considerada como um depósito de livros com o objetivo

apenas de preservação dos documentos (MATOS, 2003), com o passar do tempo teve sua

função transformada de simples guardiã do conhecimento para assumir um papel social e

cultural mais amplo como ponto de acesso à socialização do conhecimento da humanidade.

Para Almeida Júnior (2004, p. 2),

[...] a biblioteca também foi e continua sendo vista como dissociada dos interesses da maioria da sociedade; como um equipamento cultural que contribui para a perpetuação de uma estrutura em que o saber é ferramenta para ampliação das desigualdades; como uma instituição cujas ações reforçam e ampliam o fosso entre os que possuem e os que não possuem informação.

É possível verificar que desde a época de Otlet (1934), conforme apontado no capítulo

2, o homem tem em suas preocupações a necessidade de armazenar e padronizar as

informações em um espaço para sua socialização e efetivo uso. No caso das bibliotecas

tradicionais, estas concentravam as informações em um espaço físico para servir a uma

Page 50: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

48

diversidade de usuários que restringiam-se apenas às comunidades que conseguiam acessá-la

localmente.

Uma característica marcante na evolução das bibliotecas é a utilização de catálogos

em fichas, abandonando os catálogos que eram em forma de livros, ponto este centrado no

início do processo de automação em bibliotecas.

Com o surgimento da tecnologia do computador, os serviços das bibliotecas

(catalogação, classificação, indexação) e a própria organização do acervo, começam ser

realizados de forma automatizada, proporcionando o acesso on-line aos bancos de dados

através de redes de telecomunicações e a dinamização dos processos de disseminação e

recuperação das informações.

Para alavancar ainda mais os processos informacionais, com a chegada da Internet,

tem-se um novo espaço além do físico – o ciberespaço, onde neste tipo de ambiência,

encontram-se textos na íntegra, disponíveis de forma on-line, ampliando as possibilidades de

acesso aos conteúdos informacionais na facilitação ao usuário final.

Para Lévy (1999, p. 92, 107) o ciberespaço pode ser definido como,

[...] o espaço de comunicação aberto pela interconexão mundial de computadores e das memórias de computadores. [...] Esse novo meio tem a vocação de colocar em sinergia e interfacear todos os dispositivos de criação de informação [...] pesquisas sobre as interfaces de navegação são orientadas, direta ou indiretamente, pela perspectiva última de transformar o ciberespaço em um único mundo virtual, imenso, infinitamente variado e perpetuamente mutante.

O uso efetivo das tecnologias da informação e a associação dos computadores às

tecnologias da comunicação culminaram no aumento exponencial das facilidades com relação

ao fluxo e ao acesso aos recursos informacionais potencializando a conectividade entre os

sujeitos e viabilizando a amplitude da disseminação das informações.

Como apresentado no capítulo anterior, as bibliotecas, em diferentes épocas, sempre

foram dependentes das TICs acompanhando dessa forma, o desenvolvimento de paradigmas

tecnológicos. Desde a iniciativa de Bush em 1945 com a criação do Memex, é possível

Page 51: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

49

observar o trabalho árduo de diferenciados profissionais no estabelecimento de mecanismos

que pudessem agilizar as tradicionais rotinas de tratamento das informações a fim de garantir

a integridade e recuperação das mesmas. A evolução das bibliotecas tem merecido grande

destaque ao longo destes anos, no que se refere ao desenvolvimento e uso de tecnologias,

principalmente as da informação e comunicação (TICs) que se potencializam por meio dos

novos recursos de acesso e formatos de intercâmbio advindos principalmente da área de

Biblioteconomia no tratamento de informações bibliográficas e catalográficas.

A história das bibliotecas digitais está intimamente ligada à realidade dos últimos anos

do século XX: o uso corrente das tecnologias da informação e comunicação, permitiram a

ampliação da produção de informações em formato digital e o êxito social das redes de

comunicação, impulsionaram o intercâmbio de informações em diferentes formatos.

Pode-se considerar que a diferença entre a biblioteca tradicional e a biblioteca digital

está na potencialização do suporte eletrônico que, por meio dos avanços tecnológicos amplia

as possibilidades de tratamento, acesso e recuperação dos recursos informacionais.

Vale ressaltar, que a temática bibliotecas digitais têm sido alvo de estudo e pesquisa de

muitas comunidades científicas, principalmente por profissionais da Ciência da Informação

onde muitos, numa perspectiva futurista a denominam de “Biblioteca Universal” que

vislumbra ser aquela que, por meio de redes de computadores, em diferentes suportes,

garantirá o acesso livre aos conteúdos informacionais permitindo a recuperação.

Para tanto são oferecidos vários congressos, simpósios e seminários em níveis

nacional e internacional onde os profissionais da área procuram discutir e sanar problemas

relativos ao tema, na tentativa de identificar conceitos, teorias, instrumentos tecnológicos e

metodologias que permitam ser aplicados a esta ambiência digital, na melhoria dos processos

informacionais abarcados pelas bibliotecas digitais.

Uma variedade de estudos para a definição de bibliotecas digitais está disponível,

alguns centrados nos objetivos que as bibliotecas digitais devem contemplar, outros voltados

para o conteúdo informacional, no sentido de que tipo de informação deve ser armazenado e

disponível e outros direcionados ao público que estas devem servir. Nesse sentido, procura-se

mostrar alguns conceitos relativos às bibliotecas digitais, abarcados pela literatura científica, a

Page 52: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

50

fim de subsidiar uma discussão mais acurada do universo da pesquisa. Para tanto, estabelece-

se um recorte dos últimos dez anos, resgatando através dos tempos e propondo a ampliação do

conceito de biblioteca digital no cenário atual.

Segundo Borgman (1996, p. 6, tradução nossa),

Bibliotecas digitais são um conjunto de fontes eletrônicas e serviços técnicos associados para a criação, pesquisa e uso da informação, que possibilitam uma extensão e um aumento do armazenamento da informação e dos sistemas de recuperação de informação, manipulando dados digitais em qualquer meio (texto, imagens, sons, imagens dinâmicas e estáticas) em redes distribuídas de trabalho. O conteúdo das bibliotecas digitais inclui dados e metadados que descrevem vários aspectos do dado (representação, criador, dono, direitos de reprodução) e metadados que consistem em ligações ou relacionamentos com outros dados ou metadados, sejam esses externos ou internos à biblioteca digital.

É pertinente destacar neste momento, de acordo com a citação anterior que a presente

pesquisa tem como objetivos, a identificação de padrões de representação e descrição de

recursos informacionais no âmbito das bibliotecas digitais, que se dão por meio dos

metadados, instrumentos fundamentais nos ambientes de manipulação de dados bibliográficos

e que potencializam os resultados das buscas. Sem a utilização dos metadados não

conseguimos ter uma ambiência padronizada o que acarretará a dificuldade nos processos de

recuperação dos recursos informacionais.

As bibliotecas digitais incorporam o uso de rede de computadores e dispositivos de

armazenamento, tais como discos magnéticos, memórias e CD-ROM, facilitando o

armazenamento e distribuição de conteúdos digitais.

Para Marchiori (1997, p. 117),

A biblioteca digital difere das demais, porque a informação que ela contém existe apenas na forma digital, podendo residir em meios diferentes de armazenagem. [...] a biblioteca digital não contém livros na forma convencional e a informação pode ser acessada em locais específicos e remotamente, por meio de redes de computadores.

Page 53: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

51

A concepção de representação, descrição, organização e do acesso às informações

juntamente com as tecnologias da informação e comunicação tem proporcionado um

desenvolvimento mais intensivo nos serviços de informação de forma global.

Pereira e Rutina (1999, p. 7), consideram que “[...] a biblioteca digital seria aquela que

teria, além de seu catálogo, os textos dos documentos de seu acervo armazenado de forma

digital, permitindo sua leitura na tela do monitor ou sua importação (download) para o disco

rígido do computador”.

Para melhor entendermos a estrutura das bibliotecas digitais, bem como seu

funcionamento, Cunha (1999, p. 258) aponta algumas características, tais como:

a) acesso remoto pelo usuário, por meio de um computador conectado a uma rede; b) utilização simultânea do mesmo documento por duas ou mais pessoas; c) inclusão de produtos e serviços de uma biblioteca ou centro de informação; d) existência de coleções de documentos correntes onde se pode acessar não somente a referência bibliográfica, mas também o seu texto completo. O percentual de documentos retrospectivos tenderá a aumentar à medida que novos textos forem sendo digitalizados pelos diversos projetos em andamento; e) provisão de acesso em linha a outras fontes externas de informação (bibliotecas, museus, bancos de dados, instituições públicas e privadas); f) utilização de maneira que a biblioteca local não necessite ser proprietária do documento solicitado pelo usuário; g) utilização de diversos suportes de registros da informação, tais como: texto, som, imagem e números; h) existência de unidade de gerenciamento do conhecimento, que inclui sistema inteligente ou especialista para ajudar na recuperação de informação mais relevante.

Com relação à estrutura tecnológica que a biblioteca digital deve possuir, vale destacar

que o planejamento e o desenvolvimento devem estar pautados de acordo com o modelo

estipulado em uma biblioteca tradicional, ou seja, todo o tratamento informacional

(representação descritiva e temática), formas de aquisição, recuperação, disseminação, serviço

de referência até mesmo a preservação, devem estar contemplados de acordo com uma

política institucional que norteará a funcionalidade da biblioteca digital.

Nesta perspectiva, conforme pode ser observado por Wainwright (1996, p. 2, tradução

nossa),

Page 54: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

52

[...] as bibliotecas digitais, ainda permanecem sendo bibliotecas, [sustentadas] com os mesmos propósitos, funções e metas das bibliotecas tradicionais [convencionais]. A parte digital do termo indica meramente que os materiais estão armazenados e acessados digitalmente.

Podemos dizer que a Internet propicia às bibliotecas formas mais efetivas de atuação

no ciberespaço. Nesse contexto, é necessário um olhar para os estudos voltados para o

desenvolvimento de websites que possibilitem melhores formas de acesso, uso e reuso dos

recursos informacionais para os usuários.

3.2 Pontuações sobre os Websites

Vale destacar nesse momento, que não é nosso objetivo neste trabalho, estudar com

profundidade as tecnologias e as metodologias para a construção de websites, mas apontarmos

a necessidade de estudos para a construção de ambientes padronizados, na facilitação da

interação dos sujeitos com os recursos disponíveis.

Num primeiro momento, pode-se pensar no website de uma biblioteca digital, como

uma mimetização de um modelo de biblioteca convencional, ou seja, com sua estrutura física

transportada para um ambiente tecnológico.

Se a Internet propicia às bibliotecas estarem presentes na Web para continuarem a desempenhar suas funções, o website da biblioteca passa a ser sua forma de atuar no ciberespaço. Nesta lógica de raciocínio, o website da biblioteca deve ser capaz de desempenhar todas as funções da biblioteca, de modo a aproveitar todo o potencial de acessibilidade, disponibilidade, interconectividade e interatividade à informação e ao conhecimento que a Web pode oferecer. (AMARAL, 2005, p. 22).

Complementando tal idéia, outro ponto que deve ser repensado é a arquitetura da

informação de websites, que podem ser potencialmente aplicados ao contexto das bibliotecas

digitais, com a facilitação de interfaces mais amigáveis para os usuários. Para tanto,

Rosenfeld e Morville (1998), Vidotti e Sant’Ana (2006, p. 80-2) apresentam alguns elementos

que devem estar descritos no delineamento de um sistema informacional, tais como:

Page 55: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

53

Sistema de organização: formas de agrupamento dos conteúdos informacionais – responsável pela estruturação dos conteúdos, nele são definidos os critérios de disposição dos itens informacionais, observando os esquemas e /ou estruturas que melhor satisfaçam a necessidade do usuário, sem comprometer a navegabilidade do website. Os esquemas podem ser dos tipos exatos, ambíguos ou híbridos. As estruturas podem ser hierárquicas, de base relacional ou hipertextuais;

Sistema de rotulagem: denominação do conteúdo do grupo informacional – forma de representar um conjunto de informações utilizando uma palavra ou um ícone, de modo a facilitar a recuperação da informação e a navegabilidade do website. Possibilita ao usuário decidir qual caminho seguir, permitindo que o mesmo possa identificar-se com a linguagem e com a estruturação do site, culminando em um tempo de navegação mais otimizado;

Sistema de navegação: forma de interação do usuário com o ambiente

e com o conteúdo informacional disponível, permitindo ao usuário ir de um ponto ao outro pelo caminho desejado, possibilitando melhor aproveitamento do tempo de uso ou de acesso. Mantém o equilíbrio entre a movimentação e o oferecimento de opções de links para o usuário. As estruturas de navegação baseiam-se geralmente nas formas hierárquicas, globais e locais;

Sistema de busca: possibilita ao usuário a formulação das expressões de busca para a recuperação dos documentos que correspondem à informação desejada. Para a recuperação das informações, é necessária uma forma de representação descritiva e temática adequada aos conteúdos do metadados. Deve-se observar, antes da implementação, a forma como os usuários potenciais realizam essas buscas, e seus diferentes tipos de necessidades informacionais. Os tipos de buscas são os seguintes: busca por itens conhecidos, busca por idéias abstratas, buscas exploratórias e buscas compreensivas.

Além dos elementos propostos por Rosenfeld e Morville (1998), Vidotti e Sant’Ana

(2006), a literatura científica aponta o estudo da usabilidade de websites ou das bibliotecas

digitais, que visa o estudo de usuários na garantia de satisfação de suas necessidades

informacionais num processo de interação homem (usuário) e sistema.

Segundo Dias (2003, p. 28),

Um sistema interativo é considerado eficaz quando possibilita que os usuários atinjam seus objetivos. A eficácia é a principal motivação que leva um usuário a utilizar um produto ou sistema. Se um sistema é fácil de usar, fácil de aprender e mesmo agradável ao usuário, mas não consegue atender a objetivos específicos de usuários específicos, ele não será usado, mesmo que seja oferecido gratuitamente.

Com a utilização das redes de computadores, foi possível uma maior agilidade nos

processos de recuperação e disseminação da informação. Nesse sentido, Machado, Novaes e

Page 56: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

54

Santos (1999, p. 217), apontam que “[...] com o surgimento da Internet a biblioteca ganha

uma nova dimensão, deixa de ter somente um espaço físico e ganha um novo espaço - o

Ciberespaço”.

Parece ser consensual entre muitos autores que uma das características principais das

bibliotecas digitais é o fácil compartilhamento instantâneo dos recursos informacionais

através de redes de computadores de forma que o acesso aconteça local ou remotamente, em

qualquer lugar e a qualquer tempo, cujo custo é proporcionalmente baixo.

Neste sentido, Machado, Novaes e Santos (1999, p. 216), para reforçarem tal assertiva

dizem que

[...] a biblioteca digital tem como característica uma coleção de documentos eminentemente digitais, independendo se forem criados na forma digital ou digitalizados a partir de documentos impressos, e permite, por meio do uso de redes de computadores, compartilhar a informação instantânea e facilmente.

Numa visão mais contemporânea, outros autores, tais como Dias (2001, p. 4) na

tentativa de conceituar as bibliotecas digitais, bem como seu desenvolvimento, diz que

[...] a biblioteca digital parece estar se firmando como um conjunto de artefatos, conhecimento, práticas e uma comunidade que engendra compromissos realísticos assumidos por profissionais da informação, analistas de sistemas e usuários. [...] elementos estes que em conjunto constituiriam a instância dos conhecimentos/práticas tecno-científicas, com as práticas ativas e em evolução substitutas da considerada passiva e estática estrutura tradicional.

O discurso de uma biblioteca digital onde todos possam acessar “todo” o

conhecimento em tempo real, sem restrições, ainda parece utópico, uma vez que mesmo

havendo iniciativas por parte do governo ao inserir todo e qualquer cidadão no mundo digital,

fica visível que apenas uma parcela da população realmente tem acesso às tecnologias e são

participantes ativos nesta sociedade. Dentre essas iniciativas, podemos destacar a chamada

Sociedade da Informação5, que visa incluir os cidadãos numa sociedade digital,

5 Sociedade da Informação é o termo concebido aos programas nacionais voltados às Tecnologias da Informação e Comunicação como forma de garantir sua utilização e distribuição para toda a população, a fim de que as TICs não sejam mais um fator de exclusão social, mas possibilite a troca de informação em formato digital, suportando a interação entre indivíduos e entre estes e instituições, recorrendo a práticas e métodos em construção permanente. No Brasil, o projeto é finalizado entre 1999 e 2000. (NAZARENO et al., 2007).

Page 57: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

55

principalmente com o uso intensivo das tecnologias da informação e comunicação, que são

consideradas a base material da sociedade.

Para Hernández e Tosete Herranz (2004, p. 189, tradução nossa),

[...] as bibliotecas digitais deveriam possibilitar a qualquer cidadão acessar a todo o conhecimento humano, em qualquer momento e lugar e de forma amigável, multi-modal, eficiente e efetiva, superando as barreiras da distância, da linguagem e da cultura - mediante o uso de múltiplos dispositivos de conexão a Internet.

É possível identificar na literatura científica que biblioteca digital é a terminologia

mais empregada para aplicar ao contexto de um cenário marcado pelos aparatos tecnológicos,

em especial, as tecnologias da informação e da comunicação, o que implica uma mudança de

paradigma, principalmente no que diz respeito ao fazer profissional dos bibliotecários e dos

cientistas da informação, uma vez que “nas bibliotecas digitais, as fontes não são catalogadas

e classificadas como os bibliotecários entendem esses termos, tornando impossível um

tratamento da informação nos moldes tradicionais”. (ALVARENGA, 2001, p. 11). Deste

modo, é preciso repensar formas diferenciadas para um tratamento de forma mais compatível

com o potencial das novas tecnologias, na possibilidade da garantia de uma recuperação mais

precisa e eficaz.

Ao tentar-se construir um conceito de biblioteca digital que mais se adeque aos tempos

hodiernos, verifica-se uma pluralidade discursiva na área de Ciência da Informação.

Em uma das obras mais recentes no Brasil sobre a temática bibliotecas digitais,

Toutain (2006, p. 16), as define como sendo

Biblioteca que tem como base informacional conteúdos em texto completo em formatos digitais - livros, periódicos, teses, imagens, vídeos e outros -, que estão armazenados e disponíveis para acesso, segundo processos padronizados, em servidores próprios ou distribuídos e acessados via rede de computadores em outras bibliotecas ou redes de bibliotecas da mesma natureza.

Nessa perspectiva, vale salientar que a pluralidade conceitual na área é demarcada pela

consideração de que as bibliotecas digitais são formadas por documentos em formato digital.

Entretanto, faz-se necessário acrescentar a importância da utilização de procedimentos e

Page 58: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

56

metodologias pautadas em normas e padrões, para a representação e a descrição dos recursos

informacionais para o tratamento, a divulgação, o acesso, o uso e o reuso dos conteúdos

informacionais, de modo a garantir a preservação das informações digitais e a

interoperabilidade entre os sistemas informacionais, por meio de redes de computadores,

proporcionando a ampliação do acesso, otimização de recursos e a integração ambiências.

Para reforçar tal definição, e de acordo com os conceitos apresentados no texto, pode-

se neste momento, de acordo com Vicentini (2006, p. 242), estabelecer os principais

componentes em uma biblioteca digital:

• Coleção/conteúdo

• Recursos humanos

- Equipe multidisciplinar

- Capacitação

• Padronização

- Metadados

- MARC

- Formato do arquivo digital

- Padrão de digitalização

• Tecnologia

- Hardware

- Software

- Livre

- Proprietário

- Flexibilidade de desenvolvimento

- Facilidade de gerenciamento da coleção digital

- Linguagem de programação

- Utilização de protocolos de comunicação para importação e exportação de

dados

• Digitalização

• Garantia de direito autoral

• Preservação do documento digital

Page 59: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

57

A coleção/conteúdo do acervo digital, compreendida aqui como o processo de

aquisição (compra, digitalização etc.), pode ser composta por recursos multimídias (imagem,

som, texto), interligados por informações referenciais. Os recursos humanos - devem ser

formados por equipes multidisciplinares e com a atualização e a capacitação dos sujeitos

constantemente, uma vez que tem-se um cenário com os mais variados recursos e serviços

tecnológicos, disponíveis no atendimento digital ao usuário. A padronização dos recursos

informacionais, entendida nesse contexto, como o processamento técnico do material

informacional, é o elemento-chave na representação (forma e conteúdo) e na descrição dos

recursos informacionais na confecção de metadados. A tecnologia possibilita a integração dos

serviços, bem como dos conteúdos informacionais, de modo a permitir uma amplitude na

interação dos sujeitos com a ambiência. As questões de direito autoral, também devem ser

levadas em consideração, na garantia de preservar a integridade e a fidedignidade dos

conteúdos informacionais para um posterior uso das informações digitais. Além disso, é

necessário um olhar para o estabelecimento de políticas que contemplem à preservação dos

conteúdos digitais, de forma a garantir a integridade lógica e física do ambiente

informacional.

As bibliotecas digitais apresentam-se hoje como importantes instrumentos que

possibilitam a facilitação da disseminação da informação, em ambiências digitais de forma

global, no que concerne à democratização da informação e dos conteúdos informacionais,

além de garantir a confiabilidade e a integridade dos recursos informacionais, uma vez que o

mesmo não ocorre, por exemplo, na Internet, cujas informações são caracterizadas pela

efemeridade e não asseguram que tais informações possuam um determinado grau de

veracidade em sua totalidade.

Pode-se considerar, pelo estado da arte sobre bibliotecas digitais abordado no texto,

que há um grande desafio e inúmeras possibilidades no desbravamento desta ambiência

digital por parte de uma diversidade de profissionais, com destaque para os da área de Ciência

da Informação, no tocante em questões de representação e descrição de conteúdo e forma dos

recursos informacionais.

O armazenamento e a preservação dos recursos informacionais e de seu conteúdo têm

sido objetos de estudo de pesquisas atuais na área de Ciência da Informação, isto é, uma área

de investigação que tem adquirido cada vez mais importância, uma vez que a massa de

Page 60: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

58

informações em meio digital cresce exponencialmente, dificultando muitas vezes o controle, o

acesso e a integridade das informações.

Vale destacar também que a necessidade de estudos sobre a temática hoje, é uma

realidade brasileira e está presente também nos cursos de Pós-Graduação em Ciência da

Informação. Sendo assim, o que motivou a construção da seção seguinte, foi uma disciplina

ministrada no curso de Pós-Graduação em Ciência da Informação da Universidade Estadual

Paulista – UNESP – campus de Marília, pormenorizando um conjunto de iniciativas e

desenvolvimento de políticas e ambientes informacionais digitais que contemplem os

princípios da preservação digital.

Nosso objetivo neste capítulo não é tratar com profundidade as técnicas,

procedimentos e metodologias concernentes à preservação digital, mas alertarmos para a

importância sobre o assunto para que seja estudado em consonância no estabelecimento e

desenvolvimento de uma biblioteca digital, e as iniciativas que norteiam o cenário atual.

3.3 Paradigma da Preservação digital na perspectiva das Bibliotecas Digitais

Com a grande quantidade de bibliotecas digitais desenvolvidas nos últimos tempos e o

volume avassalador de informações no ambiente Web, cresce também paralela e

vertiginosamente o número de documentos digitais permitindo uma ampla produção e

disseminação de conteúdos informacionais no ambiente digital, causando assim, um repensar

dos tradicionais modelos para preservação destes conteúdos no cenário atual.

As informações geradas atualmente estão, cada vez mais, sendo armazenadas no formato digital. As vantagens desta forma de armazenamento de informações são muitas, destacando-se, entre elas, a flexibilidade oferecida para a sua recuperação e a possibilidade de armazenamento e veiculação em diferentes tipos de mídia. (CARVALHO, 2003, p. 76).

Por preservação digital entende-se ser a capacidade de manter disponíveis informações

e documentos digitais para que possam transcender a largo prazo com os avanços

Page 61: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

59

tecnológicos nos ambientes digitais, sem riscos de que haja alteração ou perda de legibilidade

destes documentos.

O que pode ser constatado atualmente é que a grande parte das informações

produzidas hoje “nascem” em formato digital e as que se encontram armazenadas em suportes

convencionais, tais como, papel, disquetes, CD-ROMs, por exemplo, rapidamente são

transformadas/convertidas ao suporte digital. Mas a grande preocupação da comunidade e

alvo de discussão e estudos é como garantir o acesso de longo prazo aos recursos

informacionais digitais, uma vez que não são determinadas políticas e estratégias

consolidadas que contemplem a preservação para documentos digitais.

Vale mais uma vez destacar que as bibliotecas, desde a Antiguidade, constituem-se

como centros de preservação da memória e do conhecimento da humanidade. Neste sentido,

com o uso cada vez mais intenso das tecnologias da informação e comunicação, temos as

bibliotecas digitais que são consideradas por alguns especialistas o caminho mais adequado

para a preservação dos recursos informacionais digitais. (HILDRETH, 1996; ARELLANO,

2004).

As bibliotecas e os arquivos têm estabelecido programas de preservação para materiais

tradicionais. A preservação digital possui uma natureza diferente, principalmente na

diversidade de formatos de materiais existentes atualmente. Segundo Hedstrom (1997-1998) a

preservação digital abarca o material que começa sua vida no formato digital, bem como o

material que é convertido do formato tradicional/convencional para o formato digital.

Sendo assim, pode-se considerar que as bibliotecas digitais apresentam-se como

espaços propícios para o armazenamento, a disseminação e a preservação das informações

digitais, uma vez que elas podem ser manipuladas simultaneamente em vário locais, sem a

limitação de espaço e tempo, com uma maior amplitude de acesso aos recursos

informacionais.

Ainda nessa perspectiva, Lesk (1997) e Arellano (2004, p. 17), afirmam que “as

bibliotecas digitais são meios mais dinâmicos para preservação digital do que as bibliotecas

tradicionais, no sentido da sua adaptação às freqüentes mudanças tecnológicas”.

Page 62: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

60

De acordo com a figura 3, pode-se melhor compreender os elementos que devem estar

contemplados numa estrutura tecnológica de um acervo digital.

FIGURA 3: Elementos básicos do acervo digital

Fonte: Innarelli (2005)

De acordo com a figura 3, a responsabilidade de preservar documentos digitais por um

longo prazo, em uma biblioteca digital, por exemplo, só se efetivará de acordo com uma infra-

estrutura tecnológica adequada por meio de hardware e software sofisticados (atualizados de

acordo com determinada época). Ferreira (2006) elucida que além da parte física e lógica do

acervo digital, necessita-se atentar para o tratamento das informações, entendidas nesse

contexto, na transformação de bits, mediados pelo hardware e software, de forma a serem

interpretados/processados pelas máquinas, proporcionando significado aos objetos digitais.

A preservação de informação no domínio analógico manifesta-se, sobretudo, pela tentativa de conservar o suporte inalterado durante o máximo de tempo possível. No contexto digital, a preservação do suporte ou da seqüência de bits que constitui o objecto, não é condição suficiente para garantir que a informação permanece acessível, reutilizável e autêntica ao longo do tempo. Preservar informação digital consiste, por vezes, em modificar ou transformar deliberadamente o objecto físico ou lógico que transporta a mensagem. Para que essa transformação não produza uma mensagem exageradamente degradada, é fundamental definir quais as propriedades da mensagem que deverão ser asseguradas durante o processo de transformação. (FERREIRA, 2006, p. 51).

O grande desafio da preservação de documentos em ambientes digitais é garantir a

integridade e autenticidade dos recursos informacionais e o acesso contínuo a seus conteúdos,

bem como suas funcionalidades, através dos recursos tecnológicos disponíveis em cada

momento, a fim de proporcionar a facilidade no processamento, transmissão e armazenamento

das informações de forma eficiente.

Page 63: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

61

Em uma carta aprovada pela UNESCO em 2003 sobre a temática preservação digital

que culminou em um texto apresentado pela Conferência de Diretores das Bibliotecas

Nacionais – CDNL – destacaram a preservação digital como um dos pontos emergentes na

constituição da sociedade da informação, no sentido dos países refletirem sobre o

estabelecimento de políticas nacionais de preservação e que garanta o acesso aos recursos

digitais.

Para o delineamento da preservação digital que permita o armazenamento em

repositórios de dados digitais, faz-se necessária a adoção de algumas estratégias, métodos e

ferramentas tecnológicas que integrem determinado processo, tais como:

Preservação física: A preservação física está centrada nos conteúdos armazenados em mídia magnética (fitas cassete de áudio e de rolo, fitas VHS e DAT etc.) e discos óticos (CD-ROMs, WORM, discos óticos regraváveis). Preservação lógica: A preservação lógica procura na tecnologia formatos atualizados para inserção dos dados (correio eletrônico, material de áudio e audiovisual, material em rede etc.), novos software e hardware que mantenham vigentes seus bits, para conservar sua capacidade de leitura. Preservação intelectual: No caso da preservação intelectual, o foco são os mecanismos que garantem a integridade e autenticidade da informação nos documentos eletrônicos. (ARELLANO, 2004, p. 17).

Uma vez adotadas as estratégias anteriormente mencionadas, tem-se a possibilidade de

potencializar o acesso aos recursos informacionais de forma mais efetiva, na melhoria e na

integridade dos conteúdos digitais, para um posterior uso e reuso das informações. A seção

seguinte, apresenta brevemente algumas iniciativas apontadas pela literatura científica, nas

questões de preservação digital.

3.3.1 Modelo de Referência Open Archival Information System (OAIS)

Uma das iniciativas da preservação digital, no âmbito das bibliotecas digitais e alvo de

pesquisa de muitos profissionais da Ciência da Informação, que norteiam a manutenção do

acesso aos recursos informacionais, é o modelo de referência Open Archival Information

System (OAIS), mais conhecido como Sistema Aberto para Arquivamento de Informação,

Page 64: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

62

publicado pelo Consultive Committee for Space Data Systems6 (CCSDS), que consiste numa

proposta de padronização de um sistema de arquivamento destinado à preservação e ao acesso

dos recursos informacionais digitais em longo prazo.

Um arquivo nos termos do OAIS significa considerar os arquivos como organizações de pessoas e sistemas, que aceitaram a responsabilidade de preservar a informação e torná-la disponível e melhorar a comunicação e produtividade entre diferentes comunidades. (CCSDS, 1998 apud ARELLANO, 2004, p. 19).

Um aspecto importante a ser considerado no modelo OAIS é sua linguagem ou

terminologia, no estabelecimento de um vocabulário compartilhado na forma de um glossário

para a disseminação de conhecimento de formal mundial, proporcionando uma melhoria nos

processos de comunicação científica.

Quanto aos objetos de informação delineados para uma base de preservação digital dos

documentos, podemos destacar 4 (quatro) categorias de informação, de acordo com a figura 4:

FIGURA 4: Tipos de informação segundo o Modelo de referência Open Archival Information System (OAIS).

Fonte: Arellano (2004, p. 20)

6 Maiores informações sobre a documentação do modelo OAIS podem ser encontradas no site do Consultive Committee for Space Data Systems. Disponível em: <http://public.ccsds.org/default.aspx>. Acesso em: 20 dez. 2007.

Page 65: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

63

As categorias de informação, apresentadas no modelo OAIS, podem ser interpretadas

da seguinte maneira:

• informação de conteúdo: uma informação que é o objeto primário da preservação. Ela contém o objeto digital primário e informação representada necessária para transformar este objeto em informação com significado. • informação de descrição de preservação: qualquer informação necessária para preservar adequadamente a informação de conteúdo com a qual está associada. Ela inclui: – informação de referência: e.g. identificadores; – informação de contexto: e.g. classificações por assunto; – informação de proveniência: e.g. copyright, histórico; – informação de integridade: documenta os mecanismos de autenticação. • informação de pacote: informação que enlaça e relaciona os componentes de um pacote dentro de uma entidade identificável em uma mídia específica. • informação descritiva: informação que permite localizar, analisar, recuperar ou ordenar a informação de pacote dentro de um OAIS. (ARELLANO, 2004, p. 20).

Nesse sentido, pode-se observar, por exemplo, quando comparado a uma ambiência do

tipo biblioteca, seja ela convencional ou digital, que as etapas acima citadas, podem ser

compreendidas como processos padronizados, pautados em normas e padrões que

estabelecem a garantia da representação (informação descritiva e informação de conteúdo, por

exemplo) dos recursos informacionais, de modo que garanta a facilitação pelo usuário no

acesso e o uso aos conteúdos informacionais.

Na preservação digital, pode-se evidenciar a ocorrência de duas práticas distintas: na

primeira, as bibliotecas escolhem gerar e guardar uma cópia de preservação e uma de acesso

ao mesmo tempo ou gerar uma cópia de preservação e fazer cópias de acesso; na segunda, as

matrizes de preservação têm o tratamento de preservação e não as demais cópias. Neste

sentido, as bibliotecas digitais assumem uma responsabilidade vital no que concerne às

práticas de preservação digital em sua totalidade, devendo estas estar inseridas e englobadas

nos fluxos normais de trabalho.

Os formatos digitais (mídia magnética e óptica) são qualitativamente diferentes, uma

vez que são considerados meios reusáveis pondendo deteriorizar-se rapidamente, em vez de

décadas, em apenas alguns anos começam um processo de deteriorização.

Page 66: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

64

Um outro problema destacado é a obsolescência das tecnologias (hardware e

software), aliado à ausência de padrões, protocolos e métodos para preservar a informação

digital. Para garantir uma acessibilidade futura, faz-se necessário determinar fatores em

relação à arquitetura, ao alocamento dos recursos informacionais e ao planejamento das

bibliotecas digitais.

Outros dois tópicos precisam ser discutidos quando falamos em preservação digital: a

memória de massa, ou seja, a grande capacidade de armazenamento e a preservação a longo

prazo. Há duas maneiras distintas para examinar as exigências da preservação digital:

Da perspectiva dos usuários e a respeito da opinião das bibliotecas, arquivos e

repositórios e;

Dos administradores responsáveis pela manutenção, preservação e distribuição da

informação. (HEDSTROM, 1997-1998, tradução nossa).

O armazenamento digital não é apenas uma alternativa para armazenar formatos

impressos, porque muitos tipos de objetos digitais não possuem equivalentes impressos e não

podem ser preservados em formatos que não seja o digital.

Na concepção de Hedstrom (1997-1998, tradução nossa) muita informação que

começa sua vida no formulário eletrônico é impressa no papel ou no microfilme para ser

armazenada de forma segura. O papel neutro ácido de alta qualidade pode durar um século ou

mais, o microfilme pode durar 300 anos ou mais e mesmo assim, eles não requerem nenhum

tipo de equipamento ou software especial para a recuperação ou visualização da informação.

Uma outra estratégia para a preservação digital é preservar a informação digital nos

diversos formatos possíveis. A informação digital pode ser transferida por meio de gerações

sucessivas de tecnologias em um “software-independente” como o formato ASCII (arquivos

em formato texto) ou como arquivos simples e uma estrutura uniforme, homogênea, que

necessita ser migrada periodicamente. (HEDSTROM, 1997-1998, tradução nossa).

Portanto, as ameaças comuns a todos os tipos de documentos, independentemente do

seu suporte físico, requerem as mesmas estratégias de preservação. Já as ameaças atreladas

Page 67: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

65

somente aos documentos digitais requerem o uso de estratégias diferenciadas e, na maioria

das vezes, de forma associada.

A importância de salvaguardar a integridade do objeto digital como parte da missão é

um ponto importante para todas as bibliotecas digitais que estão envolvidas em preservação

digital e neste contexto, podemos destacar o papel dos repositórios institucionais (RI) que

atuam para assegurar e preservar a produção intelectual de comunidades acadêmicas

específicas, além de tornar acessível o capital intelectual de uma determinada instituição e

estabelecer melhores níveis de comunicação científica.

De acordo com a definição de Café et al. (2003, p. 4),

Um repositório institucional agrega um conjunto avançado de serviços relativos à organização, tratamento, acesso e disseminação do conteúdo digital produzido por uma instituição e sua comunidade acadêmica e de pesquisa. Dentre estes serviços, inclui-se principalmente o de preservação digital, uma vez que o gerenciamento da migração do conteúdo digital de uma tecnologia em vias de ser desativada para um sistema de ponta deve ocupar um espaço primordial nas preocupações das organizações que detêm os repositórios institucionais.

Pode-se ainda nesta perspectiva enumerar algumas estratégias técnicas para a

preservação em ambientes digitais tais como:

Atualização: compreende a cópia do conteúdo de um meio de armazenamento para

outro. Como tal, só se centra na obsolescência do meio, não é uma estratégia de

preservação completa. Exemplo: copiar um grupo de arquivos de CD-ROMs a DVDs.

Emulação: é a preservação do objeto digital junto com o software original, ou seja, é a

recriação do ambiente técnico requerido para ver e utilizar a coleção digital.

Migração/Conversão: é o processo de transferência de informação digital de uma

configuração de hardware e software para outra, ou de uma geração de computadores

a gerações subseqüentes. As melhorias em tecnologias da conversão podem suportar

soluções híbridas à preservação e alcançar problemas permitindo repositórios

armazenar determinados formatos do material digital em meios estáveis, tais como o

Page 68: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

66

microfilme, com versão da demanda do formulário digital para a análise e reuso.

(HEDSTROM, 1997-1998, tradução nossa).

Ainda nessa perspectiva, deve-se considerar como um fator primordial no processo de

preservação digital a utilização de metadados, que podem documentar a manutenção e usam a

história do documento, tempo e descrição, e uma série de documentos que são essenciais para

determinar a autenticidade e a compreensão da origem das fontes.

O objetivo da presente pesquisa é analisar os metadados descritivos para informações

bibliográficas no ambiente de bibliotecas digitais, advindos das áreas de Biblioteconomia e de

Ciência da Informação que serão tratados de forma específica no capítulo 4. Assim, a intenção

deste estudo não é analisar os metadados específicos para a preservação digital, mas

pontuarmos a necessidade de usá-los para que se tenha uma representação completa e

padronizada para o acesso e o uso efetivos das informações.

3.3.2 O papel dos metadados na preservação digital

É pertinente destacar nesse momento, que a representação dos recursos informacionais

por metadados, é uma condição-chave para as questões de preservação digital, ou seja, uma

vez as informações bem descritas e representadas, melhores condições de uso, reuso e

preservação dos conteúdos informacionais haverá.

A criação e uso de metadados é uma parte essencial para a caracterização dos recursos

informacionais em todas as estratégias operacionais de preservação digital, uma vez que elas

estão baseadas na conservação de software e hardware, emulação ou migração, ou seja, um

meio para garantir a autenticidade, registrar o gerenciamento de direitos e coleções de dados,

a interação com os recursos de busca, bem como a identificação e a localização dos recursos

informacionais. (ROTHENBERG, 1996, tradução nossa).

A palavra-chave neste contexto de bibliotecas digitais, repositórios institucionais,

comunicação científica, é interoperabilidade, ou seja, a capacidade entre sistemas

Page 69: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

67

heterogêneos intercambiar recursos informacionais que somente ocorrerá com o uso efetivo

dos metadados para a potencialização dos ambientes informacionais.

Neste sentido, foi desenvolvido o Open Archives Initiative Protocol for Metadata

Harvesting (OAI-PMH), que em português - Protocolo de Coleta de Dados da Iniciativa de

Arquivos Abertos, o qual oferece um ambiente de interoperabilidade, baseado na coleta de

metadados, que é independente das aplicações (computadores, seus programas e suas

tecnologias).

Os metadados nesta perspectiva de preservação digital, atuam como ferramentas

indispensáveis no âmbito das bibliotecas digitais, podendo estar agrupados em quatro grandes

categorias:

Metadados descritivos: metadados usados para descrever e identificar

informações sobre recursos;

Metadados de acesso: metadados que definem os termos e condições para o

acesso e a recuperação de um recurso;

Metadados estruturais: metadados que respondem a uma estrutura previsível ou

pré-determinada, tanto se essa estrutura é um padrão ou não;

Metadados administrativos/preservação: metadados usados no gerenciamento e

administração dos recursos informacionais.

Além disso, pode-se apontar algumas iniciativas do desenvolvimento de metadados

para preservação digital, tais como o METS (Metadata Encoding and Transmission

Standard), criado pela Library of Congress, que consiste num esquema XML (Extensible

Markup Language) – Linguagem de Marcação Extensível, usado para codificar todo o

conteúdo e o metadado de um objeto digital. Um documento METS pode ser um simples

arquivo com conteúdo e metadado, um documento direcional que aponta para o conteúdo e

para o metadado ou ainda, uma combinação dos elementos acima mencionados.

A importância da utilização dos METS pode ser destacada em três momentos:

Page 70: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

68

1. Interoperabilidade: partilhar objetos digitais entre sistemas de bibliotecas, permitindo

que a biblioteca digital trabalhe no compartilhamento com objetos de outros

repositórios;

2. Escalabilidade: a utilização de um único software podendo ser usado para indexar,

navegar e mostrar diferentes tipos de conteúdos;

3. Preservação: auxilia as estratégias de processo de migração.

Como pode ser apontado de acordo com a literatura, verifica-se que as bibliotecas

digitais assumem um papel decisivo na constituição da sociedade da informação, uma vez que

são produzidas gigantescas quantidades de informações no ambiente digital, precisando ser

repensado constantemente formas diferenciadas para preservar os conteúdos informacionais

para uma futura recuperação.

Vale destacar neste contexto que a atuação dos profissionais da informação, em

especial, os bibliotecários – sujeitos protagonistas neste cenário - precisam mais ainda agir de

forma ética, a fim de assegurar a integridade dos recursos informacionais e permitir o acesso e

o uso das informações pelo usuário final. Neste sentido, serão levantados alguns pontos com

relação aos elementos éticos para possíveis reflexões sobre o fazer do profissional do

bibliotecário.

3.4 Elementos éticos no contexto das Bibliotecas Digitais

Nosso objetivo neste estudo não é apresentarmos teorias, conceitos ou filosofias

concernentes à ética, mas sim, fornecer subsídios para uma maior compreensão da existência

de elementos éticos que norteiam a atuação e o fazer profissional dos profissionais da

informação, em ambiências informacionais sejam estas convencionais ou digitais.

De acordo com McGarry (1999) as bibliotecas existem há quase tanto tempo quanto os

próprios registros escritos; as práticas realizadas nas bibliotecas geralmente estão relacionadas

entre si, como, guardar para preservar e organizar para usar. Tanto os aspectos de

armazenagem como organização apresentam uma evolução maior nos estudos e busca de

soluções aos aspectos relativos ao acesso.

Page 71: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

69

Vivencia-se uma mudança de paradigmas com os aportes e instrumentos tecnológicos

desenvolvidos ultimamente, onde nossa sociedade, em especial a sociedade da informação é

caracterizada pela interconectividade permeada por redes de computadores nos processos de

interação.

Neste sentido, pode-se mais uma vez considerar neste cenário marcado pela

impactante presença das tecnologias da informação e comunicação (TICs) na potencialização

de ambientes informacionais, tais como as bibliotecas digitais, que trouxeram consigo um

novo repensar sobre questões éticas, principalmente no que diz respeito à preservação e ao

acesso aos recursos informacionais.

Entretanto, não se trata somente de uma mudança no ambiente tecnológico, mas, indo além, de uma mudança nas bases da ação profissional, visto que o componente ético passa a exigir uma constante reflexão em virtude da própria mutabilidade do ambiente. (CASTRO et al., 2006, p. 11).

A grande oportunidade para as bibliotecas digitais, bem como para o profissional

bibliotecário reside na mediação e criação de facilidades para o desenvolvimento no que

concerne ao acesso e uso da informação com o propósito de gerar conhecimento.

Como destaca Valentim (2004, p. 55),

[...] o fazer intrínseco do profissional da informação, haja vista a natureza eminentemente mediadora do mesmo, “desde a prospecção e filtragem de dados e informações, até a disseminação e transferência desses mesmos dados e informações ao público interessado”, com especial destaque para o tratamento de conteúdos informacionais, no âmbito dos quais o uso das linguagens, como instrumentos de mediação, requer uma atitude - e reflexão - ética constante e vigilante.

As novas tecnologias de produção, de processamento, de difusão e de exploração da

informação digital modificam profundamente as práticas sociais e profissionais relativas ao

uso da informação, causando dessa forma, questionamentos sobre os fundamentos ou

justificativas das reivindicações dos direitos autorais, por exemplo.

Page 72: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

70

Nesta perspectiva, Stuber e Franco (1999, p. 3) afirmam que,

O fato das obras e informações transmitidas através da Internet estarem sob a forma digital não retira delas a característica de criação humana, passíveis de proteção jurídica, garantindo ao criador ou autor destas obras o direito exclusivo de reprodução, divulgação e utilização de seus trabalhos, e o direito à remuneração por sua utilização, seja através da aplicação das normas de direito do autor, seja através da aplicação de normas de proteção à propriedade industrial.

Sem dúvida as bibliotecas digitais começam a se expandir exponencialmente. Sendo

assim, necessitam ser analisadas e tratadas sob o enfoque dos aspectos legais. Questões sobre

os direitos autorais (copyright) precisam ser esclarecidas, haja vista serem essenciais para a

aquisição, o armazenamento e a disseminação dos conteúdos digitais à medida que se

populariza o uso da informação digital por meio das redes eletrônicas abertas e das

ferramentas e produtos da multimídia.

Atualmente, os diferentes contextos que pautam discussões éticas compreendem

questões como propriedade intelectual e direitos autorais, principalmente com o número de

informações disponíveis na Internet, fomentadas pelas tecnologias da informação e

comunicação que rompem com tradicionais formas de circulação e de produção de

conhecimento e de informação.

As bibliotecas digitais, ao possibilitar o acesso aos recursos informacionais, permitem

ampliar a capacidade discursiva humana e, portanto, propiciam condições para a participação

cidadã e produtiva dos indivíduos na sociedade.

Mas a questão chave no atual cenário das bibliotecas digitais com relação aos aspectos

éticos, apontados por Brey (1999) é a necessidade de um olhar sobre os aspectos

representacionais (do ambiente e dos recursos informacionais) e aos aspectos interativos e de

comportamento (do usuário) nos ambientes informacionais digitais.

Nesse sentido, as questões éticas no contexto das bibliotecas digitais merecem ser

amplamente debatidas pela comunidade científica, como desafio para proporcionar o acesso à

informação neste ambiente.

Page 73: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

71

Pode-se, dessa maneira conforme apontado por Castro et al. (2006, p. 12) elencar

alguns problemas éticos específicos no âmbito das bibliotecas digitais, tais como:

A. ACESSO • Haveria controle de acesso aos recursos informacionais e como se daria o acesso a estes na biblioteca virtual [digital]? • A interação com o bibliotecário virtual (agente inteligente) atenderia a todas as necessidades dos usuários? • O custo do desenvolvimento e manutenção de uma Biblioteca virtual [digital] viabilizaria sua implementação?

B. DIREITOS AUTORAIS • Os usuários teriam acesso parcial (simples visualização) ou total (na íntegra) aos recursos informacionais? • Como resolver a questão do direito autoral na hipótese de acesso total aos recursos informacionais? • Como se resolve o conflito entre o respeito aos direitos de autor e os direitos de acesso à informação?

C. REPRESENTAÇÃO DO VIRTUAL [digital] • Entre a proposição e a representação da biblioteca virtual [digital] existe violação ética, quando não houver fidedignidade? O profissional estaria sendo tendencioso? • O fato de alguns serviços (e não dos recursos informacionais) da biblioteca virtual [digital] ser disponibilizada em outras línguas violaria a fidedignidade da representação em realidade virtual, em detrimento da garantia cultural?

D. REPRESENTAÇÃO DO RECURSO INFORMACIONAL • Evitar desvios • Evitar tendenciosidade • Evitar insuficiência • Evitar suprimir a informação (censura) • Evitar a ausência de padronização • Evitar a má-representação

Conforme apontado pela literatura científica, as questões éticas sempre permearam os

ambientes informacionais, tais como as bibliotecas e neste contexto, principalmente com o

uso intensivo das tecnologias da informação e comunicação. Atualmente, tanto na Web quanto

nas bibliotecas digitais verifica-se uma forte tendência para a disponibilização de conteúdos

digitais o que sugere um novo repensar dos profissionais envolvidos no que tange num

comportamento ético que vá ao encontro das necessidades informacionais dos usuários,

considerados os sujeitos que atuam decisivamente nos sistemas informacionais no âmbito

digital.

Page 74: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

72

Nesse momento, retomam-se algumas questões no que tange ao contexto das

bibliotecas digitais. As bibliotecas digitais, como ambientes propícios para a recuperação de

informações, têm na utilização de metadados a padronização das formas de representação e a

possibilidade de garantia de interoperabilidade entre sistemas, favorecendo a integridade e a

acessibilidade dos recursos informacionais de forma eficiente pelo usuário final.

Diante disso, pode-se dizer que, sem o uso de metadados, não haverá o

estabelecimento de uma biblioteca digital de acordo com um conjunto de padrões e normas

que garantam o acesso, a recuperação, o uso e a reutilização dos recursos informacionais e

que atendam às necessidades dos usuários apresentadas nas solicitações de busca. (CASTRO;

SANTOS, 2007).

Nesse sentido, pode-se considerar que as bibliotecas digitais, que são consideradas

ambientes específicos e padronizados, e distribuídas de acordo com áreas do conhecimento, já

se constituem como segmentos na Internet e proporcionarão o estabelecimento da semântica

aos recursos informacionais de forma mais precisa, uma vez que os metadados atribuídos nas

bibliotecas digitais garantirão a representação dos recursos informacionais e contribuirão para

aplicações mais efetivas na construção Web Semântica.

Assim, o capítulo seguinte aponta a necessidade de estruturas padronizadas para as

questões de representação e de descrição dos recursos informacionais e o surgimento de novas

ferramentas e instrumentos tecnológicos, que atuam decisivamente nos ambientes

informacionais digitais.

Page 75: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

73

CapíCapíCapíCapítulo tulo tulo tulo 4444

Formas de representação daFormas de representação daFormas de representação daFormas de representação da

informação: informação: informação: informação:

um diálogoum diálogoum diálogoum diálogo intersubjetivointersubjetivointersubjetivointersubjetivo

Page 76: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

74

4 FORMAS DE REPRESENTAÇÃO DA INFORMAÇÃO: UM DIÁLOGO INTERSUBJETIVO

“Representar algo significa conter a semelhança da coisa”.

(Tomás de Aquino)

Esse capítulo destaca a necessidade de se ter e se criar estruturas e modelos

padronizados para a construção de formas de representação da informação registrada,

pautados principalmente nas metodologias cristalizadas da Biblioteconomia e da Ciência da

Informação, na possibilidade do estabelecimento de ambientes informacionais digitais

interoperáveis.

4.1 Representação da informação

A tarefa de representação é uma atividade que os seres humanos, por se tratarem de

sujeitos cognitivos, realizam-na de forma espontânea e a todo o momento, uma vez que a

estrutura do cérebro permite uma analogia com o sistema hipertexto à medida que o

pensamento (complexo simbólico) é processado e disponibilizado na “teia” neural a exemplo

de uma verdadeira rede cíclica7.

A interação das mensagens constrói redes de significação transitórias na mente de um

ouvinte, e Lévy (2001, p. 23) elucida que “Quando ouço uma palavra, isto ativa

imediatamente em minha mente uma rede de outras palavras, de conceitos, de modelos, mas

também de imagens, sons, odores, sensações proprioceptivas, lembranças, afetos etc.”.

7 Rede cíclica nesta pesquisa é entendida como um processo mental, construído exatamente na instabilidade e na não-linearidade da construção da forma de representação da informação.

Page 77: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

75

A representação documentária acontece desde as primeiras tentativas de registro do

conhecimento em suportes passíveis de armazenamento para posterior utilização. Nesse

sentido, Castro (2002, p. 22) afirma que

Desde que o homem começou a registrar suas descobertas e conquistas, desde os primitivos meios de comunicação quando foi possível registrar o pensamento em um suporte informacional, a necessidade e a preocupação em recuperar de alguma forma o que foi registrado e armazenado parece existir.

A representação e a mediação do conhecimento são destacadas como os elementos-

chave para acesso rápido à informação, necessidade que originou várias formas de

organização da informação. A representação deve ser suficientemente rica sob o aspecto

cognitivo e, ao mesmo tempo sintética para economizar a energia do usuário de uma maneira

significativa. (MARCONDES, 2001). Deve ser levado em consideração o papel ativo do

usuário (sujeitos cognitivos), que é o principal personagem que se apropriará da representação

e fará uso do conhecimento registrado.

Algumas áreas do conhecimento, tais como a Ciência Cognitiva e a Psicologia, por

exemplo, ressaltam que os sujeitos ao interagirem com um determinado ambiente, devem ter

em mente algum tipo de representação de segmentos deste ambiente, ou seja, ter

representações internas. Em contrapartida, temos as representações externas, ou seja,

manipulações que operam as representações numa externalização do comportamento do

sujeito que poderia conduzir a estabilidade entre o sujeito e o ambiente. Vale destacar que os

humanos fazem uso de representações externas constantemente, tais como o alfabeto, a tecla

do piano, notas musicais, computador etc. (PESCHL, 2002).

A construção de uma forma de representação apropriada pode ser vantajosa e ainda

facilitar a compreensão, a resolução de problema, o cálculo e especialmente, a ampliação de

nossos conhecimentos. (SANTOS; VIDOTTI, 2007).

A representação não tem que conter e mostrar toda a possível informação sobre uma

certa realidade, mas tem que prover a informação que é pertinente a realização de uma tarefa.

Não se tem acesso direto ao ambiente e o conhecimento sempre é um sistema relativo, no

sentido de que é constituído para ser aplicado para a solução de um problema ou por gerar um

comportamento que é específico para o usuário em uma determinada tarefa. A questão está

Page 78: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

76

em estabelecer uma boa estabilidade dentro do sistema cognitivo e entre o ambiente, ou seja,

prover a informação que é pertinente para a realização de uma tarefa. (PESCHL, 2002).

Vale destacar também que a forma escolhida de representação tem que ser apropriada

com respeito à tarefa que o usuário da representação (sujeitos que se apropriarão e farão uso

das representações) tem que realizar.

Diferentes formas de representação podem ainda ser usadas para apresentar um objeto

ou conceito de diferentes pontos de vista. (CASA, 1997). O aspecto positivo está justamente

na possibilidade de obter “estruturas capazes de representar somente a informação relevante

em um determinado momento”. (CASA, 1997, p. 210). Podemos entender como estrutura

neste contexto, algo que propicie e dê suporte informacional.

Nesse sentido, McGarry (1999, p. 11) diz que “a informação deve ser ordenada,

estruturada ou contida de alguma forma, senão permanecerá amorfa e inutilizável”, ou seja, a

informação deve receber um tratamento que permita seu acesso para o uso, a preservação e a

reutilização e se apresentar representada de alguma forma para que tenha sentido.

Para tanto, faz-se necessário um veículo de comunicação para que a informação seja

compreensível para o receptor. McGarry (1999) destaca três tipos de veículos para a

transmissão de informações: sinais, símbolos e signos.

Os sinais proporcionam ou determinam as relações com as ações a serem desenvolvidas

pelo receptor. Por exemplo, um indivíduo ao dirigir um carro, no momento de estacionar

ou deslocar-se para a direita ou para a esquerda, sinaliza que o momento e o local para

determinada ação estão próximos. Nessa perspectiva, de uma forma genérica, percebe-se

que o indivíduo (receptor) recebeu uma dada informação ao detectar os sinais. Os sinais

podem ser considerados como uma forma de signo, enfatizando uma dada necessidade que

será seguida por algum tipo de reação, requerendo também, algum tipo de reação do

receptor. Em termos gerais “um sinal é comunicado de uma pessoa a outra para indicar

que o momento de agir está próximo”. (McGARRY, 1999, p. 12).

Page 79: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

77

Os símbolos constituem-se em representações culturalmente construídas e reconhecidas

por uma comunidade específica. Um símbolo pode ter ou não semelhanças com o que

representa. Um ícone de uma impressora pode ter uma boa semelhança com aquilo que

pretende representar e pode ter sentido para indivíduos do mundo todo, desde que

consigam identificar o objeto real. Entretanto, a palavra impressora terá sentido apenas

para quem a conhece, ao mesmo tempo, o objeto real e a Língua Portuguesa. Neste

contexto, podemos fazer uma distinção entre os símbolos icônicos, pois de acordo com

McGarry (1999, p. 13) estes possuem uma semelhança sensorial com o que representam.

“Um símbolo icônico pode ser uma pintura, uma imagem esculpida, etc. Tais

representações têm utilidade mais prática quando transmitem informações através das

barreiras lingüísticas”.

Os signos indicam a presença física de determinada coisa ou algum evento relacionado a

eles. Por exemplo, a fumaça representa ou indica fogo, o aumento da temperatura pode

indicar febre e até mesmo um simples olhar entre duas pessoas pode ter um sentido ou

significado conhecido. “Há também numerosas linguagens de signos em que gestos

convencionais são usados como substitutos da fala, como por exemplo, em nossa

comunicação com os surdos ou entre eles próprios”. (McGARRY, 1999, p. 13).

A representação da informação passa por uma definição de conjuntos de elementos

básicos e de regras para a conjunção desses elementos. Partindo desse pressuposto, podemos

dizer que a tarefa de representar a informação registrada não é algo simples de realizar,

porque a própria construção do processo de representação é redutora da informação, pois é

realizada por um intermediário/mediador.

No contexto atual das Tecnologias da Informação e Comunicação, tem-se a

representação da informação por metadados, criados por humanos e o acesso aos recursos

informacionais, realizados por sistemas/agentes especialistas das ferramentas de busca

(intermediário/mediador), por exemplo, que realizam as buscas na Web, percorrendo bases de

conhecimento pré-estabelecidas e/ou regras de inferências.

Pode-se dizer que a representação da informação registrada é compreendida numa

perspectiva de que é primeiramente mentalizada ou internalizada numa estrutura cerebral,

onde os sujeitos cognoscentes (mediadores ou intermediários), precisam externalizar em um

Page 80: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

78

formato ou em um suporte informacional, que garanta o registro (armazenamento) do

conhecimento para uma posterior socialização, uso e reuso dos recursos informacionais.

Reforçando tal assertiva, Alvarenga (2003, p. 4) diz que

A representação compreende em ambos os casos, um processo cognitivo. Destaca-se como uma instância do processo cognitivo humano aquela que culmina com a representação primária do conhecimento, situando-se no âmbito do registro do pensamento em um suporte documental, incluindo as etapas de percepção, identificação, interpretação, reflexão e codificação, etapas que são envolvidas no ato de se conhecer um novo ser ou coisa, ou aprofundar-se no conhecimento de um ser ou uma coisa já conhecida, utilizando-se dos sentidos, da emoção, da razão e da linguagem.

A principal função da representação é criar uma estrutura eficientemente rica com o

objetivo de recuperação das informações. Entretanto, a transferência da informação por meio

de sua representação é algo impreciso. Por exemplo, na descrição de conteúdo de uma

determinada obra, são adotadas palavras-chave que resumem um assunto, no entanto, essas

palavras são apenas representações parciais ou longínquas que contemplam a originalidade, a

integridade e a perfeição do documento.

Na perspectiva de Peterson (1996) formas de representação podem ser vistas como um

tema interdisciplinar à ciência cognitiva, pois há uma grande multiplicidade de formas de

representação (anotações, formalismos, interfaces, linguagens de programação etc.), e a

admissão de uma nova forma de representação pode tornar um domínio mais acessível para

um determinado propósito, comunidades de interesse específico ou tipo de usuário.

Unidade informacional8 é o que queremos representar de acordo com algum

formalismo escolhido, pois é isso que efetivamente seremos capazes de manipular no

ambiente de geração e uso de informações.

No trabalho de informar, a representação é tão trivial que sua relevância é

freqüentemente ignorada. E hoje, o aporte das Tecnologias da Informação e Comunicação –

TICs - disponíveis no auxílio da construção de formas de representação, para uma diversidade

8 Unidades informacionais nesta pesquisa são os recursos informacionais representados pelos seguintes tipos documentais: livros, periódicos, fotografias, filmes, músicas etc.

Page 81: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

79

de recursos nos mais variados suportes, remete a tarefa de representar a patamares de grande

necessidade e ao mesmo tempo de invisibilidade.

Nesse momento, passaremos ao interesse específico de tratar da análise da construção

de formas de representação para informações registradas a partir de um código textual e/ou

imagético e sustentada em um suporte de informação caracterizando um tipo documental

passível de armazenamento, recuperação, uso e reuso.

Nesse sentido, a representação da informação pode ser caracterizada por um processo

dúplice que é constituído pelo desenvolvimento de uma operação e que resulta em um

produto, a partir das etapas de catalogação e classificação.

Nosso interesse de pesquisa está voltado para a análise do processo de catalogação e a

construção do registro bibliográfico como elemento que agrega a representação de forma e

conteúdo do recurso informacional na construção de metadados que comporão o catálogo em

ambientes informacionais ou quaisquer dimensões.

Destaca-se, portanto, que o principal objetivo dos catálogos é representar os recursos

informacionais para que se possa recuperar a informação contida nos recursos disponíveis.

4.2 Breves considerações sobre os catálogos, as regras e os códigos de catalogação:

marcos de formas de representação na perspectiva da Biblioteconomia e da Ciência da

Informação

O catálogo é um dos instrumentos mais antigos na história da descrição e organização

da informação registrada. A palavra vem do grego kata, que significa (de acordo com, sob, em

baixo ou parte) e logos (ordem, razão). Muitas vezes define-se o catálogo como lista ordenada

dos documentos existentes em um ou mais acervos. (CASTRO, 2002).

No Renascimento, o Libri Graeci Impressi foi o primeiro catálogo impresso com

objetivos comerciais de acordo com o desenvolvimento e o aperfeiçoamento da imprensa,

Page 82: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

80

juntamente com a criação das chamadas feiras de livros, com destaque para as de Frankfurt e

as de Leipizig.

A necessidade de construção de um instrumento facilitador para a identificação e a

localização das informações disponíveis impulsionou o desenvolvimento de padrões de

representação que oferecessem o mínimo de uniformidade aos registros bibliográficos.

No século XIX, mais exatamente em 1839, na Inglaterra, Antony Panizzi estabeleceu

as 91 regras de catalogação, como forma de padronização das informações. Tais regras

estabeleciam a valorização da página de rosto, a introdução do conceito de autoria coletiva e o

cabeçalho de entrada de autor conforme determinada pela página de rosto.

Em 1850, Charles Jewett, adapta e amplia as 91 regras de Panizzi e utiliza a tecnologia

de esteriotipia em seu trabalho de catalogação centralizada, numa proposta precursora de

implantação do catálogo coletivo nos Estados Unidos.

Em 1876, Charles Ami Cutter define os objetivos e funções dos catálogos em Rules

for a Dictionary Catalog e destaca a relevância de uma estrutura que contemple os interesses

do usuário no catálogo de uma biblioteca, a partir de representações uniformes dos

documentos.

Em 1895, Otlet e La Fontaine criaram os primeiros passos para o Controle

Bibliográfico Universal - CBU, iniciando o levantamento de registros das publicações

editadas no mundo que se baseava numa estimativa de aproximadamente 16 milhões de

registros, partindo do princípio de socialização do conhecimento.

A padronização na representação das informações contidas nos catálogos passa a ser

preocupação e, nesse sentido, diversos códigos de catalogação são desenvolvidos e

aperfeiçoados. A preocupação com a uniformidade encontra eco nas discussões da

Conferência Internacional sobre Princípios de Catalogação, realizada em 1961, em Paris, que

culminou na publicação da Declaração de Princípios.

O período compreendido entre 1992 até 1997 é marcado por estudos realizados pela

IFLA - International Federation of Library Association and Institutions (Federação

Page 83: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

81

Internacional de Associações e Instituições Bibliotecárias) a respeito da representação

descritiva na reflexão pautada nos Princípios de Catalogação ou Princípios de Paris de 1961

para o estabelecimento de novas regras ou princípios que resultaram no documento publicado

em 2003, denominado Declaración de Princípios Internacionales de Catalogación (2003, p.

1, tradução nossa), destacando que

[...] novos princípios substituem e alargam os Princípios de Paris, consignando todos os tipos de materiais e não apenas as obras textuais e considerando a escolha e a forma de entrada para todos os aspectos dos registros bibliográficos e de autoridade utilizados em catálogos de bibliotecas.

Ainda nesse sentido esses novos princípios cobrem ou abrangem de acordo com a

DECLARACIÓN... (2003, p. 1-6, tradução nossa, grifo nosso):

1. Âmbito: Os princípios aqui enunciados destinam-se a orientar o desenvolvimento de códigos de catalogação. Aplicam-se a registros bibliográficos e de autoridade e a catálogos correntes de bibliotecas. Os princípios podem também ser aplicados a bibliografias e ficheiros de dados criados por bibliotecas, arquivos, museus e outras comunidades. 2. Entidades, Atributos e Relações: Para a criação de registros bibliográficos devem considerar-se as seguintes entidades, respeitantes a produtos de natureza intelectual ou artística: Obra, Expressão, Manifestação, Exemplar. 2.1.1. Os registros bibliográficos devem refletir tipicamente manifestações. Estas manifestações podem incorporar uma coleção de obras, uma obra individual ou uma parte componente de uma obra. As manifestações podem aparecer em uma ou mais unidades físicas. 3. Funções do Catálogo: As funções do Catálogo destinam-se a permitir ao utilizador: 3.1. Encontrar recursos bibliográficos numa coleção (real ou virtual) como resultado de uma pesquisa, utilizando atributos ou relações dos recursos: 3.1.1. Para localizar um determinado recurso. 3.1.2. Para localizar conjuntos de recursos representados 4. Descrição Bibliográfica: A parte descritiva do registro bibliográfico deve ser baseada na Descrição Bibliográfica Internacional Normalizada e pode ser feita de acordo com vários níveis de exaustividade. 5. Pontos de Acesso: O registro bibliográfico deve incluir pontos de acesso controlados e formulados de acordo com um código de catalogação normalizado ou com princípios internacionais. Esses pontos de acesso controlados devem ser feitos utilizando as formas autorizadas dos nomes usados para a entidade, de acordo com o que constar em registros de autoridade.

Page 84: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

82

6. Registros de Autoridade: 6.1. Os registros de autoridade devem ser construídos para controlar as formas autorizadas de nomes e referências que são usados como pontos de acesso para entidades como pessoas, coletividades, obras, expressões, manifestações, exemplares, conceitos, objetos, eventos e lugares. 6.2. Se uma pessoa, família ou coletividade usa nomes variados ou formas variantes dos nomes, deve escolher-se um nome ou uma forma do nome como cabeçalho autorizado. Se há títulos variados para uma obra, deve escolher-se um como título uniforme. 7. Fundamentos para permitir a Pesquisa: Os pontos de acesso são os elementos dos registros bibliográficos que providenciam 1) recuperação confiável de registros bibliográficos e de autoridade e respectivos recursos bibliográficos associados e 2) limitação dos resultados de pesquisa.

Antecedendo a publicação da Declaración de Princípios Internacionales de

Catalogación, a IFLA em 1998, verifica a necessidade de um reexame dos registros

bibliográficos e lança os Functional Requirements of Bibliographic Records (FRBR) –

Requisitos Funcionais para Registros Bibliográficos, ou seja, com uma proposta de,

[...] produzir um quadro que fornecesse um entendimento claro, precisamente determinado e compartilhado [por todos] do que seria aquilo sobre o que o registro bibliográfico proveria informação e o que se esperaria que o registro obtivesse, em termos de responder às necessidades dos usuários. (IFLA, 1998, p. 8).

Os FRBR constituem em uma nova abordagem para a representação descritiva nos

seus moldes convencionais, no sentido de propiciar uma recuperação mais efetiva e intuitiva

dos itens documentários, agindo como um bibliotecário de referência, ou seja, relaciona todos

os materiais atrelados ao termo da busca, trazendo-os de uma só vez em uma única interface.

Por exemplo, se um determinado autor além de livros, possui outras manifestações, tais como

discos, CDs, DVDs, o sistema permitirá através do modelo de relacionamento FRBR, no

momento da busca realizada pelo usuário, relacionar todas essas manifestações e recuperá-las

uma única vez.

Os FRBR não são formatos para catalogação, mas sim, um referencial teórico atualizado para orientar a elaboração de formatos de descrição que sejam mais úteis para as diversas categorias de usuários dos catálogos. Utiliza uma abordagem baseada no usuário para analisar os requisitos da descrição bibliográfica e, a partir da análise, define de forma sistemática os elementos que o usuário espera encontrar no registro bibliográfico. (CAMPELLO, 2006, p. 61).

Page 85: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

83

De acordo com Moreno (2006) os requisitos funcionais para registros bibliográficos

constituem-se de um modelo conceitual que tem por objetivo reestruturar os registros

bibliográficos a fim de reorganizar os elementos por meio da análise de entidades9, atributos10

e relacionamentos11.

No que se refere à entidade, por exemplo, vale dizer que compreende 3 (três) grupos:

Grupo 1: entidades que são produto de trabalho intelectual ou artístico,

Grupo 2: entidades que são responsáveis pelo conteúdo intelectual, guarda ou disseminação

das entidades do primeiro grupo e,

Grupo 3: entidades que são ou podem ser assunto das entidades.

Pode-se visualizar de acordo com a figura 5, uma das manifestações no modelo de

relacionamento propostos pelos FRBR no Grupo 1.

FIGURA 5: Entidades do Grupo 1 e Relações Bibliográficas Primárias Fonte: Mey (1999) apud Moreno (2006, p. 57).

9 As entidades podem ser compreendidas, por exemplo, como uma obra, um texto, um livro etc. 10 Os atributos correspondem às características dos dados relacionados à entidade e servem para diferenciar o conteúdo intelectual ou artístico, por exemplo. (MORENO, 2006). 11 Os relacionamentos descrevem as ligações entre uma entidade e outra, na facilitação de manuseio do recurso informacional pelo usuário em um sistema.

Page 86: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

84

Moreno (2006, p. 35, grifo do autor) de uma forma mais resumida apresenta que

Obra é uma entidade abstrata, uma criação intelectual ou artística distinta. A entidade Expressão é a realização intelectual ou artística específica que assume uma obra ao ser realizada, excluindo-se aí aspectos de alteração da forma física. Uma Manifestação é a materialização de uma expressão de uma obra, ou seja, seu suporte físico, que podem ser livros, periódicos, kits multimídia, filmes, etc., que é representada pelo Item, um único exemplar de uma manifestação. As duas últimas entidades refletem a forma física, são entidades concretas, enquanto as duas primeiras refletem o conteúdo intelectual ou artístico.

De acordo com a figura 5, pode-se fazer a seguinte interpretação para

compreendermos a estrutura dos FRBR. Tomemos como exemplo, um romance literário

(Obra), onde se tem o texto original e o mesmo fora traduzido ou tivera alguma modificação,

tal como uma edição ilustrada (Expressão); as formas em que a obra está disponível podem

ser encontradas/visualizadas em um formato impresso (manual) ou num formato

eletrônico/digital (Manifestação); e no momento em que a obra está disponibilizada na

estante de uma biblioteca, ou seja, os exemplares relativos àquela obra são denominados

Itens.

Os FRBR podem ser vistos como instrumentos que beneficiam e facilitam as tarefas

dos usuários em um sistema de informação automatizado, reforçando as tarefas/objetivos

tradicionais de um catálogo, por exemplo, enquanto um canal ou um meio como descrito por

Cutter12 em 1876, com a finalidade de habilitar os usuários a encontrar e sistematizar suas

obras. Nesse sentido, seriam tarefas dos usuários no modelo de relacionamento FRBR:

Encontrar: encontrar recursos que correspondam aos critérios de busca especificados

pelo usuário, por meio de um atributo ou um relacionamento de uma entidade;

Identificar: confirmar que o recurso descrito corresponde ao recurso buscado, ou

distinguido entre dois ou mais recursos com características similares;

Selecionar: selecionar um recurso que é apropriado às necessidades dos usuários, de

acordo com suas especificidades, por exemplo, conteúdo, formato físico, etc.

Obter: adquirir ou acessar o recurso descrito, por meio de compra, permuta ou acesso

eletrônico remoto, por exemplo. (TILLET, 2004, tradução nossa).

12 CUTTER, C. A. Rules for a printed dictionary catalogue. Washington, D.C.: Government Printing Office, 1876, p. 10.

Page 87: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

85

Considerando que os FRBR fornecem uma nova perspectiva da estrutura e nos

relacionamentos dos registros bibliográficos, pois relacionam os metadados presentes em um

registro bibliográfico com as necessidades dos usuários e recomendam um nível básico de

funcionalidade para esses registros, os FRBR têm como objetivo padronizar e possibilitar um

acesso mais efetivo aos recursos informacionais por meio do estabelecimento de

representações mais adequadas e seus relacionamentos.

Perspectiva essa que vai ao encontro da DECLARACIÓN... (2003, p. 1, tradução

nossa), que retrata a intenção de que,

[...] estes princípios potencializem a troca internacional de dados bibliográficos e de autoridade e orientem os que têm a missão de preparar regras de catalogação nos seus esforços para desenvolver um código internacional de catalogação.

Criado em 1966, o Comitê de Direção para a Revisão do AACR - Joint Steering

Committee for Revision of AACR, desde 2002 tem trabalhado e são os responsáveis pela

atualização do código internacional de catalogação. Em 2004, iniciou-se uma revisão do

AACR2 e em dezembro do mesmo ano foi lançado o que seria um primeiro esquema do novo

código de catalogação - AACR3.

Com o aumento dos recursos informacionais em meio digital em novos formatos e

com novas tecnologias disponíveis e para atender às exigências atuais no que concerne aos

impactos nas estruturas de descrição bibliográfica, o Comitê estabeleceu que tais regras eram

inadequadas e adaptaram-nas desenvolvendo o Resource Description and Access (RDA13)

com lançamento de sua versão primeira prevista para 2008.

De acordo com Tillett (2007, tradução nossa) o RDA será um novo padrão para a

descrição e o acesso dos recursos informacionais, remodelado/projetado para o mundo digital,

que proverá um conjunto compreensível de normas e instruções abarcando todos os tipos de

conteúdos e mídias.

13 Detalhes mais específicos sobre o RDA estão disponíveis no site: http://www.collectionscanada.ca/jsc/rda.html

Page 88: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

86

O RDA possibilitará aos usuários dos catálogos de bibliotecas e outros sistemas de

organização da informação potencializar as tarefas de encontrar, de identificar, de selecionar e

de obter recursos apropriados e melhor explicitados de acordo com suas necessidades

informacionais. (TILLET, 2007; JOINT STEERING COMMITTEE FOR REVISION OF

AACR, 2006, tradução nossa).

Para Tseng (2005, p. 1) o novo código de catalogação deverá contemplar

[...] modelos multinacionais de conteúdos a fim de fornecer descrições bibliográficas e acesso que abriguem todos os tipos de informação, incluindo meios emergentes, audiovisuais, objetos tridimensionais, etc. [...]. Será aplicado não apenas a bibliotecas, como a museus, arquivos, galerias e fontes de informação digitalizadas disponíveis na Web. O AACR3 irá englobar o conjunto de princípios e regras internacionais para catalogação denominado FRBR (Functional Requirements for Bibliographic Records) para controle das fontes autorizadas.

O RDA de acordo com Bowen e Attig (2007) deverá ser constituído de duas partes,

conforme pode ser visto, na figura 6:

Parte A: Descrição e Relacionamentos

Parte B: Controle de Pontos de Acesso

FIGURA 6: Estrutura do código RDA. Fonte: Bowen e Atting (2007, p. 19).

Page 89: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

87

Ao ser comparado com o código em exercício - AACR2, pode-se verificar notórias

diferenças com relação à estrutura do RDA. O AACR2 contempla atualmente duas partes:

Description (descrição) e Access (acesso). No RDA percebemos a inserção de alguns

elementos, como por exemplo, na parte A (Descrição) onde estão agregados os Relationship

(Relacionamentos) dados pelo modelo de relacionamento FRBR, ou seja, a parte A é agora

descrição e relacionamento e abarca o conteúdo dos registros bibliográficos. Já a parte B

Access Point Control (Controle de Pontos de Acesso) abarca o conteúdo de autoridade dos

registros bibliográficos.

Retomando a questão da preocupação da padronização, em especial da descrição

bibliográfica, podemos dizer que foi a partir de Panizzi (1839) que houve uma efetivação de

regras e normas no sentido de estabelecer uma padronização nas formas de representação, ou

seja, regras que garantissem a uniformidade da descrição bibliográfica, o que pode ser

visualizado nos tempos atuais e que vem influenciando decisivamente o trabalho da

representação descritiva, mais comumente denominada catalogação.

4.3 Catalogação ou metadados... “eis a questão”: paradigmas e transformações no

cenário atual

O uso dos computadores contribuiu para o avanço da tecnologia e da ciência em geral,

permitindo a automação de bibliotecas e o desenvolvimento de formas de representação que

agilizassem o processamento dos dados bibliográficos e catalográficos para máquinas,

contemplados nos catálogos convencionais. (CASTRO; SANTOS, 2005).

À medida que as coleções aumentam uma das principais preocupações, principalmente

das bibliotecas, e uma condição elementar é representar e descrever documentos de acordo

com normas e técnicas padronizadas a fim de proporcionar a recuperação dos itens e

posteriormente o seu uso.

O surgimento da Web em meados dos anos de 1990 foi marcado pelo crescimento

exponencial de informações em meio digital e nesse cenário há uma participação

interdisciplinar entre bibliotecários, profissionais da Computação e da Lingüística, por

Page 90: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

88

exemplo, na tentativa de se criar novas técnicas e instrumentos tecnológicos nos processos de

produção, armazenagem representação, descrição e recuperação dos recursos informacionais

digitais.

Sobre esse aspecto, vale dizer que a Web caracterizada como um ambiente

heterogêneo abarcando vários tipos de mídias tais como, som, imagem, texto etc. requer um

olhar para novas formas diferenciadas do tratamento dos recursos informacionais digitais, a

fim de que tais unidades possam ser representadas e descritas com o propósito de garantir o

acesso, a recuperação, o uso e o reuso pelo usuário final.

Nesse contexto, os formatos que possibilitam a descrição de documentos digitais,

aparecem estruturados em formas denominadas metadados que etimologicamente refere-se a

dados sobre dados, apontados pela literatura científica com o objetivo de descrever e localizar

documentos eletrônicos na Web, de forma a permitir a sua recuperação de forma mais

adequada e precisa. O catálogo de uma biblioteca é um exemplo típico de metadados, pois,

nele existem várias informações que descrevem os recursos armazenados, auxiliando os

usuários na recuperação.

Muitas são as definições e conceitos sobre o termo metadados disponíveis hoje na

literatura científica, o que vem causando uma pluralidade semântica acerca do seu uso, que

interfere na sua compreensão por diferentes profissionais. Para este estudo recorremos a Alves

(2005, p. 115), pois este é o conceito de metadados que mais se aplica aos propósitos dessa

pesquisa. Segundo a autora, “[...] os metadados são conjuntos de atributos, mais especificamente

dados referenciais, que representam o conteúdo informacional de um recurso que pode estar em meio

eletrônico ou não”.

A Internet ao ser considerada um ambiente com informações desestruturadas, tem nos

metadados, a possibilidade de melhor estruturar os dados a fim de representar e proporcionar

uma maior consistência na descrição dos recursos informacionais bem como sua recuperação.

Os metadados podem ter diferentes níveis de especificidades e estruturas com o

objetivo de descrever e identificar um recurso eletrônico mais exaustivamente, de forma a

possibilitar sua integridade a fim de garantir o acesso, o uso, a preservação e a

interoperabilidade entre ambientes informacionais digitais.

Page 91: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

89

Para os profissionais da Ciência da Informação, o termo metadados está relacionado

com o tratamento da informação, mais especificamente às formas de representação que

caracterizam um recurso informacional para fins de identificação, de localização e de

recuperação, ou seja, dados sobre catalogação e indexação que servem para organizar e tornar

a informação mais acessível (GILLILAND-SWETLAND, 1999).

Sobre essa ótica faz-se necessário retomar o ponto sugestivamente intitulado neste

subcapítulo a fim de assoalhar o cenário atual. Surge a dúvida catalogação ou metadados? A

questão-chave é a utilização ou a criação de terminologias novas para designar conceitos,

atividades e funções há muito tempo sedimentadas por áreas específicas, tais como a

Biblioteconomia e a Ciência da Informação num verdadeiro “reinventar a roda”. Tal práxis é

realizada cotidianamente por profissionais de outras áreas sem o conhecimento das atribuições

biblioteconômicas. Nesse sentido, é imprescindível um reexame dos aportes teóricos,

conceituais e metodológicos da Biblioteconomia e da Ciência da Informação que propiciarão

formas de representação mais efetivas.

Os bibliotecários produzem e padronizam metadados há séculos, desde as primeiras

tentativas de organização da informação a partir da descrição de documentos. O que vem

acontecendo ultimamente é que profissionais de diversas áreas estão buscando criar

instrumentos de descrição da informação, mas seu desconhecimento dos métodos, processos e

peculiaridades característicos da documentação da Biblioteconomia, tem gerado uma

variedade de padrões que muitas vezes não atende satisfatoriamente às exigências de uma

lógica descritiva estabelecida na Biblioteconomia e que dê conta da complexidade da

caracterização desse material. (MILSTEAD; FELDMAN, 1999; ALVES, 2005; CASTRO;

SANTOS, 2007).

Assim, podemos dizer que o objetivo e a função dos metadados estão fundamentados

nos princípios da catalogação, ou seja, garantir a padronização dos recursos informacionais

(forma e conteúdo), pautados em normas e regras internacionais na tentativa de facilitar e

potencializar a identificação, a busca, a localização, a recuperação, a preservação, o uso e o

reuso dos recursos informacionais. “A diferença dessa forma de representação está na nova

abordagem dada pelo ambiente tecnológico em que ela se insere”. (ALVES, 2005, p. 117).

Page 92: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

90

Nesse sentido, os metadados e padrões de metadados pormenorizados nessa pesquisa

são MARC21, MARCXML, Dublin Core e BibTeX, pois estes são formatos vislumbrados

pela iniciativa MarcOnt, no sentido de permitir a representação dos documentos e a

interoperabilidade semântica entre formatos distintos.

4.3.1 Padrão de metadados MARC21

O padrão de metadados MARC21 é datado da década de 1960 e foi desenvolvido pela

Library of Congress (LC), com o objetivo de padronizar a descrição bibliográfica em meio

eletrônico com o início da utilização de computadores para gerenciar o processo de

catalogação. O padrão de metadados MARC21 está inserido na era pré-internet e é

considerado segundo as características dos metadados, um formato rico.

O padrão de metadados MARC21 é considerado um formato completo e complexo,

pois sua estrutura está baseada na semântica estrutural do AACR2 para a descrição e a

identificação das características e especificidades do recurso informacional, por meio de uma

representação padronizada, apresentando-se como o primeiro formato para a comunicação de

registros bibliográficos.

Quanto às suas funções, podemos dizer que o MARC21 é um formato destinado à

criação, ao armazenamento, ao gerenciamento e ao intercâmbio de registros bibliográficos e

catalográficos, de forma que diferentes computadores e programas possam reconhecer, processar

e estabelecer pontos de acesso dos elementos que compõem a descrição bibliográfica. (ALVES;

SOUZA, 2007).

De acordo com Ferreira (2002), o formato MARC21 é um padrão amplamente

utilizado na área biblioteconômica e é aceito internacionalmente para estabelecer a estrutura

de representação, a importação e a exportação de dados bibliográficos e catalográficos.

Outro fato que devemos destacar no padrão de metadados MARC21 é sua

abrangência, ou seja, o formato contempla a descrição bibliográfica dos recursos

informacionais em diferentes suportes de armazenamento, tais como: livros, periódicos,

Page 93: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

91

mapas, música, materiais de arquivo e manuscritos, arquivos de computador e materiais

visuais.

O registro MARC é formado por campos14, subcampos e indicadores; cada campo,

etiqueta ou tag é constituído por três caracteres numéricos para sua identificação possuindo

uma estrutura complexa e extensa (FURRIE, 2003), como pode ser vista na figura 7, a seguir.

FIGURA 7: Exemplo de registro bibliográfico em formato MARC21 comentado pelo autor. Fonte: MARC21 Standards. Disponível em: < http://www.loc.gov/marc/marc-functional-

analysis/multiple-versions.html#intro>. Acesso em: 24 jun. 2007.

Como pode-se perceber de acordo com a figura 7, o formato MARC21 apresenta um

conjunto de campos em sua estrutura, com funções e objetivos para a representação e a

sistematização de cada dado. Sendo assim, foi instituída a família MARC com a finalidade de

dar um tratamento mais adequado e específico para diferentes tipos de dados, tais como:

Formato MARC21 para dados bibliográficos (Bibliographic data): contêm

especificações para a representação dos mais variados tipos de recursos

informacionais, garantindo a descrição e a recuperação dos diferentes suportes;

14 Para este estudo adotaremos a termo campo para nos reportarmos à estrutura do formato MARC.

Page 94: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

92

Formato MARC21 para controle de dados (Holding): contêm especificações para a

codificação dos elementos referentes ao controle e a localização dos recursos

informacionais, além de ser utilizado para o gerenciamento dos materiais;

Formato MARC21 para dados de autoridade (Authority): possui especificações para a

codificação de elementos que identificam autoridade (responsabilidade pela obra) de

um registro bibliográfico e estabelecem o controle do conteúdo;

Formato MARC21 para comunidade informacional (Community Information): contêm

especificações para a codificação de registros que contenham informações sobre

eventos, programas, serviços etc. Permite a inclusão e a disseminação de informações

que podem ser integrados ao catálogo, tornando o recurso informacional acessível ao

público;

Formato MARC21 para dados de classificação (Classification): contêm especificações

para a codificação e controle dos elementos de dados relacionados à classificação do

conteúdo dos recursos informacionais. (LIBRARY OF CONGRESS, 2006).

À medida que as tecnologias se desenvolvem, novos padrões de metadados surgem

para atender à comunidade e para acompanhar os avanços tecnológicos. Sendo assim, o

MARC21 para atender tal exigência, juntamente com a linguagem computacional XML

estabelece a criação do padrão MARCXML, desenvolvido pela LC, abordado a seguir.

4.3.2 Padrão de metadados MARCXML

Como mencionado anteriormente, o MARCXML foi desenvolvido pela LC com a

finalidade de padronização e intercâmbio de dados em formato MARC para a linguagem

computacional XML, além de permitir a navegabilidade na Web. Com o desenvolvimento

tecnológico e para acompanhar os avanços da área de Ciência da Informação, a XML está

sendo considerada cada vez mais a base de vários padrões da área de informação,

principalmente no âmbito das bibliotecas digitais, ocorrendo, dessa forma, a migração do

formato MARC21 para o MARCXML.

Page 95: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

93

De acordo com Siqueira e Santos (2004, p. 106),

[...] a estrutura do MARC21 em XML suporta todos os dados codificados na forma tradicional e sua arquitetura é baseada em componentes, e é extensível, ou seja, permite que os programadores de computador distribuam partes diferentes do software para construir soluções feitas sob encomenda.

Vale destacar que o MARCXML possui exatamente a mesma estrutura do formato

MARC21 (campos, subcampos, indicadores) apenas sua representação incorpora a XML

redefinindo sua estrutura para potencializar a descrição dos recursos informacionais em meio

digital. O MARCXML pode ser compreendido de acordo com a figura 8, a seguir.

<?xml version="1.0" encoding="UTF-8" ?> - <collection xmlns="http://www.loc.gov/MARC21/slim ">

- <record> <leader>01142cam 2200301 a 4500</leader> <controlfield tag="001">92005291</controlfield> <controlfield tag="003">DLC</controlfield> <controlfield tag="005">19930521155141.9</controlfield> <controlfield tag="008">920219s1993 caua j 000 0 eng </controlfield> - <datafield tag="010" ind1="" ind2="">

<subfield code="a">92005291</subfield> </datafield> - <datafield tag="020" ind1="" ind2="">

<subfield code="a">0152038655 :</subfield> <subfield code="c">$15.95</subfield>

</datafield> - <datafield tag="040" ind1="" ind2="">

<subfield code="a">DLC</subfield> <subfield code="c">DLC</subfield> <subfield code="d">DLC</subfield>

</datafield> - <datafield tag="042" ind1="" ind2="">

<subfield code="a">lcac </subfield> </datafield> - <datafield tag="050" ind1="0" ind2="0">

<subfield code="a">PS3537.A618</subfield> <subfield code="b">A88 1993</subfield>

</datafield> - <datafield tag="082" ind1="0" ind2="0">

<subfield code="a">811/.52</subfield> <subfield code="2">20</subfield>

</datafield> - <datafield tag="100" ind1="1" ind2="">

<subfield code="a">Sandburg, Carl, </subfield> <subfield code="d">1878-1967.</subfield>

</datafield> - <datafield tag="245" ind1="1" ind2="0">

<subfield code="a">Arithmetic / </subfield> <subfield code="c">Carl Sandburg ; illustrated as an anamorphic

adventure by Ted Rand. </subfield> </datafield> - <datafield tag="250" ind1="" ind2="">

<subfield code="a">1st ed. </subfield> </datafield>

Page 96: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

94

- <datafield tag="260" ind1="" ind2=""> <subfield code="a">San Diego : </subfield> <subfield code="b">Harcourt Brace Jovanovich, </subfield> <subfield code="c">c1993.</subfield>

</datafield> - <datafield tag="300" ind1="" ind2="">

<subfield code="a">1 v. (unpaged) : </subfield> <subfield code="b">ill. (some col.) ; </subfield>

<subfield code="c">26 cm.</subfield> </datafield>

</datafield> - <datafield tag="500" ind1="" ind2="">

<subfield code="a">One Mylar sheet included in pocket. </subfield> </datafield> - <datafield tag="520" ind1="" ind2="">

<subfield code="a">A poem about numbers and their characteristics. Features anamorphic, or distorted, drawings which can be restored to normal by viewing from a particular angle or by viewing the image's reflection in the provided Mylar cone.

</subfield> </datafield> - <datafield tag="650" ind1="" ind2="0">

<subfield code="a">Arithmetic </subfield> <subfield code="x">Juvenile poetry. </subfield>

</datafield> - <datafield tag="650" ind1="" ind2="0">

<subfield code="a">Children's poetry, American. </subfield> </datafield> - <datafield tag="650" ind1="" ind2="1">

<subfield code="a">Arithmetic </subfield> <subfield code="x">Poetry. </subfield>

</datafield> - <datafield tag="650" ind1="" ind2="1">

<subfield code="a">American poetry. </subfield> </datafield> - <datafield tag="650" ind1="" ind2="1">

<subfield code="a">Visual perception. </subfield> </datafield> - <datafield tag="700" ind1="1" ind2="">

<subfield code="a">Rand, Ted, </subfield> <subfield code="e">ill. </subfield>

</datafield> </record>

</collection>

FIGURA 8: Estrutura de um registro em formato MARCXML. Fonte: MARCXML. Disponível em:

<http://www.loc.gov/standards/marcxml/Sandburg/sandburg.xml>. Acesso em: 23 jul. 2007.

Pode-se destacar que o padrão de metadados MARCXML está sendo usado cada vez

com mais intensidade nas questões de descrição, recuperação e preservação dos recursos

informacionais na potencialização e padronização de ambientes informacionais digitais, o que

implica e requer uma nova postura dos profissionais envolvidos na construção de formas de

representação da informação.

Page 97: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

95

4.3.3 Padrão de metadados Dublin Core

O Dublin Core Metadata (DC), em seus objetivos, é destinado a organizar as

informações disponíveis nas páginas da Web, na tentativa de estabelecer padrões de

catalogação dos recursos informacionais em meio digital. É considerado como o primeiro a

ser denominado padrão de metadados, cujo conceito é previsto nos fundamentos da

Catalogação da área de Biblioteconomia e originário do MARC.

Segundo Marcondes (2006, p. 108),

Dublin Core é um padrão voltado principalmente para a descrição e a descoberta de documentos eletrônicos. Caso a biblioteca digital, além de referenciar recursos eletrônicos, seja uma publicadora ou editora, como o são várias bibliotecas digitais especializadas ou arquivos eletrônicos que têm a custódia dos documentos que compõem sua coleção, terá de se preocupar, além de referenciar seus documentos com metadados segundo padrões como o Dublin Core, com questões como copyright, administração e gestão destes documentos e a preservação digital dos mesmos. Para todas estas atividades, existem conjuntos de metadados específicos.

O Dublin Core foi desenvolvido em 1995 por um consórcio de instituições produtoras

de informação no setor de pesquisas da OnLine Computer Library Center (OCLC), cuja

filosofia é que a descrição de um documento pode ser elaborada/representada pelo seu criador

ou produtor devido a “simplicidade” do preenchimento dos campos, sem a obrigatoriedade de

um profissional (bibliotecário/catalogador) especialista em catalogação.

De acordo com Souza, Vendrusculo e Melo (2000, p. 93),

[...] o Dublin Core, pode ser definido como sendo o conjunto de elementos de metadados planejado para facilitar a descrição de recursos eletrônicos. A expectativa é de que os autores e Websites, que não possuam conhecimentos em catalogação, possuam capacidade de usar o Dublin Core para descrição de recursos eletrônicos, tornando suas produções mais visíveis aos mecanismos de busca e sistemas de recuperação.

Nesse momento é pertinente destacar que mesmo possuindo essa característica de

simplicidade e flexibilidade apontadas pela literatura científica, vale dizer que há normas e

princípios que norteiam a sua construção de forma a garantir uma representação efetiva e para

que se estabeleça a interoperabilidade entre os sistemas informacionais digitais.

Page 98: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

96

O Dublin Core é constituído por 15 elementos para facilitar a descrição e a

recuperação dos recursos informacionais em meio digital. Barreto (1999, p. 74) destaca-os.

Nome do elemento

Descrição do elemento

Subject Tópico relacionado ao objeto descrito

Title Nome do objeto

Author Pessoas diretamente responsáveis pelo conteúdo intelectual do objeto

Publisher Agente ou agência responsável por tornar o objeto disponível

OtherAgent Pessoas, tais como editores e ilustradores, que contribuíram de forma significativa para o conteúdo intelectual do objeto.

Date Data da publicação

ObjectType Gênero do objeto, tal como uma novela, um poema ou dicionário.

Form Formato de dado do objeto, tal como postScript, HTML, etc.

Identifier Números ou caracteres usados para identificar o recurso de forma única

Relation Categoria de relacionamento do objeto com outros objetos

Source Objetos dos quais o objeto descrito é derivado

Language Idioma relativo ao conteúdo intelectual do objeto

Coverage Localização especial e duração temporal do objeto

Rights Contém ou referencia o direito de propriedade sobre o objeto

Description Contém uma descrição textual do objeto ou uma referência para essa descrição

FIGURA 9: Elementos contemplados no padrão de metadados Dublin Core. Fonte: Adaptado de DCMI (2006).

Assim, para melhor compreender-se a estrutura de um documento no formato de

metadados Dublin Core, segue de acordo com a figura 10, um modelo.

Page 99: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

97

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml" lang="en-US" xml:lang="en-US"> <head> <title>Dublin Core Metadata Initiative (DCMI)</title> <link rel="schema.DC" href="http://purl.org/dc/elements/1.1/" /> <meta name="DC.title" content="Dublin Core Metadata Initiative (DCMI) Home Page" /> <meta name="DC.description" content="The Dublin Core Metadata Initiative is an open forum engaged in the development of interoperable online metadata standards that support a broad range of purposes and business models. DCMI's activities include consensus-driven working groups, global conferences and workshops, standards liaison, and educational efforts to promote widespread acceptance of metadata standards and practices." /> <meta name="DC.date" content="2006-08-28" /> <meta name="DC.format" content="text/html" /> <meta name="DC.contributor" content="Dublin Core Metadata Initiative" /> <meta name="DC.language" content="en" /> <meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1" /> <link rel="meta" href="index.shtml.rdf" /> <link rel="alternate" type="application/rss+xml" title="RSS" href="http://dublincore.org/news.rss" /> <link rel="stylesheet" href="/css/default.css" type="text/css" /> <script src="/js/default.js" type="text/javascript"></script> </head>

FIGURA 10: Estrutura de registro em formato Dublin Core. Fonte: Dublin Core Metadata Initiative. Disponível em: <http://dublincore.org>. Acesso em: 24 jul.

2007.

Vale destacar de acordo com a figura 10, que os mesmos elementos (campos) do DC

correspondem a elementos (campos) do padrão de metadados MARC21, por exemplo,

“DC.title” (DC) e “245” (MARC21), ver figuras 7 e 8: dizem respeito à indicação do título do

recurso informacional. Isso significa que ambos os formatos provêm da mesma fonte e têm a

possibilidade de intercambiar seus dados, ou seja, estabelecer a interoperabilidade entre

formatos e padrões distintos.

Uma das grandes discussões na comunidade científica é a polêmica de qual padrão de

metadados utilizar (MARC21 ou DC), uma vez que devido a sua simplicidade grande parte

dos ambientes informacionais, tais como repositórios digitais, bibliotecas digitais etc., adotam

o DC. Mas o que precisa ficar evidente são quais princípios que norteiam sua criação. O DC

foi criado com o objetivo de facilitar a descoberta do recurso informacional no ambiente Web,

ou seja, abarca uma representação mínima que proporciona a sua identificação bem como a

sua localização. Enquanto o MARC21 está relacionado à criação, ao armazenamento, ao

gerenciamento e ao intercâmbio de registros bibliográficos e catalográficos e atende às

peculiaridades exigidas nas grandes coleções.

Page 100: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

98

Sendo assim, a adoção de um formato/padrão ou outro dependerá dos objetivos

institucionais dos ambientes informacionais e de uma lógica descritiva que atenda e

contemple suas necessidades informacionais e que permita o estabelecimento dos requisitos

da interoperabilidade na satisfação dos usuários.

Faz-se necessário destacar também que para acompanhar os avanços tecnológicos, o

padrão de metadados Dublin Core já se encontra também disponível numa versão na

linguagem computacional XML o que implica uma melhor estruturação e efetividade dos

dados e dos metadados.

4.3.4 Padrão de metadados BibTeX

O padrão de metadados BibTeX foi desenvolvido em 1985 por Oren Patashnik e Leslie

Lamport enquanto um formato bibliográfico para a preparação de documentos no sistema

LaTeX. LaTeX é um sistema de preparação para buscas abertas de documentos utilizado na

comunidade acadêmica. (KRUK; SYNAK; ZIMMERMANN, 2005, tradução nossa). De

acordo com os autores o BibTeX é considerado um formato bibliográfico simples para a

descrição dos recursos informacionais na Internet e aplicado atualmente em bibliotecas

digitais.

Pode-se perceber que o BibTex é um padrão muito parecido com o Dublin Core no

aspecto da “simplicidade” e autonomia dos autores na descrição e na criação do registro

bibliográfico. Os autores provêm suas referências/citações de outras publicações, totalmente

baseadas nas características originais do documento, para então, serem compartilhadas pela

comunidade na Internet. (KRUK; SYNAK; ZIMMERMANN, 2005, tradução nossa).

Os elementos contemplados pelo padrão podem ser assim elencados de acordo com

Kruk, Synak e Zimmermann (2005):

Abreviação

Editor/autor

Título

Título (livro, revista, série)

Page 101: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

99

Mês/dia/ano

Issn/Isbn

Volume/número/páginas

Instituição/organização/escola

Publicador/URL

Endereço

Notas

O tipo de publicação (recurso informacional) pode ser classificado de acordo com 13

categorias diferentes. Cada arquivo de BibTeX contém um número de entrada. Uma entrada

descreve uma única publicação, que pode ser uma entidade autônoma (como um livro, por

exemplo) ou uma parte da publicação no todo (como um capítulo de um livro, por exemplo).

Há entradas padrão em BibTeX tais como:

Artigo - artigo de um periódico ou jornal

Livro

Conferência

Inbook - parte de um livro, bem como um capítulo, seção

Incollection - parte de um livro com o seu próprio título

Inproceedings - um artigo nos anais do evento

Manual – documentação técnica

Dissertação

Miscelânea

Tese (PHD)

Anais/Resumos de uma conferência

Relatórios técnicos – um relatório publicado por uma instituição ou

universidade

Unpublished – um documento nunca publicado, mas com um título e um autor.

(KRUK; SYNAK; ZIMMERMANN, 2005, tradução nossa).

O formato BibTeX apresenta quatro tipos diferentes de entradas, tais como:

@STRING: define abreviações na forma de apresentação do conteúdo do recurso

informacional, como por exemplo, @string { foo = "Mrs. Foo" }

Page 102: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

100

@PREAMBLE: define como o texto deve ser formatado;

@COMMENT: para comentários não feitos por BibTeX;

Cada uma das entradas declarando uma referência única para um determinado tipo de

publicação, por exemplo: @article, @book, @inproceedings, etc. (FEDER, 2006,

tradução nossa).

Para melhor compreender-se a estrutura de um registro BibTeX vejamos um modelo,

de acordo com a figura 11, a seguir.

FIGURA 11: Estrutura de um registro no padrão de metadados BibTeX

Fonte: Synak (2005, p. 55)

Como pode ser observado na figura 11, um registro BibTeX contempla alguns

elementos descritivos tais como (author, title, address etc.) referente neste caso a um recurso

informacional do tipo artigo publicado em anais de evento (inproceedings). Vale destacar

também alguns sinais diacríticos, tais como { (chaves) que constituem a entrada do conteúdo

do registro BibTeX, e finalizado também por } (chave); pode-se ainda verificar que cada

campo do registro é separado por um sinal do tipo , (vírgula).

Uma entrada de BibTeX consiste no tipo (uma palavra antecedida de @), uma palavra-

chave e um número de metadados que definem várias características de uma entrada

Page 103: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

101

específica de BibTeX. Entre esses metadados, pode-se destacar: autor, título, ano etc. Alguns

campos são obrigatórios para determinados tipos de entradas em BibTeX, alguns são

opcionais. Cada campo é especificado por seu nome seguido por um sinal de igual e pelo

conteúdo contemplado no registro bibliográfico e por um sinal de marcação do tipo “” (aspas).

Há um conjunto de metadados-padrão existentes, que podem ser interpretados por

BibTeX ou ferramentas autorizadas por ele. Os campos que são desconhecidos pelo padrão

são “ignorados” por ele e podem assim, ser usados para o armazenamento de informações

adicionais sem interferir no resultado de uma busca de um documento original. (FEDER,

2006, tradução nossa).

O padrão BibTeX tem em seus objetivos a possibilidade de facilitar a separação da

bibliografia com a apresentação do texto, ou seja, utiliza-se do mesmo conceito da distinção

do conteúdo com o estilo do texto utilizada no próprio LaTeX, por exemplo, ou da própria

linguagem computacional XHTML15 (eXtensible Hypertext Markup Language).

Além disso, pode-se dizer que tal padrão está voltado principalmente para a

comunidade científica (pesquisadores) e temas relacionados à educação. Em uma biblioteca

digital que contenha publicações técnicas diferentes, publicar registros em BibTeX junto com

essas pode ser muito mais útil para a comunidade de pesquisadores. (SYNAK, 2005, tradução

nossa).

Dessa forma, assim como os padrões de metadados MARC21 e Dublin Core que

possuem versões na linguagem computacional XML, o formato BibTeX também possui em

sua versão o padrão BibTeXML. Além disso uma das iniciativa atuais do Massachussets

Institute of Technology (MIT) é a representação de BibTeXML na linguagem computacional

OWL (Web Ontology Language), destinada a construção de ontologias cuja base está calcada

na arquitetura de metados RDF (Resource Description Framework) que atua efetivamente na

construção Web Semântica.

Além dos padrões de metadados mencionados anteriormente, faz-se necessário o

estudo e a atenção para outras ferramentas e instrumentos tecnológicos para o estabelecimento

15 Trata-se de uma evolução da linguagem HTML para a imposição de regras semânticas às páginas escritas em HTML bem como a sua integração com outras aplicações. (FEITOSA, 2006).

Page 104: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

102

da interoperabilidade entre ambientes informacionais digitais. Para que haja um trabalho

conjunto entre os sistemas, destaca-se a linguagem de marcação XML (Extensible Markup

Language) e a arquitetura de metadados RDF (Resource Description Framework), pois são

consideradas a base da infra-estrutura da Web Semântica e da iniciativa MarcOnt.

4.4 XML (Extensible Markup Language)

Antes de adentrar-se no assunto propriamente dito, precisa-se destacar a importância

da XML16 para a construção Web Semântica e para o desenvolvimento da iniciativa MarcOnt.

No primeiro caso, com a necessidade de embutir semântica para que os agentes de softwares

possam entender o conteúdo dos dados, a XML atua como ferramenta que proporcionará,

além da sintaxe, a semântica, na padronização e na estruturação dos dados. Já no segundo

caso, vale dizer que para haver a interoperabilidade semântica entre os padrões de metadados

vislumbrados pelo MarcOnt, é imprescindível uma linguagem comum, que poderá

proporcionar melhores resultados na busca e na recuperação dos recursos informacionais e

esta linguagem é a XML.

A XML (Extensible Markup Language) foi desenvolvida em 1996 por um grupo de

especialistas do W3C (World Wide Web Consortium), com o objetivo de tornar-se um padrão

universalmente aceito para a descrição e a redefinição da estrutura de documentos eletrônicos

e está sendo cada vez mais utilizada de forma generalizada na codificação de metadados.

A linguagem computacional XML originou-se a partir da linguagem SGML (Standard

Generalized Markup Language) e provê a estruturação de dados independente de plataforma,

ou do modelo de dados em que as informações estão representadas sendo apontada na

literatura como uma meta-linguagem, ou seja, uma linguagem genérica para definir a

formatação de documentos.

16 É pertinente retratar que não é nosso objetivo nesta pesquisa abordar com profundidade a linguagem XML, mas sim apontar sua importância no desenvolvimento de ambientes informacionais específicos, como por exemplo, a Web Semântica e as Bibliotecas digitais. Informações mais detalhadas sobre XML podem ser encontradas em Furgeri (2006); Feitosa (2006); Flamino (2006); Alves (2005); Siqueira (2003); Siqueira e Santos (2004); Almeida (2002) e Bax (2001).

Page 105: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

103

Um ponto que se faz necessário destacar é a diferença entre a HTML (HyperText

Markup Language) e a XML; a primeira diz respeito à disposição de como o documento será

apresentado, enquanto a segunda especifica o significado (semântica) das informações

contempladas pelo documento na facilitação de proporcionar ao usuário uma busca mais

significativa e dados melhor compreensíveis pelos agentes de softwares.

Alguns autores como Esteves, Santos e Guimarães (2002) apud Siqueira (2003, p. 78)

relatam que

A XML aparece, no contexto da internet, para facilitar a difusão da informação documental. Como possui uma semântica própria, descreve a estrutura e conteúdo do documento, não a sua formatação, tornando-se, por isso, "revolucionário" em relação ao HTML que apenas possibilita a formatação dos dados no que respeita à sua apresentação gráfica, não fornecendo nenhum conteúdo semântico.

A figura 12 apresenta uma forma de apresentação de um documento na estrutura

XML, a seguir.

FIGURA 12: Exemplo de documento livro em XML. Fonte: do autor.

Como pode ser observado pela figura 12, a estrutura de um documento XML é sempre

constituído por marcações de início <documento> e marcações de fim </documento> onde a

estrutura textual é denominada por elementos (atributos) e cada atributo é dado por um valor

entre aspas (“2006”) .

<documento> <livro ano= “2006”>

<autor> <nome> Bernadete</nome>

<sobrenome> Campello</ sobrenome> </autor> <titulo> Introdução ao controle bibliográfico</titulo> <editora>

<nome> Briquet de Lemos/Livros</nome> </editora>

</documento>

Page 106: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

104

Ao nos reportarmos ao cenário da Biblioteconomia e da Ciência da Informação, vê-se

que a XML é apontada na literatura, de acordo com vários autores (Furgeri, 2006; Feitosa,

2006; Flamino, 2006; Siqueira, 2003; Siqueira e Santos, 2004; Almeida, 2002; Bax, 2001)

como uma ferramenta tecnológica que contribui significamente com os padrões de metadados

no sentido de potencializar a preservação, o uso e o reuso dos recursos informacionais. Para

este estudo adotam-se alguns conceitos de Siqueira (2003) e Siqueira e Santos (2004), pois de

acordo com sua análise são os que mais se adaptam aos princípios do MarcOnt.

A XML depende também da participação de outras tecnologias para a sua efetividade;

dentre essas tecnologias destacam-se o DTD, XSL, XML Schema.

DTD (Document Type Definition) – estabelece um conjunto de regras (sintaxe) para a

validação da estrutura de um documento XML. Umas das desvantagens da DTD é que

ela permite apenas a verificação sintática de um documento sem nenhum tipo de

controle semântico (conteúdo). “[...] pode-se garantir que o título foi digitado, mas não

se realmente era o título, ou ainda, pode-se verificar se o dado informado no campo

‘data de publicação’ é realmente uma data, mas não se garante que seja a data correta”.

(SIQUEIRA, 2003, p. 75).

XSL (Extensible Stylesheet Language) – funciona como um instrumento na

transformação de dados XML de forma a serem apresentados em HTML, cujo

objetivo é permitir a correta visualização dos dados no navegador. Em relação ao

MarcOnt, esta linguagem tem um papel importante principalmente no que diz respeito

às formas de apresentação dos padrões de metadados contemplados no âmbito das

bibliotecas digitais, por exemplo. A XSL juntamente com as linguagens XSLT

(Linguagem de Transformação) e XSLFO (Linguagem de Formatação de Objetos)

potencializa as estruturas de apresentação de um recurso informacional. (SIQUEIRA,

2003).

XML Schema – recomendada pelo W3C essa ferramenta está sendo empregada em

substituição à DTD aplicada a diferentes contextos, com a finalidade de garantir a

integridade sintática e semântica da estrutura de um documento XML. O papel de um

XML Schema “é similar ao dos esquemas de especificações de estruturas de dados

[elementos, atributos e tipos de dados] – como nomes de campos e seus respectivos

Page 107: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

105

tipos – em um banco de dados relacional”. (FURGERI, 2006, p. 93). Vale destacar

nesse momento, que a XML juntamente com a XML Schema localiza-se na camada

base da Web Semântica e são, portanto, uma das linguagens que proporcionarão uma

melhor estruturação dos dados (sintaxe e semântica) a fim de uma melhor recuperação

dos recursos informacionais.

A XML, no contexto das bibliotecas digitais, apresenta-se como uma das linguagens

que mais se adapta às formas de representação da informação, permeado pelas TICs no que

diz respeito à descrição bibliográfica dos recursos informacionais.

Nessa perspectiva pode-se considerar que a linguagem XML visa à criação e o

estabelecimento de padrões de comunicação entre os sistemas informacionais, tais como, por

exemplo, as bibliotecas digitais na possibilidade de integração entre sistemas, plataformas e

arquiteturas heterogêneos favorecendo a interoperabilidade semântica entre ambientes

informacionais digitais.

Além da linguagem computacional XML e para promover o estabelecimento da

interoperabilidade, e de acordo com a diversidade de padrões de metadados, surgem as

arquiteturas de metadados, que são apontadas pela literatura, como uma forma de representar

e dar suporte à uma variedade de esquemas de metadados. Nesse sentido, a seção seguinte

apresentará a arquitetura de metadados RDF, considerada uma estrutura computacional

proposta por Berners-Lee para a Web Semântica.

4.5 Arquitetura de metadados RDF

Assim como os padrões de metadados abordados anteriormente, esta seção apresenta a

arquitetura de metadados RDF (Resource Description Framework), umas das recomendações

do W3C que permeia a construção da Web Semântica, bem como apontada na literatura como

o pilar para a iniciativa MarcOnt, além de possibilitar a interoperabilidade semântica entre

bibliotecas digitais.

Page 108: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

106

De acordo com o idealizador do MarcOnt, Kruk (2005, tradução nossa), a arquitetura

de metadados RDF, constitui o centro ou “coração” da arquitetura deste novo padrão, na

possibilidade de funcionar como uma ferramenta para o armazenamento de descrições

bibliográficas semânticas e a comunicação entre recursos informacionais de ambientes

heterogêneos, com diferentes arquiteturas e plataformas.

Com a heterogeneidade de dados e metadados disponibilizados no ambiente Web, faz-

se necessário o desenvolvimento de um esquema ou estrutura que comporte esta diversidade

de metadados, de modo que permita sistemas interoperáveis na rede. Esse esquema ou

estrutura é denominado arquitetura de metadados, cujos objetivos são representar e

proporcionar uma base de codificação de metadados por meio de estruturas flexíveis.

Vale destacar que assim como há padrões de metadados diversificados, há também

arquiteturas de metadados distintas. Para este estudo trataremos da arquitetura RDF, pelos

motivos anteriormente explicitados. A arquitetura de metadados RDF possibilita o

processamento e o gerenciamento automatizado de recursos informacionais, de acordo com

áreas do conhecimento distintas, principalmente com relação: à descoberta de recursos

informacionais, à descrição das relações entre os recursos informacionais representadas na

rede, ao auxílio aos agentes de software, ao intercâmbio e ao compartilhamento de

informações entre outros tipos de aplicações. (LASSILA; SWICK, 1999).

A arquitetura RDF em seus objetivos visa

[...] ter um modelo de dados simplificado; possuir semântica formal e provável inferência; utilizar um vocabulário extensível; utilizar sintaxe baseada em XML; dar suporte aos tipos de dados do XML Schema; permitir que qualquer pessoa possa fazer declarações acerca de qualquer recurso informacional. (FEITOSA, 2006, p. 101-102).

De acordo com o World Wide Web Consortium (W3C), em termos semânticos, a

estrutura de um documento RDF é baseada no conceito de tripla, ou seja, partes que

contemplam a informação para sua compreensão tanto por homens, quanto por máquinas.

Essas partes são denominadas como sujeito, predicado e objeto.

Para Daconta (2003) apud Feitosa (2006, p. 102-103, grifo do autor), as partes de RDF

podem ser assim entendidas:

Page 109: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

107

O sujeito, no contexto gramatical, corresponde a um nome ou frase nominal que representa aquele que pratica uma ação – no campo da lógica, esse é o objeto sobre o qual se elabora alguma declaração. Em RDF, necessita-se de um URI para a identificação unívoca do conceito sobre o qual se elabora tal declaração; esse URI é também representativo de um recurso [unidade informacional]. O predicado, gramaticalmente, é a parte da sentença que modifica o sujeito e inclui uma frase verbal; em outras palavras, o predicado diz algo a respeito do sujeito – no campo da lógica, um predicado é uma função de um indivíduo (um tipo particular de sujeito) para valores verdade, com base em certo número de argumentos. […] um predicado é uma relação entre o sujeito e o objeto. Gramaticalmente, um objeto é um nome que sofre a ação expressa por um verbo – para a lógica um objeto é influenciado pelo predicado. […] o objeto pode ser também um recurso [unidade informacional], referenciado por um predicado ou por um valor literal.

Pode-se visualizar uma estrutura RDF, bem como suas características explicitadas

anteriormente, de acordo com a figura 13, a seguir:

FIGURA 13: Arquitetura RDF simples. Fonte: Lassila e Swick (1999)

Conforme pode ser observado na figura 13, apresenta-se uma estrutura RDF, onde se

podem traçar os seguintes comentários: o assunto (recurso) é definido neste diagrama pelo

arco http://www.w3.org/Home/Lassila, cujo predicado (propriedade) é definido por um

criador (creator), possuindo como objeto (Ora Lassila). Além disso, o recurso possui

atributos e valor estruturado com identificador (85740), criado por (Ora Lassila) que possui o

e-mail [email protected].

Page 110: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

108

A arquitetura de metadados RDF pode ser representada e apresentada também na

linguagem XML, conforme pode ser visto na figura 14.

<rdf : RDF>

< rdf: Description about= “http://www.w3.org/Home/Lassila” >

<creator> Ora Lassila </ Creator >

</ rdf: Description >

</rdf : RDF>

FIGURA 14: Declaração RDF utilizando a sintaxe XML. Fonte: Lassila e Swick (1999)

Conforme pode ser observado pela figura 14, uma declaração RDF utilizando a

linguagem XML pode ser representada de acordo com a etiqueta rdf : RDF cujo conteúdo

dessa etiqueta é expressa por outra etiqueta do tipo rdf: Description, bem como a validação ou

referência de um recurso já existente, representado pela etiqueta about.

Para melhor potencializar a descrição e o relacionamento entre os recursos

informacionais, surge o RDF Schema a fim de estabelecer uma amplitude semântica nas

formas de representação, conforme pode ser visto, a seguir.

4.5.1 RDF Schema

Além da arquitetura RDF pode-se destacar também uma outra ferramenta tecnológica

que em outras palavras, pode ser considerada uma extensão de RDF, o denominado RDF

Schema ou RDFS.

O RDFS apresenta-se nesse contexto como uma linguagem de descrição de

vocabulário, ou seja, descreve as propriedades de um recurso informacional bem como

estabelece relações entre propriedades de outros recursos, podendo, além disso, descrever

classes, propriedades e outros recursos informacionais condizentes aos pares atributo-valor

contemplados em XML. (FEITOSA, 2006).

Page 111: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

109

Assim como no XML Schema, o RDF Schema foi originado para fornecer a sintaxe e a

semântica a um documento, com a finalidade de estabelecer uma estrutura/arquitetura para a

descrição de classes e de propriedades específicas para atender a determinadas aplicações.

Além disso, o RDF Schema fornece um modelo de dados para os recursos informacionais da

Web e seus relacionamentos, propiciando uma semântica simples, com a possibilidade de

representações do próprio modelo em XML. (FEITOSA, 2006).

De uma maneira mais sucinta, o RDF Schema pode ser compreendido da seguinte

forma:

[...] os recursos podem ser divididos em grupos chamados classes. Os membros de uma classe são denominados instâncias. As classes em si, são também recursos e podem ser descritas por meio de propriedades. Ao conjunto de instâncias de uma classe denomina-se extensão da classe. Uma classe pode ser membro de sua própria extensão, isto é, pode ser uma instância de si própria. Todas as classes em RDF Schema são agrupadas em uma classe principal denominada rdfs:Class. De tal maneira, se uma classe X é uma subclasse de Y, todas as instâncias de X serão também instâncias de Y e poderão ser declaradas com o uso da propriedade rdfs:subClassOf. O termo superclasse é utilizado para designar uma classe superior em relação a suas subclasses. Coleções de recursos podem ser representadas em RDF pelo uso de contêineres, que podem ser de valores alternativos (rdf:Alt), de valores não ordenados (rdf:Bag) e de valores seqüenciais (rdf:Seq). (FEITOSA, 2006, p. 109, grifo do autor).

O RDF Schema, nesse sentido, pode ser compreendido como uma ferramenta que

permite descrever vocabulários, bem como as classes e as propriedades para um recurso RDF,

fornecendo assim, uma estrutura mais flexível e com uma maior amplitude semântica na

descrição dos recursos informacionais.

A estrutura do RDF Schema pode ser visualizada de acordo com a figura 15, a seguir.

<?xml version="1.0"?> <!DOCTYPE rdf:RDF [<!ENTITY xsd "http://www.w3.org/2001/XMLSchema#">]> <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#" xml:base="http://example.org/schemas/vehicles"> <rdfs:Class rdf:ID="MotorVehicle"/> <rdfs:Class rdf:ID="PassengerVehicle"> <rdfs:subClassOf rdf:resource="#MotorVehicle"/>

Page 112: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

110

</rdfs:Class> <rdfs:Class rdf:ID="Truck"> <rdfs:subClassOf rdf:resource="#MotorVehicle"/> </rdfs:Class> <rdfs:Class rdf:ID="Van"> <rdfs:subClassOf rdf:resource="#MotorVehicle"/> </rdfs:Class> <rdfs:Class rdf:ID="MiniVan"> <rdfs:subClassOf rdf:resource="#Van"/> <rdfs:subClassOf rdf:resource="#PassengerVehicle"/> </rdfs:Class> <rdfs:Class rdf:ID="Person"/> <rdfs:Datatype rdf:about="&xsd;integer"/> <rdf:Property rdf:ID="registeredTo"> <rdfs:domain rdf:resource="#MotorVehicle"/> <rdfs:range rdf:resource="#Person"/> </rdf:Property> <rdf:Property rdf:ID="rearSeatLegRoom"> <rdfs:domain rdf:resource="#PassengerVehicle"/> <rdfs:range rdf:resource="&xsd;integer"/> </rdf:Property> <rdf:Property rdf:ID="driver"> <rdfs:domain rdf:resource="#MotorVehicle"/> </rdf:Property> <rdf:Property rdf:ID="primaryDriver"> <rdfs:subPropertyOf rdf:resource="#driver"/> </rdf:Property> </rdf:RDF>

FIGURA 15: Estrutura da arquitetura RDF Schema. Fonte: W3C (2004)

Pode-se perceber pela figura 15, que a descrição de um recurso informacional em RDF

Schema é escrita em XML (<?xml version="1.0"?>). O recurso descrito é indicado aqui,

pela sua URL – Universal Resource Locator –

(xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"). O recurso é dado por

uma classe, definida aqui, por exemplo, como (<rdfs:Class rdf:ID="Truck">),

possuindo uma subclasse, expressa por (<rdfs:subClassOf

rdf:resource="#MotorVehicle"/>), possuindo como valor ("#MotorVehicle").

Além disso, o recurso é descrito com algumas propriedades, ou seja, é uma subclasse de

Page 113: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

111

(rdfs:Class), tal como: (<rdf:Property rdf:ID="registeredTo">). Destaca-se

ainda, que o recurso possui um domínio relativo à propriedade, dado por (<rdfs:domain

rdf:resource="#MotorVehicle"/>) e um valor expresso por ("#MotorVehicle"). O

recurso, possui uma extensão relativa à propriedade domínio (<rdfs:range

rdf:resource="#Person"/>), cujo valor é expresso por ("#Person"). Vale dizer ainda,

que o recurso possui uma subpropriedade (<rdfs:subPropertyOf

rdf:resource="#driver"/>), cujo valor é expresso por ("#driver").

A arquitetura de metadados RDF está sendo acoplada a outros padrões de metadados,

tais como Dublin Core e também a linguagens computacionais do tipo XML, por exemplo, o

que implica uma maior e melhor estruturação dos recursos informacionais e uma amplitude

entre os relacionamentos e características semânticas dos metadados em ambientes

informacionais digitais.

4.6 Apontamentos sobre as formas de representação da informação

Faz-se necessário nesse momento retomarmos algumas questões acerca da

representação da informação, a fim de tecermos discussões e reflexões com um olhar para os

ambientes informacionais digitais.

De acordo com a literatura disponível, os metadados são considerados uma condição

sine qua non para a resolução de problemas de descrição e posteriormente de recuperação de

informações no contexto Web. É possível visualizar-se o uso de metadados bem como

aplicações em ambientes informacionais específicos, tais como as bibliotecas digitais e sob

esse prisma precisa-se atentar para as seguintes abordagens:

a) A adoção de um padrão de metadados ou outro está pautada e dependerá de uma

lógica descritiva e o princípio para o qual o padrão foi criado que norteará uma representação

mais efetiva do recurso informacional;

Page 114: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

112

b) As bibliotecas digitais são apresentadas contemplando estruturas pré-estabelecidas e

padronizadas (metadados) o que possibilita uma maior e melhor interoperabilidade, entre não

somente bibliotecas digitais, mas também entre outros sistemas informacionais;

c) Os padrões de metadados gerenciados por bibliotecários no âmbito de bibliotecas

digitais terão que ser inteligentes/compreensíveis não somente por humanos, mas também

para que possam ser interpretados e gerenciados semanticamente pelas máquinas ou agentes

de softwares, trabalhando numa sinergia e de forma colaborativa entre ambientes

informacionais digitais, como é o caso da Web semântica, Web 2.0, Repositórios

Institucionais etc. (LOURENÇO, 2007).

Pode-se dizer que cada tipo de formato ou padrão de metadados fornecerá um tipo de

representação e quanto mais específica, completa e detalhada for uma representação, mais

pontos de acesso à unidade informacional ela fornecerá e melhor ou mais possibilidades de

recuperação haverá. A adoção de um padrão ou outro dependerá de uma lógica descritiva que

contemple à realidade e às necessidades de cada instituição, de forma a possibilitar a

individualização da unidade informacional e multidimensionar suas formas de acesso,

evitando um re-trabalho na construção das formas de representação da informação bem como

na descrição da unidade informacional.

Além dos metadados e padrões de metadados, podemos dizer que XML, RDF e RDF

Schema, são apontadas como tecnologias que poderão proporcionar estruturas de descrição do

significado dos recursos informacionais em ambiências informacionais digitais específicas,

por exemplo, Bibliotecas Digitais, Web Semântica e Repositórios Institucionais melhor

explicitadas.

Vale destacar que as bibliotecas digitais, ao adotarem a arquitetura de metadados RDF,

podem encontrar um caminho para o estabelecimento da interoperabilidade semântica entre

ambientes informacionais heterogêneos e distintos. Uma dessas iniciativas é o

desenvolvimento do padrão MarcOnt que possui uma arquitetura baseada no modelo RDF e

algumas aplicações preliminares em bibliotecas digitais semânticas específicas, tais como a

JeromeDL, que será tratada posteriormente no capítulo 5.

Page 115: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

113

Nessa perspectiva, vale salientar que até o presente momento ainda não se tem uma

representação plena, de acordo com normas e padrões internacionais que contemple às

necessidades informacionais dos usuários na sua totalidade. Sobre essa ótica, faz-se

necessário a criação ou o reaproveitamento de teorias e metodologias sedimentadas e

cristalizadas da Biblioteconomia e da Ciência da Informação no tocante às questões de

descrição dos recursos informacionais para um estabelecimento mais efetivo da construção de

formas de representação em ambientes informacionais digitais. Vale dizer ainda que tais

metodologias oferecem respaldo para qualquer tipo de apresentação para a representação do

recurso informacional.

Assim, ao se pensar na construção de formas de representação da informação por

metadados podemos considerar que estamos diante de um diálogo intersubjetivo entre o

catalogador (sujeito pensante) - profissional responsável pela representação - e os recursos

tecnológicos que estão à sua disposição. Uma coisa é pensarmos na representação do ponto de

vista do catalogador e outra é para quem a representação foi construída (usuários que se

apropriarão da representação), uma vez que tal representação estará numa constante mutação,

ou seja, a representação poderá ser adequada e atender a determinados usuários num dado

período. Vale destacar que a representação muda de acordo com as percepções da realidade.

A construção da representação caracteriza-se exatamente pela não-linearidade e plasticidade,

isto é, as contribuições no processo não são estáticas, muito pelo contrário, encontram-se em

permanente mudança.

Observa-se, atualmente, o surgimento de novos padrões para a descrição de forma e

conteúdo dos recursos informacionais e a possibilidade de um aproveitamento das

metodologias cristalizadas da Biblioteconomia e da Ciência da Informação para a construção

de formas de representação da informação, bem como sua efetiva aplicação. Dentre esses

padrões, destaca-se o MarcOnt, que será apresentado no capítulo seguinte.

Page 116: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

114

Capítulo Capítulo Capítulo Capítulo 5555

MarcOntMarcOntMarcOntMarcOnt Initiative: Initiative: Initiative: Initiative: uma proposta para a representação euma proposta para a representação euma proposta para a representação euma proposta para a representação e a a a a descrição de descrição de descrição de descrição de recursos recursos recursos recursos informacionais nainformacionais nainformacionais nainformacionais na WebWebWebWeb

Page 117: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

115

5 MARCONT INITIATIVE: UMA PROPOSTA PARA A REPRESENTAÇÃO E A DESCRIÇÃO DE RECURSOS INFORMACIONAIS NA WEB “Será que, via Web Semântica, [...] o conto de fadas está a caminho de se tornar realidade?”

Jaime Robredo

Nesse capítulo, procura-se apresentar o surgimento e o desenvolvimento de um novo

padrão de descrição bibliográfica (MarcOnt Initiative), no contexto que atualmente se

conhece por Web Semântica, cujo impacto repercute nas formas de tratamento, de

armazenamento, de descrição, de representação, de preservação, e de uso dos recursos

informacionais, no âmbito de ambientes informacionais digitais, especificamente na

Biblioteca Digital Semântica JeromeDL. Apresenta-se também o Portal Colaborativo

MarcOnt.

5.1 Web Semântica: novos olhares para a representação e a descrição de recursos

informacionais

Pode-se observar contemporaneamente um cenário marcado por grandes

transformações tecnológicas e pelo surgimento e criação das mais variadas técnicas para as

questões de representação, de descrição, de produção, de organização, de transmissão e de uso

das informações em ambientes informacionais digitais. Conforme apontado nos capítulos 3 e

4, essas questões vem permeando o contexto digital e trazendo um constante repensar nos

paradigmas informacionais.

O ambiente Web, por possuir informações heterogêneas e efêmeras, pode ser

caracterizado como caótico, onde profissionais de diversas áreas buscam soluções para um

tratamento mais significativo dos conteúdos que ali estão armazenados e disponibilizados para

um uso mais efetivo.

Page 118: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

116

Idealizada por Tim Berners-Lee e liderada pelo World Wide Web Consortium (W3C) -

a Web Semântica é um projeto que visa a solucionar e a minimizar os problemas de

recuperação da informação na Web por meio do acesso automatizado aos recursos

informacionais. Para tanto, pretende implantar uma estrutura tecnológica e instaurar uma

maior representação do conhecimento na rede com o estabelecimento semântico das

informações contidas nas unidades e assim, possibilitar técnicas mais eficazes de recuperação

(BERNERS-LEE; HENDLER; LASSILA, 2001, tradução nossa).

A Web Semântica, por meio de sua estrutura tecnológica, quer incorporar maior nível

semântico nas representações dos recursos informacionais, tornando-os mais significativos

para as ferramentas de busca e recuperação, além de possibilitar a criação de ferramentas mais

eficazes, que serão capazes de “entender” e gerenciar os dados representados.

De acordo com a literatura disponível na área de Ciência da Informação, que parece

ser consensual, as teorias e os conceitos subjacentes à Web Semântica, encontram-se

principalmente nos autores Berners-Lee, Hendler e Lassila (2001); Alves (2005); Ramalho

(2006); Marcondes (2006); Feitosa (2006); Ferreira (2006); Campos, Campos e Campos

(2006); Shadbolt, Hall e Berners-Lee (2006); e Pickler (2007).

Conforme relatado por Marcondes (2006, p. 71),

[...] a Web Semântica está ainda em seus estágios iniciais, mas há evidências de que sua consolidação depende apenas de tempo e do amadurecimento das tecnologias utilizadas. Uma dessas evidências é o investimento crescente de grandes fabricantes, organizações internacionais de padronização e comunidades, com destaque para a área de bibliotecas digitais, na qual problemas de tratamento de informações são cada vez mais críticos, devido ao volume e à complexidade cada vez maior de manipular e integrar informações heterogêneas e distribuídas de maneira dinâmica.

De acordo com a assertiva acima, pode-se dizer que se visualizam teorias e aportes

teóricos bem cristalizados e a ausência de aplicações práticas no cenário atual, destacando

que, as bibliotecas digitais com sua estrutura pré-estabelecida (metadados) têm muito a

contribuir no que concerne ao tratamento documentário, com a possibilidade de integrar e

manipular recursos informacionais em ambientes e plataformas heterogêneas.

Page 119: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

117

A Web Semântica pode ser definida como,

[...] uma extensão da Web atual que apresentaria recursos informacionais melhor estruturados e representados, ou seja, o conteúdo informacional desses recursos seriam melhor explicitados e definidos semanticamente, formando uma rede de informações conectadas que por meio de ferramentas tecnológicas, tais como os agentes de softwares, proporcionaria uma melhor recuperação de informação (ALVES, 2005, p. 28).

Com base nos autores Berners-Lee, Hendler e Lassila (2001), podemos dizer que a

Web Semântica fornecerá estrutura para o conteúdo dos recursos informacionais, criando um

ambiente onde agentes de softwares realizam atividades sofisticadas de processamento e

entendimento dos dados solicitados na busca, com o propósito de oferecer uma recuperação

mais precisa.

A arquitetura da Web Semântica está representada em um esquema de camadas

sobrepostas, onde cada camada apresenta uma ferramenta ou tecnologia responsável por uma

determinada tarefa, ao mesmo tempo em que trabalham de modo complementar umas com as

outras, com o intuito de melhorar a recuperação.

Na primeira versão esquemática da arquitetura da Web Semântica temos, nas primeiras

camadas, a indicação de algumas ferramentas tecnológicas responsáveis pela estruturação e

representação dos dados. Era necessário estabelecer uma padronização nas camadas iniciais

para posteriormente definir e indicar as ferramentas tecnológicas mais específicas das

camadas superiores, que inicialmente continham apenas a indicação de modo mais geral das

tecnologias envolvidas. (RAMALHO, 2006).

As propostas atuais para a arquitetura da Web Semântica seguem o mesmo esquema da

arquitetura anterior, com a diferença de possuir um pouco mais de detalhamento nas

ferramentas tecnológicas17 presentes em certas camadas, conforme pode ser visualizado na

figura 16, a seguir.

17 Vale destacar que nessa pesquisa, não é nosso objetivo tratar com profundidade as ferramentas tecnológicas contempladas na arquitetura da Web Semântica, mas apontar a necessidade de estudá-las adequadamente e em consonância com os instrumentos e metodologias da Biblioteconomia e Ciência da Informação, para um estabelecimento pleno e efetivo.

Page 120: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

118

FIGURA 16: Arquitetura da Web Semântica proposta em 2005 comentada pelo autor. Fonte: Berners-Lee (2005).

Tendo como base a categorização em camadas apontadas por Moura (2002) e adaptada

por Alves (2005), pode-se destacar, de modo resumido, as seguintes características dos

elementos que compõe a arquitetura da Web Semântica:

Característica Internacional: composta por padrões de descrição e identificadores

universais, tais como a URI (Uniform Resource Identifier) e UNICODE, que são

responsáveis por uma identificação e localização mínima do recurso informacional na

rede;

Camada Sintática: responsável pelo estabelecimento da sintaxe de descrição dos dados,

essa camada é composta pela linguagem XML, namespaces e também pelo XML Schema,

que permite uma melhor estruturação dos dados e conseqüentemente uma melhor

visualização do conteúdo dos recursos pelos agentes de software;

Característica Internacional

Camada Sintática

Camada de Ontologia

Camada de dados

Camada Lógica

Camada de Prova

Camada de Validação

Assinatura Digital complementada pela

Criptografia

Page 121: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

119

Camada de Dados: essa camada trabalha com a representação, processamento e

codificação dos metadados, é composta pela arquitetura de metadados RDF (RDF Core) e

o RDF Schema, que são ferramentas responsáveis por expressar significados e promover a

interoperabilidade. É importante destacar que nesta camada e na camada anterior está

implícito o uso de padrões de metadados para garantir a representação dos recursos

informacionais;

Camada de Ontologia: o uso de ontologias permite o estabelecimento da semântica, ou o

significado dos dados descritos e representados pelos metadados. A definição dos

conceitos nessa camada servirá para os agentes inteligentes “compreenderem” a semântica

dos dados e a linguagem recomendada pelo W3C é a OWL – Ontology Web Language.

Vale destacar que as ferramentas SparQL, DLP são canditadas a recomendação pelo

W3C;

Camada Lógica: é responsável por uma recuperação mais eficiente devido ao uso de

agentes, regras (presentes também na camada de ontologia) e mecanismos de inferência,

mas para isso contam como base as camadas responsáveis pela estruturação, representação

e estabelecimento semântico dos dados, para posteriormente relacionar e processar as

informações de forma lógica;

Camada de Prova: responsável pelo intercâmbio entre agentes; é nessa camada onde serão

processadas as definições lógicas pelos agentes para a construção da prova, que será

criada para verificar se a dedução do agente estava correta;

Camada de Validação: essa última camada é responsável pelo estabelecimento de

verdades, autenticidade, confiabilidade e validade dos dados recuperados, garantindo aos

agentes que raciocinam sobre os dados se a informação é verdadeira. (ALVES, 2005).

O potencial da Web Semântica será notado pela troca de informações disponibilizadas

em fontes de informações diversas e processadas pelos agentes de softwares; mas para isso é

necessário o acesso a coleções de recursos informacionais estruturados e representados, além

do trabalho conjunto das ferramentas citadas em sua arquitetura. (ALVES, 2005).

Page 122: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

120

Quanto ao funcionamento da Web Semântica os autores Souza e Alvarenga (2004)

explicam que os usuários teriam acesso a esta por meio de portais nos quais formulariam suas

buscas. Em seguida os agentes de softwares, presentes nos mecanismos de busca e inferência,

acessariam um repositório de metadados constituído por recursos informacionais

representados pelos padrões de metadados e anotados semanticamente pelas definições

estabelecidas nas ontologias. Nesse ambiente, os agentes trabalhariam formando uma espécie

de sinergia ao trocarem informações entre si, além disso, proporcionando uma recuperação

mais eficaz, pois teriam acesso a coleções de recursos informacionais melhores estruturados e

representados.

Neste cenário, dois pontos são destacados pelos autores: a) a questão da representação

e indexação dos recursos, por meio dos metadados, padrões de metadados e as definições

semânticas presentes nas ontologias, e; b) a questão da recuperação mais eficiente dos

recursos informacionais ocasionadas pelos agentes de softwares, associados aos mecanismos

de busca e inferência. Esses dois fatores promovem o acesso mais amplo aos recursos

informacionais disponibilizados em comunidades de interesse distintos e uma recuperação

mais eficiente, pois os mecanismos de busca são capazes de “compreender” o significado das

informações presentes no conteúdo dos recursos devido a essa representação informacional

(SOUZA; ALVARENGA, 2004).

Deste modo, é importante destacar que as ferramentas e tecnologias presentes na

arquitetura da Web Semântica trabalham em conjunto: os agentes de softwares responsáveis

pela busca recuperam de modo mais eficiente porque encontram recursos informacionais

melhor representados pelos metadados e ontologias, além disso, tem como apoio a linguagem

XML que promove a estruturação dos dados e a arquitetura RDF responsável pelo

estabelecimento da interoperabilidade. (ALVES, 2005).

Nesse ponto, retoma-se a questão de a Web Semântica possuir uma estrutura elaborada

de implementação, na qual todas as ferramentas tecnológicas devem estar atuando em

conjunto para garantir seu funcionamento. Contudo, acreditamos que é na representação da

informação que se encontra o núcleo de seu funcionamento, pois se não houver uma

representação por metadados adequada dos recursos informacionais, as outras tecnologias

envolvidas não terão onde se apoiar para realizar suas tarefas. Por isso, a necessidade de se ter

uma estrutura bem representada a fim de potencializar a recuperação dos recursos

Page 123: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

121

informacionais pelo usuário final. Deste modo podemos concordar com Berners-Lee, Hendler

e Lassila (2001) quando dizem que o estabelecimento da Web Semântica irá se concretizar a

partir da representação dos recursos informacionais e isso só será garantido pelo uso efetivo

dos metadados.

Na tentativa de solucionar problemas de descrição e representação dos recursos

informacionais nos ambientes digitais, novas normas e novos horizontes encontram-se em

constituição à luz da Web Semântica.

5.2 Descrição bibliográfica na era da Web Semântica

Durante as últimas décadas observou-se que mais e mais informações têm sido

publicadas, armazenadas e disponibilizadas na Web. No entanto, somente uma parte dessas

informações e em ambientes específicos, tais como as bibliotecas digitais, por exemplo,

possuem um padrão de metadados para a descrição bibliográfica e que possibilite a

padronização dos recursos informacionais para atender aos requisitos da interoperabilidade.

As bibliotecas digitais apresentam-se e atuam como um segmento na Internet onde

procuram desenvolver e criar métodos e técnicas para a padronização dos recursos

informacionais. Mas garantir/assegurar a interoperabilidade entre “ilhas” de informações bem

estruturadas e padronizadas entre formatos bibliográficos distintos encontra-se numa questão

de investigação e preocupação pela comunidade científica.

Novas tecnologias baseadas em pesquisas na temática Web Semântica desenvolvem-se

com o intuito de tentar agregar semântica à descrição bibliográfica para um tratamento mais

efetivo dos conteúdos digitais. A Web Semântica oferece algumas soluções para diferentes

problemas criando uma nova visão para o armazenamento e o processamento dos dados.

Algumas dessas soluções poderiam ser implementadas para potencializar os resultados das

buscas no âmbito das bibliotecas digitais.

Sendo assim, o projeto MarcOnt Initiative surge nesse cenário numa perspectiva na

tentativa de solucionar os problemas de descrição e de representação dos recursos

Page 124: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

122

informacionais em ambientes digitais, tais como as bibliotecas digitais, por exemplo, atrelado

aos padrões de metadados advindos das áreas da Biblioteconomia e da Ciência da Informação,

como o MARC21 para a descrição bibliográfica e outros padrões, como o Dublin Core, para a

localização de recursos na Web.

MarcOnt Initiative se desenvolveu a partir da Biblioteca Digital Semântica

JeromeDL. Como relata Synak (2005), num primeiro momento, as primeiras experiências na

JeromeDL eram positivas, mas logo, foram detectados alguns problemas, pois os objetivos

iniciais eram desenvolver e aumentar a busca automaticamente atribuindo semântica aos

recursos informacionais a fim de potencializar os processos de recuperação de informação. As

razões pelas falhas iniciais podem ser assim entendidas de acordo com dois fatos:

1. Aumentar a busca semanticamente requer a informação sobre os recursos

armazenados inicialmente na biblioteca na forma de descrições semânticas. O problema era

convencer realmente os bibliotecários que criando dados semânticos resolveria o problema de

trabalhos futuros. Como um resultado – as instalações existentes da primeira biblioteca digital

semântica não usavam suas potencialidades semânticas e nem usavam um nível mínimo de

capacidade semântica.

2. Verificou-se que as descrições na JeromeDL poderiam fornecer capacidade de

descrição de formatos de metadados conhecidos e usados por comunidades da

Biblioteconomia, tais como o MARC21. A ontologia simples da JeromeDL, consistindo de

somente três conceitos, não foi projetada simplesmente para esse tipo de dado e metadado.

(SYNAK, 2005, tradução nossa).

Nesse sentido, depois de muitos estudos realizados pelos pesquisadores da JeromeDL

e a equipe envolvida no projeto, decidiu-se tratar desses problemas criando-se uma ontologia

bibliográfica que pudesse contemplar os aspectos semânticos de forma e conteúdo dos

recursos informacionais e que pudessem atuar de forma mais efetiva numa biblioteca digital

semântica. Assim, os requisitos iniciais foram elaborados por Sebastian Ryszard Kruk e se

constituindo o projeto MarcOnt Initiative©200518.

18 O projeto detalhado encontra-se disponibilizado no Portal MarcOnt no site: Disponível em: <http://portal.marcont.org>. Acesso em: 10 out. 2007.

Page 125: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

123

Nessa perspectiva, o que seria o MarcOnt Initiative?

De acordo com Kruk, Synak e Zimmermann (2005a, p. 1, tradução nossa) “o objetivo

da iniciativa MarcOnt é desenvolver um novo padrão para a descrição bibliográfica na forma

de uma ontologia e relacionar as ferramentas da Web Semântica utilizando tecnologias

semânticas”.

Em outras palavras, e pautado nos autores supracitados, podemos dizer que o

MarcOnt Initiative seria um padrão de descrição bibliográfica semântica que contempla

forma e conteúdo do recurso informacional, a fim de sua identificação e individualização para

leitura e processamento compreensíveis por máquina/computador, utilizando-se de

instrumentos e ferramentas tecnológicas subjacentes à Web Semântica, podendo ser aplicado

no contexto de ambientes informacionais digitais.

O primeiro passo para agregar semântica à descrição das informações em bibliotecas

digitais e sua compatibilidade para que ocorra a interoperabilidade é o desenvolvimento de

uma ontologia comum. A ontologia pode ser considerada como um instrumento para a

descrição bibliográfica dos recursos informacionais, pois se cria uma rede de conceitos com

propriedades apropriadas e restritas. Kruk, Synak e Zimmerman (2005b, p. 1, tradução nossa)

alegam que “infelizmente, é muito difícil convencer os bibliotecários para realizarem o

esforço da criação da descrição semântica dos recursos, tais como, livros, por exemplo”.

Nesse contexto, pode-se destacar nesse momento, a importância da participação ativa

de profissionais de áreas interdisciplinares na criação do MarcOnt, em especial dos

profissionais da Biblioteconomia, uma vez que este profissional, em sua formação, possui as

técnicas e habilidades necessárias para o tratamento documentário dos recursos

informacionais. A Catalogação, instrumento de descrição bibliográfica da área, pautada em

regras e esquemas de descrição, fornece subsídios para a construção de formas de

representação e descrição de forma padronizada, possibilitando o armazenamento, a

preservação, o uso e o reuso das informações de forma mais efetiva.

Como aponta Synak (2005), muitas são as razões para a construção de um novo

padrão para a descrição bibliográfica semântica que podem ser assim delineadas:

Page 126: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

124

O primeiro fato é o argumento de que o padrão de metadados MARC21 não fornece

informação semântica necessária de forma a ser compreendida por uma máquina.

Synak (2005, p. 50, tradução nossa) afirma que

O formato MARC21 nos permite descrever dois tipos específicos de recursos: Língua dos materiais (que podem ser aproximadamente descritos como livros, periódicos, jornais etc.) e Língua de materiais manuscritos (tal como livros valiosos, livros antigos, escritos a mão).

Em outras palavras, quando o autor se refere à Língua dos materiais e Língua de

materiais manuscritos, podemos nos reportar à estrutura do MARC na posição 06 (Tipo de

Registro) do LÍDER , onde utiliza-se a letra “a” para Material textual (Impresso) e a letra

“t” para Material textual (Manuscrito).

Um recurso que represente “Língua dos materiais” é identificado em MARC21 colocando a letra “a” no campo número 06 no líder do registro MARC21. Para “Língua de materiais manuscritos”, a marca apropriada requer colocar a letra “t” no mesmo lugar. O problema é que não há absolutamente nenhuma conexão entre a “Língua do material” e a “Língua de material manuscrito”. Para alguém que não tem uma pista quando o recurso vem do livro, estes dois tipos de recursos poderiam ser chamados “Pedras” e “Flores”. Este é o caso quando uma máquina é usada para processar o dado. (SYNAK, 2005, p. 51, tradução nossa).

Nesse mesmo sentido, Synak (2005, p. 51, tradução nossa) para uma explicação ainda

mais plausível, diz que:

MARC21 não nos permite descrever que “Língua dos materiais” e “Língua de materiais manuscritos” são ambos adequados para leitura (têm algumas características comuns) ou que “Língua de materiais manuscritos” é de fato também, “Língua dos materiais”, mas tem algumas características específicas que as fazem diferentes. Se nós quiséssemos escrever uma busca na máquina que incluísse na busca manuscritos quando há uma falta de livros usuais no assunto, nós teríamos que especificar cada uma das conexões. Uma ontologia nos permite fazer isso automaticamente.

Um dos motivos desta pesquisa e na busca por subsídios que procuramos responder e

caracterizar o MarcOnt, está pautado na tese que o autor procura defender com tanta

propriedade, ao mencionar que o MARC21 mesmo sendo um padrão mundial e

internacionalmente aceito e adotado pelas bibliotecas e pela comunidade da Biblioteconomia,

de um modo geral, possuindo uma estrutura completa e complexa, não há um padrão de

Page 127: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

125

descrição semântica que contemple a profundidade da descrição, ou ainda, que cubra a

extensão requerida ou suportada pelo MARC21 usado para os propósitos da Biblioteconomia.

Pensando nisso, pode-se considerar que o padrão de descrição bibliográfica semântica

MarcOnt pode possibilitar uma melhora na explicitação das informações de forma a permitir

uma compreensão pela máquina nas solicitações de busca para o usuário final.

Ao mencionar esse desafio, Synak (2005) questiona a necessidade do por que em se

criar outra ontologia, dizendo que ainda não existe uma adequada que vá ao encontro dos

objetivos da descrição bibliográfica e que atenda aos requisitos dos profissionais da

Biblioteconomia.

As novas soluções não podem negligenciar padrões e formatos existentes ou nunca se tornarão amplamente conhecidos. No momento, o formato de dados bibliográficos MARC21 é ainda o principal padrão utilizado em todas as bibliotecas do mundo. A ontologia que aspira ser seu sucessor (ou ao menos contrapartes semânticas) tem que oferecer não menos capacidade na descrição. (SYNAK, 2005, p. 63, tradução nossa).

Ainda tentando responder a alguns questionamentos sobre a criação de uma ontologia

bibliográfica, bem como sua relevância, o autor menciona que se vivenciou uma experiência

com descrições semânticas na biblioteca digital semântica JeromeDL e que os resultados

apontam uma melhora nos serviços de busca e de comunicação entre as bibliotecas digitais

possibilitando uma amplitude na recuperação dos recursos informacionais.

Vale destacar que para o desenvolvimento pleno do MarcOnt os estudos mostram e

apontam algumas exigências ou requisitos a fim de atingir suas funcionalidades, onde seu

idealizador procurou, por meio do estado da arte no domínio da Biblioteconomia, levantar os

principais padrões de metadados na área com o objetivo de procurar se haveria

compatibilidade com a iniciativa MarcOnt. Segundo Synak e Kruk (2005), dentre os

principais requisitos, destacam-se:

• A ontologia deve prover não menos capacidade de descrição tal como o formato de

descrição bibliográfica MARC21.

Esta exigência é fácil de explicar. MARC21 é atualmente o padrão mais popular e forte para descrever recursos em bibliotecas. É muito provável que os futuros usuários do MarcOnt queiram mover seu registros armazenados em MARC21 para o novo formato. Permitiria que fizessem avaliações das vantagens da semântica e de novos serviços. O plano (esquema) de

Page 128: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

126

conversão sem perda de informação requer que o MarcOnt seja extensível quando descrever recursos, assim como o MARC21. MARC21 é o “nome-motivo” para MarcOnt, que é basicamente uma fusão do “MARC” e a palavra “ontologia”. (SYNAK, 2005, p. 63, tradução nossa).

Pelo que pode-se perceber é que a relação entre o MARC21 e o MarcOnt, não

consiste em transformar a estrutura pré-estabelecida do MARC21 para a linguagem da

ontologia, mas sim fornecer a informação semântica à descrição dos recursos informacionais

que o MARC21 não oferece de modo a ser compreendida pela máquina/computador.

• A ontologia deve ser descrita usando OWL DL

A linguagem OWL (Ontology Web Language) tem determinadas vantagens sobre outras, por ser a mais antiga especificação de linguagem para ontologia. Ela é um novo padrão, aprovado e recomendado pelo W3C (World Wide Web Consortium). Pode-se facilmente predizer que a maioria das ontologias no futuro serão descritas usando OWL. Foi selecionada a OWL Description Logic (OWL DL) – Lógica de Descrição OWL. OWL DL tem expressado suficientemente as maiores razões para suportar outras ontologias. (SYNAK, 2005, p. 64, tradução nossa).

Vale destacar que a linguagem OWL DL, assim como a OWL destinam-se ao

processamento dos recursos informacionais de forma mais inteligente, localizada na camada

de ontologias da arquitetura da Web Semântica, possuindo suas bases na arquitetura de

metadados RDF, o que implica uma maior potencialidade de uso e reuso das informações no

âmbito de bibliotecas digitais e no atendimento aos requisitos de interoperabilidade.

• A ontologia deve reusar (se possível) outras ontologias existentes ou suas partes. Ela

deve ser relativamente fácil para aderir a ontologia MarcOnt com ontologias

existentes se requerido.

Estas exigências são mais fáceis para realizar com OWL, pois esta, já é uma exigência indicado primeiro. Nós não podemos somente importar alguns conceitos de outras ontologias, mas adicionar novas propriedades ou facetas a elas e criar subclasses etc. Tal prática é comum. Por exemplo, o Semantic Web Portal Ontology usa o conceito de foaf: Agent da ontologia Friend-of-a-friend e o expande para refletir pessoas/organizações específicas no ambiente acadêmico. (SYNAK, 2005, p. 64, tradução nossa).

Nesse caso, a existência de outras ontologias podem possibilitar um compartilhamento

dos recursos tecnológicos para o desenvolvimento do MarcOnt indo ao encontro da filosofia

de ambientes colaborativos subjacentes à Web 2.0, no cenário atual, principalmente com os

conceitos de foaf: Agent que visa definir propriedades para os perfis dos usuários do sistema e

Page 129: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

127

os responsáveis pela criação dos recursos. É usada para expressar os metadados sobre pessoas

(usuários) assim como seus nomes, endereços, etc., na possibilidade de um agente de software

acessar e fazer uso de uma descrição num processo de busca.

• Deve ser fácil traduzir descrições semânticas MarcOnt compatíveis para outros

formatos, tais como MARC21, Dublin Core ou BibTeX.

Isto vem ao encontro dos objetivos da Iniciativa MarcOnt. A definição para o problema da tradução encontra-se mais nas ferramentas que serão desenvolvidas junto com a ontologia do que a própria ontologia. Mas a exigência de traduções fáceis tem que ser mantida em mente ao projetar/delinear a estrutura da ontologia. A conversão de menos perdas de informações entre outros formatos e MarcOnt requer que MarcOnt seja capaz de preservar a informação em primeiro lugar. (SYNAK, 2005, p. 64, tradução nossa).

Sobre esse aspecto, pode-se dizer que um dos propósitos do MarcOnt é possibilitar a

integração entre recursos informacionais de padrões de metadados heterogêneos e o

reaproveitamento das informações, agregando semântica às informações e torná-las

armazenadas e disponíveis numa mesma interface ou plataforma, permitindo uma busca e

recuperação de forma mais efetiva e significativa.

• O primeiro esboço/esquema da ontologia deve ser um ponto de partida para um

trabalho futuro

A primeira versão da ontologia não tem que estar completa ou imediatamente pronta para ser usada. Ela deve definir as principais estruturas e prover um mínimo de funcionalidades requeridas para começar as avaliações e estar pronta para um desenvolvimento colaborativo mais adicional. A primeira versão da ontologia MarcOnt será desdobrada testando suas funcionalidades na Biblioteca Digital JeromeDL. (SYNAK, 2005, p. 64, tradução nossa).

Nesse ponto, pode-se destacar que o MarcOnt já encontra-se disponível na Biblioteca

Digital Semântica JeromeDL, o que será tratado nas seções seguintes e o próprio Portal

MarcOnt, disponibiliza um ambiente para a construção de descrições bibliográficas

semânticas para experiência e testes.

Page 130: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

128

5.3 Arquitetura MarcOnt

Para uma melhor compreensão do padrão de descrição semântica MarcOnt, os autores

Kruk, Synak e Zimmermann (2005) propuseram uma arquitetura inicial a fim de ter uma

visualização como seria o seu funcionamento ao se pensar na questão da interoperabilidade

semântica entre padrões de metadados heterogêneos bem como o acesso aos recursos

informacionais numa única interface.

Nesse sentido, a figura 17, em seguida, apresenta o delineamento de uma arquitetura

inicial dos serviços de mediação MarcOnt.

FIGURA 17: Arquitetura de serviços de mediação MarcOnt. Fonte: Kruk, Synak e Zimmermann (2005a, p. 2)

Page 131: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

129

De acordo com a figura 17, pode-se nesse momento, traçar alguns comentários no que

concerne ao funcionamento do padrão de descrição semântica MarcOnt.

A arquitetura forma um fluxo, onde a parte superior é a entrada (input), as descrições

semânticas estão no centro (MarcOnt ontology) e a parte mais inferior é a saída (output).

Nota-se que o centro da arquitetura é o RDF (Resource Description Framework) –

considerado o núcleo para o armazenamento para descrições semânticas compiladas de outros

padrões de metadados.

As caixas na primeira fileira (na entrada) e na última fileira (na saída) da arquitetura

representam os formatos inerentes aos tradicionais (arquivos neste formato). As caixas no

meio (MARCXML, BibTeXML) representam a primeira fase do processo de tradução onde

os arquivos inerentes são analisados gramaticalmente (sintaxe) e seus conteúdos são incluídos

no formato XML.

Os adaptadores de entrada e saída (input e output) são implementados usando o

mecanismo de inferência Sesame19. De um lado dos adaptadores, nós temos as descrições

semânticas e do outro, dados de descrições bibliográficas convertidas para um modelo RDF.

Converter diferentes formatos de descrição para o modelo RDF depende do formato original

do arquivo. Registros em formato MARC21 são armazenados em arquivos binários; então a

conversão exige primeiro que tais arquivos sejam transformados para o formato MARCXML

e então, numa fase posterior, transformam-se os dados para o modelo RDF usando XSLT.

Nesse aspecto, vale ressaltar que o autor destaca que ainda não há representações

oficiais de dados de MARC21 em RDF, desenvolvido pela Library of Congress (LC) e que os

pesquisadores do MarcOnt, criaram seu próprio formato (MARCRDF). “Apoiar outros

formatos é uma questão de desenvolver adaptadores e conversores apropriados. Atualmente,

nós estamos desenvolvendo adaptadores para MARC21”. (SYNAK, 2005, p. 75, tradução

nossa).

19 Sesame é uma ferramenta, ou seja, um conjunto de classes-base desenvolvido em Java com código aberto para o desenvolvimento de sistemas, com o objetivo de armazenar e consultar dados em RDF. Este sistema é totalmente extensível e configurável no que concerne aos mecanismos de inferência e armazenamento de dados em formato RDF. Maiores informações sobre o sistema Sesame podem ser encontrados no site: Disponível em: <http://www.openrdf.org/>. Acesso em: 10 mar. 2008.

Page 132: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

130

A fase final é traduzir os dados RDF para dentro de estruturas compatíveis com o

padrão de descrição bibliográfica MarcOnt. Os estágios precedentes requerem escrever

ferramentas simples para que as bibliotecas disponíveis usassem e pudessem ser relativamente

fáceis para intercambiá-las. (SYNAK, 2005, tradução nossa). Assim, pode-se dizer que essa

arquitetura inicial, visa o compartilhamento entre padrões de metadados distintos, podendo

proporcionar a interoperabilidade semântica entre bibliotecas digitais, por exemplo, onde as

informações semânticas estarão disponíveis e armazenadas em uma única interface, neste

caso, no MarcOnt.

Outra releitura sobre a questão da descrição bibliográfica, pautada na arquitetura de

serviços de mediação MarcOnt, pode ser compreendida de acordo com a figura 18,

reforçando a criação e a necessidade de um padrão de descrição bibliográfica semântica que

contemple a representação de forma e de conteúdo dos recursos informacionais.

FIGURA 18: Estrutura de representação em MarcOnt. Fonte: Kruk, Synak e Zimmermann (2005b, p. 27)

Conforme se pode observar pela figura 18, temos a representação dos recursos

informacionais no padrão de metadados MARC21, MARCXML (na estrutura MARC com a

linguagem computacional XML) e MARC-RDF (estrutura MARC em RDF), uma vez que

Page 133: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

131

essas representações passam por ferramentas de tradução/conversão, dadas por RDF

Translator gerando nesse sentido, informações semânticas armazenadas em MarcOnt. Assim,

pode-se dizer que o estabelecimento de uma linguagem comum (vocabulary) que proporcione

e garanta uma busca e recuperação dos recursos informacionais para o uso e o reuso das

informações pelo usuário final, será determinado por MarcOnt.

Umas das grandes dificuldades apontadas pela literatura e um problema para a

interoperabilidade entre padrões de metadados distintos em bibliotecas digitais é que os dados

para a tradução das informações nem sempre estão representados em RDF, o que implica o

desenvolvimento de novas tecnologias para o tratamento adequado dos recursos

informacionais.

O autor menciona a dificuldade em se criar regras que contemplem os objetivos do

MarcOnt , dizendo que a “tarefa requer escrever centenas de regras de inferência para

traduzir aos usuários do MarcOnt sua lógica de funcionamento, bem como suas propriedades

para garantir de forma apropriada um pouco mais de informação sem possíveis perdas”.

(SYNAK, 2005, p. 75, tradução nossa).

Synak (2005) elucida que os formatos de descrição bibliográfica são exatamente tal

caso. A informação é armazenada em cada arquivo binário ou textual (dependendo do

formato). Para processar a informação usando as tecnologias da Web Semântica faz-se

necessário que primeiramente representemos estas informações em RDF.

Ainda nesse sentido, Synak (2005) enumera duas fases para a tradução/conversão

entre os padrões de metadados:

1. Tradução do formato original para RDF

2. Tradução de um grafo RDF para outro.

Os três formatos que foram avaliados são MARC21, BibTeX e Dublin Core, tratados

de forma específica no capítulo 4.

MARC21- formato binário, os arquivos necessitam de ser analisados gramaticalmente. O resultado de um arquivo no formato MARCXML pode ser transformado em RDF usando XSL Transform. O problema é que não há nenhuma representação oficial de MARC em RDF (ao menos

Page 134: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

132

não desenvolvido pela LC). Para nossas necessidades, nós especificamos o formato MARCRDF (para RDF Schema de MARCRDF), que é uma representação RDF das estruturas de MARCXML.

BibTeX- formato de texto. Segue a sintaxe TeX. Os arquivos BibTeX

necessitam ser analisados gramaticalmente antes de ser processados mais adiante. Há representações BibTeX em XML (BibTeXML) e RDF (BibTeX em OWL). O arquivo XML analisado gramaticalmente pode ser facilmente transformado para RDF usando XSLT.

Dublin Core- muitas sintaxes disponíveis (em XML, como metadado em

HTML, RDF), os elementos de DC são usados geralmente em RDF. Ao contrário do MARC21 ou BibTeX, DC não é um formato de arquivo fechado, podendo ser mais flexível na transformação dos dados. (SYNAK, 2005, p. 73, tradução nossa).

Nessa perspectiva, foram formuladas algumas regras para as transformações de

descrições no padrão de metadados MARC21, a fim de possibilitar melhores níveis de

relacionamento entre os registros bibliográficos.

A figura 19, apresenta regras que poderiam ser usadas no processo de transformações

de descrições em MARC21 para descrições semânticas em MarcOnt. No exemplo abaixo,

visualiza-se um registro MARC21, descrevendo um tipo documental do tipo livro, com

metadados de autor e título, utilizando os conceitos de MarcOnt (marcont:Book) para o

armazenamento das informações. As regras de transformações de um padrão de metadados

específico para MarcOnt, e vice-versa, encontram-se disponíveis no Anexo A.

Page 135: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

133

FIGURA 19: Regras para construção de descrição semântica de MARC21 para MarcOnt. Fonte: Synak (2005, p. 74)

Vale lembrar que o padrão de metadados MARC21 descreve vários recursos

informacionais e que o exemplo acima (livros) é apenas um dos tipos documentais

contemplados pelo formato.

Na figura 19, pode-se verificar a criação de regras para apenas dois campos

específicos abarcados pelo padrão de metadados MARC21 (autor e título), o que implica, para

um registro completo, a construção detalhada e padronizada de normas que forneçam a

semântica tão necessária para o entendimento de cada campo para uma leitura das

informações pela máquina/computador.

A ontologia terá que ser atualizada constantemente para permitir uma melhor representação da informação. As regras existentes terão que refletir estas mudanças. Atualmente, existem um conjunto de regras que permite mover uma quantidade limitada de informações de formatos tradicionais para MarcOnt. A informação (a mais importante) como título ou autor é suportada. Criar ferramentas que simplificariam e acelerariam o processo de criação de regras será a próxima etapa e um dos assuntos de trabalhos no Portal Colaborativo MarcOnt. A primeira etapa que nós já fizemos foi criar um framework (estrutura), uma máquina (sistema) que poderia processar as regras. (SYNAK, 2005, p. 74, tradução nossa).

Com a finalidade de um maior aproveitamento das informações em diferentes

formatos bibliográficos, foram definidas algumas ferramentas a fim de constituir a estrutura

MarcOnt, conforme pode ser visualizada na figura 20, a seguir.

Page 136: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

134

FIGURA 20: Estrutura básica do MarcOnt.

Fonte: Synak (2005, p. 65)

As partes do padrão de descrição semântica MarcOnt, pautadas na figura 20, e de

acordo com Synak (2005), podem ser assim entendidas:

Material: Compreendida aqui como uma classe com suas subclasses. Vale dizer que

Material é um nome comum designado para qualquer tipo de recurso informacional, o

qual pode estar armazenado em uma biblioteca.

Marc21Description: O conjunto de descrições das classes incorpora a terminologia

oriunda do padrão de metadados MARC21, originando a classe Marc21Description.

Marc21Description pode ser compreendida como uma superclasse usada para prover a

descrição para diferentes tipos de materiais. Em geral, podemos simplesmente

conectar Material a Marc21Description. “Essa ligação seria afirmar que qualquer

material pode ter um número de características derivados do MARC21. Mas essa

ligação não transportaria qualquer informação semântica sobre que tipos de recursos

estão associados aos tipos de propriedades”. (SYNAK, 2005, p. 67, tradução nossa).

As subclasses por sua vez, contemplam os seguintes tipos documentais: livros,

periódicos, material cartográfico, arquivo de computador, música, material visual etc.

Page 137: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

135

Foaf:Agent: Todo recurso informacional pode estar associado com seu criador,

domínio e palavras-chave. MarcOnt utiliza foaf:Agent que permite a descrição de

pessoas e organizações/instituições responsáveis pela criação do recurso.

Domain: O sistema Domain permite a visualização do conteúdo do recurso,

compatível com normas e códigos de Classificação, como por exemplo, a

Classificação Decimal de Dewey (CDD) e outros sistemas que utilizam algum tipo de

código decimal. A classe domínio pode ser usada para sistemas que são baseados em

classificações decimais. O tipo de classificação é especificada pela propriedade

classificationType da classe Domain. Para a definição dos tipos de classificação é

utilizada a OWL.

wnet:LexicalConcept: WordNet20 pode ser descrito como uma ferramenta que

proporciona serviços de referência lexicais via on-line. “Substantivos, verbos e

adjetivos em Inglês são organizados dentro de conjuntos de sinônimos. Cada conjunto

representa um conceito léxico. Os usuários submetem a palavra e o sistema encontra

palavras relacionadas (sinônimos, antônimos e outras). (SYNAK, 2005, p. 69,

tradução nossa). É usado como uma classe para a representação de palavras-chave em

MarcOnt. Em outras palavras podemos dizer que essa classe, funcionaria como uma

ferramenta para a representação temática do recurso informacional, ou seja, definiria o

conteúdo do recurso.

Nesse momento, retomam-se algumas questões para a justificativa de criação do

padrão de descrição bibliográfica semântica MarcOnt. Pode-se dizer que o padrão surgiu à

luz da Web Semântica, projetado para atender aos requisitos de interoperabilidade semântica

entre ambientes informacionais, por exemplo, as bibliotecas digitais. Para garantir uma

melhora na performance na manipulação de formas de representação bibliográfica e da

interação dos sujeitos com o ambiente informacional, tem-se no MarcOnt, um ponto de

partida para a integração de fontes/sistemas que se utilizam de padrões de metadados

heterogêneos, potencializando a busca e a recuperação dos recursos informacionais, e

possibilitando a preservação, o uso e o reuso das informações de forma mais efetiva numa

única interface.

20 Informações mais detalhadas podem ser encontradas no site: Disponível em: <http://wordnet.princeton.edu/>. Acesso em: 22 out. 2007.

Page 138: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

136

Assim, trataremos agora da aplicação do MarcOnt em um ambiente informacional

específico, a biblioteca digital semântica denominada JeromeDL, onde pode-se verificar como

está atuando em sua aplicabilidade e funcionalidade, fornecendo modelos de experiências e

testes.

5.4 Biblioteca Digital Semântica JeromeDL

Conforme abordado no capítulo 3 sobre as bibliotecas digitais, vale dizer que essas

têm muito a contribuir com as questões da padronização da representação dos recursos

informacionais, constituindo-se de uma ambiência pré-estabelecida (metadados) de acordo

com regras e normas que permeiam a construção dos recursos, possibilitando um maior nível

de interoperabilidade entre ambientes informacionais digitais.

Entretanto, com a finalidade de potencializar os serviços que uma biblioteca digital

pode oferecer e de acordo com as novas esferas tecnológicas trazidas no bojo da chamada

Web Semântica, evidencia-se várias tentativas de melhorar os sistemas de busca e navegação

por meio da agregação de tecnologias semânticas aos recursos informacionais, de forma a

obter resultados mais significativos pelos usuários.

Nesse sentido, para acompanhar esse cenário de evoluções tecnológicas e como um

modelo de aplicação do padrão de descrição semântica MarcOnt, surge a Biblioteca Digital

Semântica JeromeDL como uma ambiência que visa ou procura, por meio da semântica,

possibilitar um refinamento nos mecanismos de busca.

A Biblioteca Digital Semântica JeromeDL originou-se de experiências e testes da tese

de Sebastian Ryzard Kruk na Gdańsk University of Technology (GUT) – Polônia, em

2004/2005 contando com a participação e a supervisão da Digital Entreprise Research

Institute (DERI), em Galway, na Irlanda, que é uma parte da National University of Ireland,

na mesma cidade. JeromeDL consiste numa biblioteca digital semântica que utiliza as

principais tecnologias abordadas na Web Semântica.

Page 139: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

137

A descrição dos recursos informacionais tem como base a arquitetura de metadados

RDF e a realização de buscas semânticas baseadas em ontologias, o que significa a

possibilidade de melhorias na busca e na usabilidade com o estabelecimento de um maior

nível de interoperabilidade entre ambientes informacionais digitais. (KRUK; DECKER;

ZIEBORAK, 2005, tradução nossa).

Nesse momento, é oportuno tecer algumas diferenças no que tange aos aspectos

conceituais entre biblioteca digital e biblioteca digital semântica. Pautado nos autores

supracitados, podemos dizer que uma biblioteca digital semântica pode ser considerada aquela

que:

Tem a possibilidade de integrar/compartilhar informações baseadas em diferentes

padrões de metadados com anotações semânticas dos recursos e perfil dos usuários;

Pode prover níveis de interoperabilidade não somente com bibliotecas digitais, mas

com outros sistemas de informação, por exemplo, Repositórios Digitais, com

metadados distintos;

Possibilita a construção de interfaces mais amigáveis ao usuário com relação às

buscas e à navegação determinadas pela semântica.

Pode apresentar-se como um modelo no que concerne à transição de informações

estáticas (somente armazenadas em bibliotecas digitais convencionais) para uma

estrutura dinâmica e colaborativa na formação e geração de espaços de construção de

conhecimento.

Kruk (2006a, tradução nossa) elucida que as bibliotecas digitais, as quais se têm e

conhecemos hoje, trazem descrições semânticas básicas e que juntamente com anotações

semânticas comunitárias (perfil do usuário) e dos recursos informacionais, podem trazer a

próxima ou a nova geração da Internet.

Isso nos leva a inferir que as bibliotecas digitais apresentam-se com uma nova visão,

caracterizadas como ambientes sociais colaborativos com o uso e o reuso de informações

semânticas, indo ao encontro dos princípios do modelo que vem se constituindo hoje, como

Web 2.0.

Page 140: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

138

Pensando nisso, a Biblioteca Digital Semântica JeromeDL foi projetada a fim de

atender desde os profissionais responsáveis pela confecção dos recursos informacionais até os

usuários que irão se beneficiar e fazer uso desses recursos. Assim, de acordo com Kruk,

Decker e Zieborak (2005, p. 2, tradução nossa) foram traçados os principais requerimentos

para JeromeDL, tais como:

• Suportar a herança de bibliotecas clássicas/convencionais (ex., livros antigos), • Prover características de navegação orientadas ao usuário, • Permitir busca eficiente, • Suportar múltiplos formatos dos recursos, • Possibilitar a comunicação com outros sistemas de biblioteca digital, • Utilizar resultados dos últimos resultados na Web Semântica bem como a comunicação e o gerenciamento da informação nas pesquisas.

Esses requerimentos contemplam inicialmente, a arquitetura estabelecida para a

Biblioteca Digital Semântica JeromeDL, que pode ser visualizada de acordo com a figura 21,

a seguir.

FIGURA 21: Arquitetura da Biblioteca Digital Semântica JeromeDL. Fonte: Kruk, Decker e Zieborak (2005, p. 3)

Page 141: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

139

O produto central da JeromeDL implementa características dos aspectos dos recursos,

busca e navegação, o gerenciamento do perfil dos usuários (baseado em FOAF) e o

gerenciamento dos recursos informacionais. A descrição e o conteúdo dos recursos, por

exemplo, o índice (do texto completo) do conteúdo dos recursos, descrições bibliográficas em

MARC21 e BibTeX e a descrição semântica de acordo com a ontologia Jerome, estão

empregadas em vários sistemas de armazenamento. (KRUK; DECKER; ZIEBORAK, 2005,

tradução nossa).

A parte dos recursos textuais do sistema da Biblioteca Digital JeromeDL tem sido

designada para também assegurar o escaneamento de coleções de livros antigos e outros

recursos binários, como por exemplo, apresentações em Macromedia Flash. Uma ligação na

comunicação no ambiente Web fora do sistema possibilita a busca em uma rede de bibliotecas

digitais. (KRUK; DECKER; ZIEBORAK, 2005, tradução nossa).

O conteúdo da base de dados do sistema JeromeDL está traduzido em XHTML

seguindo uma solicitação em HTTP. Para administrar o conteúdo da base de dados e

descrever os recursos em uma aplicação de base de dados autônoma, é utilizado o

JeromeAdmin. JeromeDL comunica-se diretamente com o sistema principal pelo protocolo

RMI (Remote Method Invocation). O conteúdo da base de dados JeromeDL pode ser buscado

não somente pelas páginas Web da biblioteca digital, mas também em outras bibliotecas

digitais e outras aplicações Web, um serviço especial de interface Web baseado no Extensible

Library Protocol (ELP). (KRUK; DECKER; ZIEBORAK, 2005, tradução nossa).

Embora as bibliotecas construídas (convencionais), foram inicialmente criadas para

lidar somente com livros, os usuários encontravam usualmente uma remota e ampla variedade

de recursos. Segue o mesmo paradigma o sistema JeromeDL, suportando não somente

recursos em formatos PDF ou RTF, mas também outro conteúdo multimídia (ex.,

apresentações em Flash). Para suportar ambos, flexibilidade e especialização no manusear os

recursos, cada recurso tem sua própria descrição de sua estrutura. (KRUK; DECKER;

ZIEBORAK, 2005, tradução nossa).

É possível o recurso estar armazenado no formato XSL: FO o que permite a leitura

para escolher entre diferentes tipos de tradução, ex. PDF, RTF, HTML. O conteúdo dos

recursos pode ser adicionalmente protegido desde a impressão ou cópia (se aplicável) com o

Page 142: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

140

ACL (Access Control List) anexado ao recurso. (KRUK; DECKER; ZIEBORAK, 2005,

tradução nossa).

Freqüentemente um usuário de uma biblioteca digital que busca por informações

específicas é “inundado” com uma abundância de resultados inadequados na elaboração da

pergunta. Muitas tentativas têm sido feitas para limitar o número de respostas do processo de

pergunta. A pesquisa na usabilidade das características da busca cobre uma larga variedade de

aproximações, desde palavras com sentido ambíguo baseadas nas expressões e léxicos

booleanos até a dinâmica de perguntas usadas nas interfaces. (KRUK; DECKER;

ZIEBORAK, 2005, tradução nossa).

Desde prover o acesso aos recursos na base de dados, um sistema de biblioteca digital

espera fornecer características da busca e da navegação dos recursos. A Biblioteca Digital

Semântica JeromeDL almeja agregar alta qualidade nas características de busca e navegação

do sistema. A diversidade de padrões de metadados utilizado no sistema da biblioteca digital

reflete a sofisticação de algoritmos de busca. Para alcançar o conjunto de resultados (os mais

próximos/exatos) às exigências dos usuários, conceitos de conteúdo, significado e

preferências do usuário têm sido adaptados aos algoritmos de busca semântica. Enquanto o

usuário está navegando, a base de dados da JeromeDL possibilita anotar semanticamente o

perfil do usuário de acordo com informações estatísticas geradas pelo próprio sistema. Então,

os perfis são utilizados no processo de busca. (KRUK; DECKER; ZIEBORAK, 2005,

tradução nossa).

Uma das maneiras para adicionar recursos à Biblioteca Digital Semântica JeromeDL e

descrevê-los é usando a aplicação autônoma de administração de Java – JeromeAdmin. A

aplicação JeromeAdmin fornece uma interface para gerar a descrição dos recursos e o

uploading do conteúdo dos recursos para o sistema da base de dados. Com JeromeAdmin um

administrador/criador pode anexar a descrição bibliográfica em MARC21 e BibTeX bem

como anotações ontológicas para o recurso. Os usuários podem submeter também recursos ao

sistema de JeromeDL. Neste caso, um dos dois estágios do processo é requerido. Primeiro um

usuário submete o conteúdo do recurso e o conjunto de descrições. Então, o administrador

aprova e finaliza a submissão do recurso à base de dados. (KRUK; DECKER; ZIEBORAK,

2005, tradução nossa).

Page 143: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

141

Para melhor entender-se o funcionamento da arquitetura da Biblioteca Digital

Semântica JeromeDL, bem como a estrutura MarcOnt ,vejamos como ela está disponibilizada

para os usuários, a seguir.

5.4.1 Formas de representação dos recursos informacionais na Biblioteca Digital

Semântica JeromeDL

Ao se pensar em formas de representação da informação registrada, como visto no

capítulo 4, além da descrição e da representação dos recursos em um ambiente informacional,

de acordo com normas e padrões que norteiam sua construção, deve-se também pensar nas

formas de apresentação do recurso informacional, de forma a possibilitar uma boa usabilidade

dos sujeitos que se apropriarão das informações no sistema.

Assim, as seções seguintes apresentarão de uma forma sucinta o ambiente da

Biblioteca Digital Semântica JeromeDL, apontando como estão construídas as formas de

representação dos recursos informacionais, bem como estão distribuídas ou apresentadas para

os usuários.

FIGURA 22: Interface de apresentação da Biblioteca Digital Semântica JeromeDL. Fonte: Disponível em: <http://www.jeromedl.org/>. Acesso em: 31 out. 2007.

Page 144: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

142

A figura 22 apresenta a interface de apresentação da biblioteca digital semântica, onde

constam alguns links sobre a documentação da biblioteca, as formas de acesso e manuseio aos

recursos informacionais, projetos relacionados à biblioteca, os órgãos e instituições que estão

vinculados à JeromeDL, uma breve contextualização da criação da biblioteca etc.

FIGURA 23: Formas de busca e tipos documentais.

Fonte: Disponível em: <http://library.deri.ie/?lang=pt_BR>. Acesso em: 31 out. 2007.

A figura 23 descreve outra interface que contempla as formas de busca aos recursos

informacionais, bem como os tipos documentais que estão armazenados na biblioteca digital

semântica. Vale destacar que no menu da biblioteca, tem-se uma opção de Idiomas, onde o

usuário pode escolher em qual idioma ele deseja visualizar a interface da biblioteca. Vale

destacar que nesse caso, nos reportaremos ao idioma português.

Um dos grandes desafios da iniciativa da Biblioteca Digital Semântica JeromeDL, é

oferecer e estender seus serviços a uma ampla variedade de países com a finalidade de se

tornar uma biblioteca universal. O que se pode nesse momento, fazer uma analogia com os

sonhos e ideais do visionário Paul Otlet (1934), que vislumbrava uma biblioteca universal,

onde todos, sem a limitação de espaço e tempo, pudessem ter o acesso aos registros do

conhecimento.

Page 145: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

143

Ainda com relação a essa interface pode-se destacar as formas de busca aos recursos

informacionais constando-se de três opções: simples, avançada e semântica. As buscas

simples e avançadas constam de operadores booleanos encontrados em qualquer tipo de

biblioteca digital.

Vale atentar-nos para um diferencial na busca avançada onde se têm opções de

pesquisarmos pelo conteúdo do recurso informacional, bem como pelo tipo de padrão de

metadado (Dublin Core, BibTeX, MARC21), o que pode ser visto na figura 24, a seguir.

FIGURA 24: Interface de busca avançada. Fonte: Disponível em: <http://library.deri.ie/search?type=advanced>. Acesso em: 31 out. 2007.

O grande impacto e o diferencial está na busca semântica, que se pode visualizar de

acordo com a figura 25, a seguir.

metadados

Page 146: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

144

FIGURA 25: Interface de Busca semântica.

Fonte: Disponível em: <http://library.deri.ie/search?type=semantic>. Acesso em: 31 out. 2007.

O desafio para a Biblioteca Digital Semântica JeromeDL está justamente em fornecer

informações semânticas que outras bibliotecas digitais não oferecem. Na opção Select

template, o usuário pode optar pelas seguintes opções: Exiba todos os recursos na biblioteca,

Exiba todos os recursos criados por..., Exiba todos os recursos criados por meus amigos,

Exiba todos os recursos criados por alunos de... Pode-se dizer que num primeiro momento a

biblioteca digital semântica funciona como um ambiente colaborativo, como mencionado nas

seções anteriores, com a participação, não somente de profissionais (bibliotecários,

informáticos), mas também dos sujeitos (usuários) que se apropriarão dos recursos

informacionais.

Destaca-se, nesse momento, que a opção de busca semântica não está ativa e que

segundo informações do idealizador da JeromeDL, Sebastian Kruk (2006a) encontra-se ainda

em fase de experimentos e testes para um funcionamento breve.

Page 147: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

145

Com relação aos tipos documentais que estão armazenados na Biblioteca Digital

Semântica JeromeDL, escolhemos um recurso do tipo livro para analisar-se sob o prisma da

Catalogação como o recurso estaria representado e apresentado ao usuário.

FIGURA 26: Recurso informacional Livro.

Fonte: Disponível em: <http://library.deri.ie/preview?show=book>. Acesso em 31 out. 2007.

A figura 26 apresenta algumas informações do recurso, como por exemplo, as

palavras-chave, descrições adicionais do recurso e uma opção de apresentação do recurso de

acordo com um padrão de metadado numa única interface .

Além disso, a Biblioteca Digital Semântica JeromeDL possibilita a apresentação dos

recursos informacionais no momento da busca e sua visualização num padrão de metadado de

acordo com a preferência do usuário, conforme pode ser visto na figura 27, logo em seguida.

Page 148: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

146

FIGURA 27: Formas de apresentação dos recursos informacionais Fonte: Disponível em:

<http://library.deri.ie/servlet/mms?uri=http://books.deri.ie/resource/oSdCFq9y>. Acesso em: 31 out. 2007.

A figura 27 mostra um recurso informacional apresentado ao usuário numa única

plataforma contemplando os padrões de metadados vislumbrados na iniciativa MarcOnt

(BibTeX, BibTeXML, BibTeXRDF, Dublin Core, MARC21, MARCXML, MARCRDF e

MarcOnt) uma vez que temos nessa interface a possibilidade de interoperabilidade entre

padrões de metadados heterogêneos.

Assim, a figura 28 mostrará a apresentação da representação de um recurso

informacional no padrão de descrição bibliográfica semântica MarcOnt.

Page 149: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

147

FIGURA 28: Representação de um recurso informacional em MarcOnt.

Fonte: Disponível em: < http://library.deri.ie/servlet/mms?uri=http://books.deri.ie/resource/oSdCFq9y>. Acesso em: 31 out.

2007.

De acordo com a figura 28, pode-se considerar que o MarcOnt, utiliza-se para o

armazenamento das suas descrições a arquitetura de metadados RDF, possibilitando um nível

de interoperabilidade entre os campos do registro, bem como a possibilidade de

compartilhamento entre outras bibliotecas digitais e sistemas de informação que fazem uso de

padrões de metadados heterogêneos.

Faz-se necessário tecermos alguns comentários, pautados e vivenciados na prática

biblioteconômica, mais especificamente à luz dos fundamentos da Catalogação, que permite

como visto no capítulo 4, a padronização da descrição e da representação dos recursos

informacionais.

Um dos pontos que vale a pena ser destacado é como se apresenta uma descrição em

MARC21, por exemplo, na Biblioteca Digital Semântica JeromeDL. Em outras buscas

realizadas na biblioteca com a finalidade de verificar a representação e a descrição de um

recurso informacional, foram observadas algumas falhas nesses quesitos. Encontramos um

registro MARC21 que possuía mais de um autor, responsável pela obra. E o mais curioso era

que o campo 100 (Entrada Principal – Nome Pessoal) do registro estava repetido. De acordo

Page 150: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

148

com a estrutura MARC, este campo não se repete, pois de acordo com os esquemas de

descrição AACR2, que antevêem ou norteiam a construção do campo numa estrutura legível

por máquina MARC, seria necessário a criação de uma entrada secundária de autoria, que no

registro MARC é dado pelo campo 700 (Entrada Secundária – Nome Pessoal). Vale relembrar

também que até o presente momento, não se encontram disponíveis representação e descrição

em MARC21 na sua totalidade, julgando relevante, segundo Kruk (2007) apenas os campos

de autoria (100) e título (245) para a busca e a recuperação dos recursos informacionais.

Dessa forma, o bibliotecário é considerado protagonista na construção de regras para o

estabelecimento da semântica para outros campos do registro MARC21, podendo estes

compartilhar informações semânticas não só num mesmo registro/estrutura, mas também com

outros padrões de metadados e em sistemas diferentes.

Assim, pode-se dizer e reforçar a tese de que para um estabelecimento mais efetivo de

representações na estrutura MarcOnt e para a funcionalidade da Biblioteca Digital Semântica

JeromeDL, é imprescindível a participação ativa e direta do profissional bibliotecário, pois

este é o sujeito que possui as técnicas e as habilidades necessárias para um tratamento das

informações de forma padronizada, pautada em normas e regras na construção e confecção de

registros bibliográficos. O bibliotecário em consonância com profissionais da Computação e

outros atores envolvidos no processo, podem propiciar a clareza nos serviços oferecidos pela

biblioteca digital semântica, no atendimento e na satisfação nas solicitações de busca

requeridas pelo usuário.

Ainda nesse sentido, pode-se dizer que, para o funcionamento pleno do padrão de

descrição semântica MarcOnt, faz-se necessário que este compreenda e absorva a égide dos

conceitos oriundos da Catalogação, uma vez que esta proporcionará e subsidiará os elementos

fundamentais para a construção padronizada da representação. Além disso, a possibilidade de

permitir uma melhora na performance de interoperabilidade semântica entre os padrões de

metadados vislumbrados em JeromeDL e outros sistemas e ambientes informacionais digitais,

de forma a garantir a apresentação dos recursos para a preservação, o uso e o reuso das

informações para o usuário final.

Page 151: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

149

5.5 Portal Colaborativo MarcOnt: um modelo de aplicação para recursos

informacionais

Conforme mencionado nesse capítulo, a proposta MarcOnt caminha para os novos

paradigmas tecnológicos que vêem se constituindo hoje: Web Semântica, Bibliotecas Digitais

Semânticas, Repositórios Institucionais Digitais, Web 2.0 etc. E o grande desafio é oferecer

aos usuários de informações serviços que os atendam com qualidade e rapidez no acesso e no

uso dessas informações.

Nesse contexto, o padrão de descrição semântica MarcOnt emerge-se como uma

ferramenta tecnológica que pode propiciar a semântica às informações, no que tange às

formas de representação da informação registrada, de forma a atender uma diversidade de

usuários num único ambiente.

Pensando nisso, uma das iniciativas de MarcOnt, foi desenvolver um portal para que

os usuários, profissionais de diversas áreas, pesquisadores etc., pudessem participar

ativamente no processo de construção de representações e descrições semânticas, funcionando

como um ambiente colaborativo, a fim de testar as potencialidades do padrão de descrição

semântica MarcOnt.

Assim, as seções seguintes, apresentam os cenários de construção e a aplicação da

ferramenta MarcOnt, com o objetivo de reforçar sua relevância e a possibilidade de testes e

experimentos nessa ambiência.

Vale dizer que não é nosso objetivo nesse momento, relatar detalhadamente as

ferramentas e os instrumentos tecnológicos desenvolvidos no Portal MarcOnt, mas sim

apresentarmos um modelo e um sistema que já se encontram disponíveis para uso, aberto à

comunidade. Faz-se necessário um estudo de forma mais aprofundado sobre tais tecnologias

de modo a testar suas funcionalidades e potencialidades em aplicações efetivas.

Page 152: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

150

FIGURA 29: Interface de entrada no Portal MarcOnt.

Fonte: Disponível em: <http://portal.marcont.org/>. Acesso em 31 out. 2007

A figura 29 apresenta a interface inicial mostrando que o usuário ao entrar no sistema,

deverá cadastrar-se por meio de um login e uma senha, que atualmente, o próprio sistema

fornece aos usuários encontrados na página do Portal.

FIGURA 30: Principais ferramentas para a construção de descrições semânticas. Fonte: Disponível em: <

http://portal.marcont.org/main.jsf;jsessionid=1FF0FCA2148B85E6D27EFDECC8CB7B2D>. Acesso em: 31 out. 2007.

Page 153: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

151

Uma vez cadastrados e conectados ao sistema, os usuários são remetidos

automaticamente para a interface onde estão disponibilizadas as ferramentas tecnológicas para

a construção de descrições bibliográficas semânticas, conforme pode ser visto na figura 30.

FIGURA 31: Ambiente das regras gerais de transformação. Fonte: Disponível em: < http://portal.marcont.org/rulegenerator/frameForm.jsp>. Acesso em: 31 out.

2007.

A figura 31 nos traz as regras e as ferramentas para a construção das descrições

semânticas pautadas em algumas recomendações, tais como:

Source ontology: nessa modalidade o usuário define uma classe (assunto tratado), bem

como as propriedades, os atributos etc. que contemplarão a descrição semântica.

Translation rules: nessa parte os usuários definem os namespaces, ou seja, regras para

validar o endereço URI da ontologia, com alternativas de adicionar novas regras ou

mudá-las quando necessário. Lembrando sempre que as estruturas que comportam as

descrições estão calcadas na linguagem computacional XML e na arquitetura de

metadados RDF.

Page 154: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

152

FIGURA 32: Criação de múltiplas descrições. Fonte: Disponível em: < http://portal.marcont.org/diff.jsf>. Acesso em: 31 out. 2007.

De acordo com a figura 32, podem-se criar vários tipos de descrições, atribuindo a

cada uma delas as regras, as classes, as propriedades, de modo que elas possam interagir num

mesmo ambiente. Além disso, o sistema possibilita a apresentação das descrições na opção

SHOW DIFF, o que podemos verificar na figura 33, a seguir.

FIGURA 33: Apresentação do recurso em forma de tripla. Fonte: Disponível em: <http://portal.marcont.org/diff.jsf>. Acesso em: 31 out. 2007.

Page 155: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

153

Conforme apresentado na figura 33, o sistema permite uma visualização do recurso no

processo de construção em forma de tripla, identificando o subject, predicate e object, onde o

criador do recurso tem as possibilidades de adicionar uma nova tripla, bem como removê-la.

Destaca-se que para a construção das descrições é utilizado à linguagem OWL, uma

recomendação do W3C.

FIGURA 34: Submissão da criação da descrição do recurso ao comitê de avaliação. Fonte: Disponível em: <http://portal.marcont.org/graph.jsf>. Acesso em: 31 out. 2007.

No momento de criação da descrição do recurso informacional, os sujeitos

construtores podem, conforme visto na figura 34, trabalharem em um mesmo ambiente,

facilitando a visualização das diferentes características e etapas da confecção da

representação, tais como:

EDITOR: permite a consulta nas definições da classe, das propriedades e dos

namespaces definidos e utilizados na construção da descrição.

CODE: define o tipo de linguagem utilizado na construção da descrição do recurso,

como por exemplo, OWL.

TRIPLES: disponibiliza aos construtores da descrição do recurso as características dos

tipos: subject, predicate e object.

GRAPH: apresenta a descrição do recurso informacional na forma de grafo.

Page 156: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

154

Definida a descrição do recurso informacional, os sujeitos encaminham-na para um

comitê de avaliação, com as possibilidades de sugestões para possíveis alterações,

descrevendo os níveis de descrição com campos para comentários.

FIGURA 35: Verificação das normas exigidas para construção da descrição. Fonte: Disponível em: <http://portal.marcont.org/new.jsf>. Acesso em: 31 out. 2007.

Nessa apresentação de acordo com a figura 35, quando os sujeitos submetem as

descrições criadas nessa interface, o sistema verifica alguns elementos para analisar se são

compatíveis com as normas que permeiam a construção das descrições semânticas, como por

exemplo: se a representação da descrição obedece ao quesito da estrutura do tipo XML ou

está associada à linguagem OWL.

Page 157: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

155

FIGURA 36: Acesso aos recursos informacionais. Fonte: Disponível em: <http://portal.marcont.org/repository.jsf>. Acesso em: 31 out. 2007.

A interface final do sistema apresenta um repositório onde estão armazenadas e

disponibilizadas as descrições para o uso e o reuso das informações; oferece as opções de

busca por palavras-chave ao recurso, o nível (classe) do recurso, os comentários por parte da

comunidade, a data de criação do recurso, permitindo ainda visualizar ou editar um modelo de

descrição (View or edit selected model).

Conforme pôde-se observar até o presente momento, o padrão de descrição semântica

MarcOnt vislumbra ser uma nova tendência para os ambientes informacionais digitais de

modo a permitir a descrição semântica dos recursos informacionais e a possibilidade de

permitir a interoperabilidade semântica, não somente entre os campos de um registro

bibliográfico, mas também entre outros padrões de metadados em plataformas e sistemas

heterogêneos.

Tem-se a Biblioteca Digital Semântica JeromeDL, juntamente com o Portal MarcOnt

a possibilidade de sistemas que apresentam-se como ambiências propícias no sentido de

compartilhar e colaborar com representações e descrições bibliográficas semânticas, onde os

sujeitos psico-sociais têm a possibilidade de interação com o ambiente na construção das

formas de representação dos recursos informacionais.

Page 158: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

156

A partir das apresentações anteriormente explicitadas, a seção seguinte mostrará os

resultados alcançados nesta pesquisa, bem como as perspectivas para análise mais

aprofundada sobre o padrão de descrição bibliográfica semântica MarcOnt, com relação à

outros tipos de padrões de metadados.

5.6 À guisa de resultados

Tomando como base os capítulos apresentados até agora, principalmente com relação

à construção de formas de representação da informação, e a necessidade de padronização dos

recursos informacionais, a fim de garantir o acesso de maneira mais otimizado nos ambientes

informacionais digitais e a possibilidade de interoperabilidade semântica entre ambientes e

sistemas informacionais heterogêneos, foi possível identificar numa análise primeira do

MarcOnt, categorias para uma avaliação futura mais aprofundada e sistemática do padrão,

com relação ao padrão de metadados MARC21, bem como a performance de uso e de

aplicação em ambientes informacionais, atualmente. Dentre essas categorias pode-se destacar:

Estrutura

Número de campos e tipos

Conceitos

Metadados descritivos

Níveis de Interoperabilidade

Elementos de preservação

Tecnologias envolvidas

Tipos documentais contemplados

Pontos de acesso aos recursos informacionais

Acredita-se, que estes elementos podem permitir e subsidiar uma discussão de forma

mais acurada no entendimento do padrão de descrição semântica MarcOnt, bem como sua

aplicação nos ambientes informacionais digitais, à luz dos princípios da Catalogação e na

otimização dos processos de representação, de descrição, de recuperação, de acesso, de

preservação, de uso e de reuso das informações.

Page 159: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

157

Assim, o capítulo seguinte apresenta as considerações finais, bem como os resultados,

impressões, observações e reflexões propostas pela pesquisa, e os novos horizontes acerca dos

ambientes informacionais digitais.

Page 160: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

158

Capítulo Capítulo Capítulo Capítulo 6666

CONSIDERAÇÕES FINAISCONSIDERAÇÕES FINAISCONSIDERAÇÕES FINAISCONSIDERAÇÕES FINAIS

Page 161: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

159

6 CONSIDERAÇÕES FINAIS

“O futuro é uma astronave que tentamos pilotar”. Toquinho

A pesquisa ora concluída procurou revisitar as Tecnologias da Informação e

Comunicação, bem como seu desenvolvimento ao longo dos tempos, atuando significamente

no campo da Ciência da Informação enquanto instrumentos na facilitação dos processos

informacionais e na construção de ambientes informacionais. Na origem desses movimentos

destacou-se o pensamento de visionários, como Paul Otlet, Vannevar Bush, Ted Nelson etc.,

que procuraram criar e desenvolver instrumentos tecnológicos, na tentativa de padronizar e

garantir o tratamento dos recursos informacionais, de modo que pudessem ser processados e

disponibilizados, para uma busca e uma recuperação mais efetivas. Constatou-se que as

ferramentas concebidas e desenvolvidas, tais como, o Memex e o hipertexto, contribuíram e

serviram como modelo para o processamento dos recursos informacionais conhecidos hoje.

A presente dissertação, a partir de um estudo exploratório, envolvendo integração de

áreas disciplinares e ferramentas, deu origem a importantes constatações, a seguir

enumeradas:

Que a sociedade contemporânea vem sofrendo modificações constantes, nos mais

variados segmentos, político, social, econômico, cultural, ecológico etc., onde a informação é

considerada elemento chave em sua constituição e condição ímpar da pós-modernidade na Era

do Conhecimento;

Que dentre essas modificações, destaca-se a de esfera tecnológica, uma vez que a

informação vem sendo analisada numa perspectiva de formação de ambientes informacionais

digitais. Nesse contexto, as Tecnologias da Informação e Comunicação – TICs - vêem

permeando tais ambientes e, sob essa óptica, faz-se necessário um repensar sobre a

informação naquilo que diz respeito ao tratamento documentário, notadamente nos processos

de armazenamento, descrição, representação, preservação, uso e reuso das informações;

Page 162: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

160

Que a Ciência da Informação e a Biblioteconomia apresentam-se, nesse sentido, como

áreas que têm muito a contribuir para o desenvolvimento de ambientes informacionais

digitais, uma vez que elas oferecem respaldo indispensável, com seus aportes teóricos e

metodológicos, na padronização das informações registradas;

Que as TICs causaram mudanças significativas no campo da Ciência da Informação,

principalmente no que diz respeito aos paradigmas epistemológicos da área. Trata-se,

portanto, de um campo ou disciplina em constituição, que utiliza aportes teóricos e

metodológicos de outros campos científicos em busca de cientificidade;

Que as TICs podem ser consideradas instrumentos pautados em processos e

metodologias que atuam e norteiam o fazer profissional dos profissionais da Ciência da

Informação e que possibilitam a implementação efetiva das idéias de Otlet (1934) e de Bush

(1945);

Que as TICs influenciam a construção de formas de representação da informação

registrada, tomando como modelo de aplicação as bibliotecas, sejam essas convencionais ou

digitais, que se apresentam como redes informacionais estruturadas com modelos de

ambientes colaborativos;

Que sempre foi uma preocupação, desde as primeiras tentativas de registro do

conhecimento em um suporte informacional, armazenar e representar a informação registrada

para que pudesse ser preservada e utilizada;

Que a Catalogação, enquanto instrumento de descrição da Biblioteconomia, tem um

papel decisivo na manipulação de formas de representação bibliográficas e da interação de

sujeitos psico-sociais com o ambiente informacional. Nesse contexto, especificamente, a

pesquisa se caracterizou pelo estudo da construção de formas de representação da informação,

a partir da análise do processo de catalogação e da construção do registro bibliográfico, como

elemento que agrega a representação de forma e conteúdo do recurso informacional na

confecção de metadados. Foram descritos alguns padrões de metadados, tais como MARC21,

MARCXML, BibTeX, e Dublin Core que são apontados hoje pela literatura científica e

aplicados em ambientes informacionais específicos, como as bibliotecas digitais;

Page 163: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

161

Que a relação entre outros padrões de metadados, tais como o MARC21 e o MarcOnt,

não tem em seus objetivos, transformar a estrutura pré-estabelecida do MARC21 para a

linguagem da ontologia, mas fornecer a informação semântica à descrição dos recursos, de

modo a oportunizar uma compreensão pela máquina/computador;

Que se faz necessário a criação ou o reaproveitamento de teorias e metodologias

sedimentadas e cristalizadas da Biblioteconomia e da Ciência da Informação, no tocante às

questões de descrição dos recursos informacionais para um estabelecimento mais efetivo da

construção de formas de representação em ambientes informacionais digitais;

Que os metadados são considerados uma condição sine qua non para a resolução de

problemas de descrição e posteriormente de recuperação de informações nos ambientes

informacionais digitais, tais como as bibliotecas digitais e no contexto Web;

Que as bibliotecas digitais, enquanto estruturas pré-estabelecidas, consideradas

ambientes propícios para a recuperação de informações, têm na utilização de metadados a

padronização das formas de representação e a possibilidade de garantia de interoperabilidade

entre sistemas, favorecendo a integridade e a acessibilidade dos recursos informacionais de

forma eficiente pelo usuário final;

Que as bibliotecas digitais encontram-se como ambiências colaborativas para a

constituição de novos ambientes informacionais no cenário atual, tais como, Web Semântica,

Repositórios Institucionais, Web 2.0 e Bibliotecas Digitais Semânticas;

Que no âmbito da Web Semântica, por exemplo, é condição elementar que os

computadores/máquinas tenham acesso às coleções estruturadas de informações (metadados)

e regras de inferência (ontologias) que permitam representar explicitamente a semântica dos

recursos informacionais, para um possível uso e reuso das informações. Entretanto, se

considerarmos que a Web Semântica ainda não está consolidada, não possuindo um arcabouço

teórico sedimentado e aplicações efetivas, vislumbrada ainda numa dimensão “anímica”, fica

evidente que os aportes metodológicos e as ferramentas tecnológicas trazidas no bojo da

Ciência da Informação, podem contribuir no que concerne ao tratamento informacional dos

recursos informacionais digitais bem como de seus conteúdos, de forma a garantir a

interoperabilidade semântica entre ambientes informacionais digitais;

Page 164: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

162

Que se destacou instrumentos e ferramentas tecnológicas surgidos no bojo da Web

Semântica para a representação e a descrição de forma e conteúdo dos recursos

informacionais digitais, ressaltando-se o MarcOnt Initiative;

Que o padrão descrição bibliográfica semântica MarcOnt surgiu à luz da Web

Semântica, com a finalidade de atender aos requisitos de interoperabilidade semântica entre os

ambientes informacionais digitais, tais como as bibliotecas digitais. Nesse contexto, depois

das experiências na Biblioteca Digital Semântica JeromeDL, decidiu-se em criar uma

ontologia bibliográfica que pudesse contemplar os aspectos de forma e de conteúdo dos

recursos informacionais, a fim de resolver os problemas de representação e de descrição dos

recursos, na tentativa de agregar semântica à descrição das informações;

Que o padrão de descrição semântica MarcOnt, é um instrumento tecnológico que no

contexto das bibliotecas digitais e da Web de um modo geral, visa ser uma ferramenta capaz

de oportunizar ao tratamento dado aos recursos informacionais uma descrição de forma e de

conteúdo legível por máquinas com a possibilidade de resultados compreensíveis aos

humanos para a apresentação das informações com vistas a uma recuperação mais eficiente.

Além da garantia da apresentação das informações para o uso, a preservação e o reuso para os

usuários;

Que se tem no padrão de descrição bibliográfica semântica MarcOnt um ponto de

partida par a integração de fontes/sistemas que se utilizam de padrões de metadados

heterogêneos, no que tange a uma melhora na performance na manipulação de formas de

representação bibliográfica e da interação dos sujeitos com o ambiente informacional;

Que o padrão de descrição bibliográfica semântica MarcOnt assume um papel chave

na evolução e na construção de bibliotecas digitais semânticas, uma vez que tem a

possibilidade de intercambiar informações semânticas, não somente entre padrões de

metadados já consolidados, mas também a possibilidade de interoperabilidade semântica entre

outros ambientes informacionais;

Que se vive atualmente uma mudança de paradigmas e novos horizontes se abrem à

Catalogação bem como novas tendências e novos olhares para os registros bibliográficos no

século XXI;

Page 165: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

163

Que os Requisitos Funcionais para Registros Bibliográficos – FRBR, os padrões de

metadados já consagrados na área de Biblioteconomia, como por exemplo, MARC21,

juntamente com o padrão de descrição bibliográfica semântica MarcOnt, atuam em sinergia,

pois podem possibilitar uma maior potencialidade nos relacionamentos entre registros

bibliográficos e uma amplitude nas solicitações de busca pelo usuário final;

Que com relação à constituição de ambientes informacionais digitais, o curso atual da

Web Semântica e da Web 2.0 devem e podem ser combinados para o desenvolvimento de

bibliotecas digitais. Portanto, o futuro das bibliotecas digitais prevê ir além da integração

(interoperabilidade) de informações, alcançando a integração com outros serviços. (KRUK,

2006b, tradução nossa);

Que as bibliotecas digitais da próxima geração, denominadas de Biblioteca 2.0 surgem

nesse cenário redesenhando os modelos convencionais com os quais estamos acostumados

atualmente. Assim, a Biblioteca 2.0 visualiza um serviço com a atuação do usuário que opere

de acordo com as suas expectativas nas bibliotecas de hoje. Nesta visão, a biblioteca torna a

informação disponível onde e sempre que o usuário a desejar. (RAMOS, 2007, tradução

nossa);

Que o padrão de descrição semântica MarcOnt vislumbra ter um papel sine qua non

nesse contexto, onde poderá contribuir com suas representações e descrições semânticas de

forma e de conteúdo num ambiente colaborativo, com a participação, não somente de

profissionais (bibliotecários, cientistas da computação etc.) mas também dos usuários que

atuam nos processos de busca e recuperação dos recursos informacionais condicionados pela

interatividade e conectividade dos novos ambientes;

Que os bibliotecários em consonância com profissionais da Computação e outros

atores envolvidos no processo, podem propiciar a clareza nos serviços oferecidos pela

Biblioteca Digital Semântica JeromeDL, para um funcionamento mais efetivo, no que

concerne ao atendimento e na satisfação nas solicitações de busca requeridas pelo usuário;

Que aos profissionais bibliotecários, cabe a competência de se atualizarem e se

adaptarem às novas realidades tecnológicas trazidas principalmente no cenário da

Catalogação. Faz-se necessária uma mudança de comportamentos, atitudes e abertura às

Page 166: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

164

novas filosofias de compartilhamento e colaboração de idéias, num único ambiente

informacional, provendo o acesso aos recursos de maneira mais fácil, ágil e efetiva para o

usuário final;

Pode-se afirmar que as TICs têm permeando a formação de ambientes informacionais

digitais, potencializando os processos de tratamento documentário na melhoria dos serviços

oferecidos aos usuários no ambiente Web; espera-se contribuir com subsídios de cunho

teórico e metodológico para a área de Ciência da Informação, destacando o padrão de

descrição bibliográfica semântica MarcOnt, como um caminho para a melhora da

performance do instrumento tecnológico estudo no processo de recuperação da informação e

identificação do recurso informacional na Web.

Para tanto, pode-se considerar que tal padrão de descrição bibliográfica semântica:

Apresenta-se como um novo padrão para a representação (forma e conteúdo) do

recurso informacional no contexto digital, na busca por uma descrição bibliográfica

mais completa e complexa com a possibilidade de garantir uma melhora na

performance de interoperabilidade entre sistemas e ambientes informacionais digitais.

Pode possibilitar uma melhora na explicitação das informações de forma a permitir

uma compreensão pela máquina nas solicitações de busca para o usuário final.

Pode possibilitar o compartilhamento de recursos entre ambientes informacionais

heterogêneos indo ao encontro da filosofia colaborativa da Web Semântica e,

recentemente, Web 2.0.

Apresenta-se como uma ferramenta tecnológica que pode potencializar a padronização

das informações, na otimização dos processos de representação, descrição,

organização, acesso, recuperação, preservação, uso e reuso dos recursos

informacionais em distintas ambiências.

Page 167: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

165

Vale ressaltar que mesmo sendo amplamente discutido em nível internacional e

contando com o apoio financeiro de renomados órgãos de fomento, até o presente momento,

não encontram-se relatos e experiências do padrão de descrição bibliográfica semântica

MarcOnt no Brasil.

Espera-se que a presente pesquisa contribua como uma fonte de informação

bibliográfica em Língua Portuguesa para os profissionais da área de Ciência da Informação,

no tocante às questões de representação e de descrição dos recursos informacionais e no

ensino da Catalogação nos cursos de graduação em Biblioteconomia.

Como sugestões para pesquisas futuras, pode-se destacar:

A análise da usabilidade da Biblioteca Digital Semântica JeromeDL;

A construção de descrições bibliográficas semânticas no Portal Colaborativo

MarcOnt, a fim de verificar suas potencialidades;

O delineamento de outras ferramentas tecnológicas para a construção de descrições

bibliográficas semânticas pautadas em MarcOnt;

A aplicação dos modelos de relacionamentos FRBR em construções de registros

bibliográficos no padrão de descrição semântica MarcOnt;

A construção de uma arquitetura de serviços destacando os padrões de metadados

(MARC21, MARCXML, BibTeX, Dublin Core) com a adoção do instrumento

tecnológico MarcOnt;

A análise detalhada entre o padrão de metadados MARC21 e MarcOnt de acordo com

as categorias de análise identificadas e definidas nessa pesquisa;

Estudo de ontologias voltadas para os interesses específicos de sistemas de

recuperação de informações.

Page 168: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

166

REFERÊNCIASREFERÊNCIASREFERÊNCIASREFERÊNCIAS

Page 169: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

167

REFERÊNCIAS ALMEIDA, M. B. Uma introdução ao XML, sua utilização na internet e alguns conceitos complementares. Ciência da Informação, Brasília, v. 31, n. 2, p. 5-13, maio/ago. 2002. ALMEIDA JÚNIOR, O. F. de. Profissional bibliotecário: um pacto com o excludente. In: BAPTISTA, S. G.; MUELLER, S. P. M. (Org.). Profissional da informação: o espaço de trabalho. Brasília: Thesaurus, 2004. p. 70-86. (Estudos avançados em Ciência da Informação, 3). ALVARENGA, L. A teoria do conceito revisitada em conexões com ontologias e metadados no contexto das bibliotecas tradicionais e digitais. DataGramaZero – Revista de Ciência da Informação, v. 2, n. 6, p. 1-21, dez. 2001. ALVARENGA, L. Representação do conhecimento na perspectiva da ciência da informação em tempo e espaço digitais. Enc. Bibli: R. Eletr. Bibliotecon. Ci. Inf., Florinópolis, n. 15, 2003. ALVES, M. das D. R.; SOUZA, M. I. F. Estudo de correspondência de elementos de metadados: Dublin Core e MARC21. Revista Digital de Biblioteconomia e Ciência da Informação, Campinas, v. 4, n. 2, p. 20-38, jan./jun. 2007. ALVES, R. C. V. Web semântica: uma análise focada no uso de metadados. 2005. 180 f. Dissertação (Mestrado em Ciência da Informação) - Faculdade de Filosofia e Ciências, Universidade Estadual Paulista, Marília, 2005. AMARAL, S. A. do. Websites: uso de tecnologias no cumprimento das funções da biblioteca. Informação & Sociedade: Estudos, João Pessoa, v. 15, n. 2, p. 15-40, jul./dez. 2005. ANDRADE, M. E. A.; OLIVEIRA, M. de. A ciência da informação no Brasil. In: CENDÓN, B. V. et al. Ciência da informação e biblioteconomia: novos conteúdos e espaços de atuação. Belo Horizonte: Editora UFMG, 2005. 143 p. p. 45-60. ARELLANO, M. A. Preservação de documentos digitais. Ciência da Informação, Brasília, v. 33, n. 2, p. 15-27, maio/ago. 2004. BARRETO, C. M. Modelo de metadados para a descrição de documentos eletrônicos na web. 1999. 189f. Dissertação (Mestrado em Ciências em Sistemas de Computação) - Instituto Militar de Engenharia, Rio de Janeiro, 1999.

Page 170: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

168

BAX, M. P. Introdução às linguagens de marcas. Ciência da Informação, Brasília, v. 30, n. 1, p. 32-38, jan./abr. 2001. BERNERS-LEE, T. Semantic web Concepts. 2005. Disponível em: Disponível em: <http://www.w3.org/2005/Talks/0517-boit-tbl>. Acesso em: 18 out. 2007. BERNERS-LEE, T. Semantic Web - XML2000. [2005?]. Disponível em: <http://www.w3.org/2000/Talks/1206-xml2k-tbl/Overview.html>. Acesso em: 21 maio 2007. BERNERS-LEE, T.; HENDLER, J.; LASSILA, O. The semantic web: a new form of web content that is meaningful to computers will unleash a revolution of new possibilities. Scientific American, New York, May, 2001. Disponível em: <http://www.sciam.com/2001/050lissue/0501berners-lee.html>. Acesso em: 28 jun. 2005. BORGMAN, C. L. Social aspects of digital libraries. In: WORKSHOP ON SOCIAL ASPECTS OF DIGITAL LIBRARIES, 1996, Los Angeles. Final Report… Los Angeles: UCLA/NSF, 1996. Disponível em: <http://www.lis.gseis.ucla.edu/DL>. Acesso em: 27 jul. 2006. BORLUND, P. Evaluation of interactive information retrieval systems. Àbo, Finland: Àbo Academy University, 2000. BORKO, H. Information science: what is it? American Documentation, v. 19, n. 1, p. 3-5, 1968. BOWEN, J.; ATTIG, J. RDA: resource description and access: a new cataloging standard for a digital future. [S.l.]: Music Library Association, March 3, 2007. Disponível em: <http://www.musiclibraryassoc.org/BCC/Presentations/RDA_MLA_2007.pdf>. Acesso em: 20 jun. 2007. BREY, P. The ethics of representation and action in virtual reality. Netherlands: Kluwer Academic Publishers. Ethics and Information Technology, v. 1, p. 5-14, 1999. BROOKES, B. C. The developing cognitive view in information science. International Workshop on the Cognitive Viewpoint, CC-77, p. 195-203, 1977. BUCKLAND, M. K. Information as thing. Journal of the American Society for Information Science, v. 42, p. 351-360, 1991.

Page 171: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

169

BUSH, V. As we may think. Atlantic Monthly, v. 176, n. 1, p. 101-108, 1945. Disponível em: <http://www.theatlantic.com/unbound/flashbks/computer/bushf.htm>. Acesso em: 02 mar. 2007. CAFÉ, L. et al. Repositórios institucionais: nova estratégia para publicação científica na rede. In: ENDOCOM – Encontro Nacional de Informação em Ciências da Comunicação, 13., 2003. Anais eletrônicos... Disponível em: <http://www.intercom.org.br/papers/2003/endocom/ENDOCOM_CAFE.pdf>. Acesso em: 30 maio 2006. CAMPELLO, B. Introdução ao controle bibliográfico. 2. ed. Brasília: Briquet de Lemos/Livros, 2006. 94 p. CAMPOS, M.L.M.; CAMPOS, M.L.de A.; CAMPOS, L.M. Web semântica e a gestão de conteúdos informacionais. In: MARCONDES, C. H. et al. (Org.). Bibliotecas digitais: saberes e práticas. 2. ed. Salvador: EDUFBA; Brasília: IBICT, 2006. p. 55-74. CAPURRO, R. Epistemologia e ciência da informação. IN: ENCONTRO NACIONAL DE PESQUISA EM CIÊNCIA DA INFORMAÇÃO - ENANCIB, 5., 2003, Belo Horizonte. Anais... Belo Horizonte: UFMG, 2003. 1 CD-ROM. CAPURRO, R.; HJORLAND, B. O conceito de informação. Perspectivas em Ciência da Informação, v. 12, n. 1, p. 148-207, jan./abr. 2007. CARVALHO, J. O. F. de. O papel da interação humano computador na inclusão digital. Transinformação, Campinas, v. 15, p. 75-89, set./dez. 2003. (Edição especial). CASA, M. E. Ambientes computacionais com múltiplas formas de representação. In: GONZÁLES, M. E. Q. et al. (Org.). Encontro com as ciências cognitivas. 2. ed. rev. e ampl. Marília: Faculdade de Filosofia e Ciências, 1997. p. 209-220. CASTELLS, M. A sociedade em rede – a era da informação: economia, sociedade e cultura. 4. ed. São Paulo: Paz e Terra, 2000. CASTRO, F. F. de. Conversão retrospectiva de registros bibliográficos. 2002. 87 f. Trabalho de Conclusão de Curso (Graduação em Biblioteconomia) – Faculdade de Filosofia e Ciências, Universidade Estadual Paulista, Marília, 2002. CASTRO, F. F. de et al. Impactos éticos da internet e das tecnologias de informação e comunicação na atuação do profissional da informação na atualidade: a questão das

Page 172: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

170

bibliotecas virtuais. In: ASSOCIACIÓN DE EDUCACIÓN E INVESTIGACIÓN EM BIBLIOTECOLOGÍA, ARCHIVOLOGÍA, CIENCIAS DE LA INFORMACIÓN Y DOCUMENTACIÓN DE IBEROAMÉRICA Y EL CARIBE - EDIBCIC, 7., 2006, Marília. Anais… Marília: UNESP, 2006. p. 1-16. 1 CD-ROM. CASTRO, F. F. de; SANTOS, P. L. V. A. da C. Conversão retrospectiva de registros bibliográficos. In: FUJITA, M. S. L. (Org.). A dimensão social da biblioteca digital na organização e acesso ao conhecimento: projetos, produtos e relatos de experiência. São Paulo: Sistema Integrado de Bibliotecas da USP, Dep. Técnico: IBICT, 2005. v. 2, p. 63-87. CASTRO, F. F. de; SANTOS, P. L. V. A. da C. Os metadados como instrumentos tecnológicos na padronização e potencialização dos recursos informacionais no âmbito das bibliotecas digitais na era da web semântica. Informação & Sociedade: Estudos, João Pessoa, v. 17, n. 2, p. 12-21, maio/ago. 2007. CERVO, A. L.; BERVIAN, P. A. Metodologia científica. 5. ed. São Paulo: Prentice Hall, 2003. 242 p. CUNHA, M. B. da. Desafios na construção de uma biblioteca digital. Ciência da Informação, Brasília, v. 28, n. 3, p. 257-268, set./dez. 1999. CUNHA, M. B. da. Construindo o futuro: a biblioteca universitária brasileira em 2010. Ciência da Informação, Brasília, v. 29, n. 1, p. 71-89, jan./abr. 2000. DACONTA, M. The semantic web: a guide to the future of XML, web services and knowledge management. Indianápolis, Indiana: Wiley Publishing Inc, 2003. DECLARACIÓN de Princípios Internacionales de Catalogación. 2003. 6 p. Traducción: Elena Escolano Rodríguez. Disponível em: <http://www.loc.gov/loc/ifla/imeicc/source/declaracion_2003-sp.pdf>. Acesso em 19 jun. 2007. DENCKER, A. F. M.; VIÁ, S. C. da. Pesquisa empírica em ciências humanas: com ênfase em comunicação. São Paulo: Futura, 2001. DIAS, C. Usabilidade na web: criando portais mais acessíveis. Rio de Janeiro: Alta Books, 2003. DIAS, E. J. W. Contexto digital e tratamento da informação. DataGramaZero – Revista de Ciência da Informação, v. 2, n. 5, p. 1-10, out. 2001.

Page 173: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

171

DUBLIN Core Metadata Initiative. DCMI metadata terms. 2006. Disponível em: <http://dublincore.org/documents/dcmi-terms/>. Acesso em: 18 dez. 2007. ESTEVES, A.; SANTOS, L.; GUIMARÃES, P. XML nas bibliotecas digitais: standard. Disponível em: <http://www.bibliosoft.pt/projectoxml/_standard.htm> Acesso em 6 nov. 2002. FEDER, A. BibTeX format description. 2006. Disponível em: <http://www.bibtex.org/>. Acesso em: 12 set. 2007. FEITOSA, A. Organização da informação na web: das tags à web semântica. Brasília: Thesaurus, 2006. 132 p. FERREIRA, E. C. H. G. Geração automática de metadados: uma contribuição para a web semântica. 2006. 229 f. Tese (Doutorado em Engenharia) – Escola Politécnica da Universidade de São Paulo, São Paulo, 2006. FERREIRA, M. Introdução à preservação digital: conceitos, estratégias e actuais consensos. Guimarães, Portugal: Escola de Engenharia da Universidade do Minho, 2006. 88 p. Disponível em: <https://repositorium.sdum.uminho.pt/bitstream/1822/5820/1/livro.pdf>. Acesso em: 20 dez. 2007. FERREIRA, M. M. (Trad. e Adap.). MARC21: formato condensado para dados bibliográficos. 2. ed. Marília: UNESP-Marília-Publicações, 2002. v. 1. 286 p. FLAMINO, A. N. MARCXML: um padrão de descrição para recursos informacionais em open archives. 2006. 164 f. Dissertação (Mestrado em Ciência da Informação) - Faculdade de Filosofia e Ciências, Universidade Estadual Paulista, Marília, 2006. FURGERI, S. O papel das linguagens de marcação para a ciência da informação. Transinformação, Campinas, v. 18, n. 3, p. 225-239, set./dez. 2006. FURRIE, B. Understanding MARC bibliographic: machine-readable cataloging. 7th. ed. rev. Washington, D. C.: Library of Congress; Follet Software, 2003. Disponível em: <http://www.loc.gov/marc/umb/>. Acesso em: 17 jun. 2007. GILLILAND-SWETLAND, A. J. La definición de los metadatos. In: INTRODUCCIÓN a los metadatos: vías a la información digital. [S. l.]: GETTY, 1999. p. 1-9.

Page 174: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

172

GOMES, H. E.; ZAHER, C. Da bibliografia à ciência da informação: um histórico e uma posição. Ciência da Informação, Brasília, v. 1, n. 1, p. 5-7, 1972. HAWKINS, D. T. Information science abstracts: tracking the literature of information science. Part 1: Definition and map. Journal of the American Society for Information Science and Technology, v. 52, n. 1, p. 44-53, 2001. HEDSTROM, M. Digital preservation: a time bomb for digital libraries. Computer and the Humanities, v. 31, n. 3, p. 189-202, 1997-1998. Disponível em: <http://www.uky.edu/~kiernan/DL/ hedstrom.html>. Acesso em: 03 mar. 2007. HERNÁNDEZ, T.; TOSETE HERRANZ, F. Las bibliotecas digitales y los nuevos retos en la gestión de recursos electrónicos. In: CARIDAD SEBASTIÁN, M.; NOGALES FLORES, J. T. (coord.). La información en la posmodernidad: la sociedad del conocimiento en España e Iberoamérica. Madrid: Centro de Estudios Ramón Areces, 2004, cap. 15, p. 189-204. HILDRETH, C. R. Preserving what we really want to access, the message, not the medium: challenges and opportunities in the digital age. In: HELAL, A. H.; WEISS, J. W. (Ed.). PROCEEDING OF THE INTERNATIONAL ESSEN SYMPOSIUM, 18., Proceedings…1995, Essen. Festschrift in honour of Patricia Battin. Essen: Germany Universitätsbibliothek, 1996. p. 76-95. HJØRLAND, B. Epistemology and the socio-cognitive perspective in Information Science. Journal of the American Society for Information Science and Technology, v. 53, n. 4, p. 257-270, 2002. HOUAISS, A.; VILLAR, M. de S.; FRANCO, F. M. de M. Minidicionário Houaiss da língua portuguesa. Rio de Janeiro: Objetiva, 2001. 481 p. IFLA Study Group on the Functional Requirements for Bibliographic Records. Functional requirements for bibliographic records: final report. UBCIM Publications - New Series, vol. 19. München: K. G. Saur, 1998. 136 p. Disponível em: <http://www.ifla.org/VII/s13/frbr/frbr.pdf>. Acesso em: 18 dez. 2007. INGWERSEN, P. Conceptions of Information Science. In: VAKKARI, P.; CRONIN, B. (ed). Conceptions of Library and Information Science: historical, empirical and theoretical perspectives. London: Taylor Graham, 1992. p. 299-312. INNARELLI, H. C. Preservação de acervos digitais: a fragilidade do suporte e seus elementos de preservação. In: SIMPÓSIO INTERNACIONAL DE BIBLIOTECAS DIGITAIS, 3., 2005, São Paulo. Anais eletrônicos... São Paulo: CRUESP, 2005. Disponível em:

Page 175: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

173

<http://bibliotecas-cruesp.usp.br/bibliotecas/APRESENT/Humberto_Innarelli_H_C.pdf>. Acesso em: 12 mar. 2007. JOINT STEERING COMMITTEE FOR REVISION OF AACR. Strategic plan for RDA 2005-2008. May, 29, 2006. Disponível em: < http://www.collectionscanada.ca/jsc/docs/5strategic1rev.pdf>. Acesso em: 19 jun. 2007. KRUK, S. R. JeromeDL 2.0: a digital library on social semantic information spaces. [2006a]. Disponível em: <http://www.sebastiankruk.com/storage/presentation/jeromedl2.0stable_gut/img0.html>. Acesso em: 25 ago. 2007. KRUK, S. R. The role of ontologies in semantic digital libraries. Alicante, Spain. NKOS WORKSHOP 1., Sep., [2006b]. 30 p. Disponível em: <http://www.sebastiankruk.com/storage/presentation/nkos2006/img0.html>. Acesso em: 25 ago. 2007. KRUK, S. R. ; DECKER, S. ; ZIEBORAK, L. JeromeDL: reconnecting digital libraries and the semantic web. Chiba, Japan, May 2005. Disponível em: <http://www.marcont.org/marcont/pdf/www2005_jeromedl.pdf>. Acesso em: 14 jan. 2006. KRUK, S. R.; SYNAK, M.; ZIMMERMANN, K. MarcOnt initiative: mediation services for digital libraries. 2005a. Disponível em: <http://www.marcont.org/marcont/pdf/marcontecdl2005.pdf>. Acesso em: 16 jan. 2006. KRUK, S. R. ; SYNAK, M. ; ZIMMERMANN, K. MarcOnt initiative: integration ontology for bibliographic description formats. Madrid, 2005b. Disponível em: <http://dc2005.uc3m.es/program/presentations/Thursday%2015.%2015.30%20h%20-%20s.kruk.pdf>. Acesso em: 16 jan. 2006. LASSILA, O.; SWICK, R. R. Resource description framework (RDF) model and syntax specification. [S. l.: S. n.], 1999. Disponível em: <http://www.w3.org/TR/1999/REC-rdfsyntax- 19990222/>. Acesso em: 3 jul. 2007. LE COADIC, Y-F. A ciência da informação. 2. ed. rev. e atual. Brasília: Briquet de Lemos/Livros, 2004. 124 p. LESK, M. Practical digital libraries: books, bytes and bucks. San Francisco, CA: Morgan Kaufmann, 1997.

Page 176: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

174

LÉVY, P. Cibercultura. São Paulo, Ed. 34, 1999. (Coleção Trans). LÉVY, P. As tecnologias da inteligência. Rio de Janeiro: Ed. 34, 2001. LIBRARY OF CONGRESS. MARC 21 concise formats. 2006. Disponível em: <http://www.loc.gov/marc/concise/concise.html>. Acesso em: 30 jul. 2007. LOURENÇO, C. A. O grande desafio na organização da web. Informação & Sociedade: estudos, João Pessoa, v. 17, n. 1, p. 71-80, jan./abr. 2007. MARC21 Concise Classification: introduction. 2006. Disponível em: <http://www.loc.gov/marc/classification/eccdintr.html>. Acesso em: 3 jul. 2007. MACHADO, R. N.; NOVAES, M. S. F.; SANTOS, A. H. Biblioteca do futuro na percepção de profissionais da informação. Transinformação, Campinas, v. 11, n. 3, p. 215-222, set./dez. 1999. MARCHIORI, P. Z. “Ciberteca” ou biblioteca virtual: uma perspectiva de gerenciamento de recursos de informação. Ciência da Informação, Brasília, v. 26, n. 2, p. 114-24, maio/ago. 1997. MARCONDES, C. H. Representação e economia da informação. Ciência da Informação, Brasília, v. 30, n. 1, p. 61-70, jan./abr. 2001. MARCONDES, C. H. Metadados: descrição e recuperação de informações na web. In: ______. et al. (Org.). Bibliotecas digitais: saberes e práticas. 2. ed. Salvador: EDUFBA; Brasília: IBICT, 2006. p. 95-111. MATOS, A. T. A biblioteca em realidade virtual com um ambiente colaborativo. 2003. 241 f. Dissertação (Mestrado em Ciência da Informação) - Faculdade de Filosofia e Ciências, Universidade Estadual Paulista, Marília, 2003. MATURANA, H. R.; VARELA, F. J. Autopoiesis and cognition. Dordrecht, The Netherlands: Reidel, 1980. McGARRY, K. O contexto dinâmico da informação. Brasília: Briquet Lemos, 1999. 206 p. MEY, E. S. A. Introdução à catalogação. Brasília: Briquet de Lemos, 1995. 123 p.

Page 177: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

175

MILSTEAD, J.; FELDMAN, S. Metadata: cataloging by any other name. Online, [S. l.], January 1999. Disponível em: <http://www.online.com/online/ol1999/milstead1.html>. Acesso em: 22 mar. 2007. MIRANDA, A.; SIMEÃO, E. (Org.). Informação e tecnologia: conceitos e recortes. Brasília: UNB/Dept. de Ciência da Informação, 2005. 259 p. MOOERS, C. N. Zatocoding appplied to mechanical organization of knowledge. American Documentation, v. 2, p. 20-32, 1951. MORENO, F. P. Requisitos funcionais para registros bibliográficos - FRBR: um estudo no catálogo da rede bibliodata. 2006. 202 f. Dissertação (Mestrado em Ciência da Informação) – Faculdade de Economia, Administração, Contabilidade e Ciência da Informação e Documentação, Universidade de Brasília, Brasília, 2006. MOURA, A. M.ª de C. A Web Semântica: fundamentos, tecnologias e tendências. [S. l.: S. n.], 2002. Disponível em: <http://genesis.nce.ufrj.br/dataware/TESI_2002_3/unidades/tutorial_sbbd2002.pdf >. Acesso em: 13 ago. 2007. NAZARENO, C. et al. Tecnologias da informação e sociedade: o panorama brasileiro. Brasília: Câmara dos Deputados, 2007. 187 p. Disponível em: < http://www.camara.gov.br/internet/infdoc/Publicacoes/html/pdf/tecnologia_info.pdf>. Acesso em: 31 jul. 2007. OLIVEIRA, M. de. A investigação científica na ciência da informação: análise da pesquisa financiada pelo CNPq. 1998. 200 f. Tese (Doutorado em Ciência da Informação) – Departamento de Ciência da Informação e Documentação, Universidade de Brasília, Brasília, 1998. OLIVEIRA, M. de. Origens e evolução da ciência da informação. In: CENDÓN, B. V. et al. Ciência da informação e biblioteconomia: novos conteúdos e espaços de atuação. Belo Horizonte: Editora UFMG, 2005. 143 p. p. 9-28. O'REILLY, T. What is web 2.0: design patterns and business models for the next generation of software. 30 Sept. 2005. Disponível em: <http://www.oreillynet.com/pub/a/oreilly/tim/news/2005/09/30/what-is-web-20.html#mememap>. Acesso em: 15 dez. 2007. OTLET, P. Traité de Documentation – Le livre sur le livre: théorie et pratique. Bruxelles: Mundaneum, 1934. 411 p.

Page 178: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

176

PEREIRA, E. C.; RUTINA, R. O século XXI e o sonho da biblioteca universal: quase seis mil anos de evolução na produção, registro e socialização do conhecimento. Perspectiva em Ciência da Informação, Belo Horizonte, v. 4, n. 1, p. 5-9, 1999. PESCHL, M. F. Representing representations. 2002. Disponível em: <http://chassutoronto.ca/epc/srb/srb/representing.html>. Acesso em: 15 maio 2007. PETERSON. D. (Org.) Forms of representation: an interdisciplinary theme for cognitive science. Wiltshire: Cromwell Press, 1996. 208 p. PICKLER, M. E. V. Web semântica: ontologias como ferramentas de representação do conhecimento. Perspectivas em Ciência da Informação, Belo Horizonte, v. 12, n. 1, p. 65-83, jan./abr. 2007. PINHEIRO, L. V. R. A ciência da informação entre a sombra e luz: domínio epistemológico e campo interdisciplinar. 1997. 269 f. Tese (Doutorado em Comunicação) – ECO, Universidade Federal do Rio de Janeiro, Rio de Janeiro, 1997. POPPER, K. R. Replies to my critics. In: SCHLIPP, P. A. (Ed.). The philosophy of Karl Popper. La Salle, IL: Open Court, 1974. p. 940-1180. RAMALHO, R. A. S. Web semântica: aspectos interdisciplinares da gestão de recursos informacionais no âmbito da ciência da informação. 2006. 120 f. Dissertação (Mestrado em Ciência da Informação) - Faculdade de Filosofia e Ciências, Universidade Estadual Paulista, Marília, 2006. RAMOS, M. M. The role of librarians in the 21st century. In: ALAP – ANNIVERSARY FORUM, 35., 2007. Filipinas: International Rice Research Institute (IRRI). Disponível em: <http://alapph.blogspot.com/search/label/papers%20ALAP%20Forum>. Acesso em: 23 set. 2007. RAYWARD, W. B. The origins of information science and the International Institute of Bibliography/International Federation for Information and Documentation (FID). Journal of the American Society for Information Science, n. 48, p. 289-300, Apr. 1997. Disponível em: <http://alexia.lis.uiuc.edu/~wrayward/otlet/OriginsofInfoSci.htm>. Acesso em: 12 dez. 2006. RICOEUR, P. Interpretação e ideologia. Rio de Janeiro: Francisco Alves, 1977. ROBREDO, J. Da ciência da informação revisitada aos sistemas humanos de informação. Brasília, 2003. 262 p.

Page 179: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

177

ROBREDO, J. Documentação de hoje e de amanhã: uma abordagem revisitada e contemporânea da ciência da informação e de suas aplicações biblioteconômicas, documentárias, arquivísticas e museológicas. 4. ed. rev. e ampl. Brasília, 2005. 409 p. ROSENFELD, L.; MORVILLE, P. Information architecture for the world wide web. Sebastopol, CA: O’Reilly, 1998. 202 p. ROTHENBERG, J. Metadata to support data quality and longevity. In: PROCEEDINGS OF THE IEEE METADATA CONFERENCE, 1., 1996, Proceedings… Silver Spring: NOAA Complex, 1996. Disponível em: <http://www.computer.org/conferences/meta96/rothenberg_Paper/ieee.data-quality.html>. Acesso em: 11 mar. 2007. SANTOS, P. L. V. A. C. As novas tecnologias na formação do profissional da informação. In: VALENTIM, M. L. P. (Org.). Formação do profissional da informação. São Paulo: Polis, 2002. p. 103-116. SANTOS, P. L. V. A. da C.; VIDOTTI, S. A. B. G. Formas de representação. Aula proferida na disciplina “Formas de Representação da Informação: dos catálogos aos repositórios digitais”. Programa de Pós-Graduação em Ciência da Informação. Marília, UNESP, maio/jul. 2007. SARACEVIC, T. Interdisciplinary nature of information science. Ciência da Informação, Brasília, v. 24, n. 1, p. 36-41, 1995. SHADBOLT, N.; HALL, W.; BERNERS-LEE, T. The semantic web revisited. IEEE Intelligent Systems, vol. 21, no. 3, pp. 96-101, May/Jun. 2006. Disponível em: < http://eprints.ecs.soton.ac.uk/12614/01/Semantic_Web_Revisted.pdf>. Acesso em: 02 ago. 2007. SHERA, J. H.; CLEVELAND, D. B. History and foundations of information science. ARIST - Annual Review of Information Science and Technology. Washington, CO, v. 12, p. 249-275, 1977. SIQUEIRA, M. A. XML na ciência da informação: uma análise do MARC21. 2003. 133 f. Dissertação (Mestrado em Ciência da Informação) - Faculdade de Filosofia e Ciências, Universidade Estadual Paulista, Marília, 2003. SIQUEIRA, M. A.; SANTOS, P. L. V. A. da C. A versão em XML do MARC21 e as formas de representação descritiva na ciência da informação. In: VIDOTTI, S. A. B. G. (Org.).

Page 180: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

178

Tecnologia e conteúdos informacionais: abordagens teóricas e práticas. São Paulo: Polis, 2004. p. 95-111. SOUZA, R. R. ; ALVARENGA, L. A web semântica e suas contribuições para a ciência da informação. Ciência da Informação, Brasília, v. 33, n. 1, p. 132-141, jan./abr. 2004. SOUZA, M. I. F.; VENDRUSCULO, L. G.; MELO, G. C. Metadados para a descrição de recursos de informação eletrônica: utilização do padrão Dublin Core. Ciência da Informação, Brasília, v. 29, n. 1, p. 93-102, jan./abr. 2000. STUBER, W. D.; FRANCO, A. C. de P. A Internet sob a ótica jurídica. 1999. Disponível em: <http://www.jcampos.com.br/info2.ht.1999>. Acesso em: 28 fev. 2007. SYNAK, M. MarcOnt Ontology: Semantic MARC21 Description for L2L & L2C Communication. 2005. 126 f. Master’s Thesis (Informatics, Distributed Computer Systems) - Faculty of Eletronics, Telecommunications and Informatics, Gdańsk University of Technology, Gdańsk, 2005. Disponível em: <http://library.deri.ie/servlet/showPDF?docId=http%3a%2f%2flibrary.deri.ie%2fresource%2f3a9faf28&chapter=1&view=pdf>. Acesso em: 25 jul. 2007. TÁLAMO, M. F. G. M. Quando a informação e o conhecimento fazem a diferença. Aula proferida na disciplina “Conceitos e Métodos da Ciência da Informação”. Programa de Pós-Graduação em Ciência da Informação. Marília, UNESP, ago./dez. 2006. TILLET, B. B. What is FRBR?: a conceptual model for the bibliographic universe. [S.l.]: Library of Congress/Cataloging Distribution Service, Feb. 2004. Disponível em: <http://www.loc.gov/cds/FRBR.html>. Acesso em: 19 jun. 2007. TILLET, B. B. RDA and FRBR: next big things in cataloging. Massachusetts: Massachusetts Library Association Technical Services Section, May 4, 2007. Disponível em: < http://www.collectionscanada.ca/jsc/docs/mlardappt-may07-bt.pdf>. Acesso em: 19 jun. 2007. TOUTAIN, L. M. B. B. Biblioteca digital: definição de termos. In: MARCONDES, C. H. et al. (Org.). Bibliotecas digitais: saberes e práticas. 2. ed. Salvador: EDUFBA; Brasília: IBICT, 2006. p. 15-24. TSENG, S. C. À procura do sistema de gestão de conhecimentos mais efectivo: entrevista com a Professora Sally C. Tseng, pioneira do sistema Metadata. Agenda, jan. 2005. ISSN 1810-0120. Disponível em: <http://www.library.gov.mo/Newsletter/2005/nl0501p_3.asp>. Acesso em: 22 jun. 2007.

Page 181: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

179

VALENTIM, M. L. P. Ética profissional na área de ciência da informação. In: ______. (Org.). Atuação profissional na área de informação. São Paulo: Polis, 2004. cap. 3, p. 55-69. VICENTINI, L. A. Gestão em bibliotecas digitais. In: MARCONDES, C. H. et al. (Org.). Bibliotecas digitais: saberes e práticas. 2. ed. Salvador: EDUFBA; Brasília: IBICT, 2006. p. 239-257. VIDOTTI, S. A. B. G.; SANT’ANA, R. G. Infra-estrutura tecnológica de uma biblioteca digital: elementos básicos. In: MARCONDES, C. H. et al. (Org.). Bibliotecas digitais: saberes e práticas. 2. ed. Salvador: EDUFBA; Brasília: IBICT, 2006. p. 77-93. WAINWRIGHT, E. Digital libraries: some implications for government and education from the Australian development experience. Canberra, Austrália: National Library of Australia, 1996. Disponível em: <http://www.nla.gov.au/nla/staffpaper/ew6.html>. Acesso em: 12 mar. 2007. WERSIG, G. Information science: the study of postmodern knowledge usage. Information processing & Management, v. 29, n. 2, p. 229-239, 1993. W3C. RDF Primer. 2004. Disponível em: <http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example16>. Acesso em: 19 jul. 2007.

Page 182: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

180

BIBLIOGRAFIABIBLIOGRAFIABIBLIOGRAFIABIBLIOGRAFIA CONSULTADACONSULTADACONSULTADACONSULTADA

Page 183: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

181

BIBLIOGRAFIA CONSULTADA AMERICAN LIBRARY ASSOCIATION. About AACR2. 2006. Disponível em: <http://www.aacr2.org/about.html>. Acesso em: 31 jul. 2007. BABINI, D.; FRAGA, J. Bibliotecas virtuales para las ciências sociales. Buenos Aires: Clacso, 2004. 120 p. BALBY, C. N. Formatos de intercâmbio de registros bibliográficos: conceitos básicos. Cadernos da F.F.C. Marília, v.4, n.1, 1995. p. 29-35. BEZERRA, F. M. P.; PINTO, V. B. Web semântica: uma proposta de produção de sentidos para a recuperação de informações no ciberespaço. In: CONGRESSO BRASILEIRO DE BIBLIOTECONOMIA, DOCUMENTAÇÃO E CIÊNCIA DA INFORMAÇÃO - CBBD, 22., 2007, Brasília. Anais... Brasília: FEBAB, 2007. 1 CD-ROM.

BLATTMANN, U.; SILVA, F. C. C. da. Colaboração e interação na web 2.0 e biblioteca 2.0. Revista ACB: Biblioteconomia em Santa Catarina, Florianópolis, v. 12, n. 2, p. 191-215, jul./dez., 2007. CAMPOS, L. F. de B. Web 2.0, Biblioteca 2.0 e ciência da informação: um protótipo para disseminação seletiva de informação na web utilizando mashups e feeds RSS. In: ENCONTRO NACIONAL DE PESQUISA EM CIÊNCIA DA INFORMAÇÃO – ENANCIB, 8., 2007, Salvador. Anais… Salvador, 2007. 16 p. 1 CD-ROM.

CARDOSO, J. C; OLIVEIRA, J. B. Uma proposta de interface para bibliotecas digitais configuráveis ao perfil do usuário. Porto Alegre, 2000. Plano de Estudo e Pesquisa. CHAVES, M. S. Padrões em bibliotecas digitais. 2002. 58 f. Dissertação (Mestrado em Ciência da Computação) - Pontifícia Universidade Católica do Rio Grande do Sul, Porto Alegre, 2002. CURRÁS, E. Ontologías, taxonomía y tesauros: manual de construcción y uso. 3. ed. act. Y ampl. España: Trea, 2005. 337 p. DAVIES, J.; FENSEL, D.; HARMELEN, F. Towards the semantic web: ontology-driven knowledge management. England: John Wiley & Sons, 2005. 288 p.

Page 184: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

182

DOWNES, S. Collaboration tools and web 2.0. Aug. 2007. Disponível em: <http://www.slideshare.net/Downes/collaboration-tools-and-web-20/>. Acesso em: 09 jan. 2008. EL-SERBINI, M. Metadata and the future of cataloging. Library Computing, [S.l.], v. 19, n. 3/4, p. 180-191, 2000. FENSEL, D. et al. Spinning the semantic web: bringing the world wide web to its full potential. Cambridge: The MIT Press, 2005. 479 p. FERREIRA JÚNIOR, H. da S. Otlet realizador ou visionário? O que existe em um nome? Ciência da Informação, Brasília, v. 35, n. 2, p. 9-16, maio/ago. 2006. GARRIDO ARILLA, M. R. Teoria e historia de la catalogación de documentos. Madrid: Sintesis, 1999. HILARIO, A. B. R. Nuevos horizontes en el análisis de los registros y la normativa bibliográfica. España: Trea, 2003. 165 p. KLENSIN, J. C. When the metadata exceed the data: data management with uncertain data. Statistics and Computing, v. 5, p. 73-84, 1995. LÉVY, P. A inteligência coletiva: por uma antropologia do ciberespaço. São Paulo: Loyola, 2000. LIMA-MARQUES, M. Ontologias: da filosofia à representação do conhecimento. Brasília: Thesaurus, 2006. 69 p. LORIST. H. H. J. ; MEER, K. V. D. Standards for digital libraries and archives: digital longevity. 2001. Disponível em: <http://www.betade.tudelft.nl/publications/LoristMeer_ICEIS2001.pdf>. Acesso em: 21 set. 2005. MACHADO, A. M. N. Informação e controle bibliográfico: um olhar sobre a cibernética. São Paulo: UNESP, 2003. 159 p. MANESS, J. M. Library 2.0 theory: web 2.0 and its implications for libraries. WeboLogy, v. 3, n. 2, jun. 2006. Disponível em: <http://www.webology.ir/2006/v3n2/a25.html>. Acesso em: 04 jan. 2008.

Page 185: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

183

MÉNDEZ RODRÍGUEZ, E. Metadados y recuperación de información: estándares, problemas y aplicabilidad em bibliotecas digitales. Gijón: Trea, 2002. 429 p. MODESTO, F. Metadados: introdução básica. São Paulo, 2005. Apostila de aula da disciplina de representação descritiva II. Disponível em: <http://www.eca.usp.br/prof/fmodesto/textos/metadado2005f.pdf>. Acesso em: 25 mar. 2007. ORTIZ-REPISO JIMÉNEZ, V. Qué enseñamos después del MARC? Organizacion del Conocimiento en Sistemas de Información y Documentación, Zaragoza, v. 03, p. 217-225, 1999. RICH, E. Inteligência artificial. São Paulo: McGraw-Hill, 1988. 503 p. ROCHA, R. P. da. Metadados, web semântica, categorização automática: combinando esforços humanos e computacionais para a descoberta e uso dos recursos da web. Em Questão, Porto Alegre, v. 10, n. 1, p. 109-121, jan./jun. 2004. ROSETTO, M. Metadados: novos modelos para descrever recursos de informação digital. In: INTEGRAR: CONGRESSO INTERNACIONAL DE ARQUIVOS, BIBLIOTECAS, CENTROS DE DOCUMENTAÇÃO E MUSEUS, 1., São Paulo. Textos... São Paulo: Imprensa Oficial do Estado, 2002, p. 485-498. ROSETTO, M. Metadados e recuperação da informação: padrões para bibliotecas digitais. In: SIMPÓSIO INTERNACIONAL DE PROPRIEDADE INTELECTUAL, INFORMAÇÃO E ÉTICA – CIBERÉTICA, 2., 2003, Florianópolis. Anais... Florianópolis, 2003. ROWLEY, J. A biblioteca eletrônica. 2. ed. Brasília: Briquet de Lemos/Livros, 2002. SEMANTIC WEB. Disponível em: <http://www.semanticweb.org/about.html>. Acesso em: 25 ago. 2005. SENSO, J. A.; ROSA PIÑERO, A. de la. El concepto de metadato. Algo más que descripción de recursos eletrónicos. Ciência da Informação, Brasília, v. 32, n. 2, p. 95-106, maio/ago. 2003. SYNAK, M. ; KRUK, S. R. MarcOnt initiative: the ontology for the librarian world. Greece, May 2005. Disponível em: <http://www.marcont.org/marcont/pdf/ms_eswc2005marcont.pdf>. Acesso em: 06 jan. 2008.

Page 186: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

184

ANEXOSANEXOSANEXOSANEXOS

Page 187: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

185

ANEXO A – Regras de transformação entre os padrões de metadados

Extraído de: SYNAK, M. MarcOnt Ontology: Semantic MARC21 Description for L2L & L2C Communication. 2005. 126 f. Master’s Thesis (Informatics, Distributed Computer Systems) - Faculty of Eletronics, Telecommunications and Informatics, Gdańsk University of Technology, Gdańsk, 2005. Disponível em: <http://library.deri.ie/servlet/showPDF?docId=http%3a%2f%2flibrary.deri.ie%2fresource%2f3a9faf28&chapter=1&view=pdf>. Acesso em: 25 jul. 2007.

Page 188: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

186

Page 189: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

187

Page 190: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

188

Page 191: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

189

Page 192: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

190

Page 193: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

191

Page 194: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

192

Page 195: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

193

Page 196: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

194

Page 197: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

195

Page 198: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

196

Page 199: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

197

Page 200: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

198

Page 201: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

199

Page 202: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

200

Page 203: FABIANO FERREIRA DE CASTRO - Unesp - Faculdade de ... · de Filosofia e Ciências – Universidade Estadual Paulista, 2008. ... Desde o tempo do GOU (Grupo de Oração Universitário)

201