do - bibliotextos. planilha para o delineamento de planos de emergência 26. controle integrado de...

46
CONSERVAÇÃO PREVENTIVA EM BIBLIOTECAS E ARQUIVOS 49 Do microfilme à imagem digital Do microfilme à imagem digital 2 edição a Donald J. Waters Donald J. Waters

Upload: vuongtruc

Post on 13-May-2018

216 views

Category:

Documents


1 download

TRANSCRIPT

Armazenagem e manuseio

Conservação

Meio Ambiente

Emergências

1. Métodos de armazenamento e práticas demanuseio2. A limpeza de livros e de prateleiras3. A escolha de invólucros de qualidadearquivística para armazenagem de livros edocumentos4. Invólucros de cartão para pequenos livros5. A jaqueta de poliéster para livros6. Suporte para livros: descrição e usos7. Montagens e molduras para trabalhosartísticos e artefatos em papel8. Mobiliário de armazenagem: um breveresumo das opções atuais9. Soluções para armazenagem de artefatosde grandes dimensões

10. Planificação do papel por meio deumidificação11. Como fazer o seu próprio passe-partout12. Preservação de livros de recortes e álbuns13. Manual de pequenos reparos em livros

14. Temperatura, umidade relativa do ar, luz equalidade do ar: diretrizes básicas depreservação15. A proteção contra danos provocados pelaluz16. Monitoramento da temperatura eumidade relativa17. A proteção de livros e papéis duranteexposições18. Isopermas: uma ferramenta para ogerenciamento ambiental19. Novas ferramentas para preservação-avaliando os efeitos ambientais a longo prazosobre coleções de bibliotecas e arquivos

20. Planejamento para casos de emergência21. Segurança contra as perdas: danosprovocados por água e fogo, agentesbiológicos, roubo e vandalismo22. Secagem de livros e documentosmolhados23. A proteção de coleções durante obras24. Salvamento de fotografias em casos deemergência25. Planilha para o delineamento de planosde emergência26. Controle integrado de pragas27. A proteção de livros e papel contra omofo28. Como lidar com uma invasão de mofo:instruções em resposta a uma situação deemergência29. Controle de insetos por meio de gasesinertes em arquivos e bibliotecas

Armazenagem e manuseio

Conservação

Meio Ambiente

Emergências

Planejamento

Edifício/Preservação

Fotografias e filmes

Registros sonoros e fitas magnéticas

Reformatação

30. Planejamento para preservação31. Políticas de desenvolvimento de coleção epreservação32. Planejamento de um programa eficaz demanutenção de acervos33. Desenvolvimento, gerenciamento epreservação de coleções34. Seleção para preservação: umaabordagem materialística35. Considerações complementares sobre:"Seleção para preservação: uma abordagemmaterialística"36. Implementando um programa de reparoe tratamento de livros37. Programa de Planejamento dePreservação: um manual para auto-instruçãode bibliotecas

38. Considerações sobre preservação naconstrução e reforma de bibliotecas:planejamento para preservação

39. Preservação de fotografias: métodosbásicos para salvaguardar suas coleções40. Guia do Image Permanence Institute (IPI)para armazenamento de filmes de acetato41. Indicações para o cuidado e aidentificação da base de filmes fotográficos

42. Armazenamento e manuseio de fitasmagnéticas43. Guarda e manuseio de materiais deregistro sonoro

44. O básico sobre o processo de digitalizarimagens45. Microfilme de preservação: plataformapara sistemas digitais de acesso46. O processo decisório em preservação efotocopiagem para arquivamento47. Controle de qualidade em cópiaseletrostáticas para arquivamento48. Microfilmagem de preservação: um guiapara bibliotecários e arquivistas49. Do microfilme à imagem digital50. Uma abordagem de sistemas híbridospara a preservação de materiais impressos51. Requisitos de resolução digital para textos:métodos para o estabelecimento de critériosde qualidade de imagem52. Preservação no universo digital53. Manual do RLG para microfilmagem dearquivos

Planejamento

Edifício/Preservação

Fotografias e filmes

Registros sonoros e fitas magnéticas

Reformatação

Títulos PublicadosTítulos Publicados

CONSERVAÇÃO PREVENTIVA

EM BIBLIOTECAS E ARQUIVOS

49

Do microfilme à imagem digitalDo microfilme à imagem digital

2 ediçãoa

Donald J. WatersDonald J. Waters

capa 49.psD:\Trabalho\Clientes\CPBA\Capas Final\capa 49.cdrter a-feira, 19 de junho de 2001 18:08:54

Perfil de cores: DesativadoComposi ªo Tela padrªo

��� ��������� �� ��� �� �� ����������������������������������������

������ ������� � ��������� �� ������������� ��� ��� �� ������ �� �����

����������� �� ������������������� �� ��������

��� �����

Donald J. Waters

���������� � �������� ������ �������������������������� �����

����

W329 Waters, Donald J.

Do microfilme a imagem digital : como executar um projeto para estudo dosmeios, custos e benefícios de conversão para imagens digitais de grandesquantidades de documentos preservados em microfilme / Donald J. Waters ;[tradução José Luiz Pedersoli Júnior ; revisão técnica Mauro Resende deCastro, Ana Virginia Pinheiro, Dely Bezerra de Miranda Santos; revisão finalCássia Maria Mello da Silva, Lena Brasil] . – 2. ed. – Rio de Janeiro : ProjetoConservação Preventiva em Bibliotecas e Arquivos: Arquivo Nacional,2001.

43 p. : il. ; 30 cm. – (Conservação Preventiva em Bibliotecas e Arquivos;49. Reformatação).

Inclui bibliografias.ISBN 85-7009-053-6.

1. Microfilmagem. 2. Reprografia. I. Título. II. Série.

CDD 686.43

Copyright ©1991 by The Commission on Preservation and Access.

Título original, publicado por The Commission on Preservation and Access:From Microfilm to digital imagery: on the feasibility of a project to study the means, costs and benefits ofconverting large quantities of preserved library materials from microfilm to digital images.Autor: Donald J. Waters

Projeto cooperativo interinstitucional Conservação Preventiva em Bibliotecas e Arquivos, em parceria com oCLIR - Council on Library and Information Resources (Conselho de Recursos em Biblioteconomia eInformação, que incorporou a antiga Commission on Preservation and Access).

Suporte FinanceiroThe Andrew W. Mellon FoundationVitae, Apoio à Cultura, Educação e Promoção Social

ApoioArquivo NacionalFundação Getulio Vargas

CoordenaçãoIngrid Beck

ColaboraçãoSérgio Conde de Albite Silva

TraduçãoJosé Luiz Pedersoli Júnior

Revisão TécnicaMauro Resende de CastroAna Virginia PinheiroDely Bezerra de Miranda Santos

Revisão FinalCássia Maria Mello da SilvaLena Brasil

Projeto GráficoT’AI Comunicações

Coordenação EditorialEdnéa Pinheiro da SilvaAnamaria da Costa Cruz

Impresso em papel alcalino.

Sumário

Apresentação 5

Prefácio da Commission on Preservation and Access 7

Introdução 9

Visão 10

Preservando o acesso através da preservação 14

Uma economia de escolhas 18

Arquitetura do sistema 25

Plano de trabalho 34

Conclusão 42

Notas 43

4

5

Apresentação

O Projeto Conservação Preventiva em Bibliotecas e Arquivos - CPBA éuma experiência de cooperação entre instituições brasileiras e a organização norte-americana Commission on Preservation and Access, atualmente incorporada aoCLIR - Council on Library and Information Resources (Conselho de Recursosem Biblioteconomia e Informação).

Em 1997, o Projeto traduziu e publicou 52 textos sobre o planejamento e ogerenciamento de programas de conservação preventiva, onde se insere o controledas condições ambientais, a prevenção contra riscos e o salvamento de coleções emsituações de emergência, a armazenagem e conservação de livros e documentos, defilmes, fotografias e meios magnéticos; e a reformatação envolvendo os recursos dareprodução eletrônica, da microfilmagem e da digitalização.

Reunidos em 23 cadernos temáticos, estes textos, somando quase mil páginas,foram impressos com uma tiragem de dois mil exemplares e doados a colaboradores,instituições de ensino e demais instituições cadastradas no banco de dados do Projeto.

Esta segunda edição revisada, com uma tiragem de mais dois mil exemplares,pretende, em continuidade, beneficiar, as instituições e os profissionais de ensino, etodas aquelas instituições inscritas no banco de dados depois de 1997 e que nãochegaram a receber os textos.

O presente caderno, de número 49, relata aspectos de um projeto de conversãode microfilme em imagem digital, desenvolvido nos Estados Unidos. Aborda não apenasa tecnologia, mas a preocupação de assegurar a preservação da informação, o seuuso e acesso. Apresenta um plano de trabalho para desenvolver sistemas práticospara a conversão de microfilme em imagem digital. Mapeia a arquitetura de um sistemade reprodução digital de imagens, identificando pontos críticos. Ao final apresenta oescopo do projeto aplicado na Universidade de Yale, em uma biblioteca de 10 millivros, digitalizados a partir de cópias em microfilme.

Este texto, assim como todo o conjunto de publicações do Projeto CPBA,encontra-se disponível em forma eletrônica na página do Projeto, www.cpba.net.

Além das publicações distribuídas em 1997, o Projeto CPBA ainda formoumultiplicadores, por meio de seminários organizados nas cinco regiões brasileiras,com o apoio de instituições cooperativas. Os multiplicadores organizaram novos eventos,estimulando a prática da conservação preventiva nas instituições. No início de 2001 oprojeto já contabilizava mais de 120 eventos realizados, somando mais de quatro milpessoas envolvidas. Os inúmeros desdobramentos ocorridos a partir dos colaboradoresem todo o país fizeram o Projeto merecedor, em 1998, do Prêmio Rodrigo Melo Francode Andrade.

Entre 1997 e 2001, o Projeto CPBA continuou promovendo seminários ecursos, envolvendo as instituições cooperativas. Em muitas ocasiões enviou professorese especialistas aos eventos organizados pelos multiplicadores. No início de 2001 oProjeto já contabilizava mais de 120 eventos realizados em todo o país, somando maisde 4.000 pessoas envolvidas.

6

As instituições que colaboram com o Projeto CPBA estão relacionadas napágina www.cpba.net , onde também poderá ser acessado o seu banco de dados, commais de 2.600 instituições cadastradas. Esta página virtual pretende ser uma plataformapara o intercâmbio técnico e o desenvolvimento de ações cooperativas.

Desde o início o Projeto contou com recursos financeiros da Andrew W.Mellon Foundation e de VITAE, Apoio à Cultura, Educação e Promoção Social.Em 1998 estes patrocinadores aprovaram um segundo aporte financeiro, com o objetivode dar continuidade às ações empreendidas e de preparar esta segunda edição.

O Projeto agradece o generoso apoio recebido de seus patrocinadores e dasinstituições cooperativas, brasileiras e estrangeiras, reconhecendo que sem esta parcerianada teria acontecido. Deseja também agradecer aos autores e editores das publicaçõesdisponibilizadas, por terem cedido gratuitamente os direitos autorais. Agradecimentosespeciais ao Arquivo Nacional, que hospedou o Projeto desde o seu início, assimcomo à Fundação Getulio Vargas, pela administração financeira dos recursos.

Considerando que a fase do Projeto apoiada pela Fundação Mellon se encerraem junho de 2001, o grupo cooperativo espera encontrar, em continuidade,colaboradores e parceiros no Brasil, para que o processo de difusão do conhecimentoda preservação não seja interrompido.

Rio de Janeiro, junho de 2001.

Ingrid BeckCoordenadora do Projeto CPBA

7

Prefácio da Commission on Preservation and Access

Em um relatório da Commission, Michael Lesk, membro do Technology Assessment AdvisoryCommittee, declara que é recomendável, a longo prazo, a conversão de microfilme para imagemdigital objetivando a preservação e o acesso de documentos em deterioração, sendo tecnicamentepossível e relativamente barata de se realizar (Image formats for preservations & access, julho de1990, página 8). Contudo, a tecnologia de imagem digital está ainda em desenvolvimento, os padrõespara hardware e software continuam a evoluir e a conversão de microfilme para formatos de imagemdigital ainda não está amplamente testada nas bibliotecas.

No estágio atual, é essencial direcionar a pesquisa e o investimento ao desenvolvimento desistemas para gerenciamento da conversão digital, armazenamento e acesso, para que possam serutilizados por universidades e bibliotecas de pesquisa. É para o desenvolvimento de tais sistemas quea Biblioteca da Universidade de Yale direcionou seus esforços neste estudo de planejamento.

O estudo, encomendado pela Commission, explora a exeqüibilidade de um projeto para estudaros meios, custos e benefícios da conversão para imagens digitais de grandes quantidades de documentosde bibliotecas, preservados em microfilme. O Estudo identifica as necessidades visando um projetomaior, de anos de duração, para proporcionar acesso tanto intra quanto inter-institucional às imagensarmazenadas e para investigar as implicações mais gerais da intensificação do acesso intelectual àdocumentação digitalizada. A Commission espera que os resultados se constituam numa importantecontribuição à nossa capacidade de utilização das novas tecnologias digitais para propósitos depreservação. Cópias gratuitas das publicações deste relatório foram distribuídas aos assinantes daCommission.

8

9

Introdução

Nas últimas três décadas, o processo de microfilmagem foi considerado o mais eficiente para apreservação de documentos em deterioração nas bibliotecas: o microfilme é durável, desde quearmazenado num ambiente controlado e que bibliotecas e arquivos sigam procedimentos e especificaçõesnormatizados, podendo partilhar até mesmo instalações comuns na microfilmagem. Os custos do processosão previsíveis, variando de 10 a 15 centavos de dólar por página, excluindo-se os custos de despesasgerais administrativas e da seleção do material a ser microfilmado. Além disso, a tecnologia para se teracesso ao microfilme é estável e dificilmente sofrerá qualquer alteração significativa no futuro. Emresumo, para a solução do problema dos livros quebradiços, que atualmente afeta todos os depósitosde material impresso sobre papel ácido, o microfilme é essencialmente livre de riscos

1.

Michael Lesk, gerente da Divisão de Pesquisa em Ciência da Computação na Bellcore, em umrecente relatório apresentado à Commission on Preservation and Access, ratificou a utilização domicrofilme para preservação nos dias atuais. Contudo, ele foi relativamente cauteloso no tocante à suavisão sobre o papel do microfilme no futuro, argumentando que o mesmo, provavelmente, não é aúltima etapa no processo de preservação. Mais propriamente, argumentou ele, o microfilme é “umrazoável passo intermediário para a obtenção de imagens digitais”, que é o processo de escaneamentode livros para armazenagem em computadores

2.

Apesar de Lesk ter admitido que a tecnologia de reprodução digital é cara e que “ainda não estábem estabelecida”, ele argumentou fortemente que esta tecnologia encerra uma promessa fundamentalà missão das bibliotecas de gerar, preservar e otimizar o acesso ao conhecimento registrado. Eleobservou que a conversão de microfilme para imagem digital é tecnicamente possível hoje e argumentouque os usuários de bibliotecas irão, a longo prazo, exigir os resultados de tal conversão. Previu, ainda,que a tecnologia de imagem digital, incluindo a possibilidade de conversão a partir do microfilme,“estará ao alcance da maioria das bibliotecas ainda nesta década” e incentivou o desenvolvimento depesquisas e investimentos, hoje, para o “desenvolvimento de sistemas que possam ser utilizados porbibliotecas comuns” no futuro

3.

A biblioteca da Universidade de Yale, uma das primeiras instituições a desenvolver práticas demicrofilmagem para preservação, está atualmente envolvida nos estágios iniciais de um esforço amploe de longo prazo visando a desenvolver sistemas práticos para a conversão de microfilme em imagemdigital e, assim, compreender melhor a relação adequada entre as duas tecnologias na prática depreservação futura. Este relatório resume os resultados da fase inicial de planejamento do projetomaior. Na próxima seção, começa-se a articular uma visão do lugar a ser ocupado pela tecnologiadigital em uma biblioteca de pesquisa como a de Yale. Em seguida, faz-se um esboço de economia de

1 Nancy E. Gwinn (Ed.). Preservation microfilming: a guide for librarians and archivists. Chicago: American Library Association,

1987. p. xxxvi; John C. Mallinson. On the preservation of human and machine-readable records. Information Technology andLibraries, v. 7, no. 1, p. 22, Mar. 1988.2 Michael Lesk. Digital imagery, preservatioon and access. Information Technology and Libraries, v. 9, no. 4, p. 307, Dec. 1990.

3 Idem, ibidem, p. 308.

1 0

escolhas e organização na qual a conversão de microfilme para imagem digital pode surgir como umaopção viável de preservação. O relatório mapeia a arquitetura de um sistema de reprodução digital deimagens e identifica pontos críticos de exeqüibilidade. Finalmente, o relatório apresenta um plano detrabalho para um projeto de demonstração, que investigará em profundidade os custos e benefícios daconversão no processo de construção de uma biblioteca digitalizada de 10 mil livros a partir de cópiasem microfilme.

Visão

Para uma visão ampla do futuro papel das bibliotecas de pesquisa na universidade, deve-seolhar cuidadosamente, e de perto, a maneira como os estudiosos trabalham para produzir e disseminaro conhecimento. Uma série de estudos recentes enfatiza que a qualidade e a quantidade da produçãodos estudiosos em todas as disciplinas dependem decisivamente do acesso pronto e oportuno àinformação relevante. A biblioteca do futuro, para estes pesquisadores, não será necessariamente uma‘biblioteca eletrônica’, nem será sua a missão de preservar simplesmente o conhecimento registrado.Ela terá, sim, como objetivo, mais apropriadamente, a geração, a preservação e a melhoria para seususuários do pronto acesso — físico e intelectual — ao conhecimento registrado. Tecnologias emergentes,como a de imagem digital, terão então uma posição fundamental, na medida em que ajudam a sustentara missão geral da biblioteca.

O Valor do Acesso

Iniciando em 1985, o Research Libraries Group estabeleceu um Programa Especial paraGerenciamento da Informação de Pesquisa, PRIMA. O programa resultou em uma avaliação detalhadadas necessidades de informação em mais de 20 disciplinas de três grandes áreas de conhecimento:Ciências Humanas, Ciências Sociais e Ciências Físicas. Entre as várias necessidades que emergiramdessas avaliações, muitas eram específicas das disciplinas em estudo. Um tema, contudo, percorretodos os estudos e aplica-se a todas as disciplinas: os estudiosos, usando as palavras expressas norelatório sobre as necessidades de informação na área de humanas — “preferem os métodos familiarese não sistemáticos de consulta às notas de pé de página e aos colegas”

4. Nenhuma evidência é fornecida

nos relatórios para justificar a caracterização destes métodos como “não sistemáticos”, mas está claroque, para os pesquisadores, o valor de se consultar as notas de pé de página e os colegas está no fatode que esses métodos são pronta e facilmente acessíveis.

Um estudo patrocinado pelo Faxon Insitute for Advanced Studies in Scholarly and ScientificCommunication, apresentado numa conferência em abril de 1991, aborda o mesmo ponto, comrespeito aos cientistas, de forma ainda mais intensa. O estudo examinou o comportamento de umnúmero significativo de profissionais da área científica com relação à forma como eles adquiriam eutilizavam informações em seu trabalho. O estudo concentrou-se no uso da informação por profissionais

4 Constance C. Gould. Information needs in the humanities: na assessment. Mountain View, Ca.: Research Libraries Group, p. 51;

Constance C. Gould and Mark-Handler. Information needs in the social sciences: na assessment. Montain View, Ca.: ResearchLibraries Group, 1989; Constance C. Gould. Information needs in the sciences: na assessment. Mountain View, Ca.: ResearchLibraries Group, 1991.

1 1

dos níveis júnior, intermediário e sênior nas disciplinas de Química, Genética e Ciência da Computação,em instituições acadêmicas privadas e governamentais. Baseado em contagens diárias dos chamadosencontros de informação, definidos como “qualquer utilização ou aquisição de informação, idéias oudados que se relacionam à substância de sua profissão”, o estudo do Faxon Institute contém grandevolume de informações valiosas e reveladoras sobre a “capacidade de obter informações” percebidanos profissionais investigados, o tipo de fontes que eles usam para obter informação, a freqüência coma qual utilizam tais fontes, o tempo que gastam coletando informação, o uso que é dado à informaçãoe, especialmente, seus métodos ou maneiras de obter as informações necessárias.

5

A Tabela 1 resume alguns dos resultados do estudo do Faxon Institute e indica claramenteque os pesquisadores da área científica dependem intensamente, para seus trabalhos produtivos, dasfontes de informação prontamente disponíveis. A opinião dos participantes do estudo era de que abiblioteca é tão útil quanto consultar suas próprias bibliotecas particulares ou discutir pessoalmente oassunto. Contudo, eles usavam a biblioteca com muito menos freqüência do que as outras formas deobter informações, presumivelmente porque consome-se algum tempo ao se deslocar até a bibliotecae utilizá-la. Além disso, a consulta ao material disponível na biblioteca pessoal de um dado pesquisadorocorreu em um número bem maior de ‘encontros de informação’ do que qualquer outro método e foi,junto com o correio eletrônico, a forma utilizada com maior freqüência. E mais, se todos os métodosde consulta a colegas — conversa pessoal, telefonemas, comunicações por escrito, correio eletrônicoe fax — forem combinados, a pesquisa do Instituto Faxon sugere que a rede pessoal de colegas de umdado pesquisador ocupa o primeiro lugar e que a biblioteca ocupa um distante terceiro lugar naporcentagem de utilização para solucionar um problema de coleta de informação.

��������������������� ����� � ������� ������ ����������

���������������� ������������������������������� ���

��������������������������� ���

������������������� �������������

���������� �������

������������������������ ��� ���������������� �������

!"������ #

$���������%&��������� ��� '()"* +), ,)+$��������� -!)"* .)/ ,)+0����� ���� ��� .+)"* ,), ,)+1������� !()"* +)( ,).0�������������� ����� ,)"* ')' ()+$� ��������� ������� �)"* .)� �)/0������������2���� ()"* !'), �).3�4 ')"* .)� �)/05�67� .)"* !)� ()!$$8 ")-* -)� ')-

5 Eric Almquist. An examination of work-related information acquisition and usage among scientific, technical and medical fields,

resultados de um estudo comissionado pelo Faxon Institute for Advanced Studies in Scholarly and Scientific Comunications,presented at the 1991 Faxon Institute Annual Conference, Creating users pathways to electronic information, Apr. 1991, Reston,Virginia, exhibit 2.6 Idem, ibidem, exhibits 9, 22 e 25.

1 2

A biblioteca acessível

Os resultados dos estudos do Research Libraries Group e do Faxon Institute, em geral, reforçamas conclusões de quase duas décadas de pesquisa sobre o comportamento dos estudiosos na busca dainformação.

7 Existem ainda muitos campos para trabalhos adicionais que venham a refinar e testar

rigorosamente estas conclusões, com relação às disciplinas e aos grupos de disciplinas. Precisa-se, emparticular, de informações mais detalhadas, no contexto destes estudos, sobre as maneiras como ospesquisadores das várias disciplinas realmente utilizam as bibliotecas. Porém, conforme estes estudossugerem, se os pesquisadores valorizam extremamente e tendem a optar pelo uso da informação que seencontra prontamente à mão, então uma medida decisiva do sucesso para as bibliotecas que planejamseu curso no futuro será a rapidez com que elas irão disponibilizar a informação para seus usuários.

Um modelo de biblioteca de acesso orientado pode ser esquematicamente retratado conformemostra a Figura 1. Este modelo é, obviamente, uma simplificação. Ele não representa adequadamentetodas as características da biblioteca e certamente não constitui a única maneira de caracterizar osistema. Para fins de discussão, contudo, ele destaca os principais componentes funcionais e suasinter-relações.

Neste modelo, coleções e serviços são os dois componentes primários da biblioteca. Aadministração da biblioteca é o terceiro elemento principal. A administração apoia e fortalece as funçõesdos serviços de acesso e de coleções através da organização e execução de serviços dentro dabiblioteca, como, por exemplo, gerenciamento de instalações, orçamento, pessoal e tecnologia, alémde representar a biblioteca junto aos seus usuários e a outras agências externas. Cabe, também, àadministração a incumbência de formular e articular a missão da biblioteca no contexto institucionallocal.

A missão da biblioteca de acessoorientado é a de gerar, preservar emelhorar o acesso às coleções deconhecimentos registrados. Esta missãogoverna a relação fundamental entre osserviços de acesso e as coleções dabiblioteca e seus usuários, e são de doistipos:

Acesso intelectual e físico

Os serviços de acesso intelectual,como a catalogação, descrevem eorganizam para os usuários da bibliotecaa informação em coleções de interesse

7 Ver exemplo, F. W. Lancaster. The measurement and evaluation of library services. Washington, D. C.: Information Resouces

Press, 1977. p. 313. Lancaster faz referência a uma série de estudos que defendem o argumento de que a “seleção de uma fonte deinformação se baseia quase que exclusivamente na acessibilidade, sendo a fonte (canal) mais acessível a primeira a ser escolhida;considerações a respeito de qualidade e confiabilidade são secundárias, apesar de serem fatores importantes para influenciar o grauem que o usuário está disposto a aceitar a informação fornecida por uma fonte específica”.

������ ���������������������������� �����������

1 3

local e geral. As descrições de uma obra geralmente se referem, de forma padronizada, a característicastais como autor, título, local e data de publicação, editor e formato; a organização é tipicamente porassunto. A disposição de materiais na coleção por assunto faz com que uma série de materiaisrelacionados se encontre disponível para os usuários da biblioteca e é um serviço de acesso intelectualespecialmente valorizado nos estudos em áreas humanas e nos estudos interdisciplinares, onde osmétodos associativos fazem dos resultados ‘fortuitos’ de se consultar diretamente as estantes dabiblioteca, um aspecto fundamental da pesquisa.

8 Outras dimensões do acesso intelectual incluem a

disponibilidade de uma estrutura de conteúdo do material, freqüentemente representada por um índice,e a disponibilidade de um índice remissivo do texto completo do material. Os serviços de acesso físico,como a circulação e os empréstimos interbibliotecas, referem-se aos métodos de distribuição que asbibliotecas utilizam para disponibilizar informações, pertencentes às coleções locais e/ou distantes,diretamente aos seus usuários.

Coleção e renovação da coleção

A noção de coleções de biblioteca refere-se à organização, seleção e meios de armazenagem dainformação. Para os usuários de uma biblioteca, as coleções mantidas no local são as mais importantes.Obviamente, as coleções de qualquer biblioteca de pesquisa representam apenas uma pequena fração doconteúdo de informação. Portanto, a responsabilidade por uma coleção local inclui, necessariamente, aresponsabilidade de distingui-la e relacioná-la a coleções existentes em outros locais.

Dentro da universidade, as coleções da biblioteca representam um grande, talvez o maior,investimento de capital. Como todo capital, a coleção de uma biblioteca está sujeita a processosdistintos e constantes de depreciação e renovação (Figura 2): o material é perdido ou extraviado,devendo ser substituído; novas aquisições aumentam a coleção; as coleções são depuradas e parte domaterial é descartado; o acervo existente se deteriora e deve ser restaurado ou conservado, podendoser preservado por cópia ou por conversão a outro formato, por exemplo, de papel para microfilme.

Em uma biblioteca de acessoorientado, cada um dos váriosprocessos de renovação da coleçãoé objeto de uma rigorosa avaliaçãoquanto à missão de serviço daorganização: qual a qualidade degeração, preservação ou melhoria doacesso físico e intelectual à coleção?Para os fins desta discussãoabordaremos um dos processos derenovação, a saber, a microfilmagempara preservação.

8 Lawrence Downler. Conference on research trends and library resouces. Harvard Library Bulletin, v. 1, no. 2, p. 8, Summer

1990.

������� ������ ���������������������

1 4

Preservando o acesso através da preservação

A deterioração de um documento devido à idade, à acidez ou à utilização excessiva limita tantoo acesso físico quanto o acesso intelectual ao mesmo. Quando um item deteriorado é selecionado parapreservação, ele é preparado de forma típica para a microfilmagem (Figura 3). Sendo um processofotográfico, o microfilme reproduz fielmente o material impresso original, incluindo manchas,descolorações, tinta esmaecida, notas dos usuários e as bordas viradas nos cantos das páginas. Oprocesso gera um filme de 35 mm em preto e branco, de alto contrate, em um determinado grau deredução, dependendo do tamanho do original. Os limites práticos da utilização de um meio preto ebranco de alto-contraste significam, obviamente, que a microfilmagem não pode reproduziradequadamente materiais com conteúdo de cor, ilustrações com gradações de cinza ou detalhesimpressos extremamente delicados. Para evitar a perda de informação hoje, em função da tecnologiadisponível, documentos com conteúdo desse tipo devem ser, sempre que possível, conservados emsua forma original.

9

Após a reprodução, uma cópia matriz do microfilme é guardada fora da biblioteca, em umambiente controlado, onde, com base em algumas estimativas, ela durará até 500 anos sem experimentaruma deterioração significativa. Uma cópia positiva e uma negativa do filme são armazenadas na coleçãode microfilmes da biblioteca. O filme pode ser posteriormente duplicado a partir da cópia negativa,com relativa facilidade, a um custo de aproximadamente US$ 20 por rolo e o processo copyflo podegerar uma cópia sobre papel a um custo de cerca de US$ 0,15 por página. Para itens com usoelevado, a biblioteca pode decidir por disponibilizar uma cópia em papel para leitura. Os usuários dabiblioteca podem obter, por meio de solicitação, uma cópia completa do documento em papel oupodem imprimir páginas selecionadas em um copiador de microfilme.

Confrontada com a perda total de conteúdo intelectual de um documento em deterioração, abiblioteca obtém vantagens significativas com a microfilmagem para preservação. O conteúdo é salvoe mantido na coleção, em uma forma compacta e durável, por meio de uma tecnologia que é relativamentesimples e bem estabelecida. Mas, por outro lado, o acesso intelectual e físico ao material, por partedos usuários, é significativamente diminuído.

Diferentemente de um livro, que pode ser carregado e utilizado praticamente em qualquer lugar,o microfilme obriga o usuário a utilizar um equipamento especial de projeção, em um local específico.O usuário pode ficar sabendo do conteúdo intelectual de um documento em microforma, em parte pormeio do registro bibliográfico criado durante o processo de microfilmagem, mas, ao converter depapel para microfilme, o processo divide uma coleção, de modo a não ser mais tão fácil beneficiar-seintelectualmente da associação física de um volume na estante com outros de conteúdo similar. Alémdisso, o microfilme é difícil de ser ‘folheado’ e de ser lido. Com uma leitora de microfilme, o usuárionão consegue utilizar, com a mesma facilidade do que em uma cópia em papel, o aparato estruturalinterno do volume — índice de assuntos, sumários dos capítulos, prefácios, notas de pé de página,índices remissivos etc. — para obter acesso rápido e eficiente ao conteúdo intelectual do volume, sejaele uma nota, página, capítulo ou alguma combinação dos mesmos

10. Por último, cópias impressas a

9 Michael Lesk, op. cit., p. 303.

1 5

partir de microfilme, utilizando tanto a tecnologia copyflo quanto a tecnologia de copiador, têm recebidopoucos elogios quanto às suas características de clareza e de resoluções.

Não é de se surpreender que, dadas estas deficiências, os usuários reclamem intensamente arespeito da utilização do microfilme. Sob um aspecto, essas queixas a respeito das deficiências domicrofilme parecem injustas: sem a microfilmagem para preservação, porções substanciais de coleçõesde bibliotecas estariam completamente perdidas. Neste contexto, a inconveniência de se usar o microfilmeparece desprezível. Contudo, dado o valor da acessibilidade à informação para os pesquisadores, abiblioteca é obrigada a assegurar que não pode aplicar nenhuma alternativa tecnológica melhor eeconomicamente efetiva, a não ser a microfilmagem, para salvar a conteúdo intelectual de materiais emrápida deterioração e, ao mesmo tempo, preservar ou melhorar o acesso dos pesquisadores ao material.Por esta razão, bibliotecas como a de Yale, em que mais de 80% da coleção encontra-se atualmenteou é potencialmente quebradiça, devem investigar os meios, os custos e os benefícios de se acrescentara seu kit de alternativas para preservação novas e promissoras ferramentas, incluindo a tecnologia deimagem digital.

Imagem digital

A tecnologia de imagem digital propicia os meios de se codificar digitalmente documentosescaneados em forma de imagem para armazenagem, transmissão e recuperação em sistemascomputadorizados. As imagens digitais produzidas que utilizam essa tecnologia contêm texto, mas otexto não é convertido e não é acessível na forma alfanumérica. Existem recursos para tal conversão,total ou parcial, pela aplicação às imagens digitais, de tecnologias de reconhecimento de caracteres. O

10 Blipping, isto é, a colocação de marcações especiais em fotogramas selecionados, pode facilitar a utilização do microfilme

especialmente se as marcações forem codificadas e indexadas em um sistema para recuperação automatizada. A técnica, contudo,tem sido aplicada principalmente em filmes de 16 mm. A UMI estabeleceu normas de uso interno para o blipping em filmes de 35mm. Se essas normas se tornarão amplamente disponíveis e aplicadas de forma generalizada ao microfilme de 35 mm parapreservação em bibliotecas, é o que se verá no futuro.

������ ��������������������� �����

Matriz

1 6

uso da imagem digital aqui idealizado é planejado para antecipar a aplicação eventual do reconhecimentode caracteres, mas não o incorpora no presente momento11.

A digitalização promete melhorar bastante a acessibilidade de materiais de preservação, emcomparação com o microfilme (Figura 4). O acesso físico à biblioteca de imagens digitais, e logicamenteao microfilme, requer equipamento especial. Em comparação às leitoras de microfilme, contudo, oequipamento de imagem digital — um poderoso computador com um monitor de resolução relativamentealta — é tecnologia de uso geral onde o acesso à biblioteca digital deve ser apenas uma das aplicações.Além disso, o pesquisador que se encontra fora da biblioteca, e possivelmente até mesmo ausente docampus da biblioteca que possui as imagens, pode ter acesso a elas de maneira relativamente fácil erápida, uma vez que as imagens digitais podem ser transmitidas pelas redes de alta velocidade jáinstaladas e interconectadas em muitos campi universitários. O pesquisador tem, também, aoportunidade, utilizando a tecnologia de imagem digital, de adicionar integral ou parcialmente odocumento de imagem a sua biblioteca pessoal através da requisição de uma cópia impressa. Estaterá, provavelmente, melhor qualidade e resolução mais alta que a equivalente produzida a partir demicrofilme e pode até ser substancialmente mais barata, novamente porque a tecnologia subjacenteserve para uso geral.

11 O reconhecimento de caracteres a partir de imagens escaneadas digitalmente levanta uma série desafiadora de questões. Em

primeiro lugar, apesar do reconhecimento dos caracteres alfanuméricos estar sendo constantemente aprimorado a precisão datecnologia atualmente disponível é frustrante. Em segundo lugar, há muito o que fazer para melhorar a habilidade do reconhecimentode caracteres alfanuméricos ao lidar com a grande variedade de tipografias e línguas que são encontradas nos documentos preservadosem bibliotecas. Em terceiro lugar, dado o reconhecimento bem sucedido dos caracteres alfanuméricos que compõem uma imagem detexto, é necessário, para propósitos de armazenagem e recuperação, que se relacione os caracteres à estrutura e ao layout dodocumento original, incluindo quaisquer ilustrações, desenhos, diagramas ou outras imagens gráficas que estejam nele contidas.

A maneira como essas questões foram, enfim, abordadas e reconhecidas afetará bastante a acessibilidade dos documentosarmazenados na forma eletrônica. Nós pretendemos estar conscientes e informados a respeito das implicações das decisões eescolhas que faremos neste projeto para a aplicação futura da tecnologia de reconhecimento de caracteres. De fato, pretendemostomar todas as precauções razoáveis para assegurar o sucesso de uma aplicação dessa natureza às imagens digitais que produziremos.Contudo, dada a complexidade e relativa imaturidade da tecnologia de reconhecimento de caracteres, nos referimos à sua aplicaçãocomo afim, porém essencialmente fora do alcance do presente projeto.

Para uma discussão frutífera de alguns dos temas associados com a aplicação do reconhecimento de caracteres a documentos debibliotecas, ver Stuart Wibel, John Handley; Charles Huff. Automated document architecture processing and tagging. In: DonaldL. Blamberg, Carol L. Dowling; Claudia V. Weston (Ed.). Proceedings of the Conference on Aplication of Scanning Methodologiesin Libraries. Beltsville, Maryland: National Agricultural Lybrary, 1989. p. 3-14.

������ �9���������������������������

digitalizados

(������������)

1 7

A imagem digital também promete uma melhoria substancial ao acesso intelectual, em comparaçãoao microfilme. A capacidade dessa tecnologia de disponibilizar cópias em papel do documento original,de alta qualidade e relativamente baratas, para a biblioteca pessoal dos pesquisadores torna o aparatointelectual padrão — sumário, índice e assim por diante — diretamente acessível. Além disso,diferentemente da prática comum com imagens sobre microfilme de 35 mm, as imagens digitais podemser indexadas pelos números das páginas e, se os recursos disponíveis permitirem, por estruturas taiscomo seção, capítulo e fascículo. Com um índice assim e um software para utilizá-lo, os pesquisadorespodem percorrer rapidamente o documento digital e ‘folhear’ seu conteúdo intelectual de forma bemmais eficiente do que a permitida por documentos preservados em microfilme.

Nas formas aqui descritas, a tecnologia de imagem digital não proporciona uma melhoriasubstancial, em relação ao microfilme, quanto a proporcionar um substituto eficiente para a consulta devolumes em estantes. Contudo, estudos recentes sugerem que a adição de informações suplementares,como transcrições de índices, às descrições bibliográficas disponíveis online, irá permitir umaoportunidade melhor para efetuar associações intelectuais, do que com métodos tradicionais declassificação e a disposição dos documentos em papel nas estantes da biblioteca por assunto

12. À

medida em que o conteúdo dos documentos é adicionado aos registros bibliográficos online e osbenefícios resultantes da melhoria do acesso intelectual aos materiais, em todos os formatos, se tornamaparentes, torna-se possível alcançar uma substancial melhoria no aproveitamento do material no formatode imagem digital por meio da criação de conexões eletrônicas diretas entre a informação suplementardo registro bibliográfico e as imagens digitais do documento a que o registro se refere. A criação detais conexões exigirá um trabalho considerável, particularmente no sistema bibliográfico online, mas avisão de suas possibilidades significa também que se deve planejar, de forma cuidadosa e criativa, osíndices da paginação e da estrutura do documento dentro dos sistema de imagem digital, para que asimagens digitais possam ser relacionadas, de maneira fácil e confiável, à informação do conteúdoarmazenada em outras formas legíveis por computador, como o registro bibliográfico online.

Nossa visão da biblioteca do futuro está relacionada às diferenças e às interrelações principaisque identificamos entre

• as coleções da biblioteca que incluem os modos — de armazenagem de informações e doconhecimento registrado — selecionados;• o acesso físico, que inclui os modos de distribuição das coleções; e• o acesso intelectual, que inclui os modos principais de uso das coleções.

Assim como esperamos que a tecnologia da imagem digital introduza maior flexibilidade e melhoreos modos de utilização e distribuição de coleções, particularmente em comparação com o microfilme,esperamos, também, que essa tecnologia produza efeitos similares nos modos de armazenagem nacoleção. Neste contexto, é crucial distinguir entre armazenagem arquivística e armazenagem para usoe distribuição.

12 Ver, por exemplo, Karen Markey. Subject searching in library catalogs: before and after the introduction of online catalogs.

Dublin, Ohio: Online Computer Library Center, p. 75-117, 1984; Richard Van Orden. Context-enriched access to electronicinformation: summaries of selected research. Library Hi Tech, v. 8, no. 3, p. 27-32, 1990; e Martin Dillon e Patrick Wenzel.Retrieval effectiveness of enhanced bibliographic records. Library Hi Tech, v. 8, no. 3, p. 43-46, 1990.

1 8

Na biblioteca do futuro, presumimos que o microfilme continuará a ter um papel importante,talvez ainda permanecendo como o meio preferido de armazenagem de uma versão arquivística dosdocumentos preservados

13. Para a utilização e a distribuição dos materiais preservados, contudo, as

imagens digitais se tornarão provavelmente o meio de armazenagem preferido. Dependendo dos custos,a microfilmagem poderá permanecer como uma etapa preliminar em um processo de preservação queeventualmente levaria à digitalização, ou então, o filme poderá ser gerado a partir da imagem digital.Em ambos os casos, esperamos que a tecnologia digital aproveite a base substancial de documentos jápreservados em microfilme e atualmente disponíveis apenas nesta forma.

Finalmente, nossa visão da utilização da tecnologia de imagem digital sugere alguns efeitos maisamplos. Apesar de esperarmos que a biblioteca digital seja estabelecida a partir de um impulso inicialvisando à preservação e à melhoria do acesso à enorme quantidade de livros quebradiços e emdeterioração nas estantes das bibliotecas, nós também esperamos um enriquecimento das bibliotecasao longo do tempo, com documentos na forma de imagem digital que tenham sido criados por váriasoutras razões, tanto dentro quanto fora da biblioteca. Além disso, a tecnologia de imagem digital teráprovavelmente um efeito significativo, talvez profundo, na maneira segundo a qual a biblioteca dofuturo encarará, organizará e valorizará seu espaço e sua equipe de funcionários. Por exemplo, namedida em que a biblioteca digital surja como uma forma de renovar e substituir grandes estoques demateriais de papel e de microfilme, e na medida em que a biblioteca digital seja armazenada e acessívelremotamente da biblioteca propriamente dita, o uso do espaço central de estanteria, onde se armazenamdocumentos na biblioteca, quase que certamente será modificado e o equilíbrio das funções da equipede funcionários — tradicionalmente associadas à circulação e à recolocação nas prateleiras de coleçõesarmazenadas em papel — deverá ser alterado em função dos modos de distribuição de documentosgerados sob demanda a partir de formatos eletrônicos

14.

Uma economia de escolhas

As bibliotecas do futuro não alcançarão, em uma única e rápida etapa, a visão aqui apresentadacom relação ao uso da tecnologia digital na preservação e na melhoria do acesso ao conhecimentoregistrado. Contudo, as promessas de benefícios em serviços e de uma possível economia de customobilizará, de várias formas, os bibliotecários na direção dessa tecnologia. Restrições orçamentárias eoutros impedimentos organizacionais irão forçá-los, ainda, a investir nessa tecnologia de outras formas.Se a promessa justificar o investimento, a maioria irá incorporar a tecnologia de reprodução digital deimagem da mesma maneira como adotou e assimilou outras tecnologias no passado: através de uma sériede decisões específicas e escolhas regidas pela função e pelas necessidades de suas instituições.

Aqueles que desenvolvem a tecnologia de imagem digital para utilização na preservação debibliotecas devem ter em mente o princípio de aperfeiçoar seu poder e sua influência na mudança

13 Sobre a contínua utlidade do microfilme na indústria, veja Whitney S. Minkler. Optical disks vs. Micrographics: is it na

adversarial problem? Micrographics and Optical Technology, v. 7, no. 4, p. 141-149, 1989; e John Blake. War over optical diskor microfilm ends, future contains multiple media. Micrographics and Optical Technology, v. 8, no. 3, p. 141-143, 1990.14

Ver, por exemplo, Clifford A. Lynch e Edwin B. Brownrigg. Library applications of eletronic imaging technology. InformationTechnology and Lybraries, v. 5, no. 2, p. 100-102, June 1986.

1 9

organizacional. A economia no gerenciamento e administração dos recursos de uma biblioteca, comona maioria das grandes instituições, se reflete na racionalização de escolhas, mesmo quando se trata deuma tecnologia potencialmente revolucionária. O desenvolvimento da aplicação da imagem digital deve,então, produzir resultados no tocante aos meios, custos e benefícios que facilitem e informem, em vezde distorcer e enganar, sobre tal economia.

Esta seção almeja identificar um conjunto de escolhas funcionais cruciais que, provavelmente,governarão a incorporação da tecnologia de imagem digital nos processos de preservação de bibliotecas.A próxima, delineia muitas das exigências técnicas detalhadas para a arquitetura de um sistema quepossa acomodar, de maneira flexível, as diferentes escolhas que as bibliotecas provavelmente farão. Aseção final apresenta um plano de trabalho para o desenvolvimento da arquitetura e para a geração dainformação que as bibliotecas necessitarão ao fazerem uma escolha cautelosa referente aos custos ebenefícios dessa tecnologia de imagem.

O foco na conversão a partir do microfilme

A Universidade de Cornell, uma pioneira na utilização da imagem digital para fins de preservaçãoem biblioteca, optou pela investigação de métodos para superar as limitações da microfilmagem parapreservação através do escaneamento de documentos em deterioração diretamente para a forma deimagem, em vez de microfilmá-los. Trabalhos adicionais fazem-se necessários visando expandir aspossibilidades de alimentação direta, incluindo métodos para o manuseio de documentos de grandesdimensões, documentos coloridos e outros tipos de documentos especiais. Além disso, como podemser eletronicamente realçadas pela eliminação de manchas e outras marcas e pela acentuação docontraste de tintas esmaecidas, as imagens digitais deverão se tornar, em última análise, uma fonte dequalidade superior à fonte original em papel para a cópia sobre microfilme. Os meios para a geraçãode uma cópia sobre microfilme a partir da imagem digital devem, pois, ser sistematicamente explorados.

O papel, contudo, não é a única fonte de alimentação possível para a criação de uma bibliotecadigital de materiais preservados. A biblioteca da Universidade de Yale busca demonstrar à grandecomunidade bibliotecária a viabilidade de uma fonte alternativa, através do desenvolvimento de meiose da identificação dos custos e benefícios de se escanear materiais preservados a partir da microfilmagem.Embora seja alimentado por microfilme em vez de papel, o sistema de reprodução de imagensdesenvolvido no projeto da Universidade de Yale também proporcionará as mesmas capacidadesfuncionais básicas que o projeto em desenvolvimento na Universidade Cornell. No sistema completo,os usuários da biblioteca poderão ‘folhear’ a biblioteca de imagens a partir de um terminal de computador(Figura 5). Eles poderão, também, obter uma versão impressa do documento digital, sempre querequisitado; a própria biblioteca poderá gerar uma cópia sobre o papel do documento preservado ecolocá-la nas estantes da biblioteca. Além disso, a biblioteca de imagens será armazenada separadamenteda coleção nas estantes. Devido à presumida acessibilidade da biblioteca digital, tanto de dentro quantode fora da biblioteca, a versão em microfilme dos documentos digitalizados pode ser idealmente removidada biblioteca para um depósito mais remoto e barato.

2 0

O sistema da Universidade de Cornell está sendo desenvolvido, inicialmente, para manejar umabiblioteca de imagens com 1.000 volumes. Além do desenvolvimento de uma fonte alternativa deentrada, o projeto da Universidade de Yale testará a possibilidade de implementar projetos como o daUniversidade de Cornell, em grande escala, aumentando o acervo da biblioteca digital, em uma ordemde magnitude, para 10 mil volumes. O tamanho da biblioteca digital de Yale, comparado à de Cornell,ajudará a demonstrar as economias do sistema quando implementado em escala e a assegurar àcomunidade de bibliotecários que é possível medir realisticamente os custos associados à adição decomponentes ao sistema e à manutenção destes componentes ao longo do tempo.

Um modelo de investimento em incrementos

Os custos e benefícios de um sistema de reprodução de imagens dependem largamente, emboranão exclusivamente, dos principais componentes funcionais do sistema, do método e do ritmo de suaimplementação. Não é necessária a adoção de todos os componentes possíveis para a criação de umsistema de trabalho. Considerando a missão a ser cumprida pelo sistema, alguns componentes sãoessenciais e devem ser implementados, já outros são menos importantes, podendo ser instaladosopcionalmente ou posteriormente à base de incrementos. A análise que se segue distingue os principaiscomponentes funcionais de um sistema de imagem digital para preservação, ordena os componentesem relação ao objetivo do sistema e os arranja em uma seqüência cumulativa de etapas. A seqüênciasugere uma estratégia plausível, oferecendo opções de escolha a cada nível para uma biblioteca queesteja investindo na tecnologia de imagem digital. Para dar suporte às opções, o desenvolvimento doprojeto de reprodução de imagens em Yale precisa ser planejado de modo a permitir a medição doscustos e benefícios referentes ao incremento de componentes do sistema, identificados em cada etapada seqüência.

O sistema básico

Se o objetivo da preservação é de salvaguardar e otimizar o acesso físico e intelectual àdocumentação impressa em deterioração, e considerando-se que o material já foi microfilmado, osistema de imagem digital mais simples e direto é aquele que produz, a partir do microfilme, uma cópiaimpressa, de alta qualidade, do documento original para a biblioteca colocar em suas prateleiras. Oscomponentes essenciais de um sistema desse tipo seriam:

������ �0�� �������������������������� �������������������������

‘3��:�������’������������ ������������#

2 1

• um escaner para microfilme;

• um dispositivo de armazenagem temporária para guardar as imagens digitadas;

• uma estação de controle de qualidade para revisar as imagens, realçá-las sempre que possívele escanear o filme novamente quando necessário;

• uma rede de alta velocidade para a transferência das imagens ao serviço de impressão;

• um serviço de impressão, para colocar em fila e também controlar o trabalho de impressão; e

• uma impressora digital de alta qualidade.

Uma empresa de serviços poderia, naturalmente, se encarregar parcial ou totalmente dessasfunções. Poderia escanear com controle de qualidade e imprimir o documento; poderia escanear comcontrole de qualidade e devolver à biblioteca o conjunto de imagens digitalizadas para impressão. Seráimportante, para o projeto demonstrativo de Yale, acumular experiência interna suficiente em digitalização,de modo que se possa transmitir à empresa de serviços os padrões e as expectativas para conversãoe indexação, para comparar integralmente os custos de um serviço interno com os custos da contrataçãode uma empresa de serviços que realiza as mesmas funções.

Devido ao fato de que o processo copyflo já é capaz de produzir cópias impressas diretamentea partir do microfilme, uma biblioteca provavelmente achará este sistema básico de reprodução deimagens atraente se, e somente se, os custos de digitalização e impressão forem inferiores aos custosdo copyflo ou se a cópia gerada pela impressora digital for de qualidade superior. Considerando-secomo provavelmente o é, que a resolução da imagem digital gerada a partir do microfilme é da ordemde 300 pontos por polegada (dpi), então a qualidade de impressão certamente será igual ou superiorà do processo copyflo. Michael Lesk estimou, ainda, que o custo de uma conversão simples domicrofilme para imagem digital é de aproximadamente 2 centavos de dólar norte-americano porfotograma

15. Estimativas anteriores de Cornell sugerem que os custos de impressão de um documento

a partir dessas imagens são aproximadamente de 10 dólares por livro de 300 páginas (semencadernação) ou de 3,3 centavos de dólar norte-americano por página.

Estas estimativas incluem pressupostos acerca de custos da mão de obra, produtividade, volumee métodos de financiamento e amortização de equipamentos que podem ou não valer para qualquercircunstância. Contudo, reconhecendo as limitações de tais estimativas, compare-as ainda ao custoatual de 15 centavos de dólar norte-americano por página (sem encadernação) do processo copyflo.Um sistema de imagem digital restrito aos seus componentes essenciais e simplesmente capaz dedigitalizar e imprimir imagens de microfilme irá não somente produzir cópias de qualidade superior, mastambém proporcionar mais de 60% em economia com relação aos meios presentes de impressão apartir do microfilme. Obviamente, com componentes adicionais, um sistema de imagem digital podedesempenhar uma função bem maior do que a do sistema aqui descrito, mas os riscos do investimentoaumentam proporcionalmente.

15 Michael Lesk, op. cit., p. 307.

2 2

Impressão sob demanda

Se um sistema de imagem digital básico habilita a biblioteca a restringir o acesso a um documentoem deterioração através da geração de uma cópia de fac-símile de alta qualidade e a um custorelativamente baixo, então pode-se legitimamente imaginar qual o investimento adicional que serianecessário para produzir a cópia impressa sob demanda para um pesquisador colocar em sua bibliotecapessoal. Um sistema de imagem digital capaz de impressão sob demanda necessita da incorporaçãodos seguintes componentes ao sistema básico:

• um dispositivo de armazenagem permanente para as imagens do documento na forma digital;

• um índice a nível de título para o documento na forma de imagem, de modo que se possadistinguir um documento de outro no meio de armazenagem;

• uma entrada em uma descrição bibliográfica nova ou já existente, presumivelmente registradano catálogo online da biblioteca, que indique ao usuário que o documento se encontra armazenadona forma digital e está disponível para impressão sob demanda;

• um serviço de requisição de impressão; e

• um serviço de imagem que extraia as imagens sob o identificador único e as transmita àimpressora.

A otimização da impressão sob demanda sujeita-se também a custos substanciais, particularmentecom respeito ao mecanismo de armazenagem. A armazenagem de imagens digitais é tecnicamente complexae será tratada com maior detalhe na discussão sobre a arquitetura do sistema, na próxima seção. Éimportante citar aqui, contudo, que a noção de ‘permanência’ na armazenagem digital envolve os custosde se atualizar periodicamente os arquivos de imagem — e relativamente com mais freqüência que livrose microfilme — na medida em que os meios de armazenagem, os formatos de arquivo digital e oequipamento utilizado para se ter acesso a esses arquivos sofrem mudanças. É possível, mas ainda nãoprovado, que a economia feita em espaço, a partir de uma armazenagem mais densa e compacta e emoutras eficiências adquiridas com a mudança de tecnologia, poderia contrabalançar os custos de atualizaçãode arquivos de imagem e, assim, fazer com que o processo de renovação seja auto-sustentável.

O sistema de indexação neste estágio é simples de ser criado e utilizado. Consiste na aplicaçãode um número de classificação ou outro identificador único à coleção de imagens do documentodigital. O identificador único proporciona a chave que conecta a entrada bibliográfica do catálogo aotítulo na biblioteca digital, igual a um número de chamada que permite ao usuário dirigir-se ao catálogo,a um livro na estante ou a um rolo de microfilme em uma gaveta específica de arquivo.

Naturalmente, um pesquisador nem sempre pode dizer, a partir da entrada de um catálogo, seum documento é ou não é relevante ao problema ou à pesquisa de seu interesse. Antes de requisitaruma cópia impressa, pode ser necessário ‘folhear’ o documento em microfilme na biblioteca paradeterminar sua relevância. Os investimentos em um sistema de imagem digital que propicie um serviçode impressão sob demanda incluem, portanto, os custos de armazenagem e indexação dos documentosna forma digital, sem, contudo, prescindir da exigência de que a biblioteca mantenha uma versão dosmesmos em microfilme, para que o usuário possa ‘folheá-los’.

2 3

‘Folheando’ um documento online

Considerando-se a armazenagem permanente necessária ao serviço de impressão sob demanda,uma outra extensão natural dos sistema de imagem digital seria permitir ao usuário ‘folhear’ um documentoonline diretamente na forma de imagem digital. A capacidade para se ‘folhear’ online requer,adicionalmente àqueles já identificados, os seguintes componentes:

• um terminal de computador e uma impressora para que o usuário possa recuperar, exibir,navegar e imprimir imagens selecionadas do documento; e

• um serviço de apresentação que adapte a apresentação da imagem ao tipo específico deestação de ‘folheamento’ em uso.

A melhoria destes componentes do sistema de imagem digital proporciona ao usuário capacidadesfuncionais que, em pelo menos um aspecto, se assemelham ao ‘folheamento’ de um documento naforma de microfilme. Devido ao fato de que o documento neste estágio está indexado apenas pelotítulo, com um identificador único, não se pode ir automaticamente até uma página ou seção específicado documento. Como ocorre com uma leitora de microfilme, deve-se mover para frente e para trás,através do documento, imagem por imagem. A principal diferença funcional em relação ao uso domicrofilme, nesse estágio, é que o usuário não tem que localizar o rolo de filme manualmente, masdepende do software do sistema para encontrar e carregar o documento automaticamente. Alémdisso, após ‘folhear’ o documento, o usuário pode solicitar que o sistema gere uma cópia impressa dealta qualidade para uso pessoal.

É dever dos responsáveis pelo desenvolvimento do sistema assegurar que as características de‘folheamento’ online de impressão sob demanda incorporadas ao sistema, neste estágio de investimento,sejam estimulantes e suficientes ao pesquisador, para que o mesmo as utilize em lugar do microfilme.Partindo do pressuposto de que elas realmente o sejam, a biblioteca poderá começar a acumular pelomenos algumas economias em microfilme da biblioteca. A biblioteca poderá também contemplarmelhorias significativas na capacidade de ‘folheamento’.

Acesso remoto

A biblioteca pode estender a capacidade de ‘folheamento’ do sistema de imagem, sob um certoaspecto, tornando-o acessível remotamente. Dentro da biblioteca, a apresentação das funções de‘folheamento’ pode ser controlada pela limitação do tipo de estação de trabalho utilizada. O acessoremoto, contudo, requereria um servidor com maior qualificação para suportar a variedade de estaçõesde trabalho e capaz de lidar com as imagens que os pesquisadores utilizam fora da biblioteca. Além doservidor de imagem e da rede local do campus também necessitaria de capacidade para suportar otráfego mais intenso. Se a função de ‘folheamento’ pode, ou não, ser estendida para fora da rede docampus, em termos práticos, é uma questão de considerável interesse que exigirá pesquisa adicional eum grande volume de testes.

‘Folheamento’ no nível de página

A biblioteca pode, também, estender a capacidade de ‘folheamento’ do sistema de imagem,tornando as imagens de um documento diretamente acessíveis através do número da página. Oinvestimento no ‘folheamento’ em nível de página depende diretamente dos custos de geração,manutenção e suporte do software de ‘folheamento’ e de um índice de páginas para o documento de

2 4

imagem. Não se pode emitir um comando para ir a uma página específica no documento até que, e anão ser que, alguém, deliberadamente, se dedique à criação de um índice conectando as imagens comos números das páginas do documento. As páginas podem apresentar numeração romana ou arábica.Por outro lado, algumas páginas podem até não estar associadas com um número específico em qualquerforma de notação. O sistema de indexação e recuperação necessita refletir, todavia, sobre essasdistinções, variações e peculiaridades.

‘Folheado’ em nível de estrutura do documento

A biblioteca pode estender a capacidade de ‘folheamento’ do sistema de imagem ainda maisprofundamente, tornando as imagens de um documento diretamente acessíveis através de suas própriasdivisões estruturais internas, tais como página de título, sumário, parte, capítulo, seção e índice. Isto é,sem mover-se através do documento página por página, o usuário pode emitir um comando para irimediata e automaticamente ao terceiro capítulo, à parte três, ou à página do título. Novamente, aescolha para se implementar um sistema de imagem com este nível de funcionalidade dependediretamente do interesse da biblioteca na criação de um índice conectando uma imagem ou um conjuntode imagens a um ou mais elementos estruturais específicos do documento. Uma pequena variaçãodesse sistema proporcionaria ao usuário a capacidade de estruturar temporariamente o documento,durante o processo de ‘folheamento’, com marcadores de página. Uma variação ainda mais ambiciosaseria permitir ao usuário estruturar o documento, completa ou parcialmente, a seu próprio gosto esalvar o índice estrutural resultante, sob seu próprio nome, para uso posterior.

A análise aqui apresentada de um sistema de imagem digital para bibliotecas, que tem a finalidadede preservar e melhorar o acesso a materiais em deterioração e é derivado da conversão de microfilmepara formato de imagem, não esgota todos os usos possíveis de um sistema deste tipo. Por exemplo,pode-se decidir pela digitalização de uma coleção de documentos baseando-se no fato de que a coerênciaintelectual do material justifica o esforço de torná-lo mais acessível. Alternativamente, para auxiliar nadiminuição dos custos de armazenagem e indexação, pode-se optar pela digitalização apenas dedocumentos de uso intenso, como uma etapa intermediária, ou mesmo como uma alternativa à colocaçãode uma cópia em papel nas estantes. Pode-se, ainda, optar, apenas, pela digitalização de documentos, namedida em que são requisitados para uso, deixando as porções não utilizadas da coleção em microforma.

Esta análise também não esgota todas as características possíveis de um sistema de imagem digitalpara preservação. Como exemplo, uma vez que a tecnologia de reconhecimento de caracteres estejasuficientemente amadurecida, melhorias adicionais ao sistema de imagem digital tornar-se-ão possíveis.Um documento em forma de imagem poderá ser, parcial ou totalmente, convertido para um arquivo textode caracteres alfanuméricos e as imagens do documento poderiam, potencialmente, ser conectadas auma porção do arquivo de texto, como o índice, que é armazenado na descrição bibliográfica do documentode imagens ou a um índice remissivo de palavras-chave gerado a partir do arquivo de texto completo.Avanços deste tipo poderiam enriquecer bastante o valor intelectual da biblioteca de imagens.

A análise feita nesta seção, contudo, destaca as principais dimensões funcionais de um sistemade imagem digital para preservação. Sugere, também, um arranjo plausível de escolhas que devemotivar uma biblioteca a investir economicamente em um sistema deste tipo. Obviamente, deve-sedistinguir entre a motivação e a necessidade funcional e a arquitetura técnica subjacente ao sistema deimagem digital — que serve aos propósitos da biblioteca e satisfaz suas necessidades — além do

2 5

plano de trabalho para um projeto demonstrativo que desenvolva um sistema completamente articuladodentro da arquitetura e gere informação suficiente sobre o sistema, de forma a permitir às bibliotecastomar decisões prudentes e práticas no tocante a seus custos e benefícios.

Arquitetura do sistema

A arquitetura — o projeto e a estrutura global — de um sistema para criação, armazenagem,recuperação e impressão de documentos de biblioteca na forma de imagem evoluiu gradualmente durantea última década. Na pesquisa inicial e no desenvolvimento de projetos piloto, especialmente na Bibliotecado Congresso e na Biblioteca Nacional de Medicina norte-americanas, testaram, refinaram e validaramidéias-chave de projeto na medida em que a tecnologia de imagem digital emergiu: as estações de trabalhorealizam funções com imagem digital, são distribuídas numa rede de alta velocidade, utilizam os recursosnecessários na rede e interagem umas com as outras de acordo com um padrão cliente/servidor

16. Em

seu projeto de preservação digital, a Universidade de Cornell incorporou um projeto de estação detrabalho distribuída, no padrão cliente/servidor, em sua arquitetura de sistema; Yale fará o mesmo.

Outros princípios de projeto mais gerais também se aplicam à arquitetura de sistemas de imagemdigital. Alguns destes princípios governarão o sistema que vem sendo desenvolvido em Yale e deve-searticulá-los, em vez de assumi-los. Inicialmente, os dados, tanto de imagens quanto de seus índices,constituirão o recurso principal gerado no projeto de Yale. O software e o hardware necessários paracriar, armazenar e utilizar os dados mudarão e serão substituídos. Os dados permanecerão, contudo,e deverão ser facilmente conversíveis de um sistema para outro. Em segundo lugar, baseando-se noargumento da seção anterior sobre a necessidade de escolha, os componentes do sistema devem serdesenvolvidos de forma modular, para poderem ser fácil e prontamente adicionados, eliminados oualterados quando necessário. Em terceiro lugar, para assegurar flexibilidade na adição, eliminação oualteração no sistema de imagem digital em Yale, os componentes utilizados devem obedecer às normasoficiais ou industriais, ou ser construídos para interfaces padrão.

Relacionando estes princípios na ordem inversa, esta seção identifica os padrões relevantespara o sistema de imagem digital em Yale, revê os componentes do sistema e os aspectos técnicos aeles associados e considera a exeqüibilidade global do projeto, evidenciando áreas em que o interessepelos dados devem garantir atenção especial a características específicas dos sistema.

Normas técnicas

As normas relevantes que se aplicam ao projeto e à construção do sistema de imagem digital emYale se encaixam em três grupos distintos: normas de comunicações, de armazenagem e de aplicação

17.

Assim como a maior parte das principais universidades de pesquisa dos Estados Unidos, a Universidade

16 Felix P. Krayeski. Transition of na image system: from paper to microfiche to optical disk. Congresional Research Service, The

Library of Congress, June 1990; Frank L. Walker; George R. Thoma. Access techniques for document image databases. LibraryTrends, v. 38, no. 4, p. 751-786, Spring 1990; Frank L. Walker. Issues in document conversion. In: Donald L. Blamberg, CarolL. Downling; Claudia V. Weston. (Ed.). Proceedings of the Conference on Application of Scanning Methodologies in Libraries.Beltsville, Maryland: National Agricultural Library, p. 45-60, 1989.17

Para uma boa visão geral das normas técnicas relevantes, ver Gerry Walter. “Standards help advance document managementsystem progress. Optical Memory News. p. 25-27, May, 1990.

2 6

de Yale comporta uma variedade de protocolos de rede, mas tem se concentrado nos chamadospadrões ethernet, incluindo o TCP/IP como protocolo escolhido para comunicações em rede.Componentes do sistema podem operar em uma sub-rede do campus, utilizando um tipo diferente deprotocolo padrão, por exemplo, token ring (rede em anel) no nível de conexão de dados. Contudo, asub-rede deve fornecer uma porta confiável e satisfatória para a espinha central da rede, baseada naethernet, para comunicação com outros componentes do sistema.

Para armazenagem de dados de imagens, o sistema de Yale suportará o formato TIFF (TaggedImage File Format), que proporciona a padronização em nível de cabeçalho, necessária para permitiro intercâmbio de imagens. Devido aos arquivos de imagem serem muito grandes, uma norma técnicase faz também necessária para a compreensão dos arquivos a uma fração de seu tamanho original,para que se possa armazená-la e comunicá-los de forma mais econômica. O padrão de compressãodo grupo 4 do CCITT é deficiente em alguns aspectos, porque não inclui páginas cujas dimensõessejam superiores às do tamanho carta, nem manipula bem as imagens com escala mais extensa degradações de cinza ou coloridas. Grupos de normalização técnica estão cooperando no momento parao desenvolvimento de padrões de compressão mais adequados. Por enquanto, o padrão do grupo 4do CCITT deve servir às necessidades deste projeto.

Quando se trata das aplicações, a informação bibliográfica, referente a um documento na formade imagem será incorporada ao catálogo online da biblioteca em formato padrão de catalogaçãolegível por computador, MARC - Machine-readable Cataloging. As convenções existentes para oMARC não são completamente adequadas à descrição da versão em imagem digital de um documento,mas a respectiva organização de normas técnicas já esboçou uma revisão adequada da norma. AUniversidade de Yale adotará uma solução temporária até que a norma revisada seja aceita.

Duas outras normas técnicas são também apropriadas no nível das aplicações. Em primeiro lugar,índices que abrem um documento na forma de imagem para o ‘folheamento’ nos níveis de título de páginae de estrutura do documento, dependem de trabalho que descreva os conteúdos das imagens, defina etorne possível trocar e apresentar um conjunto particular de imagens como um conjunto de entidades deordem superior (por exemplo, um livro, um capítulo, um conjunto de páginas). Normas técnicas relativasao conteúdo do documento devem se aplicar (ou ser apropriadamente estendidas para se aplicar) àcriação, à armazenagem e ao uso dos vários níveis de índices estruturais. Alguns fornecedores, incluindoa IBM, têm difundido seus próprios padrões internos para conteúdo de documento. Contudo, a normaISO 8613, intitulada Information Processing - Text and Office Systems - Office Document Architeture(ODA) and Interchange Format (ODIF), é o padrão internacional que prevalece e o projeto de Yaleprocurará manter-se em conformidade com ela.

Em segundo lugar, os arquivos de estrutura, que descrevem o conteúdo dos documentos deimagem em concordância com a ISO 8613, devem ser armazenados e recuperados de um arquivo debase de dados conectado referencialmente aos arquivos de imagens de documento. Esperamos que abase de dados seja relacional. Esperamos, também, que ela incorpore e esteja em conformidade como padrão SQL (Structured Query Language)

18.

18 A apresentação de um índice da estrutura do documento em uma forma relacional padronizada, eventualmente facilitará a

criação de conexões entre o documento de imagem digital e qualquer informação sobre seu conteúdo armazenada em outras fonteslegíveis por computador, tais como a descrição bibliográfica online do documento.

2 7

Componentes do sistema

Uma representação geral da arquitetura do sistema para o projeto de imagem digital parapreservação em Yale é apresentada na Figura 6. Os componentes estão todos conectados à redeethernet de alta velocidade do campus, que tem um núcleo de fibra óptica e velocidades atuais de

transmissão de até 10 megabytes por segundo. Os componentes chave do projeto são: um subsistemade conversão, um subsistema de reprodução (ou impressão), um subsistema de armazenagem e umsubsistema de acesso.

Conversão

O propósito do subsistema de conversão é receber, como alimentação, uma série de imagens defotogramas de microfilme que constituam um documento (livro, folheto ou periódico) e tirar uma‘fotografia digital’ de cada quadro, de forma que a imagem seja armazenada como um arquivo decomputador e possa ser exibida em um monitor de computador. O processo de conversão assegura aqualidade física da digitalização, que inclui o controle da resolução, bem como do conteúdo de imagem,contraste, distorção e seqüência. O processo também serve para caracterizar, ou indexar, o conjuntode arquivos de imagem de forma que eles retenham sua identidade como um documento único paraposterior armazenagem e recuperação. O passo final no processo é submeter o conjunto de arquivos,como uma entidade documental, para armazenagem permanente.

O subsistema de conversão inclui um digitalizador de microfilme e papel e, no mínimo, umaestação de trabalho controladora em que um operador possa realizar as funções de controle dequalidade, indexação e confinamento (armazenagem permanente). Para proporcionar uma maior

������ �&�������������� � ��������������

2 8

flexibilidade, a estação de trabalho e o digitalizador deve estar conectados por uma rede local de altavelocidade. Com a interconexão via rede, novas estações de trabalho podem ser adicionadas paradividir as tarefas, mas cada função pode, ainda assim, ser realizada em todas as estações.Alternativamente — e isto pode ser necessário para maior eficiência —, o digitalizador pode estardiretamente conectado a uma estação de trabalho controladora, na qual um operador realiza as funçõesde controle de qualidade. Após a conclusão do processo, o operador pode então enviar os arquivos,utilizando um mecanismo de rede (ou sneakernet) de compartilhamento de arquivos, para uma outraestação de trabalho para processamento adicional de conversão.

O digitalizador deve aceitar rolos de microfilme 35 mm, negativo ou positivo, com fotogramasem pé ou deitados, em vários graus de redução. Deve possuir um mecanismo de alimentação automáticoque permita operação não-assistida, além de ser equipado com sensores para a detecção do início eda borda de cada fotograma e para a correção automática da distorção dos fotogramas. Se possível,ele deve detectar o início e a borda de cada página nos casos em que se tenha duas páginas porfotograma. Em função do esforço dispensado na digitalização, o projeto de Yale procurará disponibilizaras imagens com a mais alta resolução tecnicamente possível. O digitalizador deve, contudo, ser capazde escanear em diferentes níveis de resolução e, para prevenir estrangulamentos no trabalho, deve sercapaz de gerar as imagens em sua resolução máxima de saída a uma velocidade de dois segundos, oumenos, por fotograma. Finalmente, o digitalizador deve apresentar um conjunto aberto de interfacesque lhe permita trabalhar com estações de trabalho DOS, UNIX ou Macintosh. Um digitalizador paradocumentos em papel, de alta velocidade, com as mesmas características, deve estar à mão, parapermitir comparações controladas de velocidade e qualidade nos casos em que a cópia em papel domaterial microfilmado ainda se encontra disponível.

Para trabalhar com as imagens digitalizadas, cada estação de trabalho, no processo de conversão,necessita da habilidade de processamento para ler e expandir a imagem comprimida de uma página epara comprimir e salvar, no disco, imagem de uma página exposta. Todas as estações de trabalhodevem percorrer a seqüência de arquivos de imagem, para frente e para trás, e saltar para uma imagemespecífica a partir de uma outra qualquer. Cada estação de trabalho necessita, também, de um monitorde alta resolução capaz de exibir uma imagem de página legível. Cada estação de trabalho deveriaproporcionar funções gerais de manipulação de imagem tais como zoom, redução, panorâmica,rolamento e rotação. Finalmente, todas as estações de trabalho no processo de conversão devem teracesso a uma impressora laser local para a impressão de cópias de páginas selecionadas.

A estação de trabalho que controla o digitalizador e a qualidade de sua saída deve permitir aooperador tanto iniciar um processo de escaneamento totalmente automático, quanto interferir no mesmo,de forma clara e substancial. Ela deve possibilitar ao operador o ajuste e a determinação da resoluçãode escaneamento, produzindo, por exemplo, um conjunto de imagens a uma resolução elevada paraimpressão e um outro conjunto a uma resolução inferior para ‘folheamento’. A estação de trabalhodeve dar suporte às técnicas para realce automático de imagens, incluindo thresholding fixo e dinâmicoe detecção de pico, que ajudam a melhorar o contraste entre texto e fundo, na impressão. Além disso,ela deve permitir ao operador cortar bordas de imagens e realizar outras funções de realce de imagemem tempo real, bem como reescanear completamente uma imagem quando necessário. Finalmente, aestação de trabalho deveria criar, automaticamente, arquivos TIFF a partir do digitalizador, comprimiras imagens escaneadas pela técnica bidimensional do grupo 4 do CCITT e atribuir nomes seqüênciaispara os arquivos de imagens.

2 9

A aplicação de indexação no processo de conversão deve guiar o operador através de umprocesso que proporcione informação sobre certos aspectos chaves da estrutura e do conteúdo doconjunto de imagens que constituem o documento convertido. Em uma janela, deve exibir o conjuntode imagens e permitir ao operador percorrer, para frente e para trás, a seqüência de arquivos deimagens e ir diretamente até qualquer imagem específica. Em outra janela, a aplicação de indexaçãodeve induzir o operador a verificar se a seqüência de imagens está correta e a fornecer um identificadorúnico de documento sob o qual o conjunto de imagens possa ser armazenado como uma entidadeúnica. Ao fornecer o identificador, a aplicação deveria checar na lista online dos identificadoresexistentes se não houve repetição.

Em uma terceira janela, a aplicação deve dar ao operador acesso ao catálogo local online, criaruma entrada apropriada para o documento em sua forma digital e indicar o identificador único atravésdo qual o documento digital pode ser encontrado. Quando o trabalho bibliográfico estiver completo, ooperador pode, opcionalmente, fornecer informações que relacionem a seqüência de imagens a umanotação de número de página e seqüência. O operador pode, também, indexar as divisões estruturaissignificativas dentro do documento e, então, poder salvar a estrutura e a informação de conteúdo emum arquivo de base de dados que, embora distinto, aponta para o conjunto de imagens que constituemo documento preservado. Se existem duas cópias de um documento em resoluções distintas, o arquivode estrutura deve apontar precisamente para as cópias como exemplos distintos do mesmo documentocom a mesma estrutura.

Uma vez que o arquivo de estrutura tenha sido criado, e até mesmo após ter sido permanentementearmazenado, o operador de indexação deve ser capaz de acessá-lo e modificá-lo. Além disso, umavez que o operador tenha criado um índice remissivo de números de páginas para um documentoespecífico, ele deve ser capaz, de imediato, de emitir um comando para ir até uma página específica.De forma similar, uma vez que o operador tenha criado um índice para a estrutura interna do documento,a aplicação deve permitir ao operador, com uma função especial de ‘marcador de página’, que assinalariauma imagem específica e permitiria o retorno direto a ela a qualquer momento. A localização dosmarcadores de página dos operadores, contudo, não deve ser salva na versão permanente do arquivode estrutura.

Ao aplicar a função de confinamento (armazenagem permanente), o operador verifica se oprocesso de conversão está completo e se o conjunto de imagens digitais resultante deve então serarmazenado. A função assume, por motivos de segurança e de conveniência do usuário, que osdocumentos de imagem e que a base de dados de arquivos de estrutura a eles associada estejamarmazenados em uma instalação de armazenagem central, acessível por rede e não por analogia aomicrofilme, em armários localizados nas proximidades das estações de ‘folheamento’. Nos casos emque o propósito da conversão não é criar uma cópia permanente do documento na forma digital e simimprimi-lo, a função de armazenagem permanente pode encerrar o processo transferindo as imagenscom o auxílio de meio removível ou através da rede, para a impressora digital de alta velocidade.

Com respeito à armazenagem em discos no processo de conversão, cada estação de trabalhoque controla o digitalizador requer espaço de trabalho suficiente em disco magnético para que o operadorpossa armazenar e manipular as imagens escaneadas, não-comprimidas, de pelo menos dois livros(aproximadamente 600 megabytes). Em cada estação de trabalho que realiza as funções de indexação

3 0

e de armazenagem permanente, deve haver também um meio de armazenagem portátil, como umdrive para disco óptico WORM (write once, read many) contendo o disco sobre o qual as imagenscomprimidas do documento podem ser gravadas e, em seguida, fisicamente transportadas ao local dearmazenagem permanente dos discos. Alternativamente, deve existir a possibilidade de gravar em umainstalação de armazenagem em massa através da rede de alta velocidade.

Armazenagem

O propósito do subsistema de armazenagem é propiciar um meio (ou uma combinação demeios) de alta capacidade, confiável para armazenagem de uma coleção de documentos que forampreservados em forma digital ao subsistema de armazenagem que permita recuperar documentos tantopara impressão quanto para ‘folheamento’ em uma estação de trabalho computadorizada. Oscomponentes do subsistema de armazenagem incluem os dispositivos para armazenagem em massa, ocontrolador de armazenagem em massa, o servidor de base de dados de imagem e o arquivo deestrutura do documento.

Deve-se presumir que o processo de conversão crie cada arquivo de imagem a uma resoluçãode 400 dpi e que a forma comprimida de cada imagem ocupe 150 kilobytes na armazenagem e quecada livro convertido consista de 300 páginas. Por simples multiplicação, com estas suposições,concluímos que uma biblioteca digital para os 10 mil livros selecionados para conversão no projeto deYale necessitará de aproximadamente 450 gigabytes para armazenagem em massa.

Considera-se que o disco óptico WORM é, atualmente, o meio mais eficiente, em termos decusto, para a armazenagem deste volume de informação

19. Contudo, se uma segunda cópia de cada

documento for criada a uma resolução inferior para fins de ‘folheamento’, as necessidades dearmazenagem podem ser substancialmente menores para a segunda cópia (cerca de 125 GB) do quepara a primeira e a freqüência do uso pode ser suficiente para justificar os custos de armazenagem dosarquivos de imagem em disco magnético, que proporciona tempos de acesso mais rápidos que o meioóptico. Os discos ópticos WORM contendo as versões de maior resolução para impressão podemser instalados em uma jukebox, ou mantidos fora de linha, o que exigiria um operador para intervir einstalá-lo quando solicitados. Os dados armazenados em meio magnético devem ser regularmentecopiados em fita (back up), como precaução contra a perda de dados devido a falhas do disco; osdados armazenados pelos meios WORM devem ser periodicamente copiados para novos meios, namedida em que os formatos ou os equipamentos de acesso se tornem obsoletos e sejam substituídos.

O controlador de armazenagem em massa no subsistema proporciona uma interface entra aarmazenagem em disco e o servidor de imagem. Ele traduz as solicitações de imagens em comandosque localizam e recuperam adequadamente os documentos de imagem armazenados no dispositivo dearmazenagem magnético ou na jukebox para discos ópticos. Quando o documento estiver armazenadofora de linha, controlador gerará uma solicitação ao operador para que instale o disco apropriado.Para solicitações de armazenagem de documentos de imagem, em vez de sua recuperação, o controladorlocalizará o espaço, armazenará os arquivos adequadamente e atualizará o diretório de arquivos.

19 Michael Lesk, op. cit., p. 306.

3 1

O arquivo de estrutura de documento contém aspectos de indexação, de informação, de estruturae do conteúdo de cada documento de imagem. Ele é um componentes essencial da biblioteca deimagens e a informação nele contida deve acompanhar cada solicitação de documento; reciprocamente,qualquer novo documento de imagem que for armazenado deve conter um componente de índice paraarmazenagem no arquivo de estrutura. Esse arquivo é uma base de dados relacional em conformidadecom a norma SQL. Sendo um arquivo online, ele requer cópia reserva (backup) regular.

O servidor de base de dados de imagem conecta o arquivo de estrutura do documento, atravésdo controlador de armazenagem, aos arquivos de documentos de imagens. Ele é acessível pela rede eresponde às solicitações de imagens, recuperando a informação relevante do arquivo de estrutura e osarquivos relevantes da biblioteca de imagens, preparando-os para entrega ao subsistema de acesso ouà impressora. O servidor também responde a solicitações para armazenagem de documentos de imagemassegurando que o arquivo de estrutura esteja atualizado e que os arquivos de imagem sejam transferidosao dispositivo de armazenagem em massa apropriado. O servidor requer um volume substancial dememória armazenada (cache) para os documentos que entram e que saem. Uma função crucial doservidor neste processo é fornecer dados informativos de status a seus usuários, inclusive informaçãoreferente ao andamento da transmissão e erros na armazenagem ou na recuperação.

Acesso

O propósito do subsistema de acesso é dar ao usuário a possibilidade de recuperar e utilizar abiblioteca de documentos preservados na forma de imagem. Os componentes do subsistema incluemo servidor de apresentação de imagem e as estações de visualização de imagem. No caso mais simplesdo subsistema, documentos de imagem devem ser apresentados para visualização em um único tipo deestação de trabalho fornecido pela biblioteca e cuja seleção ela controla. O caso mais complicadoocorre quando a biblioteca provê acesso aos documentos de imagem para os pesquisadores de todoo campus, que utilizam diferentes tipos de estações de trabalho com capacidades de exibição deimagem variáveis. Mas, em qualquer caso, as funções mínimas proporcionadas por uma estação devisualização devem ser as mesmas. A estação deve permitir ao usuário recuperar um documento deimagem através de seu identificador único e exibir e ‘folhear’ o documento, dependendo da forma emque ele está descrito no arquivo de estrutura.

Para conseguir lidar com imagens, cada estação de trabalho requer a habilidade de processopara ler, expandir e exibir uma imagem de página comprimida. As estações requerem um monitor dealta resolução capaz de exibir uma imagem de página legível. Cada estação de trabalho deveproporcionar funções gerais de manipulação de imagem como zoom, redução panorâmica, rolamentoe rotação. Finalmente, estações de visualização devem ser capazes de, se houver equipamentodisponível, transferir imagens para impressoras a laser locais a impressão de cópias de páginasselecionadas.

A partir da estação de trabalho de acesso, o usuário deve ser capaz de consultar o catálogoonline para determinar o identificador único de um documento. Determinado o identificador, o usuáriodeve, então, ser capaz de requisitar o documento ao servidor de imagem e tê-lo disponível paravisualização na tela do monitor. Não havendo qualquer informação adicional de índice, o usuário deveser capaz de percorrer o documento para frente e para trás, através da seqüência dos arquivos deimagem e de ir diretamente a qualquer imagem específica a partir de outra.

3 2

Contudo, se existir um índice de números de páginas, o usuário deve ser capaz de emitir umcomando para ir a uma página específica. Da mesma forma, se houver um índice para o sumário, para asseções e os capítulos do documento, além de outras partes importantes de sua estrutura, o software devepossibilitar acesso imediato à imagem inicial de cada uma dessas divisões estruturais. A interface devetambém proporcionar ao usuário uma função especial de marcador de página, que marque uma imagemespecífica e permita o retorno direto e imediato a essa imagem a qualquer momento; a localização dosmarcadores de página dos usuários, contudo, existiria apenas durante a sessão de ‘folheamento’.

O servidor de apresentação de imagem separa essas diferentes funções de acesso, que todas asestações de visualização devem proporcionar em comum, das diferentes formas como os sistemas deoperação das várias plataformas (DOS, UNIX, Macintosh) efetivamente as apresentam ao usuário.No início de uma sessão de ‘folheamento’, o servidor interrogará a estação de visualização específicapara determinar seu tipo e suas capacidades. Pode ser que a estação não esteja adequadamenteequipada para a visualização de imagens e, então, o servidor responderá neste sentido. Por outro lado,quando o servidor de imagem responder a uma solicitação por um documento, o servidor deapresentação será ativado. Ele usará o arquivo de estrutura do documento, que descreve aspectoscríticos do documento, e, utilizando as conversões do Office Document Architecture, fornecerá umconjunto de alto nível de instruções sobre como o conteúdo do documento deve ser apresentado. Oservidor traduz estas instruções para um formato e um conjunto de instruções de programas apropriadosà estação de trabalho específica. Utilizando um driver obtido do servidor, a estação de visualização,por sua vez, processa as instruções e gera um formato de apresentação que permita ao usuário ‘folhear’facilmente o documento de imagem.

Reprodução

O propósito do subsistema de reprodução é gerar cópias impressas de altíssima qualidade dosdocumentos selecionados, total ou parcialmente, que se encontram armazenados na forma de imagemdigital. Os componentes do subsistema incluem a impressora, um servidor de impressão e um solicitadorde impressão. A impressora dever ser capaz de aceitar como alimentação arquivos de imagem deresolução muito alta (600 pontos por polegada ou mais), devendo gerar cópias impressas com amesma resolução. Para maior economia, ela deveria operar a velocidades bastante elevadas (100páginas por minuto, ou mais, é um critério atual de referência) e apresentar capacidade interna decotejamento e encadernação.

O servidor de impressão gerencia a fila de espera para a impressora, proporcionando várioscontroles de operação, incluindo a possibilidade de definir prioridades de execução, de informar sobreo andamento das mesmas e de cancelá-las. Ele deveria contar com uma capacidade de transferênciade dados substancial e precisaria aceitar arquivos TIFF comprimidos de acordo com o padrão grupo4 do CCITT. Se precisar reformatar tais arquivos para um formato interno, deve fazê-lo sem qualquerperda de qualidade ou informação. Para acomodar necessidades de impressão diretamente do subsistemade conversão, o servidor de impressão pode precisar de um drive WORM compatível para a entradadireta do documento a ser impresso.

Os usuários que queiram imprimir total ou parcialmente um documento específico o farãochamando um serviço de rede que submeta requisições de impressão. Um indivíduo pode solicitar umacópia impressa de um documento de imagem através do identificador único especificado no catálogo

3 3

online. O serviço de requisição recuperará a informação de estrutura referente ao documento e pediráao mesmo para determinar quais as partes ou as páginas do documento a serem impressas e se énecessária a encadernação. O serviço de requisição de impressão deve possuir capacidade interna decontabilidade, de forma que os usuários possam ser cobrados pelas cópias que geraram. O uso geraldo serviço de requisição em rede para cobrança presume que haja uma maneira de identificar osusuários e de verificar se eles são realmente quem dizem que são. Considerando a questão da identificaçãocomo tendo sido realizada, uma extensão natural do serviço de requisição de impressão será utilizadapara coletar os encargos de royalty apropriados pela reprodução de documentos tais como artigosrecentes de periódicos, que podem ser, eventualmente, adicionados à biblioteca digital.

Aspectos de exeqüibilidade

Como foi visto, um conjunto de normas técnicas está sendo elaborado para regular a arquiteturade sistemas de imagem digital. Além disso, vem tomando corpo um entendimento geral sobre a naturezae a inter-relação dos componentes do sistema de imagem digital para preservação em larga escala, emYale, no qual o material convertido a partir do microfilme se torna, em formato de imagem,consideravelmente mais acessível e valioso à comunidade de pesquisadores.

O otimismo quanto à exeqüibilidade geral da criação de um sistema viável com base em umabiblioteca de imagens com 10 mil volumes não deve, contudo, obscurecer os riscos associados. Nemtodos os aspectos dos componentes do sistema e de suas inter-relações são tão bem compreendidosquanto outras partes; há ainda muitas incertezas e aspectos desconhecidos sobre a tecnologia e suaoperação. Invocando um princípio de projeto citado anteriormente — em que os dados criados earmazenados constituem o recurso principal de uma biblioteca em um sistema automatizado — eindagando de que maneira os dados estarão em maior risco nesta arquitetura específica, podemosidentificar pelo menos quatro áreas de preocupação que devem limitar ou impedir o desenvolvimentodo sistema e que, portanto, merecem especial atenção.

Em primeiro lugar, a área de maior preocupação é a integração dos dispositivos de armazenagemem massa. A tecnologia de armazenagem óptica WORM é, em geral, bem conhecida, mas formatospadronizados para o meio ainda não foram estabelecidos. Além disso, a experiência na indústria aindanão é muito rica no tocante à utilização atual da tecnologia e, em particular, à maneira de se otimizar acombinação de armazenagem magnética e óptica para aplicações específicas e, desta forma, melhoraro tempo de acesso e aliviar a disputa pelos drives em um ambiente multiusuário.

Diante das circunstâncias, a aplicação que a biblioteca espera desenvolver parece especial. Asaplicações da tecnologia de reprodução digital de imagem estão ganhando espaço em ambientes deescritório, onde o documento modelo é uma pasta de arquivo que contém uns poucos itens e quealguém consulta rapidamente e segue em frente. O documento modelo na biblioteca, contudo, é o livrocom algumas centenas de páginas, cujo texto alguém pode ler minuciosamente por algum tempo e,ocasionalmente, percorrer rapidamente para frente e para trás, para consultar pontos relacionados,citações, e assim por diante. Parece razoável prever que os diferentes padrões de uso de documentosna biblioteca sobrecarregarão os mecanismos de armazenagem em novas e diferentes maneiras,requerendo soluções que podem não estar, ainda, disponíveis. A questão é: a experiência corroboraráesta hipótese ou não?

3 4

Em segundo lugar, a questão da renovação periódica dos dados em meios ópticos dearmazenagem ainda causa preocupação. Centros de computação e fornecedores de computadores jáatravessaram muitos ciclos de alterações técnicas no tocante aos meios magnéticos, exigindo a recópiaperiódica de dados. Os ciclos de mudança na tecnologia óptica, contudo, apenas começaram a atingiros grandes centros de produção de dados. Devido ao fato da tecnologia ser diferente e do volume dedados armazenado no disco óptico ser, em ordem de magnitude, muito superior ao volume armazenadonos meios magnéticos, os conhecidos paradigmas de renovação de dados podem não ser aplicados.Os fornecedores desempenharão um papel chave na difusão de soluções apropriadas e práticas; porém,quando interrogados, poucos são capazes de articular tais soluções.

A terceira área principal de preocupação é o denominado arquivo de estrutura do documento.À medida em que a biblioteca indexa seus documentos de imagem pelo número da página ou pelaestrutura interna do documento, uma grande parte de seu trabalho e investimento vai sendo vinculadaa este arquivo de estrutura. Os padrões ODA (Office Document Architecture) e SQL parecemapropriados para regular sua natureza e organização e para fazer com que os dados neles contidossejam transferíveis para um outro sistema ou implementação quando necessário. Contudo, já estáclaro que este modo de investimento na biblioteca de imagens e nos vários índices incorporados noarquivo de estrutura de documento irá, sem dúvida, garantir a participação ativa da biblioteca de Yalenão só na implementação específica da ODA, mas também em suas extensões e desenvolvimento.

Finalmente, um quarto aspecto de preocupação potencial emana do processo de controle dequalidade. A comunidade bibliotecária esperou durante anos que, dada a tecnologia correta, omicrofilme fosse facilmente conversível à forma digital. O projeto de Yale gerará, certamente, bastanteinformação útil sobre a facilidade (ou dificuldade) técnica do processo de conversão. Porém, aqualidade do produto resultante do processo dependerá não somente dos mecanismos e da magiatécnica do processo de conversão por si só, como também da qualidade do microfilme, da qualidadenecessária às imagens digitais para servir como ‘alimentação’ para processos técnicos subseqüentes,bem como do reconhecimento óptico de caracteres (OCR), e dos padrões de qualidade reivindicadospelos usuários que usarão as imagens digitais em seu trabalho de pesquisa. Será importante nesteprojeto, então, capturar e avaliar as formas pelas quais o acervo para preservação em microfilmepossa ou deva ser alterado para gerar uma imagem digital melhor. Da mesma forma, será importanteencontrar maneiras de avaliar a qualidade do processo de digitalização do ponto de vista dos processostécnicos afins, como o reconhecimento de caracteres, tornando-se absolutamente essencial avaliaro processo do ponto de vista da satisfação do usuário.

Plano de trabalho

O projeto de preservação digital de Yale será baseado em trabalhos relacionados, desenvolvidosna Biblioteca do Congresso norte-americano, na Biblioteca Nacional de Medicina, na Universidadede Cornell e em outras instituições bibliotecárias e arquivísticas, concentrando-se na conversão demicrofilme para imagens digitais e almejando a construção de uma biblioteca digital com 10 mil volumesdurante o processo. Grande parte do equipamento e do software de aplicação necessários à construçãode um sistema em Yale já se encontra disponível no mercado, a partir dos fornecedores, ou encontra-se em estágio avançado de desenvolvimento pelos mesmos. A principal exceção é o gerenciador deapresentação de imagem descrito na seção anterior, para o qual a Yale conta com a mão-de-obraespecializada de desenvolvimento e que será gerado como um produto específico do sistema de Yale.

3 5

Naturalmente, preocupações sobre vários aspectos ambíguos e incertos da arquitetura de sistemasde imagem digital acentuam os riscos do investimento em tecnologia relativamente nova e cara, naescala contemplada pelo projeto da Yale. Contudo, estas preocupações chamam, também, a atençãopara as áreas de oportunidade que um projeto com o alcance e a extensão que tem o projeto da Yaleoferece para o avanço de nossa compreensão acerca do potencial e dos limites da tecnologia, para odesenvolvimento de certos aspectos da tecnologia e, acima de tudo, para reduzir de modo mensurávelos riscos do investimento para aquelas bibliotecas que venham a seguir o caminho da imagem digital.Para minorar os riscos do projeto e para ampliar suas possibilidades de gerar um retorno valioso, umasolução é um plano de implementação deliberado e cuidadoso com objetivos claros, resultadosmensuráveis e uma abordagem em etapas, de forma que tudo não seja perdido ou esteja necessariamenteem risco, caso surja algum problema ou obstáculo.

Objetivos do projeto

O projeto de preservação digital planejado para a Biblioteca da Universidade de Yale apresentatrês objetivos maiores:

• identificar, desenvolver e avaliar os meios de criar e armazenar uma biblioteca digital de materiaispreservados através da conversão de imagens armazenadas em microfilme para a formadigitalizada, numa escala de produção de 10 mil volumes;

• Identificar, desenvolver e avaliar os meios de propiciar, prover e melhorar a distribuição ou oacesso físico aos materiais preservados na forma de imagem digital, tanto de dentro quanto defora da biblioteca;

• Identificar, desenvolver e avaliar os meios de prover, preservar e melhorar o acesso intelectualaos materiais da biblioteca na forma de imagem digital.

Escopo do projeto

O projeto será dividido em seis fases, ao longo de três anos (Figura 7). A primeira se estenderádo mês 1 ao 4 e estabelecerá a estrutura organizacional geral para o projeto. Durante a segunda fase,que se estenderá do mês 5 ao 8, será feita a instalação inicial do hardware e do software. A fase 3estabelecerá um processo no nível de produção para a conversão de microfilme para imagens digitais.Ela terá início no mês 9 e terminará no mês 18. A quarta fase do projeto também terá início no mês 9,mas terminará no mês 21, quando os documentos e imagem digital se tornarem acessíveis aos usuáriosdentro da biblioteca de Yale. A quinta fase se estenderá do mês 22 ao 33 e estabelecerá o acesso aosdocumentos de imagem digital para usuários de fora da biblioteca de Yale. O projeto será concluído nasexta fase, durante os meses 34 ao 36, com a finalização da conversão dos 10 mil volumes, um ajustefinal e a avaliação de todos os componentes do sistema.

Em cada estágio, um relatório será gerado para assumir os resultados até então alcançados epara avaliar o mérito geral do projeto. Devido ao fato de que a tecnologia de imagem digital que estásendo investigada e demonstrada ainda está sujeita a rápidas alterações e desenvolvimento, é possível,embora pouco provável, que os resultados daqui vislumbrados emerjam em algum outro lugar ou queas capacidades da própria tecnologia ultrapassem as pretensões em que os projetos se fundamenta.Desta forma, cada relatório tratará o final daquela fase como um marco para perguntar e responder aseguinte questão: é valido continuar este projeto?

3 6

Fase 1 - Organização

Objetivo - O objetivo da fase 1 é criar a estrutura organizacional geral para o projeto e prepararo trabalho para as fases subseqüentes.

Cronograma - Meses 1-4

Atividades - Durante a fase 1, um Comitê Diretor será criado para prover a supervisão geral ea direção para o projeto. Ele será constituído, ao menos inicialmente, pelo diretor da Biblioteca daUniversidade, pelo diretor substituto, pelos bibliotecários ligados à Biblioteca para serviços técnicos,atendimento ao público e desenvolvimento de coleções — pelo chefe do Departamento de Preservação,pelo diretor de Computação e Sistemas de Informação da Universidade, pelo diretor acadêmico deComputação, pelo gerente do projeto e por quatro membros selecionados da equipe. O Comitê podeajustar sua composição ao longo do tempo, se necessário.

A agenda inicial do Comitê incluirá os seguintes itens:

• estabelecer os critérios para identificar que porções da coleção de microfilme para preservaçãoserão convertidas em imagens digitais;

• auxiliar o gerente do projeto e membros da equipe do projeto, no estabelecimento de relaçõesde parceria adequadas, com os fornecedores de equipamento e aplicações para o processamentodigital de documentos;

• rever o orçamento proposto para o projeto e auxiliar na identificação e obtenção de fontes definanciamento.

O gerente do projeto será o chefe do escritório de sistemas da biblioteca. A equipe do projetose constituirá, inicialmente, pelo chefe do Departamento de Preservação da Biblioteca e pelo diretorassociado de Sistemas, Tecnologias e Planejamento do Departamento de Computação e Sistemas deInformação. Durante esta fase, a equipe do projeto:

������ �3� � �������;���

3 7

• identificará o hardware e o software específicos que serão adquiridos para o projeto;

• estabelecerá relações de parceria adequadas com os fornecedores de equipamento e aplicaçõespara o processamento digital de documentos que serão adquiridos no projeto;

• preparará um plano da composição do quadro de profissionais envolvidos para todas as fasessubseqüentes do projeto;

• preparará um orçamento para o projeto inteiro e trabalhará com o Comitê Diretor e outrasfontes apropriadas para a obtenção de financiamentos.

Pré-requisitos - Este documento, Do microfilme à imagem digital, proporcionará a base eos fundamentos de planejamento para o trabalho inicial do Comitê Diretor e da equipe do projeto.

Produtos

• um orçamento para o projeto;

• um plano de custeio;

• um relatório resumindo os resultados do trabalho nesta fase.

Fase 2 - Estrutura

Objetivo - O objetivo da fase 2 é iniciar a instalação do ambiente de trabalho necessário aoprojeto.

Cronograma - Meses 5-8.

Atividades - A equipe do projeto:

• aplicará os critérios estabelecidos pelo Comitê Diretor e iniciará a seleção dos segmentos dacoleção de microfilme a serem convertidos;

• criará e iniciará a implementação de um plano para avaliar se os critérios utilizados na seleçãode material para conversão criarão uma biblioteca digital que os usuários da Biblioteca consideremintelectualmente valiosa;

• contratará os profissionais necessários;

• adquirirá, instalará e testará o hardware e o software para o subsistema de conversão;

• adquirirá, instalará e testará a impressora digital de alta velocidade e o servidor de impressão.

• adquirirá, instalará e testará o componente do arquivo de estrutura de documento do subsistemade armazenagem e começará a adquirir, instalar e testar os outros componentes do subsistemade armazenagem;

• preparará o projeto e as especificações iniciais para o servidor de apresentação de imagem.

Além disso, a equipe firmará um contrato com uma agência de prestação de serviços paraconverter, de microfilme para a forma de imagem digital, até 10 volumes selecionados aleatoriamente.O contrato estabelecerá a linha base de custos para comparação com os custos de processamento naprópria instituição. Fornecerá, também, experiência na formulação e aplicação de critérios de aceitaçãopara o processo de controle de qualidade dentro da instituição. Presumivelmente, neste estágio, osdocumentos serão desenvolvidos na forma de imagem, sem qualquer indexação.

3 8

Pré-requisitos - Para que esta fase se inicie, deve haver um orçamento aprovado, provido dosfundos necessários para cobrir os custos de pessoal, da aquisição de hardware e software e daagência de prestação de serviços.

Produtos

• dez volumes estarão disponíveis na forma digital e prontos para o processo de indexaçãodentro do subsistema de conversão;

• um relatório resumindo os resultados do trabalho nesta fase, incluindo uma análise da experiênciacom a agência de prestação de serviços e um plano para avaliar sistematicamente, durante todaa duração o projeto, os méritos da conversão dentro da própria instituição versus a utilizaçãoda agência de prestação de serviços.

Fase 3 - Conversão

Objetivo - O objetivo da fase 3 é estabelecer um processo em nível de produção para aconversão de microfilme para imagens digitais.

Cronograma - Meses 9-18.

Atividades - As principais tarefas da equipe do projeto nesta fase incluem:

• desenvolver procedimentos e treinar o(s) operador(es) no uso do digitalizador e da estação detrabalho de controle de qualidade, incluindo suas características de realce de imagens;

• selecionar para a digitalização, no início desta fase, uma amostra de carretéis de microfilme quereflita as variações na qualidade do processo de microfilmagem. Planejar um método para utilizaresta amostra tanto para praticar o processo de controle de qualidade quanto para iniciar aformulação de conclusões sobre as maneiras como as técnicas de microfilmagem podem afetara qualidade do processo de digitalização;

• planejar e implementar um padrão de controle de qualidade que considere, em especial, apossibilidade futura de aplicação da tecnologia de reconhecimento de caracteres às imagensgeradas neste processo de conversão;

• criar um processo contínuo para a avaliação da satisfação do usuário com os processos e asnormas técnicas de controle de qualidade;

• rever o projeto do índice de número de página e do índice de estrutura do documento para assegurarque conexões podem ser criadas, no futuro, entre estes índices e as notas de conteúdo suplementarese que possam estar armazenadas em algum outro local, em formato legível por computador;

• desenvolver procedimentos e treinar o(s) operador (es) no uso de cada uma das quatro diferentesfunções de indexação de documentos. O(s) operador(es) no uso de cada uma das quatro diferentesfunções de indexação de documentos. O(s) operador(es) deveria(m) ser capaz(es) de: 1) atribuirum identificador único ao conjunto de imagens convertidas que constituiriam uma entidadedocumental única; 2) indexar o documento imagem por número de página; 3) indexar o documentoimagem pela estrutura interna do documento; 4) criar uma entidade bibliográfica no catálogoonline da Yale que descreva o documento imagem e o identifique na biblioteca de imagem digitalatravés de seu identificador único;

3 9

• planejar métodos de estruturação e alteração do fluxo de trabalho de indexação para isolar oscustos de cada uma das quatro formas de indexação de documentos;

• desenvolver procedimentos e treinar o(s) operador(es) para confinar o documento imagem eos índices do documento à armazenagem em arquivo permanente utilizando, neste estágio, umdrive portátil WORM;

• revisar os critérios para a seleção de materiais de preservação de alta utilização dos quais umacópia impressa será encadernada e devolvida à estante;

• desenvolver procedimentos e treinar o(s) operador(es) para transferir as imagens de documentosselecionados diretamente para a impressora de documentos de imagem de alta qualidade. Omodo de transmissão preferível é através da rede de alta velocidade;

• planejar um método de estruturação do fluxo de trabalho para isolar os custos de digitalização,controle de qualidade e impressão, sem qualquer indexação;

• planejar um método e um procedimento contínuo para comparar os custos de digitalização,controle de qualidade e indexação na própria instituição com os custos correspondentes, a nívelde agência de prestação de serviços;

• indexar e confinar à armazenagens os 10 volumes digitalizados pela agência de prestação deserviços na fase 2;

• digitalizar, realçar, indexar e confinar à armazenagem, em arquivo permanente, 490 volumes.

Pré-requisitos - Para que esta fase possa começar, o subsistema de conversão, a impressora,o servidor de impressão e o componentes de arquivo de estrutura de documento do subsistema dearmazenagem devem todos estar instalados e testados.

Aspectos a serem investigados - O trabalho nesta fase é concebido para produzir mediçãocriteriosa de qualidade e custo ao longo de várias dimensões, incluindo:

• os possíveis efeitos da qualidade do microfilme sobre a qualidade da digitalização;

• as implicações de um possível futuro reconhecimento de caracteres no processo de controlede qualidade na digitalização do microfilme;

• a satisfação do usuário com os padrões e processos de controle de qualidade;

• os custos relativos de digitalização, controle de qualidade e indexação na própria instituição eem uma agência de prestação de serviços;

• os custos variáveis dos diferentes níveis de indexação;

• os custos da digitalização e impressão simples, sem indexação.

Será importante coletar e monitorar estas várias medidas em uma base contínua durante todo oprojeto.

Produtos

• operação do subsistema de conversão em níveis de produção;

• 500 volumes digitalizados e completamente indexados;

4 0

• um relatório resumindo os resultados do trabalho nesta fase, incluindo uma análise dos custos.

Fase 4 - Acesso à Biblioteca

Objetivo - O objetivo da fase 4 é tornar a crescente biblioteca de imagem digital acessível aosusuários através de estações de trabalho localizadas dentro da biblioteca de Yale.

Cronograma - Meses 9-21.

Atividades - As principais tarefas da equipe do projeto nesta fase incluem:

• completar a aquisição, instalação e teste do subsistema de armazenagem;

• especificar, adquirir, instalar e testar as estações de acesso na biblioteca;

• desenvolver e testar um protótipo do servidor de apresentação de imagem capaz de interagircom as estações de acesso, na biblioteca;

• projetar e implementar um estudo para medir o valor, para os usuários da biblioteca, de cadauma das ferramentas de índice disponíveis para o documento digital, em comparação com oaceso ao microfilme;

• criar e implementar um plano para fazer cópia reserva (back up) dos dados armazenadossobre meios magnéticos e para, periodicamente, renovar os dados armazenados nos meiosópticos e magnéticos;

• transferir todos os volumes digitalizados para o sistema de armazenagem permanente;

• conceber um método para estimar os custos da adição do subsistema de armazenagem e demanutenção a uma base contínua;

• estabelecer e implementar métodos e procedimentos contínuos para estimar os efeitos dacarga de acesso sobre a performance do subsistema de armazenagem de imagem;

• conceber e implementar métodos e procedimentos contínuos para monitoramento e ajuste dosdefeitos da transmissão de imagens sobre a performance da rede;

• conceber métodos para estimar os custos da criação e manutenção do subsistema de acesso;

• adquirir, instalar e testar o solicitador de impressão;

• conceber métodos para estimar os custos da criação e manutenção do subsistema de impressão;

• após o término da fase 2 e durante os meses 16-18, digitalizar, realçar, indexar e confinar àarmazenagem permanente 1.300 volumes.

Pré-requisitos - Para que esta fase se inicie, a impressora, o servidor de impressão e ocomponente de arquivo de estrutura de documento do subsistema de armazenagem devem estarinstalados e testados. O projeto inicial e as especificações para o servidor de apresentação de imagemdevem também estar completos.

Aspectos a ser investigados - O trabalho nesta fase é concebido para produzir mediçãocriteriosa de qualidade e custo ao longo de várias dimensões, incluindo:

• os custos da criação e manutenção do subsistema de armazenagem;

4 1

• os custos de confecção de cópia reserva (backup) dos dados armazenados sobre discomagnético e da renovação periódica dos dados armazenados em meios óptico e magnético;

• os custos da criação e manutenção do subsistema de acesso;

• os custos da criação e manutenção do subsistema de impressão;

• os efeitos da carga de acesso sobre o subsistema de armazenagem;

• os efeitos da carga de transmissão sobre a rede;

• o valor dos índices de documento para os usuários na biblioteca;

Será importante coletar e monitorar estas várias medidas em uma base contínua durante todo oprojeto.

Produtos

• Subsistema de armazenagem de imagens operando em níveis de produção;

• Subsistema de impressão operando em níveis de produção;

• Protótipo do gerenciador de apresentação de imagem;

• Subsistema de acesso operando em níveis de produção na biblioteca;

• Servidor de solicitação de impressão;

• 1.300 volumes digitalizados e completamente indexados;

• Um relatório resumindo os resultados do trabalho nesta fase, incluindo uma análise de custos.

Fase 5 - Acesso remoto

Objetivo - O objetivo da fase 5 é estabelecer o acesso aos documentos de imagem digital defora da biblioteca de Yale.

Cronograma - Meses 22-23

Atividades - As principais tarefas da equipe do projeto nesta fase incluem:

• estender a operação do servidor de apresentação de imagens, de forma a torná-lo capaz deinteragir com tipos selecionados de estações de trabalho fora da biblioteca;

• tornar o subsistema de acesso às imagens disponível, através do servidor de apresentação deimagens, a tipos selecionados de estações de trabalho conectadas à rede do campus;

• conceber métodos para estimar os custos iniciais e os custos contínuos da introdução doacesso ao sistema de imagem de fora da biblioteca;

• planejar e implementar um estudo para medir o valor, para os usuários de fora da biblioteca, decada uma das ferramentas de índice disponíveis para o documento digital;

• digitalizar, realçar, indexar e confinar à armazenagem permanente 7.800 volumes.

Pré-requisitos - Para que esta fase se inicie, o protótipo do servidor de apresentação deimagem deve estar completo e operacional.

4 2

Aspectos a ser investigados - O trabalho nesta fase é projetado para produzir mediçõescriteriosas do valor dos índices de documento para usuários de fora da biblioteca. Será importantecoletar e monitorar estas medidas em uma base contínua durante esta e a última fase do projeto.

Produtos

• gerenciador de apresentação de imagem em nível de produção;

• operação do subsistema de acesso a partir de estações de trabalho fora da biblioteca;

• 7.800 volumes digitalizados e completamente indexados;

• um relatório resumindo os resultados do trabalho nesta fase, incluindo uma análise de custos.

Fase 6 - Finalização

Objetivo - O objetivo da fase 6 é completar a conversão dos 10 mil volumes e realizar umajuste e uma avaliação finais de todos os componentes do sistema.

Cronograma - Meses 34-36.

Atividades - As tarefas principais da equipe do projeto nesta fase incluem:

• rever e avaliar todas as medições de qualidade e performance em cada um dos subsistemas.

• digitalizar, realçar, indexar e confinar à armazenagem permanente 400 volumes.

Pré-requisitos - Para que esta fase se inicie, a versão de produção do servidor de apresentaçãode imagens deve estar completa e operacional.

Produtos

• um relatório final;

• 400 volumes digitalizados e completamente indexados.

Conclusão

A biblioteca da Universidade de Yale prevê um futuro em que a tecnologia de imagem digitalconstituirá uma ferramenta fundamental no processo de preservação dos materiais em deterioração desuas ricas e valiosas coleções. Justamente no momento em que a deterioração de documentos compostosde papel ácido está se acelerando a uma taxa alarmante em Yale e em outras grandes bibliotecas depesquisa por todo os Estados Unidos, a arquitetura de sistemas de imagem digital está se tornandomais conhecida, e os componentes do sistema estão cada vez mais bem integrados e prontamentedisponíveis. A Biblioteca do Congresso norte-americano, A Biblioteca Nacional de Medicina, aUniversidade Cornell e outras instituições bibliotecárias e arquivísticas têm fornecido, de diferentesformas, grandes contribuições ao desenvolvimento da tecnologia de imagem digital e à sua aplicaçãopara preservar e melhorar o acesso geral ao manancial nacional e internacional de conhecimentoregistrado. Este é o momento certo para outro grande passo no sentido de fazer da tecnologia deimagem digital uma ferramenta prática para bibliotecas.

O projeto de preservação digital de Yale será fundamentado em trabalho de igual natureza aosdesenvolvidos em outras instituições, particularmente na Universidade de Cornell. Concentrando-se

4 3

na conversão de microfilme para imagens digitais e almejando a construção de uma biblioteca digitalcom 10 mil volumes. Grande parte do equipamento e do software de aplicação necessários à construçãode um sistema em Yale já está disponível no mercado, ou em estágio avançado de desenvolvimentopelos fornecedores. Contudo, o sistema de processamento de imagens digitais para preservação daYale implicará em um grau elevado de capital e, particularmente na fase de indexação do processo deconversão, de trabalho. Seu sucesso exigirá auxílio considerável de agências de financiamento e parceriassignificativas e produtivas com membros da comunidade de fornecedores. O resultado para todos osparticipantes do projeto será um corpo substancial de informações sobre os custos e benefícios datecnologia de imagem digital. As bibliotecas, e os fornecedores que com elas trabalham, dependerãode tais informações, no futuro, para tomar decisões prudentes e práticas sobre a incorporação datecnologia aos materiais nela contidos.

Notas

Agradecimentos: Na preparação deste relatório de planejamento, eu recebi muita ajuda de várias pessoas em váriasinstituições privadas e universitárias. Elas são muito numerosas para serem individualmente citadas; eu sou muito grato a todaselas. Contudo, quero agradecer a meus colegas do Escritório de Sistemas da Biblioteca da Universidade de Yale, Merri BethLavagnino e Greg Kaisen, por sua considerável ajuda. Agradeço, também, à Commision of an Access Preservation por seu apoioatravés da contratação da biblioteca da Universidade de Yale para elaborar este relatório.

Donald J. WatersChefe do Escritório de SistemasBiblioteca da Universidade de YaleNew Haven, Connecticut 06520

O Projeto Conservação Preventiva em Bibliotecas e Arquivos - CPBAestá sediado no

Arquivo NacionalRua Azeredo Coutinho 77, sala 605 - C

CEP 20230-170 Rio de Janeiro - RJTel/Fax: (21) 2253-2033

www.cpba.netwww.arquivonacional.gov.br

The Council on Library and Information Resources - CLIR(incorporando a antiga Commission on Preservation and Access)

1755 Massachusetts Avenue, NW, Suite 500Washington, DC 20036

Tel: (202) 939-4750Fax: (202) 939-4765

www.clir.org

Armazenagem e manuseio

Conservação

Meio Ambiente

Emergências

1. Métodos de armazenamento e práticas demanuseio2. A limpeza de livros e de prateleiras3. A escolha de invólucros de qualidadearquivística para armazenagem de livros edocumentos4. Invólucros de cartão para pequenos livros5. A jaqueta de poliéster para livros6. Suporte para livros: descrição e usos7. Montagens e molduras para trabalhosartísticos e artefatos em papel8. Mobiliário de armazenagem: um breveresumo das opções atuais9. Soluções para armazenagem de artefatosde grandes dimensões

10. Planificação do papel por meio deumidificação11. Como fazer o seu próprio passe-partout12. Preservação de livros de recortes e álbuns13. Manual de pequenos reparos em livros

14. Temperatura, umidade relativa do ar, luz equalidade do ar: diretrizes básicas depreservação15. A proteção contra danos provocados pelaluz16. Monitoramento da temperatura eumidade relativa17. A proteção de livros e papéis duranteexposições18. Isopermas: uma ferramenta para ogerenciamento ambiental19. Novas ferramentas para preservação-avaliando os efeitos ambientais a longo prazosobre coleções de bibliotecas e arquivos

20. Planejamento para casos de emergência21. Segurança contra as perdas: danosprovocados por água e fogo, agentesbiológicos, roubo e vandalismo22. Secagem de livros e documentosmolhados23. A proteção de coleções durante obras24. Salvamento de fotografias em casos deemergência25. Planilha para o delineamento de planosde emergência26. Controle integrado de pragas27. A proteção de livros e papel contra omofo28. Como lidar com uma invasão de mofo:instruções em resposta a uma situação deemergência29. Controle de insetos por meio de gasesinertes em arquivos e bibliotecas

Armazenagem e manuseio

Conservação

Meio Ambiente

Emergências

Planejamento

Edifício/Preservação

Fotografias e filmes

Registros sonoros e fitas magnéticas

Reformatação

30. Planejamento para preservação31. Políticas de desenvolvimento de coleção epreservação32. Planejamento de um programa eficaz demanutenção de acervos33. Desenvolvimento, gerenciamento epreservação de coleções34. Seleção para preservação: umaabordagem materialística35. Considerações complementares sobre:"Seleção para preservação: uma abordagemmaterialística"36. Implementando um programa de reparoe tratamento de livros37. Programa de Planejamento dePreservação: um manual para auto-instruçãode bibliotecas

38. Considerações sobre preservação naconstrução e reforma de bibliotecas:planejamento para preservação

39. Preservação de fotografias: métodosbásicos para salvaguardar suas coleções40. Guia do Image Permanence Institute (IPI)para armazenamento de filmes de acetato41. Indicações para o cuidado e aidentificação da base de filmes fotográficos

42. Armazenamento e manuseio de fitasmagnéticas43. Guarda e manuseio de materiais deregistro sonoro

44. O básico sobre o processo de digitalizarimagens45. Microfilme de preservação: plataformapara sistemas digitais de acesso46. O processo decisório em preservação efotocopiagem para arquivamento47. Controle de qualidade em cópiaseletrostáticas para arquivamento48. Microfilmagem de preservação: um guiapara bibliotecários e arquivistas49. Do microfilme à imagem digital50. Uma abordagem de sistemas híbridospara a preservação de materiais impressos51. Requisitos de resolução digital para textos:métodos para o estabelecimento de critériosde qualidade de imagem52. Preservação no universo digital53. Manual do RLG para microfilmagem dearquivos

Planejamento

Edifício/Preservação

Fotografias e filmes

Registros sonoros e fitas magnéticas

Reformatação

Títulos PublicadosTítulos Publicados

CONSERVAÇÃO PREVENTIVA

EM BIBLIOTECAS E ARQUIVOS

49

Do microfilme à imagem digitalDo microfilme à imagem digital

2 ediçãoa

Donald J. WatersDonald J. Waters

capa 49.psD:\Trabalho\Clientes\CPBA\Capas Final\capa 49.cdrter a-feira, 19 de junho de 2001 18:08:54

Perfil de cores: DesativadoComposi ªo Tela padrªo