preservação de documentos digitais - scielo - scientific ... resumo o presente artigo tem como...

13
15 Resumo O presente artigo tem como objetivo apresentar o resultado de uma pesquisa bibliográfica sobre a preservação digital. São analisadas as questões mais relevantes no estudo das práticas atuais relacionadas com a preservação dos documentos em formato digital. Dados foram coletados na literatura produzida por especialistas experientes na área, os quais proporcionam ampla lista de argumentos que mostram a emergência e importância das atividades de preservação relacionadas aos objetos digitais. Palavras-chave Preservação digital; Metadados; Repositórios digitais; Modelo de preservação OAIS; Biblioteca digital. Preservation of digital documents Abstract The objective of this article is to present the results of a bibliographic research about digital preservation. The most relevant questions concerning the study of the current practices related to the preservation of documents on digital format are investigated. Data was collected on the literature produced by specialists, who put forth a wide list of arguments showing the emergency and importance of activities about preservation related to the digital objects. Keywords Digital Preservation; Metadata; Digital repositories; OAIS preservation model; Digital library. Preservação de documentos digitais O conteúdo, a estrutura e o contexto da informação digital devem ser associados às funcionalidades do software que preserva suas conexões executáveis ou representações de suas relações, permitindo a sua reconstrução. (David Bearman, 1994) Miguel Angel Arellano Doutorando em ciência da informação. E-mail: [email protected] INTRODUÇÃO A natureza dos documentos digitais está permitindo ampla produção e disseminação de informação no mundo atual. É fato que na era da informação digital se está dando muita ênfase à geração e/ou aquisição de material digital, em vez de manter a preservação e o acesso a longo prazo aos acervos eletrônicos existentes. O suporte físico da informação, o papel e a superfície metálica magnetizada se desintegram ou podem se tornar irrecuperáveis. Existem, ademais, os efeitos da temperatura, umidade, nível de poluição do ar e das ameaças biológicas; os danos provocados pelo uso indevido e o uso regular, as catástrofes naturais e a obsolescência tecnológica. A aplicação de estratégias de preservação para documentos digitais é uma prioridade, pois sem elas não existiria nenhuma garantia de acesso, confiabilidade e integridade dos documentos a longo prazo. É preciso chamar a atenção para a importância de informar o contexto do objeto digital a ser registrado (e preservado) para que, dessa maneira, futuros usuários possam entender o ambiente tecnológico no qual ele foi criado. A preservação dos documentos continua a ser determinada pela capacidade de o objeto informacional servir às utilizações que lhe são imputadas, às suas atribuições que garantem que ele continue a ser satisfatório às utilizações posteriores. Mas, no caso específico dos documentos em formato digital, a preservação dependerá principalmente da solução tecnológica adotada e dos custos que ela envolve. CONTEXTO A preservação é um dos grandes desafios do século XXI. Durante os últimos anos do século XX, apenas as bibliotecas, os arquivos e os centros e institutos de pesquisa e organismos governamentais criavam conteúdo digital relevante. Segundo Cunha (1999), nos últimos anos duas das funções básicas das bibliotecas estão sofrendo “perigo de extinção: a provisão de acesso à informação e a preservação do conhecimento para Ci. Inf., Brasília, v. 33, n. 2, p. 15-27, maio/ago. 2004

Upload: phunghuong

Post on 12-Jun-2018

214 views

Category:

Documents


0 download

TRANSCRIPT

15

Resumo

O presente artigo tem como objetivo apresentar o resultadode uma pesquisa bibliográfica sobre a preservação digital.São analisadas as questões mais relevantes no estudo daspráticas atuais relacionadas com a preservação dosdocumentos em formato digital. Dados foram coletados naliteratura produzida por especialistas experientes na área,os quais proporcionam ampla lista de argumentos quemostram a emergência e importância das atividades depreservação relacionadas aos objetos digitais.

Palavras-chave

Preservação digital; Metadados; Repositórios digitais;Modelo de preservação OAIS; Biblioteca digital.

Preservation of digital documents

Abstract

The objective of this article is to present the results of abibliographic research about digital preservation. The mostrelevant questions concerning the study of the currentpractices related to the preservation of documents on digitalformat are investigated. Data was collected on the literatureproduced by specialists, who put forth a wide list ofarguments showing the emergency and importance ofactivities about preservation related to the digital objects.

Keywords

Digital Preservation; Metadata; Digital repositories; OAISpreservation model; Digital library.

Preservação de documentos digitais

O conteúdo, a estrutura e o contexto da informação digitaldevem ser associados às funcionalidades do software quepreserva suas conexões executáveis ou representações de suasrelações, permitindo a sua reconstrução.

(David Bearman, 1994)

Miguel Angel ArellanoDoutorando em ciência da informação.E-mail: [email protected]

INTRODUÇÃO

A natureza dos documentos digitais está permitindoampla produção e disseminação de informação nomundo atual. É fato que na era da informação digital seestá dando muita ênfase à geração e/ou aquisição dematerial digital, em vez de manter a preservação e oacesso a longo prazo aos acervos eletrônicos existentes.O suporte físico da informação, o papel e a superfíciemetálica magnetizada se desintegram ou podem se tornarirrecuperáveis. Existem, ademais, os efeitos datemperatura, umidade, nível de poluição do ar e dasameaças biológicas; os danos provocados pelo usoindevido e o uso regular, as catástrofes naturais e aobsolescência tecnológica. A aplicação de estratégias depreservação para documentos digitais é uma prioridade,pois sem elas não existiria nenhuma garantia de acesso,confiabilidade e integridade dos documentos a longoprazo.

É preciso chamar a atenção para a importância deinformar o contexto do objeto digital a ser registrado (epreservado) para que, dessa maneira, futuros usuáriospossam entender o ambiente tecnológico no qual elefoi criado. A preservação dos documentos continua aser determinada pela capacidade de o objetoinformacional servir às utilizações que lhe são imputadas,às suas atribuições que garantem que ele continue a sersatisfatório às utilizações posteriores. Mas, no casoespecífico dos documentos em formato digital, apreservação dependerá principalmente da soluçãotecnológica adotada e dos custos que ela envolve.

CONTEXTO

A preservação é um dos grandes desafios do século XXI.Durante os últimos anos do século XX, apenas asbibliotecas, os arquivos e os centros e institutos depesquisa e organismos governamentais criavam conteúdodigital relevante. Segundo Cunha (1999), nos últimosanos duas das funções básicas das bibliotecas estãosofrendo “perigo de extinção: a provisão de acesso àinformação e a preservação do conhecimento para

Ci. Inf., Brasília, v. 33, n. 2, p. 15-27, maio/ago. 2004

16

futuras gerações”. Atualmente muitas coleções digitaisimportantes estão sendo construídas fora das bibliotecaspor diferentes organizações, ou sendo publicadasdiretamente na Internet. Com o aumento da produçãode informação em formato digital, tem sido questionadacada vez mais a importância de se ter garantida a suadisponibilização e preservação por longos períodos detempo. Essa preocupação envolve tanto os produtoresdos dados quanto os órgãos detentores dessa informação.No início, as práticas relacionadas com a preservaçãodigital estavam baseadas na idéia de garantir alongevidade dos arquivos, mas essa preocupação agoraestá centralizada na ausência de conhecimento sobre asestratégias de preservação digital e o que isso poderásignificar na necessidade de garantir a longevidade dosarquivos digitais.

Em nível mundial, as iniciativas se multiplicam (NLNZ,2003), e novas soluções são testadas por instituiçõesdetentoras de acervos de especial relevância para odesenvolvimento científico e tecnológico de seus paísesde origem. Muitos projetos e iniciativas têm conseguidoestabelecer os benefícios de algumas metodologias eestratégias. A conclusão a que essas iniciativas chegam éque devem ser usados padrões e converterem-se osdocumentos nos formatos livres, para que eles sejamacessados após a obsolescência dos equipamentos eprogramas informáticos em que foram criados. Usarpadrões abertos permite seu estudo e sua conversão paranovos padrões.

Os objetos digitais* não podem ser deixados em formatosobsoletos para serem transferidos depois de longosperíodos de negligência para repositórios digitais. O desafioé muito mais um problema social e institucional do queum problema técnico, porque, principalmente para apreservação digital, depende-se de instituições quepassam por mudanças de direção, missão, administraçãoe fontes de financiamento. Muitos materiais publicadosdigitalmente são produto de serviços de informaçãodisponibilizados por organizações que adotam algumainfra-estrutura tecnológica. Essas instituições levam emconsideração aspectos legais e culturais que afetam aoferta desses serviços orientados a atender as necessidadesde determinados usuários. Mas muitas vezes essapreocupação não é a mesma que têm os produtores dasnovas tecnologias.

Para os detentores de acervos digitais, é cada vez maisimperiosa a necessidade de contar com mecanismos quegarantam a preservação de seus documentos em formatodigital. Especificamente essa preocupação parte dascomunidades responsáveis pelas bibliotecas e pelosarquivos, para as quais o desenvolvimento de padrões ede mecanismo legais para lidar com arquivos eletrônicosprecisa de estratégias metodológicas bem definidas.

Para Sant’Anna (2001), é responsabilidade dos arquivosadotar medidas preventivas e corretivas objetivandominimizar a ação do tempo sobre o suporte físico da informação,assegurando sua disponibilidade. A perspectivaarquivística da preservação parte da compreensão doslimites e significados dos documentos (autenticidade,capacidade probatória, integridade das informações,contexto de produção, manutenção etc.), dando ênfaseàs tarefas que as organizações e instituições arquivísticasque criam e são responsáveis pela guarda permanentedesses documentos devem observar para lidar comobjetos digitais autênticos. Os arquivos administrativosrequerem o desenvolvimento de parâmetros decertificação da qualidade dos seus processos e serviços.O chamado “arquivamento” relacionado com ogerenciamento do armazenamento de registros passou aestar unido ao termo mais comum “arquivo”, queatualmente está mais identificado com formato eletrônicode documentos (e-print, pré-print, pós-print etc.).

Na área da ciência da informação, o uso da tecnologiadigital que toma o lugar dos tradicionais meios depreservação, como a microfilmagem, trouxe consigo apreocupação com as normas para o uso das técnicasdigitais e sua prontidão na tarefa da preservação a longoprazo (Chepesuik, 1997). Os especialistas da área quetrabalham com informação em formatos digitais estãoelaborando normas necessárias para armazenar ecompartilhar de maneira adequada esses materiais, assimcomo buscam a formulação de políticas institucionaisde preservação. Segundo Webb (2000), as bibliotecassão responsáveis por manter coleções para usopermanente, protegendo-as de ameaças, ou salvando-ase reparando-as para compensar seus impactos. Ossistemas de bibliotecas digitais atuais envolvem um grandeesforço de gerenciamento de coleções digitais que vaialém das tarefas tradicionais das bibliotecas (aquisição,seleção, classificação, arquivamento etc.), na construçãoda interoperabilidade de acervos digitais (arquiteturas,metadados, formatos padrão), que é possível por meiode sistemas relacionados e desenvolvidos para propósitose comunidades específicas (Arms, 2000).* Um objeto digital é aquele que foi criado em computador,

podendo ser original ou uma versão depois de haver sido convertido(ou digitalizado).

Miguel Angel Arellano

Ci. Inf., Brasília, v. 33, n. 2, p. 15-27, maio/ago. 2004

17

Para alguns especialistas, as bibliotecas digitais sãoconsideradas o caminho mais adequado para apreservação dos recursos de informação (Hildreth, 1996).As bibliotecas digitais são meios mais dinâmicos parapreservação digital do que as bibliotecas tradicionais,no sentido da sua adaptação às freqüentes mudançastecnológicas (Lesk, 1997). Para outros autores, os centrosde preservação estão sendo considerados os lugaresadequados para se testar e formular as metodologias epolíticas a serem adotadas pelos provedores deinformação científica. Os centros estariam localizadosem instituições confiáveis e capazes de armazenar,migrar e dar acesso a coleções digitais (RLG, 2002).O treinamento de especialistas e técnicos é tambémcontemplado nos custos das atividades desses centros,produzindo melhora na aplicação efetiva das estratégias(Chapman, 2003).

No quadro 1, está representado o lugar das estratégiasde preservação no fluxo dos documentos digitais dentroda estrutura da biblioteca digital (Borbinha & Correia,2001).

Na preservação de documentos digitais, assim com nados documentos em papel, é necessária a adoção deferramentas que protejam e garantam a sua manutenção.Essas ferramentas deverão servir para reparar e restaurarregistros protegidos, prevendo os danos e reduzindo osriscos dos efeitos naturais (preservação prospectiva), oupara restaurar os documentos já danificados (preservaçãoretrospectiva). Para Margaret Hedstrom (1996), apreservação digital é “(...) o planejamento, alocação derecursos e aplicação de métodos e tecnologias paraassegurar que a informação digital de valor contínuopermaneça acessível e utilizável”. A preservação digitalcompreende os mecanismos que permitem oarmazenamento em repositórios de dados digitais quegarantiriam a perenidade dos seus conteúdos.

As condições básicas à preservação digital seriam, então,a adoção desses métodos e tecnologias que integrariama preservação física, lógica e intelectual dos objetosdigitais. A preservação física está centrada nos conteúdosarmazenados em mídia magnética (fitas cassete de áudioe de rolo, fitas VHS e DAT etc.) e discos óticos (CD-ROMs,WORM, discos óticos regraváveis). A preservação lógicaprocura na tecnologia formatos atualizados para inserçãodos dados (correio eletrônico, material de áudio eaudiovisual, material em rede etc.), novos software ehardware que mantenham vigentes seus bits, para conservarsua capacidade de leitura.

QUADRO 1As estratégias de preservação no fluxo dos objetosdigitais na biblioteca digital

Aquisição Entrega pelo produtor

Captura pela biblioteca

Coletado pela biblioteca

Verificação Integridade física (meio)

Integridade do conteúdo Integridade lógica

Autenticação

Registro Metadados Descrição bibliográfica

Instalação e manipulação

Acesso

Preservação

Preservação Preservação física Refrescamento do meio

Migração de suporte

Preservação lógica Conversão de formatos

Emulação

Preservação intelectual

Acesso Condições de uso Acesso local

Acesso remoto

No caso da preservação intelectual, o foco são osmecanismos que garantem a integridade e autenticidadeda informação nos documentos eletrônicos. SegundoBorbinha & Correia (2001), a preservação digitalrepresenta um novo agrupamento da perspectiva que setinha dos requisitos associados com as atividadestradicionais nessa área. Como mostra o quadro 2, apreservação física continua relevante na mídia eletrônica,ainda que o seu armazenamento tenha mostrado anecessidade de constante atividade de migração paranovos materiais (disquete, fita VHS, CD-ROM, DVD etc.).

QUADRO 2Relevância dos requisitos de preservação dosdocumentos impressos e digitais

Requisitos Documentos Documentosimpressos digitais

Preservação física Relevante Relevante

Preservação lógica Pouco relevante Relevante

Preservação intelectual Não relevante Relevante

No caso dos materiais impressos, a preservação lógica épouco relevante, por estar garantida no formatoespecífico em que foram publicados (periódico, revista,livro etc.). Na publicação digital, a preservação lógicaestá associada à necessidade de garantir a conversão dosformatos originais que tem se convertido em obsoletosou de custosa manutenção. O quadro mostra tambémque a importância da preservação intelectual torna-se

Preservação de documentos digitais

Ci. Inf., Brasília, v. 33, n. 2, p. 15-27, maio/ago. 2004

18

maior no caso dos materiais digitais devidoprincipalmente à capacidade de o objeto digital serpassível de modificação no seu desenho (leiaute),apresentação ou interação no formato de publicação.Com isso, a perda do conteúdo intelectual original podeser declarada inaceitável pelo autor.

Esse último requisito envolve a preservação dapropriedade intelectual Intelectual Proprity Rights (IPR),que tem um significado mais argüível do que na mídiatradicional. O IPR deve considerar não apenas oconteúdo, mas também qualquer ação relacionada aosoftware (cópias, encapsulamento de conteúdo, emulaçãode software, migração de conteúdo) que envolva atividadesque podem infringir permissões específicas daqueles quemantêm os direitos. Para Bullock (1999), o IPR é umadas principais barreiras que interferem na preservaçãodos objetos digitais. Bullock também enumera osrequisitos de preservação dos documentos digitais daseguinte forma:

• fixar os limites do objeto a ser preservado;• preservar a presença física;• preservar o conteúdo;• preservar a apresentação;• preservar a funcionalidade;• preservar a autenticidade;• localizar e rastrear o objeto digital;• preservar a proveniência;• preservar o contexto.

Esses novos requisitos especificam os elementos quedeverão ser efetivamente mantidos, a série de bits quedeverá ser recuperada; referem-se à capacidade de acessoaos conteúdos dinâmicos independentemente da suaapresentação, componentes de multimídia,hipertextualidade e interatividade. Observar essascondições significa identificar o objeto digital na suaorigem e pelas suas dependências de hardware e software.

ESTRATÉGIAS

Pesquisadores em várias partes do mundo estãodesenvolvendo modelos do que seria a infra-estruturapara a preservação a longo prazo de informação emformato digital. Muitas das iniciativas propostas pelosgrandes centros de pesquisa continuam sendo utópicas,mas proporcionam uma base para a discussão sobre aimplantação de soluções futuras ao problema (Granger,2002). Para Beagrie & Greenstein (1998), algumasprecauções devem ser tomadas para reduzir o perigo daperda dos materiais digitais:

• armazenar em ambiente estável e controlável;

• implementar ciclos de atualização (refreshment) paracópia em nova mídia;

• fazer cópias de preservação (assumindo licenças epermissões de copyrights);

• implementar procedimentos apropriados demanuseio;

• transferir para uma mídia de armazenamento padrão.

Segundo vários autores, o dado e a mídia que suportama informação devem possuir um nível de funcionalidaderepresentacional que permita a sua reprodução a qualquermomento que a instituição mantenedora precisarrecuperar o dado. Cada mídia pode armazenar umaseqüência de bits de forma diferente, segundo aspropriedades físicas da mídia. O bit stream* precisa entãoser interpretado, já que toda seqüência significativa debits pode representar qualquer coisa. Os objetos digitaissão salvos como coleções de bits representandodocumentos específicos, significativos apenas para oprograma que os criou.

Os principais métodos recomendados para a preservaçãodos objetos digitais podem ser agrupados em dois tipos:os estruturais e os operacionais. Os estruturais tratamdos investimentos iniciais por parte das instituições queestão se preparando para implementar algum processode preservação e que adotam ou adaptam um dos modelosde metadados existentes ou seu próprio esquema. As atividadesoperacionais são as medidas concretas aplicadas aos objetosdigitais. No quadro 3, estão enumerados os métodos depreservação mais freqüentemente usados.

* Bitstream: a seqüência de zeros e de uns que compreende o dado.

Miguel Angel Arellano

Ci. Inf., Brasília, v. 33, n. 2, p. 15-27, maio/ago. 2004

QUADRO 3Métodos de Preservação Digital

Métodos Estruturais Métodos Operacionais

Adoção de padrões Conservação de software/

hardware

Elaboração de normas Migração de suporte

Metadados de preservação digital Conversão de formatos

Montagem de infra-estrutura Emulação

Formação de consórcios Preservação do conteúdo

As estratégias operacionais que englobariam os novosrequisitos de preservação seriam a migração de suportee o refrescamento do meio (preservação física), aconversão dos formatos, a emulação (preservação lógica)e a preservação do conteúdo (intelectual).

19

OS METADADOS DE PRESERVAÇÃO

A criação e uso de metadados é uma parte importanteem todas as estratégias operacionais de preservaçãodigital, uma vez que elas estão baseadas na conservaçãode software e hardware, emulação ou migração, como ummeio para garantir a autenticidade, registrar ogerenciamento de direitos e coleções de dados, e para ainteração com recursos de busca (Rothenberg, 1996).Os metadados informam as partes importantes do objetodigital e indicam a sua localização. Os metadados depreservação são uma forma especializada de administrarmetadados que podem ser usados como um meio deestocar a informação técnica que suporta a preservaçãodos objetos digitais. Os metadados para preservação visama apoiar e facilitar a retenção a longo prazo da informaçãodigital (OCLC/RLG, 2001).

Segundo Searle & Thompson (2003), a implementação deum esquema de metadados de preservação requer nomínimo a limitação do escopo dos metadados parapreservação, a fim de maximizar o potencial para suaautomação e garantir o controle da mudança nosmetadados. Na parte operacional do desenvolvimentodo esquema de metadados para preservação, algumasatividades são necessárias:

• a implementação do padrão de metadados;

• criação de repositórios de metadados de preservaçãointegrados a outros repositórios de metadados usadospela instituição;

• definição do script para extrair os metadados depreservação, que produza um relatório em XML* do queos metadados identificaram como importante para apreservação, para depois serem transferidos para orepositório de metadados.

Segundo a National Library of New Zealand (2003), osmetadados de preservação contêm informações sobre:

• políticas e técnicas de preservação adotadas;

• efeitos da estratégia adotada;

• gerenciamento de coleções;

• gestão de direitos autorais;

• autenticidade do recurso digital.

Várias instituições internacionais têm construído marcosconceituais para identificar elementos específicos demetadados de preservação. A National Library of NewZealand produziu um esquema de metadados parapreservação orientado para ser um ponto de equilíbrioentre os princípios expressos no modelo de referênciaOAIS (Open Archival Information System) para preservaçãode metadados e a praticidade de implementação de umconjunto de metadados operacionais de preservação. Eleestá dividido em quatro entidades: o objeto, o processo, oarquivo e a modificação de metadados. No artigo de Searle &Thompson (2003), o esquema da NLNZ é apresentadoidentificando-se as áreas nas quais ele pode ser desenvolvido:para a expansão dos dados de definição dos elementosdo esquema; para criação de um repositório baseadonesses dados de definição; para o desenvolvimento deferramentas de extração automática de metadados paraalimentar o repositório. O esquema identifica os dadosque a biblioteca coletará e manterá. O arquivo originalou preservation master deve ser preservado, gerenciado edisseminado através do tempo (NLNZ, 2003).

O MODELO DE PRESERVAÇÃO OAIS

O modelo para repositórios de metadados de preservaçãomais usado atualmente é o modelo de referência OpenArchival Information System (OAIS), publicado peloConsultive Committee for Space Data Systems (CCSDS).OAIS é uma iniciativa ISO (International Organizationfor Standardization), desde junho 2003, que define umalto nível de modelo de referência para arquivos queprecisem de uma preservação de longo prazo. Originalmenteera aplicado apenas para informações digitais obtidas deobservações de ambientes espaciais e da Terra, mas, naverdade, ele é aplicável a qualquer tipo de arquivo digitale compatível com os sistemas baseados no protocolo daOpen Archive Iniciative (Day, 2001). Um arquivo nostermos do OAIS significa considerar os arquivos comoorganizações de pessoas e sistemas, que aceitaram aresponsabilidade de preservar a informação e torná-ladisponível e melhorar a comunicação e produtividade entrediferentes comunidades (CCSDS, 1998).

No modelo atuam quatro entidades: produtores,consumidores, administração e o arquivo propriamentedito. No esquema do OAIS, está incluído um modelo deinformação para inserção dos metadados de preservação(figura 1), a seguir.

No modelo, objeto físico e objeto digital podem ser,coletivamente, referenciados como objetos de dados. Elessão interpretados pela combinação da base deconhecimento da comunidade alvo e a informação de

* Extensible Markup Language. XML é um formato padrão parapublicação, armazenamento e transferência de documentos por viaeletrônica, independente dos fabricantes de software, facilmenteinterpretável por múltiplas aplicaçõese, em certa forma, auto-explicativo.

Preservação de documentos digitais

Ci. Inf., Brasília, v. 33, n. 2, p. 15-27, maio/ago. 2004

20

representação associada ao objeto de dados.O objeto de dados pode sercomplementado com informação derepresentação, para ser entendido pelacomunidade alvo. No modelo OAIS,existem quatro categorias de objetos deinformação, entre os quais estão:

• informação de conteúdo: umainformação que é o objeto primário dapreservação. Ela contém o objeto digitalprimário e informação representadanecessária para transformar este objeto eminformação com significado.

• informação de descrição de preservação:qualquer informação necessária parapreservar adequadamente a informação deconteúdo com a qual está associada. Ela inclui:

– informação de referência: e.g. identificadores;

– informação de contexto: e.g. classificações por assunto;

– informação de proveniência: e.g. copyright, histórico;

– informação de integridade: documenta os mecanismosde autenticação.

• informação de pacote: informação que enlaça erelaciona os componentes de um pacote dentro de umaentidade identificável em uma mídia específica.

• informação descritiva: informação que permitelocalizar, analisar, recuperar ou ordenar a informaçãode pacote dentro de um OAIS.

No esquema conceitual do OAIS existem seis entidadesfuncionais: recepção, armazenamento, gerenciamento dedados, administração do sistema, planejamento depreservação e acesso (figura 2).

FIGURA 2O Modelo Funcional OAIS

Fonte: LAVOIE, Brian. Meeting the challenges of digital preservation: theOAIS reference model. OCLC-Newsletter. n. 243. jan./feb. 2000, p.26-30. (apud Thomaz & Soares, 2004)

As entidades funcionais gerenciam o fluxo de informaçãoentre as entidades que formam o ambiente OAIS eidentificam os componentes funcionais dos arquivosrelacionados com a preservação dos objetos digitais.

A estrutura conceitual para metadados de preservaçãodo OAIS está sendo usada por várias instituiçõespara identif icar seus elementos de metadadosespecíficos: Cornell University, as BibliotecasNacionais da Austrália e da Nova Zelândia, On-lineComputer Librar y Center (OCLC), MichiganInstitute of Technology (MIT) e outras. Por ser ummodelo de referência, ele não é uma implementaçãoespecífica, mas proporciona uma lista de condições

do que deve ser considerado não estabelecimentode um projeto de preservação de qualquer tipo dedocumento, seja digital ou analógico.

MIGRAÇÃO E CONVERSÃO DE FORMATOS

A migração periódica da informação digital a partir deum ambiente de hardware ou de um software para outro éa estratégia operacional para a preservação digital maisfreqüentemente usada pelas instituições detentoras degrandes acervos. Segundo a definição da Task Force onthe Archiving of Digital Information (1996), migração é atransferência periódica de materiais digitais de umaconfiguração de hardware/software para outra ou, de umageração de tecnologia computacional para a geraçãoseguinte. O propósito da migração é preservar aintegridade dos objetos digitais e assegurar a habilidade

Miguel Angel Arellano

Ci. Inf., Brasília, v. 33, n. 2, p. 15-27, maio/ago. 2004

FIGURA 1O modelo de referência Open Archival Information System (OAIS)ou Sistema Aberto para Arquivamento de Informação (SAAI)

Base deconhecimento

Objetodigital

Objeto dedados

Objetofísico

Objeto deinformação

Informaçãodescritiva

Informaçãode conteúdo

Informaçãode descrição

de preservação

Pacote deinformação

Pacote desubmissão

de informação

Pacote dearquivamentode informação

Pacote dedisseminaçãode informação

Informaçãode pacoteInformação de

representação

21

dos clientes para recuperar, expor e usá-los de outramaneira diante da constante mudança da tecnologia.A importância da migração é transferir para novosformatos enquanto for possível, preservando aintegridade da informação. Um arquivo digital podeconverter objetos digitais para um pequeno número deformatos “padrão”. Por exemplo, dados textuais podemser estocados em um formato de software relativamenteindependente como ASCII, em formatos proprietários degrande difusão como PDF ou em formatos baseados emaplicações de SGML (Standard Generalized Markup Language)como XML (Coleman e Willis, 1997). Passado o tempo,os dados podem ser copiados, “re-criados” e atualizadoscomo migrações periódicas necessárias em novos formatospara seu uso em novas gerações de hardware e software. Naárea de documentos digitais, alguns modelos começam asurgir no sentido de converter materiais de formatosproprietários para a linguagem XML.

Os metadados têm um papel importante em qualquerestratégia de migração bem-sucedida. Esse tipo deestratégia dependerá dos metadados criados para registrara história da migração de um objeto digital. Também,existe a necessidade de informação do contexto para serregistrada (e preservada) para que, dessa maneira, futurosusuários possam entender o ambiente tecnológico noqual um objeto digital foi criado.

EMULAÇÃO

As técnicas de emulação sugerem a preservação do dadono seu formato original, por meio de programasemuladores que poderiam imitar o comportamento deuma plataforma de hardware obsoleta e emular o sistemaoperacional relevante. O processo consiste na preparaçãode um sistema que funcione da mesma forma que outrode tipo diferente, para conseguir rodar programas. Essaestratégia está relacionada à preservação do dado originalno seu formato original. No lugar de preservar o softwaree hardware hospedeiro, os engenheiros de sistemaspoderiam construir programas emuladores (Rothenberg,1995). Na prática, os dados podem ser encapsulados juntocom a aplicação de software utilizada na sua criação, assimcomo uma descrição do ambiente de software e hardwarerequerido para seu funcionamento. Para facilitar seu usono futuro, Rothenberg (1996) sugere que seja anexada umaanotação de metadados na superfície de cada encapsulaçãoque poderia explicar como decodificar os dados obsoletoscontidos e prover qualquer informação desejada sobreesses registros. A emulação precisa do desenvolvimentode técnicas de encapsulamento de documentos, seusmetadados, software e especificações de emulador de formaa assegurar sua coesão e prevenir sua corrupção (figura 3).

FIGURA 3Um documento digital encapsulado (Rothenberg, 1999)

Emulação é uma estratégia importante que possuiaplicações úteis quando a aparência do recurso digitaloriginal é importante, mas onde não seja aconselhávelinvestir em uma tecnologia da informação de alto custo.Hendley (1998) pede precaução no caso de se ater apenasnesta abordagem e comenta que os gerentes de coleçõesficaram dependendo da habilidade técnica dosengenheiros de software para emular um ambienteespecífico e sustentá-lo, para rodar em futuros edesconhecidos computadores e recriar o comportamentode documentos digitais.

Um exemplo é o modelo Digital Rosetta Stone (DRS)desenvolvido por Steven Rovertson da United States AirForce (Heminger e Robertson 1998). O modelo descrevetrês processos necessários para manter o acesso a longoprazo aos documentos digitais nos seus formatos originais:

• preservação do conhecimento;

• recuperação dos dados;

• reconstrução dos documentos.

O modelo desenvolvido garante o acesso aos repositóriosde informação armazenados digitalmente. Os processose a manutenção dos metadados sugeridos pelo DRSservirão para catalogar os diferentes aspectos dastecnologias digitais.

O processo de preservação do conhecimento

Ele dá suporte à descoberta dos dados e dos processosde reconstrução dos documentos. É a preservação doconhecimento das técnicas de armazenamento da mídiae dos formatos dos arquivos que serão mantidos nosarquivos de metaconhecimento. Metaconhecimento é oconhecimento ou alerta dos fatos, regras e do contextono qual eles são usados e manipulados. O arquivometaconhecimento Meta Knowledge Archive (MKA) é umdos fundamentos sobre o qual o DRS depende e preserva

Preservação de documentos digitais

Ci. Inf., Brasília, v. 33, n. 2, p. 15-27, maio/ago. 2004

22

o conhecimento em duas áreas-chave: as técnicas dearmazenamento da mídia e os formatos dos arquivos.

Recuperação dos dados

É o processo de extração dos dados digitais da mídiaobsoleta e sua migração para uma mídia que seja acessívelaos sistemas de informação atuais. O conhecimento dosdocumentos digitais é maior que o custo da descoberta.

Reconstrução dos documentos

É o processo de interpretar documentos digitais dosarquivos originais usando informação de formato dearquivo reunida durante o processo de preservação doconhecimento. O arquivo de informação do formatodescreve a formatação de informação usada paraespecificar as aplicações do software. É um template quepode ser usado para descrever a maneira como o dado éformatado e mostrado nos processadores de texto.

Um caso especial são os metadados da mídia. É o tipomais fácil de dados coletado pelo DRS, isso porque asnormas para armazenar mídia são rigidamente definidasantes que a mídia seja comercializada. Por exemplo,ISO 9660 é a norma que especifica como os dados sãoarmazenados em um CD-ROM. Essa norma defineestruturas do volume, arquivo e todos os atributosassociados a um CD-ROM. Esse tipo de dado deve serreunido para cada tipo de mídia e ser incluído noarquivo de metaconhecimento.

CONSERVAÇÃO DO SOFTWARE /HARDWARE

A perspectiva de preservação digital que propõe aconservação do software e do hardware (technologypreservation) sugere que os dados digitais sejampreservados em uma mídia estável (e “refreshed” oucopiados para uma nova mídia caso seja necessário) eassociados a cópias preservadas de uma aplicação desoftware original, um sistema operacional que seránormalmente usado para ser lido sob uma plataformade software relevante. Essa estratégia pode ter valor paracasos particulares ou históricos de software e hardware,bem como ser útil para a comunidade dos museus (Swade,1992). A longo prazo, entretanto, é cara e pouco prática.Segundo Hendley (1998) a perspectiva da tecnologia dapreservação não pode ser apreciada como viável, masapenas para o curto e meio termo, como uma medida derelativo desespero em casos em que valiosos recursosdigitais não possam ser convertidos para formatosindependentes de software e hardware e, assim, migradospara outros formatos.

OS CUSTOS

Cada estratégia técnica de preservação e de acesso implicadiferentes custos e cronogramas. A preservação digitalrequer recursos disponíveis permanentemente quecomeçam a se delinear no momento da criação dorecurso.

Muitos materiais são criados fora dos centros deinformação e das bibliotecas. Nesses casos, são os editorese outros criadores de conteúdos que devem adotar ospadrões apropriados e as tecnologias que darão subsídiosà preservação. Segundo Feeney (1999), “diferentementeda situação que se aplica aos livros, o arquivamentodigital requer investimentos relativamente freqüentespara superar a obsolescência rápida produzida pelasmudanças tecnológicas”. Os provedores de materialdigital, no correr do tempo, precisam investir para criardocumentação e metadados, gerando novas formas dematerial para manter o acesso. Esse investimento deveser levado em consideração no momento de discutir osdireitos de uso e reuso dos objetos digitais. Do mesmomodo, entre os aspectos que devem ser identificados emqualquer estratégia de preservação está a necessidade decontratação e de capacitação de pessoal. Se não houvernenhum plano administrativo que cubra esses itens,nenhuma manutenção de acervos a longo prazo serábem-sucedida.

EXPERIÊNCIAS

Desde 1995, várias iniciativas têm surgidointernacionalmente. São projetos que envolvem o estudoe a prática de atividades de preservação digital eminstituições preocupadas com a perenidade do crescentenúmero de documentos digitais nos seus acervos. Desdeo início, foram identificados os aspectos mais relevantesrelacionados com essas atividades e propostas algumasações. A maioria das soluções tomadas enfatizava o papeldos desenvolvedores na tomada de decisões queenvolviam os primeiros estágios na criação dessesrepositórios, assim como o grau de confiança que deveriaser atingido pelos novos repositórios digitais por partedos usuários. As pesquisas desenvolvidas até o momentoindicam as atividades realizadas por meio de consórciosinternacionais como o caminho mais viável para resolveras questões relacionadas com a preservação dos arquivosdigitais Na Inglaterra, a Digital preservation coalition foiestabelecida; na Austrália a National Library of Australiafundou o projeto PADI (Preserving Access to DigitalInformation), um portal especializado em recursos parapreservação digital; o Council on Library andInformation Resources (CLIR) e a Digital Library

Miguel Angel Arellano

Ci. Inf., Brasília, v. 33, n. 2, p. 15-27, maio/ago. 2004

23

Federation (DLF) realizaram vários relatórios parachamar a atenção sobre o problema e o que a pesquisana área está fazendo.

Algumas organizações têm trabalhado no estabelecimentode padrões e melhores práticas. A OCLC e o ResearchLibraries Group (RLG)* desenvolveram documentos emque estabeleceram quais seriam as melhores práticas.Neles, estão os requisitos sugeridos para os modelos demetadados de preservação, a saber:

• abrangência: metadados estendidos a todos os aspectosdo processo de preservação digital;

• estruturação: complemento aos componentes eprocessos funcionais de um sistema de arquivamentodigital;

• ampla aplicabilidade: metadados aplicáveis a umaextensa faixa de tipos de objetos digitais, atividades depreservação digital e instituições.

Também foram determinados os atributos necessáriospara a construção de repositórios digitais confiáveis(Trusted digital repository):

• compilação com o Reference Model for an Open ArchivalInformation System (OAIS);

• responsabilidade administrativa;

• viabilidade organizacional;

• sustentabilidade financeira;

• sustentabilidade tecnológica e processual;

• sistema de segurança;

• responsabilidade processual.

Alguns experimentos têm sido elaborados emuniversidades. A Andrew W. Mellon Foundationfinanciou sete universidades para trabalhar com editoresno planejamento de repositórios para o conteúdo deperiódicos eletrônicos. Através do PubMed Central, aNational Library of Medicine atua como um repositóriode arquivos digitais para publicações da área médica ede outras informações da área da saúde.

O projeto NSDL (National Science Digital Library), centradoem ciências, tecnologia, engenharia, computação ematemática, e o Centro de Supercomputadores de SanDiego na Califórnia (SDSC San Diego SupercomputerCenter) possuem instalações imensas para comportargrandes acervos, assim como convertê-los e organizá-los

para serem acessados no futuro. Os trabalhos da NationalArchives and Records Administration (Nara) e o SanDiego Supercomputer Center, assim como a MellonFoundation, são dois exemplos relevantes da pesquisasem projetos sobre arquivos de periódicos eletrônicos.

No caso dos projetos da Nara, estão claramente separadosos armazenamentos físicos da sua interpretação lógica,e existe a distinção entre o gerenciamento dos dados e ogerenciamento do conhecimento. O conceito deorganizar a preservação digital segundo seuscomponentes dentro de um modelo de arquitetura dainformação permite que as responsabilidades sejamdistribuídas entre vários tipos de instituições. Existe umconsenso atualmente de que a existência de umarcabouço é um passo importante, mesmo que não sejaa única resposta ao problema da preservação digital. Nomomento são necessárias soluções em termos de escala,tipos de formatos e responsabilidades institucionais.Qualquer organização que esteja iniciando a construçãode uma coleção digital deve seguir um roteiro e ter umafonte financiadora. A NSF (National Science Fundation)e a Library of Congress trabalham unidas paradesenvolver uma agenda de pesquisa sobre arquivamentoe preservação digital a longo prazo.

A Library of Congress desenvolve uma estratégianacional para preservar informação digital. Com umorçamento de 100 milhões de dólares do Congressoamericano, a biblioteca estabeleceu um conselhonacional e trabalha com um número de agências privadase governamentais para desenvolver o Metadata Encodingand Transmission Standard (METS). A Library of Congressrecebeu a encomenda de construir, unida a outrasinstituições, um programa nacional sobre preservaçãodigital. O projeto Making of America II (MOA2) propôsum formato de codificação para metadadosadministrativos e estruturais para trabalhos textuais ebaseados em imagens. METS é uma iniciativa que tentaconstruir um formato em XML para codificar metadadosnecessários tanto para a gestão de objetos de bibliotecasdigitais em um repositório quanto para a troca dessesobjetos entre repositórios. O esquema METS oferece ummecanismo flexível para codificar metadados descritivos,administrativos e estruturais para um objeto de umabiblioteca digital e para exprimir as ligações complexasentre várias formas de metadados.

Em 2001, a Digital Library Federation e a University ofCornell, a University of Michigan e a Library of Congresscomeçaram a discutir a importância das característicasdos documentos digitais para a sua interoperabilidade epreservação. Com base no trabalho de Daniel Greenstein

* RLG and OCLC Explore Digital Archiving http://www.rlg.org/legacy/pr/pr2000-oclc.html

Preservação de documentos digitais

Ci. Inf., Brasília, v. 33, n. 2, p. 15-27, maio/ago. 2004

24

Gerald George Digital Reproduction Quality: BenchmarkRecommendations (2001), foi definido o “preservation digitalmaster”, que seria uma cópia digital fidedigna depublicações impressas que observaria ou excederia umconjunto mínimo de características. O grupo recomendatambém que a preservação do original digital tenha umalista mínima de elementos de metadados (descritivos,estruturais e administrativos, disponíveis e documentadosem XML). Esse conjunto de características foiprimeiramente aplicado a manuscritos, obras raras etextos com ilustrações.

No caso da Inglaterra, o Joint Information SystemsCommittee (JISC) patrocinou inúmeros projetos depesquisa e iniciativas com o intuito de conhecer osdesafios da preservação a longo prazo. Projetos como oCURL Exemplars in Digital Archives (Cedar) (em colaboraçãocom três universidades), que tinha como objetivo “addresingstrategic, methodological and practical issues and provideguidance for libraries in best practice for digital preservation”e produziu cinco guias sobre aspectos específicos comogerenciamento de coleções digitais, propriedadeintelectual, metadados, estratégias de preservação digitale protótipos de arquivamento digital. Outro esforçocolaborativo foi o do projeto Cedar com o projetoCamileon (Creative Archiving at Michigan & Leeds: Emulatingthe Old on the New), este último fundado pelo JISC ea National Science Fundation dos Estados Unidos.O projeto Camileon testou a viabilidade da emulaçãocomo estratégia de preservação e desenvolveu ferramentaspara dar suporte “(...) in future rendering of digital materials”.Todos os esforços realizados pelo JISC indicam a crescentenecessidade de acelerar a implementação de estratégiasde preservação, mas concentrando esforços paraestabelecer uma estratégia principal “(...) an infraestructureof collective and institutional services and repositories”.

A European Commission fundou o projeto ElectronicResource Preservation and Access Network (Erpanet) em 2001,tendo como finalidade unir as diversas iniciativas na áreade preservação. A principal contribuição do projeto foimostrar a importância de participar de projetos cooperativosde preservação digital, nos quais são maximizados osesforços individuais, constroem-se parcerias, é alcançadauma melhora na administração dos riscos e se evita aredundância. A Erpanet vem monitorando as iniciativassobre preservação digital que estão surgindo no mundo(http://www.erpanet.org). Até 2002 eram 63 projetos. Asiniciativas existentes são limitadas na sua abrangênciaou na sua cobertura geográfica.

O Modelo Lockss (Lots of Copies Keep Stuff Safe) parapreservar através da replicação distribuída também

implica que, sem o repositório, a preservação éimpossível. O projeto Lockss, da Stanford University,procura garantir a integridade das publicações eletrônicaspela manutenção de cópias em vários sites, checandoperiodicamente essas cópias para verificar a congruênciainformacional. Com a clonagem e o armazenamentodistribuído, o Lockss espera minimizar antecipadamenteo impacto de uma catástrofe em um site individual (Reich& Rosenthal, 2001).

A United Nations Educational, Scientific and CulturalOrganization (Unesco) lançou, em 2002, uma novainiciativa chamada “Preserving Our Digital Heritage”, unidaao Memory of the World Programme. Sua finalidade éconstruir uma linha de defesa contra a perda deinformação valiosa que será implementada desde o pontoinicial da criação desses recursos. O grupo encarregadoda preservação digital pronunciou uma estratégia de meiotermo sobre o assunto. Atualmente o projeto estáexaminando as atividades na área de digitalização nomundo e já desenvolveu, em parceria com a InternationalFederation of Library Associations (Ifla), uma base dedados on-line chamada “Directory of Digitised LibraryCollections”, com o objetivo de listar as principaiscoleções de bibliotecas e outras instituições comconteúdos relevantes para a herança cultural que já foramdigitalizados. Nas últimas reuniões dos gruposinteressados no diretório, foi enfatizada a importânciade reconhecer a necessidade de que os diferentes esforçostenham um mínimo de consistência e deinteroperabilidade.

A EXPERIÊNCIA BRASILEIRA

No Brasil, a Biblioteca Nacional está na fase inicial dadefinição dos metadados de preservação. Emcontrapartida, a Câmara Técnica de DocumentosEletrônicos do Arquivo Nacional (CONARq) abriu paraconsulta pública no mês de abril de 2004 o anteprojetoda Carta para a Preservação do Patrimônio ArquivísticoDigital (figura 4, a seguir). O objetivo do conteúdo daCarta é conscientizar as comunidades que possuemarquivos de documentos digitais a adotar práticaspadronizadas de preservação digital. A carta coloca anecessidade de que sejam criadas políticas, estratégias eações sobre o tema. Ela define o que é um documentoarquivístico digital e propõe que todos os arquivosadotem algum sistema de gerenciamento arquivístico dedocumentos digitais. A proposta esteve baseada emestudos de projetos internacionais (InterPARES I e II*,

* International Research on Permanent Authentic Records in ElectronicSystems.

Miguel Angel Arellano

Ci. Inf., Brasília, v. 33, n. 2, p. 15-27, maio/ago. 2004

25

o projeto Pittsburgh Functional and Requirements for Evidencein Recording, o modelo de requisitos para a gestão dearquivos electrónicos – MoReq –, os requisitos usadospelo United States Department of Defense Records –DOD – e a metodologia DIRKS*).

O documento é introdutório no sentido de colocar napauta de discussão a preservação digital. Baseado na Cartada Unesco, reproduz quase na íntegra as sugestões queaquela instituição pede para os estados membrosadotarem com respeito às medidas para salvaguardar opatrimônio cultural de cada país. O texto fica mais nosentido de recomendações para “melhores práticas” echama para um estudo mais aprofundado das limitaçõesda tecnologia digital. Não foi lembrada a necessidade deuma especificação maior dos tipos de informação a seremarquivados a longo prazo (dados científicos, arquivospessoais etc.). A preservação digital não é apenas realizaratividades arquivísticas ou de desenvolvimento decoleções. Ela inclui o gerenciamento da aplicação deestratégias de preservação apropriadas para cada tipo deacervo.

O documento não menciona os custos de qualquerestratégia de preservação e acesso aos documentos digitaisao longo do tempo. Por serem os arquivos administrativoso foco de atenção da Carta, a questão da “autenticidade”aparece no centro das preocupações. Ao colocar oproblema no nível das prioridades nacionais queprecisam de regulamentação, a Carta não aponta para ainclusão da problemática da preservação a longo prazono âmbito dos programas oficiais de apoio ao uso desoftware livre, de inovação tecnológica e de desenvolvimentotecnológico.

Não existem dúvidas de que novos esforços aparecerãopara entender as técnicas e os padrões que devem seraplicados no arquivamento da informação de relevânciae a manutenção do seu acesso no futuro. O ArquivoNacional é o fórum adequado para a interação entre asorganizações que criam, armazenam e disseminaminformação digital. São essas instituições que podemdefinir os requisitos indispensáveis para chegar aoestabelecimento de estratégias estruturais e operacionaisde preservação digital, dentro de uma política nacionalde informação a ser considerada em qualquerinvestimento de redes de informação eletrônica, privadoou público.

* Designing & Implementing a Recordkeeping Systems.

FIGURA 4Página do CONARq [http://www.arquivonacional.gov.br/conarq/]

CONCLUSÃO

Os documentos digitais são considerados, atualmente,registros oficiais e são gerenciados segundo leis e padrõesque compreendem todo o ciclo de vida desses materiais.A preservação digital requer procedimentos específicose técnicas apropriadas para cada tipo de formato e mídia.Pesquisas internacionais propõem o uso de técnicas deemulação, migração e preservação da tecnologia (Webb,2000), assim como da preservação de metadados(Rothemberg, 1996) e a criação de repositórios quepermitam o acesso e a recuperação dos dados.

Com a preservação digital, pretende-se garantir ainalterabilidade dos registros digitais. Todos os métodosmencionados procuram evitar o risco de criar barreiraspara um uso pleno dos recursos no futuro. Para resolveresse problema, estão sendo elaborados e testados nosúltimos anos esquemas conceituais que permitemidentificar as partes integrantes do processo depreservação digital, assim como sua padronização emmodelos de referência para iniciativas de repositóriosdigitais (CCSDS, 2002).

As tecnologias para a preservação digital estão sendopesquisadas com o intuito de compreender as suasimplicações dentro das políticas de criação e uso derepositórios de informação digital. Alguns estudos sobrea preservação digital têm estabelecido que a imediataimplementação de políticas de preservação digital é aforma mais efetiva de garantir o armazenamento e usode recursos de informação por longos períodos de tempo.A falta dessas políticas nos projetos de repositórios

Preservação de documentos digitais

Ci. Inf., Brasília, v. 33, n. 2, p. 15-27, maio/ago. 2004

26

digitais sugere a carência de conhecimentos técnicossobre a importância das estratégias de preservação digitalexistentes. Essa lacuna informacional por parte dosresponsáveis pelas políticas de implementação deinformação digital precisa ser destacada. A segunda lacunainformacional que deve ser apontada é sobre aimportância da existência de bibliotecas digitais e decentros especializados no estabelecimento e monitoraçãode estratégias de preservação digital bem-sucedidas.

O Brasil precisa de canais oficiais para aidentificação, comunicação e avaliação na área depreservação digital de longa duração. O modelo decentros de preservação digital no Brasil poderá sersemelhante àqueles desenvolvidos pelas iniciativasobservadas na comunidade internacional durante asúltimas décadas: formulação de políticas que envolvamo uso de tecnologias e padrões testados e adaptados emprojetos de coleções digitais. A organização desses centrosnão pode desconsiderar a sua dimensão internacional,já que, no momento em que se escolhe determinadomodelo de preservação, ele deve ser integrado aos outrosrepositórios que adotem a mesma estratégia.

REFERÊNCIAS

ARMS, William. Digital libraries. Massachusetts : Massachsets Instituteof Technology, 2000.

BEAGRIE, N.; GREENSTEIN, D. A strategic policy framework for creatingand preserving digital collections. London : Arts and Humanities DataService. Disponível em: <http://ahds.ac.uk/managing.htm>. Acessoem: 28 jul. 2004.

BEARMAN, David. Electronic evidence: strategies for managing recordsin contemporary organizations. Archives and Museum Informatics.[S.l : s. n., 2000?].

BORBINHA, José, CORREIA; RAMALHO, Ana Maria. Deposit ofscientific and technical gray literature in Portugal: a case study. In:INTERNATIONAL CONFERENCE ON ENTERPRISEINFORMATION SYSTEMS, 2001, Setúbal, Portugal, [S. l. : s. n.],2001.

BULLOCK, Alison. Preservation of digital information; issues and currentstatus. Disponível em: <http://www.collectionscanada.ca/9/1/p1-259-e.html>. Acesso em: 28 jul. 2004.

CHAPMAN, Stephen. Counting the costs of digital preservation: isrepository storage affordable? Journal of Digital Information, v. 4, n. 2,2003. Disponível em: <http://jodi.ecs.soton.ac.uk/Articles/v04/i02/Chapman/>. Acesso em: 28 jul. 2004.

CHEPESUIK, R. The future is here: America’s libraries go digital.American Libraries, v. 2, n. 1, p. 47-49, 1997.

COLEMAN, J.; WILLIS, D. SGML as a framework for digital preservationand access. Washington, D.C. : Commission on Preservation andAccess, 1997. Disponível em: <http://www.clir.org/pubs/cpanews/cpanl101.html>. Acesso em: 28 jul. 2004.

CUNHA, Murilo Bastos da. Desafios na construção de uma bibliotecadigital. Ciência da Informação, Brasília, v. 28, n. 3, p. 257-268, set./dez. 1999. Disponível em: <http://www.ibict.br/cienciadainformacao/rst/viewarticle.php?id=323>. Acesso em: 28 jul. 2004.

DAY, Michael. E-print services and long-term access to the record of scholarlyand scientific research. Ariadne, n. 28, June 2001. Disponível em: <http://www.ariadne.ac.uk/issue28/metadata/>. Acesso em: 28 jul. 2004.

FEENEY, M. Towards a national strategy for archiving digital materials.Alexandria, v. 11, n. 2, p. 107-121, 1999.

GRANGER, Stewart. Digital preservation and deep infrastruc-ture. D-Lib Magazine, v. 8, n. 2, Feb. 2002. Disponível em: <http://www.dlib.org/dlib/february02/granger/02granger.html>. Acesso em:28 jul. 2004.

GREENSTEIN, Daniel; GEORGE, Gerald. Digital reproductionquality: benchmark recommendations. RLG DigiNews , v. 5, n. 4.Disponível em: <http://www.rlg.org/preserv/diginews/diginews5-4.html#featured>. Acesso em: 28 jul. 2004.

HEDSTROM, Margaret. Digital preservation: a time bomb for digitallibraries. Disponível em: <http://www.uky.edu/~kiernan/DL/hedstrom.html>. Acesso em: 28 jul. 2004.

HEMIGER, A. R.; ROBERTSON, S. B. Digital rosetta stone: aconceptual model for maintaining long-term access to digital documents. In:DELOS WORKSHOP PRESERVANTION OF DIGITALINFORMATION, 6., 1998. [S. l.] : Le Chesnay European ResearchConsortium for Informatics and Mathematics, 1998. p. 35-43. (ERCIM-98-W003). Disponível em: <http://www.ercim.org/publication/ws-proceedings/DELOS6/>. Acesso em: 28 jul. 2004.

HENDLEY, T. Comparison of methods & costs of digital preservation: BritishLibrary research and innovation. London : British Library andInnovation Centre, 1998. (Report, n. 106). Disponível em: <http://www.uko ln .ac .uk/serv i ce s/e l ib/paper s/ tav i s tock/hendley/hendley.html>. Acesso em: 28 jul. 2004.

HILDRETH, C. R. Preserving what we really want to access, themessage, not the medium: challenges and opportunities in the digitalage. In: HELAL, A. H.; WEISS, J. W. (Ed.). PROCEEDING OF THEINTERNATIONAL ESSEN SYMPOSIUM, 18., 1995, Essen.Festschrift in honour of Patricia Battin . Essen : GermanyUniversitätsbibliothek, 1996. p. 76-95.

LESK, M. Practical digital libraries: books, bytes and bucks. San Francisco,CA : Morgan Kaufmann, 1997.

NATIONAL LIBRARY OF NEW ZEALAND. Initiatives. 2003.Disponível em: <http://www.natlib.govt.nz/en/whatsnew/4initiatives.html>. Acesso em: 28 jul. 2004.

_______. Metadata standards framework: preservation metadata.Disponível em: <http://www.natlib.govt.nz/en/whatsnew/4initiatives.html#meta>. Acesso em: 28 jul. 2004.

OCLC/RLG. Preservation metadata for digital objects: a review ofthe state of the art - a white paper. Disponível em: <http://www.oclc.org/research/projects/pmwg/presmeta_wp.pdf>. Acessoem: 28 jul. 2004.

REICH, L.; SAWYER, D. (Ed.). Reference model for an open archivalinformation system. [S. l.] : Consultative Committee for Space DataSystems, 1998. (650.0-W-4.0). Disponível em: <http://ssdoo.gsfc.nasa.gov/nost/isoas/ref_model.html>. Acesso em: 28 jul.2004.

REICH, Vicky; ROSENTHAL, David S. H. Looks: a permanent webpublishing and access system. [S. l. : s. n.], 2001.

Miguel Angel Arellano

Ci. Inf., Brasília, v. 33, n. 2, p. 15-27, maio/ago. 2004

Artigo recebido em 29-07-2004 e aceito para publicação de18 a 21/10/2004.

27

RESEARCH LIBRARY GROUP. Trusted digital repositories: attributesand responsabilities and RLG-OCLC report. Montain View, Canada :OCLC,.2002. Disponível em: <http://www.rlg.org/longterm/repositories.pdf>. Acesso em: 28 jul. 2004.

ROTHENBERG, J. Metadata to support data quality and longevity. In:PROCEEDINGS OF THE IEEE METADATA CONFERENCE, 1.,1996, Silver Spring, Md.[S. l. : NOAA Complex, 1996. Disponívelem: <http://www.computer.org/conferences/meta96/rothenberg_Paper/ieee.data-quality.html>. Acesso em: 28 jul. 2004.

SANT’ANNA , Marcelo Leone. Os desafios da preservação dedocumentos públicos digitais. Revista IP, v. 3, n. 2, dez. 2001. Disponívelem: <http://www.informaticapublica.mg.gov.br/revista0302/ip0302santanna.pdf>. Acesso em: 28 jul. 2004.

SEARLE, Sam.; THOMPSON, Dave. Preservation metadata:pragmatic first steps at the National Library of New Zealand. D-LibMagazine, v. 9, n. 4, Apr. 2003. Disponível em: <http://www.dlib.org/dlib/april03/thompson/04thompson.html>. Acesso em: 28 jul. 2004.

SWADE, D. The problems of software conservation. History andComputing, v. 4, n. 2, 1992. Disponível em: <http://www.cs.man.ac.uk/CCS/simulate/sim_home.htm>. Acesso em: 28 jul. 2004.

TASK FORCE ON THE ARCHIVING OF DIGITAL INFORMATION.Preserving digital information: report of the task force on archiving ofdigital information. Washington, D.C. : Commission on Preservationand Access, 1996. Disponível em: <http://www.rlg.org/ArchTF/>.Acesso em: 28 jul. 2004.

THOMAZ, Kathia P. A preservação digital e o modelo de referência:open archival information system. DataGramaZero – Revista de Ciênciada Informação, v. 5 n. 1, fev. 2004. Disponível em: <http://www.dgz.org.br/fev04/Art_01.htm>. Acesso em: 28 jul. 2004.

WEBB, Collin. The role of preservation and the library of the future. [S. l.] :National Library of Australia, 2000. Disponível em: <http://www.nla.gov.au/nla/staffpaper/cwebb9.html>. Acesso em: 28 jul.2004.

Preservação de documentos digitais

Ci. Inf., Brasília, v. 33, n. 2, p. 15-27, maio/ago. 2004