organização e representação da informação (digitalizada)

49
ORGANIZAÇÃO E REPRESENTAÇÃO DA INFORMAÇÃO (DIGITALIZADA) Arquivos, Bibliotecas e Museus nuno oliveira Universidade do Minho I Encontro de Arquivos Contemporâneos 1 25 e 26 de Outubro de 2012

Upload: gabriel-russell

Post on 31-Dec-2015

27 views

Category:

Documents


2 download

DESCRIPTION

Organização e Representação da Informação (Digitalizada). Arquivos, Bibliotecas e Museus. nuno oliveira Universidade do Minho. A Internet e a Web. Um pouco de história. 1974. 1974. Internet. IP. TCP. 1990. Web. Vinton Cerf. Robert Kahn. Timothy Berners-Lee. Um pouco de história…. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Organização e Representação da Informação  (Digitalizada)

I Encontro de Arquivos Contemporâneos 1

ORGANIZAÇÃO E REPRESENTAÇÃO DA INFORMAÇÃO (DIGITALIZADA)

Arquivos, Bibliotecas e Museus

nuno oliveiraUniversidade do Minho

25 e 26 de Outubro de 2012

Page 2: Organização e Representação da Informação  (Digitalizada)

I Encontro de Arquivos Contemporâneos 2

A Internet e a Web

25 e 26 de Outubro de 2012

Page 3: Organização e Representação da Informação  (Digitalizada)

I Encontro de Arquivos Contemporâneos 3

Um pouco de história...

25 e 26 de Outubro de 2012

Vinton Cerf Robert Kahn

Timothy Berners-Lee

Internet

1990 Web

1974

IP

1974

TCP

Page 4: Organização e Representação da Informação  (Digitalizada)

I Encontro de Arquivos Contemporâneos 4

Um pouco de história…

25 e 26 de Outubro de 2012

1º Website Info.cern.ch foi criado em hypertexto (a primeira forma básica do HTML)

HTML (HyperText Markup Language) conjunto de marcas para descrever a estrutura de um documento na web.

HTML foi baseado no SGML (Standard Generalized Markup Language), usada para descrever dialetos de anotação

Page 5: Organização e Representação da Informação  (Digitalizada)

I Encontro de Arquivos Contemporâneos 5

Um pouco de história…

25 e 26 de Outubro de 2012

1994 - Criado o W3C (World Wide Web Consortium)

de onde nasce

XML (eXtensible Markup Language)

Inicia projeto: criar uma linguagem interpretável por software, e integrável com outras linguagens

a metalinguagem para a criação de linguagens de

anotação

Page 6: Organização e Representação da Informação  (Digitalizada)

I Encontro de Arquivos Contemporâneos 6

Um pouco de história…

25 e 26 de Outubro de 2012

Larry Page Sergey Brin

1998

Redesenho do acesso à informação!

A importância de uma página web:- não depende do número de acessos com

que conta...- depende do número de páginas que lhe

apontam (e sua importância)Pag

eR

an

k

Page 7: Organização e Representação da Informação  (Digitalizada)

I Encontro de Arquivos Contemporâneos 7

Um pouco de história…

25 e 26 de Outubro de 2012

Steven ChenYoutube(com Chad Hurley)

Mark ZuckerbergFacebook

Ramu YalamanchiHi5

2003 2004 20052001 2006

Even WilliamsTwiterBlogger (1999)

Jimmy WalesWikipedia

Redesenho do uso da web

WEB 2.0Informação é criada pelos utilizadores!

Cooperação!

Page 8: Organização e Representação da Informação  (Digitalizada)

I Encontro de Arquivos Contemporâneos 8

Um pouco de história...

25 e 26 de Outubro de 2012

WEB 3.0 ou WEB Semântica

Projeto iniciado em 2001

Relacionamento semântico entre

dados

Dados na web interpretáveis por

computadores

Atribuição de significado aos conteúdos na

web

Interoperabilidade e Cooperação

Ontologias

Inteligência Artificial

Anotação e Metadados

Redesenho da Web

Page 9: Organização e Representação da Informação  (Digitalizada)

I Encontro de Arquivos Contemporâneos 9

Os Arquivos e a Informação

25 e 26 de Outubro de 2012

Page 10: Organização e Representação da Informação  (Digitalizada)

I Encontro de Arquivos Contemporâneos 10

No início era o documento!

• O Documento era o centro do arquivo

• O interesse no arquivo era por parte da história

• O arquivo era visto como auxílio a historiadores

25 e 26 de Outubro de 2012

Page 11: Organização e Representação da Informação  (Digitalizada)

I Encontro de Arquivos Contemporâneos 11

Mas o documento foi custodiado…• Nacionalização de bens• Custódia de bens nacionalizados

• Arquivos centralizados em edifícios pertencentes ao estado • Arquivos públicos e privados são destruídos• Perde-se a identidade do documento como um elemento no seu contexto original

• Mudança no paradigma arquivístico• Mas investigação histórica continua a ser o mote para o

arquivo

25 e 26 de Outubro de 2012

Page 12: Organização e Representação da Informação  (Digitalizada)

I Encontro de Arquivos Contemporâneos 12

E depois foi bifurcado...• Evolução da sociedade• Evolução das organizações, administrações e instituições• Produção de informação não histórica

• Separação dos arquivos em Históricos e Administrativos

• Arquivos administrativos • Novo paradigma arquivístico• Pragmatismo• Novas técnicas para organização e tratamento de informação• Facilitação no acesso à informação

25 e 26 de Outubro de 2012

Page 13: Organização e Representação da Informação  (Digitalizada)

I Encontro de Arquivos Contemporâneos 13

No final era a Informação!• O documento deixa de ser o foco do arquivo• A informação passa a ser o objeto de trabalho dos arquivistas

• Tratamento de informação passa a ser visto como ciência• Não só no contexto de arquivos mas (e até primeiro) em

museus e bibliotecas

• Informática e Ciências da Informação e da Documentação caminham de mãos dadas• Técnicas de Preservação, Anotação, Digitalização e

Pesquisa• Uniformização da Informação para interoperabilidade• Etc.

25 e 26 de Outubro de 2012

Page 14: Organização e Representação da Informação  (Digitalizada)

I Encontro de Arquivos Contemporâneos 14

A disponibilização da informação• Evolução da Web• Maior disponibilidade de informação• Acesso facilitado à informação• Aparecimento de standards para representação de

informação• Facilitação da Interoperabilidade entre sistemas de

informação

• Evolução da mentalidade arquivista• Necessidade de aceder pragmaticamente à Informação• Aparecimento de novos tipos de “documentos”• Necessidade de rever métodos de gestão de informação

• Desejo de troca de informação entre sistemas de informação arquivada

25 e 26 de Outubro de 2012

Page 15: Organização e Representação da Informação  (Digitalizada)

I Encontro de Arquivos Contemporâneos 15

Em busca da Interoperabilidade

25 e 26 de Outubro de 2012

Page 16: Organização e Representação da Informação  (Digitalizada)

I Encontro de Arquivos Contemporâneos 16

Uniformização de Arquivos

25 e 26 de Outubro de 2012

Modelo OAIS (Open Archival Information System)

Arquitetura standard para a construção de repositórios e arquivos digitais

Modelo para acesso aberto a informação a ser preservada a longo-termo

Page 17: Organização e Representação da Informação  (Digitalizada)

I Encontro de Arquivos Contemporâneos 17

Comunicação entre Arquivos

25 e 26 de Outubro de 2012

Arquivos não necessitam mais de estar de costas voltadas

arquivo arquivoTroca de Informação

Implementação de Protocolos de Comunicação

OAI – PMH (Open Archive Initiative – Protocol for Metadata Harvesting)

SWORD (Simple Web-service Offering Repository Deposit)

Arquivos importam e exportam informação nestes standardsProviders e Harvesters

Auxiliam a comunicação e integração de software com agregadores de informação

Page 18: Organização e Representação da Informação  (Digitalizada)

I Encontro de Arquivos Contemporâneos 18

Pesquisa Federada

25 e 26 de Outubro de 2012

arquivo

Ponto de Acesso

SRU/CQL(Search Retrieval via URL / Context Query Language)

arquivo arquivo

arquivoarquivo

Protocolo para queries de procura sobre a internet

CQL define a sintaxe para a escrita de queries

- Um ponto de acesso- Uma query- Resultados de procura provenientes de várias portais agregadores de informação

Page 19: Organização e Representação da Informação  (Digitalizada)

I Encontro de Arquivos Contemporâneos 19

Dados, Informação e Conhecimento

25 e 26 de Outubro de 2012

Page 20: Organização e Representação da Informação  (Digitalizada)

I Encontro de Arquivos Contemporâneos 20

Dados, Informação e Conhecimento

25 e 26 de Outubro de 2012

Dados

Informação

Conhecimento

Entidades sintáticas (valores, quantidades, etc.) passíveis de serem “medidas” e processados

Relacionamento semântico entre os dados atribuindo-lhes um significado

Estruturação e organização da informação adquirida como resultado de um processo cognitivo

Apren

dizag

em

Page 21: Organização e Representação da Informação  (Digitalizada)

I Encontro de Arquivos Contemporâneos 21

Informação, o segredo!

25 e 26 de Outubro de 2012

Um bombeiro dos Voluntários da Aguda

(Gaia), de 49 anos, morreu, esta

segunda-feira de manhã, na sequência

de um acidente com uma ambulância da

corporação, na A29, em Arcozelo.notícia retirada do JN a 2012-10-22

Page 22: Organização e Representação da Informação  (Digitalizada)

I Encontro de Arquivos Contemporâneos 22

Informação, o segredo!

25 e 26 de Outubro de 2012

Um bombeiro dos Voluntários da Aguda

(Gaia), de 49 anos, morreu, esta

segunda-feira de manhã, na sequência

de um acidente com uma ambulância da

corporação, na A29, em Arcozelo.notícia retirada do JN a 2012-10-22

Page 23: Organização e Representação da Informação  (Digitalizada)

I Encontro de Arquivos Contemporâneos 23

Informação, o segredo!

25 e 26 de Outubro de 2012

Um bombeiro dos Voluntários da Aguda

(Gaia), de 49 anos, morreu, esta

segunda-feira de manhã, na sequência

de um acidente com uma ambulância da

corporação, na A29, em Arcozelo.

<corporação> <localidade>

<idade> <data>

<autoestrada><localidade>

notícia retirada do JN a 2012-10-22

<evento>

<motivo>

Page 24: Organização e Representação da Informação  (Digitalizada)

I Encontro de Arquivos Contemporâneos 24

Informação, o segredo!

25 e 26 de Outubro de 2012

Anotação(interna) de documentos

Inscrição de notas, comentários ou marcas num documento que ajudam a clarificar/normalizar o seu conteúdo.

Marcas dão significado aos dados

Page 25: Organização e Representação da Informação  (Digitalizada)

I Encontro de Arquivos Contemporâneos 25

Informação, o segredo (2)!

25 e 26 de Outubro de 2012

Um bombeiro dos Voluntários da Aguda (Gaia), de 49 anos, morreu, esta segunda-feira de manhã, na sequência de um acidente com uma ambulância da corporação, na A29, em Arcozelo.

Título = “Bombeiro morre em acidente na A29”

Criador = “Jornal de Notícias”

Tema = “Acidente Mortal”

Descrição = “Notícia sobre morte de bombeiro na sequência de um acidente em autoestrada.”

Editor = “Jornal de Notícias”

Data = “2012-10-22”

Tipo = “Texto”

Formato = “text/plain”

Identificador = “http://goo.gl/e84GL”

Linguagem = “PT”

Page 26: Organização e Representação da Informação  (Digitalizada)

I Encontro de Arquivos Contemporâneos 26

Informação, o segredo (2)!

25 e 26 de Outubro de 2012

MetadadosDados sobre os dados

Definem a semântica dos dados externos ao documento

Enriquecimento da informaçãocom

Anotação (externa) de documentos usando

... que não são expressos no conteúdo do documento ...

Page 27: Organização e Representação da Informação  (Digitalizada)

I Encontro de Arquivos Contemporâneos 27

Metadados e os Documentos

25 e 26 de Outubro de 2012

Page 28: Organização e Representação da Informação  (Digitalizada)

I Encontro de Arquivos Contemporâneos 28

Documentos

25 e 26 de Outubro de 2012

Cada tipo pode ser descrito de várias formas...

O que é considerado um documento?

Os tipos de documento são variados!

Artigo Científico

LivroRelatório

Fotografia

Biografia

Filme

Fatura

Certificado

Gravação ÁudioPassaporte

... depende, claramente, do contexto e da sua utilização

Página Web

Page 29: Organização e Representação da Informação  (Digitalizada)

I Encontro de Arquivos Contemporâneos 29

Metadados do Documento

25 e 26 de Outubro de 2012

Três grandes tipos de metadados...

DescritivosDescrevem os dados essenciais do recurso.E.g., título, autor, etc.

AdministrativosDescrevem dados administrativos que ajudam na manutenção do documento.E.g., a data de criação, como foi a criação, etc.

EstruturaisDescrevem como o recurso é composto.E.g., ordenação de páginas, organização em sistema de ficheiros

Page 30: Organização e Representação da Informação  (Digitalizada)

I Encontro de Arquivos Contemporâneos 30

Esquemas de Metadados

25 e 26 de Outubro de 2012

Conjunto de metadados desenhado em específico para um dado propósito

ex. descrever um determinado relatório...

Tem, geralmente, um contexto de utilização associado!

Podem completar-se, descrevendo um documento para vários propósitos

Definem a semântica (e sintaxe) dos metadados e seus conteúdos

Page 31: Organização e Representação da Informação  (Digitalizada)

I Encontro de Arquivos Contemporâneos 31

Esquemas de Metadados

25 e 26 de Outubro de 2012

- Dublin Core – para simples descrição de um documento

- TEI (Text Encoding Initiative) – para anotação de textos eletrónicos (e.g., romances)

- METS (Metadata Encoding and Transmission Standard) – para expressar estrutura de um objeto digital assim como para o descrever e localizar os ficheiros que o compõem

- EAD (Encoded Archival Description) – para anotar dados em inventários ou índices em linha

- LOM (Learning Object Metadata) – para fomentar o uso de recursos didáticos suportados por tecnologia

- CDWA (Categories for Description of Works of Art) – para descrever objetos visuais como pinturas ou esculturas

- ISAD(g) (General International Standard Archival Description ) – guias para descrever arquivos

Page 32: Organização e Representação da Informação  (Digitalizada)

I Encontro de Arquivos Contemporâneos 32

Uma questão de Semântica

25 e 26 de Outubro de 2012

Page 33: Organização e Representação da Informação  (Digitalizada)

I Encontro de Arquivos Contemporâneos 33

Nem só de pão vive o homem...

25 e 26 de Outubro de 2012

A anotação de documentos ajuda o humano a perceber com maior exatidão o conteúdo e o próprio documento

As marcas de anotação por si só fornecem o significado ao valor marcado

Nesta perspetiva

E as relações semânticas que entre elas existem...

Porque (melhor ou pior) o humano conhece o domínio

MASAs máquinas

NÃO!!!É necessário “ensinar-lhes” o domínio!

Page 34: Organização e Representação da Informação  (Digitalizada)

I Encontro de Arquivos Contemporâneos 34

Organização semântica da Informação

25 e 26 de Outubro de 2012

Ontologias

“Uma ontologia é um artefacto que

define um conjunto de conceitos,

relações e axiomas para um domínio de

saber específico, representando e

organizando o conhecimento implícito (de

forma a que um conjunto de sistemas cooperativos

concordem e o partilhem).”Retirado, traduzido e adaptado de “Ontological Adaptive Integration Of Reverse Engineering Tools”

Page 35: Organização e Representação da Informação  (Digitalizada)

I Encontro de Arquivos Contemporâneos 35

Organização semântica da Informação

25 e 26 de Outubro de 2012

Ontologias O = (C, R, A)

- C – Entidades da Ontologia- CC – Conceitos (Ex: Mãe)- CI – Instâncias dos conceitos (Ex: Teresa)

- R – Relações entre entidades da Ontologia- RH – Relações taxonómicas/hierárquicas entre conceitos (Ex:

Mãe ‘é_uma’ Pessoa)- RI – Relações entre conceitos e Instâncias (Ex: Teresa ‘é_uma’

Mãe)- RS – Relações não taxonómicas entre conceitos (Ex: Mãe

‘tem_filho’ Filho)- RP – Propriedades dos conceitos (Ex: Pessoa

‘data_de_nascimento’ 1986-02-26)

- A – Axiomas. Dão consistência à ontologia e são usados para inferir novo conhecimento (Ex: “Se duas Filhas têm a mesma mãe então são Irmãs”)

Page 36: Organização e Representação da Informação  (Digitalizada)

I Encontro de Arquivos Contemporâneos 36

Ontologias…Metadados… Cooperação?

25 e 26 de Outubro de 2012

CooperaçãoSó haverá cooperação entre sistemas (de arquivos) se todos falarem a mesma língua!

XML é a língua franca para a interoperabilidade (de informação)!

Mas o conteúdo em XML pode ser interpretado de várias maneiras!

MetadadosMas os metadados têm um significado bem definido!

No entanto o significado depende do domínio específico...

OntologiasAs ontologias descrevem um domínio!

Os metadados (conceitos nas ontologias) podem ser relacionados de forma unívoca numa tal estrutura...

Uma vez aceites as relações inter-metadados , os sistemas podem cooperar porque se percebem mutuamente!

Page 37: Organização e Representação da Informação  (Digitalizada)

I Encontro de Arquivos Contemporâneos 37

Os nossos Projetos

25 e 26 de Outubro de 2012

Page 38: Organização e Representação da Informação  (Digitalizada)

I Encontro de Arquivos Contemporâneos 38

Metadados na Pesquisa Semântica

• Criação de Ontologia para uma área jurídica• Levantamento de metadados associados a documentos dessa área• Relacionamento entre metadados e conceitos ontológicos

• Implementação da pesquisa de documentos baseada na ontologia

• Benefícios da pesquisa ontológica na obtenção de informação jurídica

25 e 26 de Outubro de 2012

De documentos Jurídicos!

Page 39: Organização e Representação da Informação  (Digitalizada)

I Encontro de Arquivos Contemporâneos 39

Povoamento Automático de Ontologias

• Área jurídica do direito de família• Criação de Ontologia para representar conhecimento

sobre a área

• Utilização de processamento de linguagem natural para reconhecer padrões e anotar textos jurídicos

• Informação anotada usada para povoar ontologias

• Diminuição dos custos e esforços na construção de bases de conhecimento

25 e 26 de Outubro de 2012

A partir da anotação de documentos Jurídicos!

Page 40: Organização e Representação da Informação  (Digitalizada)

I Encontro de Arquivos Contemporâneos 40

Geração Automática de Museus Virtuais

• Base de dados de espólio (de museus e arquivos) anotado

• Ontologia geral para descrever o conhecimento anotado

• Construção de salas de exposição virtuais para aprendizagem a partir de especificações sobre a vistas da ontologia e os documentos anotados

• Navegação dirigida pela semântica• Uso de browsers semânticos

• Projeto CoNVEM / Geny

25 e 26 de Outubro de 2012

A partir da anotação de espólio de arquivos e museus

Page 41: Organização e Representação da Informação  (Digitalizada)

I Encontro de Arquivos Contemporâneos 41

Geração Automática de Museus Virtuais

25 e 26 de Outubro de 2012

Page 42: Organização e Representação da Informação  (Digitalizada)

I Encontro de Arquivos Contemporâneos 42

Geração Automática de Museus Virtuais

• Projeto siME, Projeto de Mestrado, Genio• Museu da Emigração e das Comunidades (Fafe)

25 e 26 de Outubro de 2012

Page 43: Organização e Representação da Informação  (Digitalizada)

I Encontro de Arquivos Contemporâneos 43

Geração Automática de Museus Virtuais

25 e 26 de Outubro de 2012

Page 44: Organização e Representação da Informação  (Digitalizada)

I Encontro de Arquivos Contemporâneos 44

Outros Projetos

25 e 26 de Outubro de 2012

Page 45: Organização e Representação da Informação  (Digitalizada)

I Encontro de Arquivos Contemporâneos 45

Qwiki

25 e 26 de Outubro de 2012

Page 46: Organização e Representação da Informação  (Digitalizada)

I Encontro de Arquivos Contemporâneos 46

Google Art Project

25 e 26 de Outubro de 2012

Page 47: Organização e Representação da Informação  (Digitalizada)

I Encontro de Arquivos Contemporâneos 47

Sumário

25 e 26 de Outubro de 2012

Page 48: Organização e Representação da Informação  (Digitalizada)

I Encontro de Arquivos Contemporâneos 48

Sumário

25 e 26 de Outubro de 2012

Tim Berners-Lee adaptou-se à (na altura) nova tendência da comunicação entre computadores e revolucionou-a!

Tal revolução levou à criação de espaços partilhados de informação, acessíveis por todo o mundo!

Os arquivos e os seus profissionais também evoluíram com o tempo, adaptando-se às demandas da sociedade e à própria evolução tecnológica!

A Web continuou a evoluir ao ponto de se estar agora a preparar para a sua terceira fase, onde as máquinas irão compreenderão o conteúdo dos recursos documentais...

A noção de anotações e metadados como o segredo para a obtenção de informação, e o seu relacionamento semântico com base em ontologias, parece estar em consonância com a noção semântica que a web quer para si.A uniformização de arquivos como repositórios de Informação, aumentam a possibilidade de cooperarem, promovendo a troca de informação (em tempos custodiada)

Page 49: Organização e Representação da Informação  (Digitalizada)

I Encontro de Arquivos Contemporâneos 49

ORGANIZAÇÃO E REPRESENTAÇÃO DA INFORMAÇÃO

Arquivos, Bibliotecas e Museus

nuno oliveiraUniversidade do Minho

25 e 26 de Outubro de 2012