controle de vocabulário
TRANSCRIPT
Vocabulários controlados: acesso rápido à informação
Controle de Vocabulário para o mundo digital
[email protected]! twitter.com/charlley!
facebook.com/charlley!linkedin.com/charlley!
• Controle de vocabulário • Arquitetura de Informação • Metadados • Indexação: Princípios básicos do tema • Vocabulários controlados !
• ALMOÇO !
• Tesauro • Caso VCS • Definindo o domínio: Matriz conceitual • Formas de estruturação de tesauros !• CAFÉ !
• Normas NISO/ISO (normas internacionais) • Caso Museu Futebol
ROTEIRO DO DIA
Estruturação da Informação
Controle de Vocabulário
Linguagens Documentárias
Arquitetura de Informação!Vocabulário Controlado!Ontologia de domínio
Contexto do Serviço de Informação
Contexto da instituição
Indexação
Busca e Uso
Funções Arquivísticas
Estruturação da Informação Gestão da Informação
Arquivos Produção
Classificação
Avaliação
Descrição
Conservação/Preservação
Aquisição/Recolhimento
Difusão/Acesso
Informação Orgânica
Atividade fim e
Atividade Meio
Ciclo Informacional
Estruturação da Informação
Coleções Geração
Seleção/Aquisição
Representacão
Distribuição
Armazenamento
Recuperação
Uso
Gestão da Informação
Conhecimento
Ciclo Informacional
Estruturação da Informação
Coleções Geração
Seleção/Aquisição
Representacão
Distribuição
Armazenamento
Recuperação
Uso
Gestão da Informação
Conhecimento
Controle de vocabulário Controle de Vocabulário
6 Procedimentos de controle de vocabulário:
1. normalização gramatical;2. opções de grafia;3. monitorar alterações nos nomes de pessoas outopônimos;
4. controle de sinonímia, homonímia e quasesinonímia;
5. adoção de termos compostos;6. introdução de notas de escopo e notas de uso.
Controle de vocabulário = processo, programaVocabulário Controlado = instrumento, confiança
Controle de vocabulário Controle de Vocabulário
6 Procedimentos de controle de vocabulário:
1. normalização gramatical;2. opções de grafia;3. monitorar alterações nos nomes de pessoas outopônimos;
4. controle de sinonímia, homonímia e quasesinonímia;
5. adoção de termos compostos;6. introdução de notas de escopo e notas de uso.
Controle de vocabulário = processo, programaVocabulário Controlado = instrumento, confiança
O controle de vocabulário intervém na organização ao nomear, de forma
consistente, os pontos de acesso aos documentos e à informação neles contida.
Objetivo principal = recuperação da informação [Precisão vs Revocação]
(SMIT & KOBASHI, 2003)
Controle de vocabulário Controle de Vocabulário
6 Procedimentos de controle de vocabulário:
1. normalização gramatical;2. opções de grafia;3. monitorar alterações nos nomes de pessoas outopônimos;
4. controle de sinonímia, homonímia e quasesinonímia;
5. adoção de termos compostos;6. introdução de notas de escopo e notas de uso.
Controle de vocabulário = processo, programaVocabulário Controlado = instrumento, confiança
O controle de vocabulário intervém na organização ao nomear, de forma
consistente, os pontos de acesso aos documentos e à informação neles contida.
Objetivo principal = recuperação da informação [Precisão vs Revocação]
(SMIT & KOBASHI, 2003)
Controle vocabulário = operação complexa: envolve uma equipe
de profissionais. Necessidade institucional e investimento humano e financeiro
Controle de vocabulário Controle de Vocabulário
6 Procedimentos de controle de vocabulário:
1. normalização gramatical;2. opções de grafia;3. monitorar alterações nos nomes de pessoas outopônimos;
4. controle de sinonímia, homonímia e quasesinonímia;
5. adoção de termos compostos;6. introdução de notas de escopo e notas de uso.
Controle de vocabulário = processo, programaVocabulário Controlado = instrumento, confiança
O controle de vocabulário intervém na organização ao nomear, de forma
consistente, os pontos de acesso aos documentos e à informação neles contida.
Objetivo principal = recuperação da informação [Precisão vs Revocação]
(SMIT & KOBASHI, 2003)
Controle vocabulário = operação complexa: envolve uma equipe
de profissionais. Necessidade institucional e investimento humano e financeiro
Controle de vocabulário pressupõe intervenções no: controle da normalização gramatical – a forma dos termos (quem, quando onde?); controle semântico dos termos ou controle do significado.
Compatibilizar as diversas linguagens: dos sistemas de informação; dos profissionais da informação; dos documentos e dos usuários.
Para proceder a um processo de normalização: mapear as variantes gramaticais do mesmo termo e/ou conceito, as formas do singular e plural e diferentes flexões dos tempos verbais. E, por outro lado, os termos e/ou conceitos são agrupados diante de um mesmo conceito ou um similar, isto é, sinônimos ou palavras que são equivalentes.
Svenonious aponta duas etapas nas atividades de controle de vocabulário: A primeira refere-se à classificação de variantes gramaticais do mesmo termo e/ ou conceito, significado singular e plural e variantes gramaticais. A segunda etapa, os termos e/ou conceitos são agrupados por descreverem o mesmo conceito ou um similar, isto, é, sinônimos ou palavras que são equivalentes em seus significados.
Segundo Canalejo a normalização terminológica como recurso para o controle de vocabulário “procede das linguagens de indexação e supõe a seleção dos termos que representam o documento em si, seu conteúdo e seu contexto para proporcionar qualidade de informação que se pede atual- mente aos arquivos, inseridos num sistema de informação e por isso cada dia frequen- tados por um público muito heterogêneo.
Controle de Vocabulário
VISÕES
Vocabulário controlado = um instrumento de controle terminológico.
Para arquivos, a recuperação da informação arquivística é mediada pelos instrumentos de pesquisa (guias, inventários, catálogos etc.) e instrumentos de gestão (quadro/tabela de classificação, tabela de temporalidade).
normalização
Como controlar vocabulário corporativo
Ambientes digitais
Geração e uso de documentos
Processos e ritos corporativos
Workflows e tomadas de decisão Fluxos de registro; Inteligência do negócio
Formulários e Manuais, Classificação eVocabulário Controlado, Quadro de Arranjo;Sistemas de Arquivos
Processos e produção. Sistemas de Gestão
Arquitetura de Informação, Arquitetura deInterface; Portais Corporativos e Intranets
Múltiplos sistemas de gestão da informação
Controle de Vocabulário
AÇÃO
Organização da Informação e Conhecimento
Controle de Vocabulário
Mediação simbólica em sistemas informacionais
Estruturação da Informação
Arquitetura
Indexação
Classificação e Arranjo
Recuperação da Informação
Pontos de Acesso
SRI/Search
Instrumentos de Pesquisa
Controle do Vocabulário
Arquitetura de Informação
ARQUITETURA DE INFORMAÇÃO
O termo arquitetura de informação foi criado pelo arquiteto/designer Saul Wurman, em 1976. !!
O conceito de Wurman tinha relação com a organização da grande quantidade de informação produzida pelo homem diariamente, sem grande preocupação com a ordem. !!
Wurman estabeleceu o propósito da AI em guias de viagem, com mapas de regiões, organizando o conteúdo por categorias de lugares para visitar.
Arquitetura de Informação
AI
Representação abstrata do metrô de Tóquio. Nela,Wurmanmostra:
A seleção dos principais prédios ou pontos turísticosperto de cada estação.
As conexões entre os dois tipos de estações.
As estações que cruzam a cidade.
Como ajuda de orientação, o Palácio Imperial.
Destaque: o mapa está dentro do design do yin-yang, algoimportante na filosofia oriental.
As estações externas.Ao invés de respeitar a geografiada cidade, se concentrou no que é mais importante para osusuários: saber a sequência das estações.
AI
Arquitetura de Informação
“A arte e ciência de estruturar e classificar websites e intranets para ajudar pessoas a encontrar e gerenciar informações.”
Arquitetura de Informação
O que é?
Basicamente, um arquiteto de informação: Organiza conteúdos dentro de um ambiente digital - websites, intranets, softwares Cria estruturas informacionais e planeja caminhos de navegação dentro destes ambientes.
Arquitetura de Informação
O que é?
www.sitepoint.com "
O que é?
Rosenfeld)e)Morville)
Arquitetura de Informação
Entregáveis
Arquitetura de Informação
Peter Morville & Louis Rosenfeld!
Blueprints/Relatórios/Definições: !•Análises iniciais: heurística e benchmarking •Orientação estratégica •Metáfora •Entrevistas •Matriz de Oportunidades •Mapa do ambiente digital •Metadados •Taxonomia •Wireframes/Protótipo •Requisitos funcionais
Entregáveis
Os olhos fixam-se primeiro no canto superior esquerdo da tela.
Depois, os olhos fazem um movimento da esquerda para a direita.
Só após observar o topo da página é que os olhos exploram os conteúdo mais abaixo.
O Poynter Institute desenvolveu um estudo utilizando o Eyetrack Recorder III, que segue os olhos dos usuários pela tela.Ao combinar os dados de vários indivíduos, foram descobertos padrões que se aplicam à maioria da população.
1
2
3
1
2
3
Arquitetura de Informação
Wireframes
As 3 principais questões dos usuários dentro da navegação de um ambiente digital: !
!
!
Onde estou? !
Onde estive? !
Onde posso ir?
Arquitetura de Informação
Navegação
Arquitetura de Informação
Sistema de navegação • Sistemas de navegação são compostos de vários elementos básicos ou subsistemas. • Temos a navegação global, a local e a contextual que são integradas nas próprias páginas.
Navegação
Navegação Global
Nave
gaçã
o Lo
cal
Navegação Contextual
Arquitetura de Informação
Navegação
Onde eu estou?
O q
ue e
stá
próx
imo?
O que está relacionado
com o que está aqui?
Arquitetura de Informação
Navegação
Onde posso ir?
Ond
e po
sso
ir?Onde posso ir?
Arquitetura de Informação
Navegação
Arquitetura de Informação
NavegaçãoGlobal
Local
Contextual
Arquitetura de Informação
NavegaçãoGlobal
Local
Contextual
!Navegação global está presente em todas as páginas de um site.
A na
vega
ção
loca
l é u
m c
ompl
emen
to à
nav
egaç
ão g
loba
l. Uma vez que a navegação global pode nos levar à uma navegação local, resta o estudo da navegação contextual, como o nome diz, é uma navegação intrinsecamente ligada ao
conteúdo.
• Logomarca no canto superior esquerdo
• Busca na barra superior
• Navegação global na parte superior
• Navegação local na coluna esquerda
• Conteúdo na área central
• Breadcrumbs na parte superior
Arquitetura de Informação
Navegação
Marca XYZ Buscar
>Link 01 >Link02 >Link03 >Link04 >Link05
Navegação local
Breadcrumbs ( Home )
Conteúdo global e contextual Conteúdo relacionado
Rodapé
> Bread > crumbs > Nome da página > Sessões > Subsessões!
Arquitetura de Informação
Passo a Passo do Mapa de AI
São executadas as primeiras atividades estratégicas para organizar e hierarquizar o conteúdo. !Depois são definidos agrupamentos e atividades para iniciar o desenho do diagrama de navegação estabelecendo as grande áreas ou grandes grupos de informação e como devem ser chamados. !Esta denominação é a primeira dica do rótulo e precisa ser coerente com cada novo rótulo criado abaixo dele e com os conteúdos que definirão a ramificação deste galho. Estes rótulos podem sofrer alterações, mas já devem fazer sentido. !O aprofundamento da navegação é definido com mapa de navegação com definição de sub-grupos que poderão ser encontrado a partir dos rótulos que identificam as grandes áreas. A definição de regras prevê transições e uso de filtros durante a montagem das ligações entre as áreas informacionais. !Legendas e símbolos utilizados para definir páginas, conteúdos e outros itens são tão importante quanto o resultado do diagrama. Não é necessário adotar modelos existentes, mas para cada símbolo criado ou utilizado deve ser compreendido por uma explicação em legenda.
Rotular!Agrupar!
Categorizar!
L A T C H LUGAR ALFABETOTEMPOCATEGORIAHIERARQUIA
Arquitetura de Informação
CINCO CABIDES DEFINITIVOS
R.S. WURMAN
Agrega informações de origens diferentes
Para grandes conjuntos de informação
Eventos com intervalo fixo. Linha de tempo.
Que tenham importância equivalente
Por ordem de grandeza, menor ao maior.
Card Sorting: técnica para estudo do usuário (categorias e rótulos)
Metodologia Card Sorting
Card Sorting é um método que consiste em escrever funcionalidades do Portal em cartões que serão manuseados por usuários, que deverão ordená-los em grupos que façam sentido semanticamente e/ou de acordo com as suas necessidades
O que é Card Sorting?
Consiste em entregar ao usuário certo número de cartões, cada um deles representando um conteúdo do website, e solicitar que ele os organize em rótulos, formando categorias.
O objetivo é gerar uma estrutura global da informação ou avaliar uma estrutura existente, aumentando a probabilidade do usuário encontrar informações enquanto estiver navegando.
Fácil de conduzir Baixo custo Envolve o usuário Identifica itens difíceis de categorizar e encontrar Aponta problemas com rótulos É uma técnica bem estabelecida, usada há mais de 10 anos por vários designers
Metodologia Card SortingMetodologia Card Sorting
Como fazer Card Sorting?
Websort Optimalsort Userzoom
Metodologia Card Sorting
Ferramentas Online
Ferramentas para AI
Writemaps Gliffy
!
Outras: FreeMind, Mindomo e Freeplane
Ferramentas Online
Classificação
A,busca,é,a,forma,mais,comum,de,navegação
Tipos de Processos de AI
Controle do Vocabulário
Metadados
Propósitos dos Metadados
Descrição do recurso
Recuperação e disseminação da
Informação
Preservação e Retenção
Gerenciamento de Usuários e Instituições
Gerenciamento de Propriedade e
Direitos
O que são Metadados?
Pra que metadados?
Uso dos Metadados (segundo NISO. Undestanding Metadata) !
!
• Descoberta de recursos • Organizar recursos eletrônicos • Interoperabilidade Definição: habilidade com que múltiplos sistemas, com diferentes plataformas de hardware e software, estruturas de dados e interfaces, trocam dados com perdas mínimas de conteudo e funcionalidade • Identificação Digital URL (Uniform Resource Locator) PURL (Persistent URL ) DOI (Digital Object Identifier). • Arquivamento e Preservação
Definição de Metadados
Pra que metadados?
Esquemas de Metadados !
!
!
• Um conjunto de elementos de metadados e regras para usá-lo [NISO. Undestanding Metadata] • Contém a definição dos elementos de metadados que serão utilizados por uma determinada comunidade para descrever seus recursos • Também são chamados de vocabulários • Exemplos: ◦ Dublin Core ◦ Marc ◦ EAD - Encoded Archival Description
Definição de Metadados
Pra que metadados?
1. Critérios de interoperabilidade entre sistemas 2. Normas diferentes 3. Correta caracterização dos recursos segundo uma determinada visão ou necessidade.
Definição de Metadados
Critérios para definição de esquema
Definição de Metadados
Critérios para definição de esquema
http://teiadeideia.com.br/
Definição de Metadados
Critérios para definição de esquema
http://teiadeideia.com.br/
Para descrever Recursos da Web Dublin Core !Para Registros Bibliográficos Marc MarcXML Mods Onix (indústria) !Para descrever Autoridades, Agentes, Pessoas, Entidades Foaf (Friend of a Friend) - Relacionamento vCard - Contatos, negócio Mads Marc Authority - Resistro de autoridades EAC ISAAR-CPF (norma) – Arquivo !Para descrever Coleções EAD Isad-G (norma) - Arquivos Dublin Core Collection - Web Mods !Para descrever Objetos de Aprendizagem LOM !Para descrever Recursos de Governos Agls (Austrália) Gils e-GMS (Reino Unido) !Para Comércio Eletrônico Idecs
!Para descrever Imagens, Audiovisuais, Fotos Mpeg-21 Mpeg-7 Vra - Visual Resources Association MIX - Metadata for images in XML Schema IPTC Photo !Para Museus, Artes, Cultura CIDOC/CRM - Conceptual Reference Model CDWA - Categories for the Description of Works of Art Vra - Visual Resources Association CIMI - Computer Interchange of Museum information !Para Notícias, Imprensa NewsML (IPTC) EventsML (IPTC) SportsML (IPTC) IPTC Photo !Para Representação, Codificação, Transmissão, Preservação Digital Mets - Metadata Encoding and Transmission Standard Premis - Preservation Metadata !Para Citação National Library of Medicine Recommended Formats for Bibliographic Citation !Para Direito Autoral ODR !!!
Definição de Metadados
Critérios para definição de esquema
Perfil de Aplicação !
!
• Esquema que consiste de elementos de um ou mais esquema de metadados, que são combinados e otimizados para uma aplicação particular • Normalmente são construídos a partir do Dublin Core. Nesse caso indicam como Dublin Core é estendido e aplicado para um domínio particular • Mais sobre a metodologia: Application profiles: mixing and matching metadata schemas
Definição de Metadados
Critérios para definição de esquema
Crosswalks !
!
• Relacionamentos entre padrões de esquemas de metadados, geralmente especificados em tabela • Utilizados para a tradução entre estes esquemas • Exemplos: ◦ Marc para Dublin Core ◦ EAD de/para ISAD-G ◦ VRA- MARC21 ◦ LOM para Dublin Core ◦ DCWA - MARC - DC - MODS - EAD
Definição de Metadados
Critérios para definição de esquema
Crosswalks !
!
• Relacionamentos entre padrões de esquemas de metadados, geralmente especificados em tabela • Utilizados para a tradução entre estes esquemas • Exemplos: ◦ Marc para Dublin Core ◦ EAD de/para ISAD-G ◦ VRA- MARC21 ◦ LOM para Dublin Core ◦ DCWA - MARC - DC - MODS - EAD
Definição de Metadados
Critérios para definição de esquema
Crosswalks !
!
• Relacionamentos entre padrões de esquemas de metadados, geralmente especificados em tabela • Utilizados para a tradução entre estes esquemas • Exemplos: ◦ Marc para Dublin Core ◦ EAD de/para ISAD-G ◦ VRA- MARC21 ◦ LOM para Dublin Core ◦ DCWA - MARC - DC - MODS - EAD
Definição de Metadados
Critérios para definição de esquema
Editor de metadados DC-Dot's Dublin Core http://www.ukoln.ac.uk/metadata/dcdot/
Editor de metadados DC-Dot's Dublin Core http://www.ukoln.ac.uk/metadata/dcdot/
Controle do Vocabulário
Taxonomias
TaxonomiaSistema para nomear e organizar informações, classificação
Grupos que compartilham características similaresBase
Tipos de GruposRótulos, metadados e hierarquias, além de Vocabulário Controlado
Estrutura formal de um domínio do conhecimentoTodo volume de informação requer padronização
Taxonomias e Domínios
Definições para taxonomia
Fatos da Taxonomia
• Lista estruturada de conceitos/termos de um domínio. • Mecanismo de consulta e navegação em Portais • Termos organizados hierarquicamente • Deixa claro um modelo/mapa conceitual do domínio
Taxonomias e Domínios
Definições para taxonomia
Fatos da Taxonomia
• Lista estruturada de conceitos/termos de um domínio. • Mecanismo de consulta e navegação em Portais • Termos organizados hierarquicamente • Deixa claro um modelo/mapa conceitual do domínio
Taxonomias e Domínios
Definições para taxonomia
Taxonomia já faz parte da nossa vida
Necessidade de uma classificação: Ordenar Entender Aplicar regras de uso/manejo/etc... Comunicação Acesso a informação Dentre muitas outras (alguma sugestão?)
Taxonomias e Domínios
Necessidades de Classificação
Rotular informações de forma lógica ou intuitiva; !
Relacionar diferentes linguagens funcionais utilizadas nas empresas padronizando seu uso;
Normalizar e disponibilizar as informações no portal corporativo (Intranet) e na Internet; !
Criar mecanismo para indexação e navegação.
Taxonomias e Domínios
Objetivos da taxonomia
!
Taxonomia Corporativa !
Facilita a recuperação da informação; Padroniza o armazenamento das informações; Organização e disseminação das informações. !
Criação de Vocabulário Controlado de Indexação; Política de Metadados;
Resultados Esperados: Facilidade na indexação e na busca; Maior precisão e revocação do sistema de buscas, diminuindo tempo de acesso à informação e otimizando o sistema.
Taxonomias e Domínios
Aplicações
Dividida em processo, sub- processo e atividade !
Estruturada pelos processos de negócio da instituição = diagnóstico funcional !
Desenvolvimento de palavras- chave e conceitos para que os conteúdos sejam classificados nos ramos.
Taxonomias e Domínios
Aplicações
Taxonomias e Domínios
Aplicações
INDEXAÇÃO:!!
! 1.!Análise - leitura e segmentação do texto para a identificação e a seleção de conceitos;!
!
! 2.!Síntese - construção do texto documentário com os conceitos selecionados;!
!
! 3.!Representação - ou tradução, por meio de linguagens documentárias.
Taxonomias e Domínios
Aplicações
INDEXAÇÃO:!!
! 1.!Análise - leitura e segmentação do texto para a identificação e a seleção de conceitos;!
!
! 2.!Síntese - construção do texto documentário com os conceitos selecionados;!
!
! 3.!Representação - ou tradução, por meio de linguagens documentárias.
ISO 5963 NBR 12.676
!Métodos para análise
de documentos - determinação de seus assuntos e seleção de termos de indexação
Indexação por atribuição é aquela que envolve a atribuição de termos a partir de uma fonte que não é o próprio documento. Esse tipo de indexação representa-se a substância da análise conceitual mediante o emprego de termos extraídos de um vocabulário controlado. !Indexação derivativa/ extração: palavras ou expressões que realmente ocorrem no documento são selecionadas para representar o seu conteúdo temático. Uma forma primitiva de indexação derivada é o UNITERMO, que emprega apenas termos formados por uma única palavra tirada do texto. !Indexação Seletiva: é a indexação que atribui ao documento uma quantidade de termos muito limitada, atribuindo apenas 5 termos a cada documento. !Indexação Exaustiva: é a indexação que, como o próprio nome já diz , é exaustiva, ou seja, o indexador poderá atribuir ao documento quantos termos ele achar necessário para representar o documento. !Indexação de Citação !Indexação Ponderada: é a indexação que , como o termo já define, atribui pesos aos termos, a fim de identificá-los como mais importantes em relação aos outros termos.
Taxonomias e Domínios
Tipos de Indexação
Os assuntos dos documentos são complexos e muitas vezes não é possível descrevê-los por palavras simples. Para a representação dos assuntos compostos utiliza-se a coordenação, ou seja, a combinação de termos. !
Combinação feita na etapa de entrada, na indexação. Dessa forma, os assuntos são tratados como uma unidade, isto é, são representados por um conjunto de termos já combinados. Exemplo: Álbum de fotografia !
Combinação feita no momento da saída, da recuperação da informação. Utilização de operadores booleanos: E, OU, NÃO. Exemplo: álbum; fotografia
INDEXAÇÃO PRÉ-COORDENADO PÓS-COORDENADO
Taxonomias e Indexação
Aplicações
Utilizadas em sistemas de indexação pós-coordenados, nos quais os termos são combinados no momento da recuperação da informação. !
O conteúdo temático, que é o objeto de um documento e é representado pelos termos de indexação que lhe são atribuídos, reveste-se de um caráter multidimensional
O vocabulário torna-se menos extenso neste tipo de linguagem, uma vez que não é necessário criar um termo para cada assunto complexo. !
Todo termo atribuído a um documento tem peso igual: nenhum é mais importante que o outro
LINGUAGEM PÓS-COORDENADA
Taxonomias e Indexação
Aplicações
Descritores: administração, avaliação, automação, sistema de informação, arquivos, coleções.
Diferentes assuntos: !
Administração de arquivos Automação de arquivos Avaliação de coleções
Administração de sistema de informação; Avaliação de sistema de informação;
Os termos podem ser combinados entre si de qualquer forma no momento em que se faz a busca
Taxonomias e Indexação
Aplicações
as linguagens documentárias recebem denominações diversas, tais como linguagens de indexação (MELTON, J.); linguagens descritoras (VICKERY, B.); codificações documentárias (GROLIER, E.); linguagens de informação (SOERGEL); vocabulários controlados (LANCASTER, F. W.); lista de assuntos autorizados (MONTGOMERY, C.); e, ainda linguagens de recuperação da informação, linguagens de descrição da informação. [...]. De um modo geral, poder-se-ia afirmar que nas expressões, tanto os substantivos como os adjetivos são sinônimos. As escolhas deixam transparecer as orientações teórico-metodológicas adotadas pelos autores, refletidas no binômio [...] informação/documentação.
Taxonomias e Domínios
Definições para taxonomia
Grupos que compartilham características similares
A homonímia (ou homografia) “corresponde à igualdade entre significantes de significados diferentes”. !
A homonímia pode ser: !
•total – como fiar, que tanto significa tecer, quanto confiar;
•ou parcial – como em coser e cozer. !
Solução: qualificadores Como, por exemplo, São Paulo (cidade); São Paulo (estado).
1. Equivalência ou sinonímia; 2. Hierarquia; e 3. Associação.
Taxonomias e Domínios
Relações semânticas num Vocabulário Controlado
Controle do Vocabulário
Vocabulário Controlado
um vocabulário controlado configura-se numa lista de termos (descritores) com a finalidade de orientar com precisão a organização e a recuperação da informação arquivística, remetendo às séries ou conjuntos de documentos.
Vocabulários Controlados
Tipos e Relações de um Vocabulário Controlado
um vocabulário controlado configura-se numa lista de termos (descritores) com a finalidade de orientar com precisão a organização e a recuperação da informação arquivística, remetendo às séries ou conjuntos de documentos.
Teoria moderna de classificação !
Quebra cada assunto em conceitos básicos !
Analisa o assunto dentro de 5 categorias lógicas: Personalidade, Matéria, Energia, Espaço e Tempo (PMEST). !
Combina conceitos para descrever o assunto. !
Cada documento é classificado levando em conta 1 ou mais símbolos das facetas apropriadas, combinado-as de acordo com certas regras.
Vocabulários Controlados
Tipos e Relações de um Vocabulário Controlado
G.M. Souza
Vocabulários Controlados
Lista Anel de Sinônimos Taxonomia Tesauro
Ambiguidade AmbiguidadeSinonímia
AmbiguidadeSinonímiaHierarquia
AmbiguidadeSinonímiaHierarquia
Associação
Relações Semânticas
VC
men
os c
ompl
exos
mai
s co
mpl
exos
Vocabulários Controlados
Tipos e Relações de um Vocabulário Controlado
Os indicadores de relacionamentos são sempre operadores emparelhados por termos. Alguns indicadores são simétricos e outros são assimétricos:
Simétrico
Termo A Termo B
Associação
TR
Assimétrico
Termo A Termo B
Equivalência
USE/UP
Tipos e Relações de um Vocabulário Controlado Vocabulários Controlados
Z39.19
Simétrico
Termo A Termo B
Hierárquico
TG / TE
PREFERIDO / NÃO PREFERIDO | Sinonímia
Relações de Equivalência Vocabulários Controlados
U ou USE, que remete de um termo não preferido para um termo preferido, e UP ou USADO PARA, relação recíproca, que remete um termo preferido para um ou mais termos não preferidos.
Z39.19
USEBOLACHA BISCOITO
TR
Simétrico
PANIFICAÇÃO PÃO
Associação
Relações de Associação Vocabulários Controlados
TR
Simétrico
PANIFICAÇÃO PÃO
Associação
Relações de Associação Vocabulários Controlados
Relações Hierárquica Vocabulários Controlados
A reciprocidade de superordinação e subordinação deve ser expressa pelos seguintes indicadores de relacionamento: TG (Termo Geral), para o termo superordinado (termo pai) TE (Termo específico), para o termo subordinado (termo filho)
BOLACHA
Bolachas Maria Bolachas de Água e Sal Bolachas Belgas Bolachas de Manteiga
TG TE
Relações Hierárquica Vocabulários Controlados
A reciprocidade de superordinação e subordinação deve ser expressa pelos seguintes indicadores de relacionamento: TG (Termo Geral), para o termo superordinado (termo pai) TE (Termo específico), para o termo subordinado (termo filho)
BOLACHA
Bolachas Maria Bolachas de Água e Sal Bolachas Belgas Bolachas de Manteiga
TG TE
Tipos de Relações Hierárquica Vocabulários Controlados
Relacionamento genérico. Esse tipo de relacionamento é o mais comum e indica uma conexão entre uma classe e suas partes. E pode ser testada usando a lógica todo-e-algum.
Relacionamento de instância. A relação de instância indica uma conexão entre uma categoria geral de coisas ou eventos expressa por um nome comum e uma instância individual dessa categoria, geralmente um nome próprio.
Relacionamento todo-parte. Cobre as situações nas quais um conceito está originalmente incluso em outro, independente do contexto, de forma que os termos podem ser organizados em uma hierarquia lógica de subordinação de assuntos.
Relacionamento poli-hierárquico. Alguns conceitos pertencem, dentro de uma concepção lógica, a mais de um contexto. Nesses casos eles possuem um relacionamento poli-hierárquico.
O vocabulário controlado para a arquivística deve: !
1. hierarquizar as funções e respectivas atividades: esta hierarquia pode ser mais ou menos detalhada, mas é necessária por duas razões: para dar uma ideia do universo funcional abrangido (a visão do todo), incluindo os termos num sistema significante; e para orientar a organização física das séries documentais;
!
2. orientar o controle de vocabulário, particularmente no que diz respeito à sinonímia, pela inclusão de remissivas na lista alfabética. As remissivas têm por função orientar a nomeação dos documentos (em sua geração e no momento de sua busca) de [descritores] ou expressões não adotadas para [descritores] ou expressões adotadas pelo sistema;
!
3. relacionar [descritores] presentes em categorias diferentes; !
4. conceituar os [descritores] e as condições de seu uso.
Abordagem Arquivística Vocabulários Controlados
após o estabelecimento terminológico, a adoção dos termos adotados e dos não adotados deve ordenar tais termos de modo que reflita as atividades orgânico-funcionais, tendo como base o plano/quadro de classificação de documentos.
Abordagem Arquivística Vocabulários Controlados
1
Levantamento das estruturas hierárquicas e de relações referentes a uma determinada atividade funcional e estrutural.
10 passos para o controle de vocabulário
2
As ações, funções e atividades orgânicas desenvolvidas pelo orgão produtor responsável pelos documentos arquivísticos;
3
A partir da análise funcional e das atividades, estabelecer os termos potenciais para representar e servir de ponto de acesso na recuperação da informação arquivística;
Vocabulários Controlados
4
Alinhamento com Descrição Arquivística: quais opções em relação a exaustividade ou especifidade descritiva.
5
Identificar os termos genéricos e específicos e estabelecer relações entre os termos (associativas, equivalência, hierárquicas e não hierárquicas);
6
Com o auxílio da terminologia normalizar as entradas dos termos (normalização gramatical; opções de grafia e controle de sinonímia e homonímia);
10 passos para o controle de vocabulário Vocabulários Controlados
7
O estabelecimento das relações entre os termos (de modo que reflitam as funções e atividades);
8
Incluir os termos preferidos (descritores) e fazer relações de equivalências (use e usado para) dos termos não preferidos;
9
Com o auxílio da terminologia normalizar as entradas dos termos (normalização gramatical; opções de grafia e controle de sinonímia e homonímia);
10 passos para o controle de vocabulário Vocabulários Controlados
10
Incluir os termos preferidos (descrito- res) e fazer relações de equivalências (use e usado para) dos termos não preferidos;
10 passos para o controle de vocabulário Vocabulários Controlados
Importância do Controle de Vocabulário Vocabulários Controlados
Indicação Vocabulários Controlados
Controle do Vocabulário
Tesauros
Dicionário Brasileiro de Terminologia Arquvística Construção de um Tesauro
Termo Geral
Termo PreferidoTermo variante Termo variante
Termo RelacionadoTermo Específico
Termo Relacionado
USE USE
TE
TR TE TR
Tipos de Relações Hierárquica Construção de um Tesauro
Termo Geral
Termo PreferidoTermo variante Termo variante
Termo RelacionadoTermo Específico
Termo Relacionado
USE USE
TE
TR TE TR
AmbiguidadeSinonímiaHierarquia
Associação
Tipos de Relações Hierárquica Construção de um Tesauro
Termo Geral
Termo PreferidoTermo variante Termo variante
Termo RelacionadoTermo Específico
Termo Relacionado
USE USE
TE
TR TE TR
AmbiguidadeSinonímiaHierarquia
Associação
Tipos de Relações Hierárquica Construção de um Tesauro
Passos metodológicos Construção de um Tesauro
a) Em que se define a equipe de trabalho, o planejamento geral do
tesauro, a delimitação do tema central e temas
periféricos e o levantamento das
principais fontes de coleta dos candidatos a descritor
(corpus textual);
Etapa Preliminar
!
b) Coleta dos candidatos a descritor em situação discursiva, a elaboração de um glossário, a determinação dos descritores autorizados e não autorizados,
sua validação por especialistas, a organização de um mapa
conceitual, o estabelecimento das relações entre os termos/conceitos e a elaboração da apresentação as respectivas
relações;
Etapa Elaboração
c) apresentação criteriosa do tesauro ao seu público-alvo.
Objetivos do instrumento, sua cobertura, sua forma de
apresentação, as abreviaturas utilizadas, explicações sobre a
forma gráfica adotada para descritor e não-descritor, as
orientações de uso, o número total de termos incluídos, seus critérios e fontes de seleção,
entre outros.
Etapa Editoração
Processo de desenvolvimento do VC: !
Organização da espinha dorsal/Matriz Conceitual; Levantamento de fontes; Identificação dos TGs (primeiro nível de TEs) Construção do Tesauro (a partir do campo de domínio); Validação por especialistas
Processos (indicados pela Z39.19) Construção de um Tesauro
Método de construção: !
Método dedutivo: coleta de dados, documentos, estatísticas, navegação pelo Portal, questionários, reunião com revisão. !
Método indutivo: Tesauros disponíveis na rede e em formato impresso, portais, sites de temas e setores específicos e diversas outras fontes de informação.
Processos (indicados pela Z39.19) Construção de um Tesauro
Recordkeeping in Brief (Manual) do New South Wales Government!
Tesauro Funcional
Fase 1
Preparação, em que se estabelece quem estará envolvido no projeto (normalmente se cria um comitê) e também a metodologia a ser aplicada;
Fase 2
Exame da documentação da instituição (relatórios anuais, legislação etc.) e entrevistas com gerentes e demais funcionários para identificação dos termos usados pela organização para descrever suas funções e atividades;
Recordkeeping in Brief (Manual) do New South Wales Government!
Tesauro Funcional
Fase 3
Análise das fontes documentárias identificadas na investigação preliminar a fim de identificar funções, atividades e as terminologias usadas para descrevê-las. Estas são colocadas em uma hierarquia para dar forma ao esquema de classificação;
Fase 4
Identificação dos termos preferidos e não preferidos, organização dos termos em uma hierarquia lógica, implementação de notas de escopo. É nesta fase também que se verificam e se estabelecem todos os relacionamentos entre os termos
Smit e Kobashi (2003, p. 49) recomendam que se elabore num primeiro momento “um vocabulário controlado, incorporando-o ao plano de classificação e, num segundo momento, elaborar um tesauro baseado no primeiro vocabulário, priorizando a organização intelectual das funções/atividades geradoras de documentos”.!
Passos do Tesauro Funcional! Tesauro Funcional
Em relação à representação, organização e recuperação da informação arquivística um tesauro funcional não representa nem recupera conteúdos documentais, mas sim as atividades, estruturas e funções consubstanciadas nos documentos.!
Passos do Tesauro Funcional! Tesauro Funcional
Comparativo Classificação / Tesauro! Tesauro Funcional
Tesauro do TSE! Tesauro Funcional
Tesauro do TSE! Tesauro Funcional
Tesauro de Administração Pública! Tesauro Funcional
Ferramentas de Construção de Tesauros! Ferramental para Tesauros
Ferramentas de Construção de Tesauros! Ferramental para Tesauros
Ferramentas de Construção de Tesauros! Ferramental para Tesauros
Ferramentas de Construção de Tesauros! Ferramental para Tesauros
Ferramentas de Construção de Tesauros! Ferramental para Tesauros
http://www.visualthesaurus.com/app/view
Ferramentas de Construção de Tesauros! Ferramental para Tesauros
Ferramentas de Construção de Tesauros! Ferramental para Tesauros
Ferramentas de Construção de Tesauros! Ferramental para Tesauros
Ferramentas de Construção de Tesauros! Ferramental para Tesauros
Thesaurus Brasileiro da Educação (Brased)
Exemplos de Matriz Conceitual! Case Tesauro e VC
Case Tesauro e exemplos
Exemplos de Matriz Conceitual! Case Tesauro e VC
Case Tesauro e exemplos
Exercício 3 - Criação de Matriz Estratégica do tesauro!
Espinha Dorsal do Tesauro
Exercício 3 - Criação de Matriz Estratégica do tesauro!
Espinha Dorsal do Tesauro
Funções Atividades
pesquisa e produção
mapeamento
incentivo difusãomanifestações artistico-intelectuais
valorização da culturacomplexa e heterogênea
promoção da cidadania
democratizar e promover a participação social
programa Rumos
gerar experiênciasarte cultura conhecimento
Contexto
Exercício 3 - Criação de Matriz Estratégica do tesauro!
Espinha Dorsal do Tesauro
Funções Atividades
pesquisa e produção
mapeamento
incentivo difusãomanifestações artistico-intelectuais
valorização da culturacomplexa e heterogênea
promoção da cidadania
democratizar e promover a participação social
programa Rumos
gerar experiênciasarte cultura conhecimento
Contexto
Exercício 3 - Criação de Matriz Estratégica do tesauro!
Espinha Dorsal do Tesauro
Centro de Memória, Documentação e Referência - Audiovisual - Educação e Relacionamento - Produção
Curadoria - Exposição - Ocupação - Imprensa - Educação Cultural - Observatório Itaú Cultural
Cultura
manifestações artísticas
AudiovisualCuradoriaExposiçãoOcupaçãoEducação Cultural
Conhecimento
manifestações intelectuais
Centro de Memória, Documentação e Referência Produção Curadoria Imprensa
Educação e RelacionamentoObservatório Itaú Cultural
Exercício 3 - Criação de Matriz Estratégica do tesauro!
Espinha Dorsal do Tesauro
Controle do Vocabulário
Ontologias
Relações: gênero-espécie, parte-todo, equivalência, associação, lugar-região, material-objeto, causa-efeito, localização, membro-conjunto, fase-processo, disjunção, restrição valor
!Objetivos: classificação do
conhecimento, reuso de informações, fornecer vocabulário a um dado domínio e recuperar
Relações: gênero-espécie, parte-todo, equivalência, associação
Objetivos: refinar buscas e fornecer
consistência na indexação; localizar a informação desejada em um dado acervo
Tesauros ou ontologias?
Conceitos de Ontologias! Conceitos de Ontologias
ontologias tesauros
Relações: gênero-espécie, parte-todo, equivalência, associação, lugar-região, material-objeto, causa-efeito, localização, membro-conjunto, fase-processo, disjunção, restrição valor
!Objetivos: classificação do
conhecimento, reuso de informações, fornecer vocabulário a um dado domínio e recuperar
Relações: gênero-espécie, parte-todo, equivalência, associação
Objetivos: refinar buscas e fornecer
consistência na indexação; localizar a informação desejada em um dado acervo
Tesauros ou ontologias?
Conceitos de Ontologias! Conceitos de Ontologias
ontologias tesaurosUma especificação explícita e formal de uma conceitualização compartilhada!!
!
!
!
!
Especificação explicita: definições de conceitos e suas relações!Formal: compreensível para agentes e sistemas!
Conceitualização: um modelo abstrato de uma área de conhecimento!Compartilhado: consensual
• Classes (organizadas em uma taxonomia) !
• Relações (representam o tipo de interação entre os conceitos de um domínio) !
• Axiomas (usados para modelar sentenças sempre verdadeiras)
!
• Instâncias (utilizadas para representar elementos específicos, ou seja, os próprios dados)
(Gruber, 1996; Noy & Guinness, 2001)
Componentes ontologias
Conceitos de Ontologias! Conceitos de Ontologias
• Classes (organizadas em uma taxonomia) !
• Relações (representam o tipo de interação entre os conceitos de um domínio) !
• Axiomas (usados para modelar sentenças sempre verdadeiras)
!
• Instâncias (utilizadas para representar elementos específicos, ou seja, os próprios dados)
(Gruber, 1996; Noy & Guinness, 2001)
Componentes ontologias
Conceitos de Ontologias! Conceitos de Ontologias
• Classes (organizadas em uma taxonomia) !
• Relações (representam o tipo de interação entre os conceitos de um domínio) !
• Axiomas (usados para modelar sentenças sempre verdadeiras)
!
• Instâncias (utilizadas para representar elementos específicos, ou seja, os próprios dados)
(Gruber, 1996; Noy & Guinness, 2001)
Componentes ontologias
Conceitos de Ontologias! Conceitos de Ontologias
Metodologia criação da Ontologia
Clareza
Legibilidade
Coerência Extensibilidade
Codificação
Legibilidade Coerência
Ontologia
Conceitos de Ontologias! Metodologia para Ontologias
Conceitos de Ontologias! Metodologia para Ontologias
Passo 1: Determinar o domínio e o escopo da
ontologia: Domínio
Aplicação Perguntas possíveis
Criação ontologia em 7 passos
Passo 2: Reutilizar ontologias existentes; Verificar se é possível
utilizar ou estender alguma das ontologias
existentes.
Passo 3: Levantar termos importantes; Termos importantes
para o problema
Conceitos de Ontologias! Metodologia para Ontologias
Passo 1: Determinar o domínio e o escopo da
ontologia: Domínio
Aplicação Perguntas possíveis
Criação ontologia em 7 passos
Passo 2: Reutilizar ontologias existentes; Verificar se é possível
utilizar ou estender alguma das ontologias
existentes.
Passo 3: Levantar termos importantes; Termos importantes
para o problema
Existem várias fontes disponíveis: - Ontolingua Ontology Library ( www.ksl.stanford.edu/software/ontolingua) ; www.ksl.stanford.edu/software/ontolingua - DAML Ontology Library ( www.daml.org/
ontologies) ; www.daml.org/ontologies
Conceitos de Ontologias! Metodologia para Ontologias
Criação ontologia em 7 passos
Passo 4: Definir classes e sua hierarquia; Selecionar
do passo 3 somente os objetos, definindo sua
hierarquia:
Passo 5: Definir propriedades das classes; Selecionar do passo 3 as propriedades e atribuir às
classes:
Passo 6: Definir restrições das propriedades; - Tipo de propriedade; - Valores
permitidos; - Cardinalidade; - Tipos de
relacionamentos.
Passo 7: Instanciar as classes, criando a base de conhecimento.
Definição classes
Arrumação classes! em hierarquia taxonômica
Atribuição valores!das propriedades nas instâncias
Definição propriedades !e atributos (linguagem)
Metodologia criação da Ontologia
Conceitos de Ontologias! Conceitos de Ontologias
• Qual o domínio que se deseja cobrir com a ontologia? • Qual o propósito de sua utilização? • Quem vai utilizar e manter a ontologia? • Usam terminologia, axiomas do domínio e definições? São as questões que a ontologia se propõe a responder
Determinação Domínio e Escopo:
Conceitos de Ontologias! Conceitos de Ontologias
Especificações da w3c:
Maneira de fazer a máquina interpretar dados;
XML: formato universal para dados estruturados;
RDF: Especialização do XML para uso em ontologias;
OWL: Evolução do RDF;
SKOS: Família específica para vocabulários controlados.
Metodologia criação da Ontologia
Conceitos de Ontologias! Conceitos de Ontologias
Controle do Vocabulário
SKOS
É um modelo de conversao de vocabulários controlados para a web semântica e
interoperabilidade. É usado na construção de esquemas de conceito que venham a
contribuir para a proposta de Dados Lincados do W3C visando a Web Semântica.
SKOS - Conceitos para a web 3.0! Conceitos de Ontologias
SKOS - Conceitos para a web 3.0! Conceitos de Ontologias
SKOS - Conceitos para a web 3.0! Conceitos de Ontologias
O Simple KnowledgeOrganization System (SKOS) éum modelo para expressar a
estrutura básica e conteúdo desistemas de organização do
conhecimento.
SKOS - Conceitos para a web 3.0! Conceitos de Ontologias
SKOS - Conceitos para a web 3.0! Conceitos de Ontologias
CAMARGO, L. S. A. Arquitetura da informação para biblioteca digital personalizável. Marília: Unesp, 2004. 145p. Dissertação (Mestrado) – Programa de Pós-Graduação em Ciên- cia da Informação, FFC – Faculdade de Filosofia e Ciência, Universidade Estadual Paulista, Marília, 2004.
CAMPOS, M. L. A. ; GOMES, H. E. Taxonomia e Classificação: princípios de categorização. Datagramazero (Rio de Janeiro), v. 9, p. 01, 2008.
Referências
AGUIAR, F., TALáMO, M.. O Controle de Vocabulário da Linguagem Orgânico-Funcional: Concepção e princípios teórico-metodológicos. Revista Acervo, Local de publicação (editar no plugin de tradução o arquivo da citação ABNT), 25, out. 2012. Disponível em: <http://www.revistaacervo.an.gov.br/seer/index.php/info/article/view/522/442>. Acesso em: 24 Set. 2014.
HEDDEN, Heather. Better living through taxonomies. Digital Web Magazine, [s.l], 2008. Disponível em http://www.digital-web.com/articles/better_living_through_taxonomies/. !MERHOLZ, Peter. Metadata for the masses. Outubo, 2004. Disponível em http://www.adaptivepath.com/ideas/essays/archives/000361.php. !MORVILLE, Peter; Callender, Jeffery. Search patterns. O’Reilly: Cambridge, 2010. 180p. !MORVILLE, Peter; Rosenfeld, Louis. Information Architecture for the World Wide Web: designing large-scale web sites. 3ed. O’Reilly: Cambridge, 2006. 504p. !National Information Standards Organization. ANSI/NISO Z39.19-2003: guidelines for the construction, format, and management of monolingual thesauri. Baltimore, MD: NISO, 2005. Disponível em: http://www.niso.org/kst/reports/standards?step=2&gid=none&project_key=7cc9b583cb5a62e8c15 d3099e0bb46bbae9cf38a. !SALZ, Peggy Anne. Talkin’ bout a B2B revolution. Econtent, Medford, NJ, v.32, n.7, p.10, sep. 2009.
SMIT, Johanna Wilhelmina; KOBASHI, Nair Yumiko. Como elaborar vocabulário controlado para aplicação em arquivos. São Paulo: Arquivo do Estado de São Paulo, 2003. (Projeto Como Fazer, 10). ______. Como organizar o arquivo enquanto sistema de informação: manual. São Paulo: Arquivo do Estado de São Paulo; Associação dos Arquivistas de São Paulo, 2005. 51p. (Projeto Como Fazer).