sistemas de gestão de ciência e repositórios - dspacecris
TRANSCRIPT
DSpace-CRIS
Projeto Piloto RCAAP
Fernando Ribeiro e José Carvalho
[email protected] e [email protected]
1
DSpaceCRIS VS DSpace
Data model
Publications
Dataset
DSpacePublications
Dataset
Researcher Pages
Projects
OrgUnits
2nd Level Dynamic Objects
DSpace-CRIS
Abordagem: dinâmica, flexível, configurávelAtributos: alguns predefinidosEntidades: algumas predefinidas
Principais características do modelo de dados DSpace-CRIS
Características DSpace-CRIS
Gestão de Utilizadores;Vários identificadores de autores, variantes de nomes, carreira;Sincronismo com ORCID;Gestão online pelos administradores
Separação de Entidades;Permite extensões no futuro, workflows e regras específicos
Uma única entidade é caracterizada por um perfil próprio (ex: Revista, Evento, Prémio, etc.;Cada perfil tem o seu conjunto de propriedades (definidas de forma independente)
www.cineca.itVisão Integrada
604/11/16
DSpace-CRIS
2. Pessoas
3. Projetos
5. Outros (2nd level)
4. Organizações
1. Publicações
O modelo de dados não necessita de codificação, apenas configuração!
• Pode ser efetuado pelo interface webe exportado para .xls
• Permite a importação por .xls
Configuração do Modelo de Dados
Página (Tabs)
Caixas (Boxes)Campos (Fields)
13
DSpaceCRIS – Importação de Dados
• Permite a exportação, correção e reintrodução dos dados para correções em larga escala, curadoria ou importação de informação nova.
04/11/16
14
DSpaceCRIS - Métricas
04/11/16
Métricas disponíveis para o registo / publicação
Ligação ao Google Scholar citations & altmetric badge
Link to Google Scholar citations & altmetric badge
DSpaceCRIS – Relacionamentos
02-05-2023 19
Ligações para os registos das entidades como autores, revistas e outras entidades do sistema
Índices Internos no Dspace-CRIS• Os valores novos introduzidos são incluídos nos
índices internos do Repositórios
• Permite a uniformização dos termos (palavras-chave, nomes de autores, revistas, eventos, etc...)
02-05-2023 21
DSpaceCRIS – Visão do Investigador
Researcher Profile
02-05-2023 22
Informação organizada em várias páginas (tabs)
Cada página tem várias caixas de informação (boxes)
Cada caixa permite introduzir vários campos com formatos distintos (imagens, números, texto, identificadores, ligações para outras entidades)
Permite explorar as relações dos autores de acordo com os seus critérios (co-autorias de publicação, projetos, interesses, etc.)
Assim que seleciona um autor, visualiza as relações
DSpaceCRIS – Organizações
02-05-2023 28
Perfil da organização e sua estrutura
Todos os objetos (publicações, projetos, autores, etc.) ligados à organização podem ser incluídos automaticamente
…incluindo a referência a métricas
Estão disponíveis estatísticas de uso em todos os níveis de hierarquia, incluindo de todo o repositório
Integração ORCID
Autenticação via ORCID iD
Criar novas contas no ORCID
Transferência de informação do repositório para o ORCID (e vice versa)
Liga o perfil local com o registo ORCID
Projeto Piloto DspaceCRIS
02-05-2023 36
Instituições Piloto• Universidade do Algarve• Universidade Aberta• Instituto Superior de Ciências da Saúde Egas Moniz
Cada instituição terá a sua área de testes
37
Metodologia
Prep
DSpaceCRIS instância master
Ferramentas
Formulário para Instituição
Kick-off
Objetivos e Expectativas
Definição do projeto
Equipa
Entidades fase 1
Publicações
Pessoas
Organizações
Projetos
Entidades fase 2
Eventos
Revistas
Outros
Relatório
38
39
Cronograma
Instituição Equipa RCAAP1 – Preenchimento de Formulário 1 – Instalação, configuração básica
2 – Identificação de informação- autores – ORCID; - projetos – OpenAIRE; - teses – RENATES, - instituição - ISNI; …
2 – Layout Gráfico
3 – Testes e exploração da aplicação 3 – Configurações Específicas
4 - Validação da informação 4 – Importação de Informação
FORMAÇÃO ONLINE5 - Consolidação da informação 5 - Apoio
6 - Testes com utilizadores finais 6 - Correções7 – Análise de Métricas e estatísticas 7 - Testes de Segurança, parametrização de backups, etc...
Relatório de Implementação Relatório de Implementação
DSpace-CRIS
40
DSPACE CRIS
DSPACE CRIS• Interface do DSpace
41
Módulo CRIS
DSPACE CRIS - Administrador
42
Módulo CRIS
DSPACE CRIS - Profile
43
DSpace CRIS - Autenticação ORCID• Piloto, apenas autenticação.• Desenvolvimento interação com ORCID, mas– APENAS DSpace -> ORCID
44
1ª Fase – Instâncias Piloto
45
1ª Fase – Instâncias Piloto
• Layout igual para as 3 instituições (proveniente do layout de desenvolvimento)
• Importação de dados:• UAB e UALG através dos AIPs (Estrutura do
Site - Archival Information Packages)• Egas Moniz através da importação das
comunidades/coleções do Repositório comum
46
Importação de dados - Problemas
• Mapeamento automático de alguns metadados em entidades CRIS.• Os dc.author, dc.contributor, etc.
mapeados como um Researcher Profile. Exemplo UALG, foram criados 8509 profiles.
47
Importação de dados - Problemas
• Mapeamento automático de alguns metadados em entidades CRIS.• O campo dc.sponshorship mapeado como
organização da instituição. Exemplo para o Egas-Moniz:
48
Importação de dados - Problemas
• Mapeamento automático de alguns metadados em entidades CRIS.• O campo dc.relation mapeado como
financiamento. Exemplo para o UALG:
49
Observações
– A maior parte do mapeamento automático na importação dos conteúdos mostra a necessidade de haver curadoria de metadados na fonte.
– Adotar uma outra abordagem para adicionar conteúdos nos repositórios na passagem para DSpaceCRIS.• Migração do repositório DSpace para um
DSpaceCRIS. Trabalho já efetuado no repositório UAB.
• A migração do Egas-Moniz não é possível, pois está inserido no repositório comum.
50
2ª Fase – Migração a partir do DSpace
• Repor a Base de Dados original dos repositórios e migrar para DSpace CRIS.
• Já efetuado no repositório piloto do UAB.
• A criação de entidades não foi automática na UAB, permitindo ter uma base de dados «limpa».
51
2ª Fase – UAB
52
• Manteve-se a estrutura do repositório
• Não foram criadas entidades «novas»
2ª Fase – UALG e Egas-Moniz
53
• Para o repositório da UALG, o mesmo procedimento da UAB vai ser efetuado.
• No caso do Egas-Moniz, o procedimento manter-se-á como na fase 1, utilizando o batch import das comunidades/coleções.
3ª Fase – Gestão dos CRIS e Adição de Entidades CRIS• Problemas de Usabilidade• Taxonomias por definir/traduzir• Campos por caixa (box) e páginas (tabs) por
definir• Configuração/Relacionamentos entre entidades
02-05-2023 54
3ª Fase – Claim do Perfil de Investigador
02-05-2023 55
ePerson
• Cria internamente o utilizador com base no autor do trabalho
Researcher Profile (RP)
• Sistema cria uma área RP para cada ePerson
ORCID user
• Com login ORCID, o user pode associar-se ao perfil (claim)
Pedido Claim
• Administrador recebe pedido de associação de perfil
Inserção de Nome/email
• Acedendo ao perfil identificado, adicionar o nome ou email de acordo com lista automática do utilizador
Associação Final
• O utilizador ORCID tem acesso ao seu RP e pode editar a informação.
Situações Distintas• Fases a considerar
02-05-2023 56
Importação Produção
Gestão de Autoridades (new)
02-05-2023 57
Interfaces Máquina-MáquinaAPI RESThttps://dev3.rcaap.pt/rest/
OAI-PMHhttp://dev3.rcaap.pt/oai/request CERIF-XML Em desenvolvimento SWORDhttp://dev3.rcaap.pt/sword/servicedocument RDFhttp://dev3.rcaap.pt/rdf/ http://dev3.rcaap.pt/sparql
58
4ª Fase – Importação de Informação• Curadoria necessária para corrigir problemas• Testes do processo de exportação -> Correção ->
Atualização (em curso)
02-05-2023 59
02-05-2023 60
Conclusões
DSpace
Publicações
PublicaçõesThesis ID
(TID)
DSpace-CRIS
Pessoas
Projetos
Outros (Revistas,
Livros, Eventos,
Datasets, ...)
Organizações
Teses
Publicações
Thesis ID (TID) ISSN
ISBN
DspaceCRIS & Portal RCAAP
02-05-2023 63
Agora Futuro
APIs
Portal RCAAP
Repositórios
OAI-PMH (DC)CERIF-XML
OAI-PMH (CERIF,mods, mets,…)
PTCRISsync
entidades
02-05-2023 64
+ 3 Instâncias
65
Desafios
• Interligar as entidades com índices de autoridade (Autores com ORCID/CiênciaID; Projetos com Identificadores OpenAIRE; Organizações com ISNI,...)
• Implementar alterações para cumprimento da Política OA da FCT e Depósito Legal de Teses & Dissertações
66
Dificuldades
• Curadoria de Informação– Nomes de Autores– Nomes de Projetos– Um campo = múltiplos usos – ...
• Bugs do Sistema (nível de maturidade baixo)– Colaboração na documentação e resolução de
problemas– Altamente configurável = Difícil estabilizar
67
Dificuldades• Funcionalidades em desenvolvimento– Interface CERIF-XML (para máquinas)– Integração com PTCRISsync– Scripts de otimização de
importação/verificação dos dados• Usabilidade do Sistema• Criação de Template / Layout Gráfico
68
Aspetos Positivos
• Qualidade dos Metadados (Dublin Core -> CERIF) (= mais tempo para registo da informação)
• Informação pormenorizada• Dimensão do Perfil de Investigador• Mais métricas• Projeto piloto desenvolve metodologia otimizada
para importar DSpace -> DSpaceCRIS
69
Aspetos Positivos• A revelar-se um projeto piloto com sucesso,
permitirá adotar 28 DSpaceCRIS • Contribuir com a metodologia adotada para a
comunidade• Integrar o quadro normativo PTCRIS