69
Workshop: Planos de Gestão de Dados: ferramentas e requisitos dos financiadores Pedro Príncipe [email protected]

Upload: vutuong

Post on 11-Nov-2018

214 views

Category:

Documents


0 download

TRANSCRIPT

Workshop:Planos de Gestão de Dados:

ferramentas e requisitos dos financiadores

Pedro Prí[email protected]

Agenda• O que são planos de gestão de dados e para que servem

• Requisitos da Comissão Europeia no âmbito do H2020

• Ferramentas para elaboração de planos de gestão de dados

• DMPonline

• Template H2020

• Discussão

http://epicgraphic.com/data-cake

Gestão de Dados ou Curadoria de dados• Curadoria de dados é a atividade de gestão e utilização de

dados desde o momento da sua criação para garantir o seu

armazenamento, a sua pesquisa e respetiva reutilização.

“the active management and appraisal of data over the lifecycle of scholarly and scientific interest”

Digital Curation Centre

Criar os dados

Processar os dados

Analisar os dados

Preservar os dados

Dar acesso

aos dados

Reutilizar os dados

Univ. Queensland http://guides.library.uq.edu.au/research-data-management

Image: https://www.flickr.com/photos/dmh650/4031607067/in/gallery-wlef70-72157633022909105/

Data management is a part of good

research practice.

RCUK Policy and Code of Conduct on the Governance of

Good Research Conduct

Responsible data management is part of good

research.

NWO – Introduction to the pilot Data Management

1.Aumentar o

impacto da

investigação

2.Melhorar a

acessibilidade

3.Prevenir o uso

inadequado

4.Salvaguardar os

dados

produzidos

5.Assegurar

compatibilidade

GESTÃO DE DADOS CIENTÍFICOS ADEQUADA IRÁ:

The what, why and how of data management planning

Planos deGestão de Dados

Data Management PlansPlanos de Gestão de DadosPara definir:

• Como é que os dados vão ser criados?

• Como é que os dados vão ser documentados?

• Quem irá aceder aos dados?

• Onde vão ficar armazenados?

• Quem irá manter os dados?

• Quando e como vão ser partilhados e preservados?

São usualmente submetidos em propostas ou no âmbito de projetos financiados, mas

são bastante úteis para todos no momentos da criação de conjuntos de dados

Propósito do Plano de Gestão de dados:• Define o plano para a criação e gestão dos dados (ex. que normas vão

ser usadas), e especifica que dados vão ser abertos. Planos para partilha

e preservação deverão ser referidos também.

• Disponibilizar uma análise dos principais elementos da política de

gestão de dados que será usada pelos beneficiários relativamente a

todos os conjuntos de dados (datasets) que serão gerados pelo projeto.

• A CE vê os planos como documentos “vivos” – deverão ser regularmente

atualizados.

Que aspetos da gestão de dadosdevem constar do plano

Que dados vão ser criados (formato, tipos, dimensão...).

Quais as Normas e metodologias que vão ser usadas (incl. metadados).

Como é que as questões éticas e de propriedade inteletual serão

definidas.

Que planos para a partilha e acesso aos dados.

Qual a estratégia para a preservação dos dados.CRIAR

DOCUMENTAR

USAR

ARMAZENAR

PARTILHAR

PRESERVAR

Tópicos do Plano de Gestão de Dados:Data set reference and name • Identificação do conjunto de dados..

Data set description

• Descrição com origem, natureza, tamanho, público. Informação de eventuais dados

similares, possibilidades de integração e reutilização.

Standards and metadata

• Referencia às normas de metadados disciplinares a usar para descrição, ou como é que vão

ser descritos ou criados os metadados.

Data sharing

• Descrição de como os dados vão ser partilhados, incluindo procedimentos de acesso,

períodos de embargo, indicando eventuais ferramentas necessárias para reutilização dos

dados. Incluir informação das limitações de acesso.

Archiving and preservation (including storage and backup)

• Descrição de procedimento de armazenamento e preservação, indicando quando tempo os

dados devem ser preservados.

http://datalib.edina.ac.uk/mantra/

http://www.ands.org.au/working-with-data/data-management/data-management-plans

Projetos europeus relevantes:

http://ands.org.au/partners-and-

communities/23-research-data-things

National Science Foundationhttp://youtu.be/Lc82pxxRkMo

RESUMO DO PROJETO PILOTO DOS DADOS DE ABERTOS NO H2020

24

Piloto de dados abertos no H2020Questões chave:

Quais as ÁREAS científicas abrangidas pelo piloto?

Qual o OBJETIVO e âmbito do piloto?

Que DADOS são abrangidos?

Quais são os REQUISITOS?

O que precisamos saber sobre gestão de dados?

Piloto de dados abertos no H2020 – ÁREASÁreas científicas abrangidas pelo projeto-piloto 2016-2017: • Future and Emerging Technologies

• Research infrastructures – (new: coverage of the whole area)

• Leadership in enabling and industrial technologies – Information and Communication Technologies

• Nanotechnologies, Advanced Materials, Advanced Manufacturing and Processing, and Biotechnology: ‘nanosafety’ and ‘modelling’ topics (new)

• Societal Challenge: Food security, sustainable agriculture and forestry, marine and maritime and inland water research and the bioeconomy - selected topics as specified in the work programme (new)

• Societal Challenge: Climate Action, Environment, Resource Efficiency and Raw materials – except raw materials

• Societal Challenge: Europe in a changing world – inclusive, innovative and reflective Societies

• Science with and for Society

• Cross-cutting activities - focus areas – part Smart and Sustainable Cities (moved from Energy WP)

Piloto de dados abertos no H2020Áreas científicas abrangidas pelo projeto-piloto 2016-2017: • Future and Emerging Technologies

• Research infrastructures – (new: coverage of the whole area)

• Leadership in enabling and industrial technologies – Information and Communication Technologies

• Nanotechnologies, Advanced Materials, Advanced Manufacturing and Processing, and Biotechnology: ‘nanosafety’ and ‘modelling’ topics (new)

• Societal Challenge: Food security, sustainable agriculture and forestry, marine and maritime and inland water research and the bioeconomy - selected topics as specified in the work programme (new)

• Societal Challenge: Climate Action, Environment, Resource Efficiency and Raw materials – except raw materials

• Societal Challenge: Europe in a changing world – inclusive, innovative and reflective Societies

• Science with and for Society

• Cross-cutting activities - focus areas – part Smart and Sustainable Cities (moved from Energy WP)

PROJETOS DE OUTRAS ÁREAS SÃO ENCORAJADOS A ADERIR VOLUNTARIAMENTE

Piloto de dados abertos no H2020 – OBJETIVO

O Projeto-piloto que visa melhorar e maximizar o acesso e a reutilização dos dados de

investigação gerados por projetos financiados pela CE.

EC:

information already paid for by the

public should not be paid for again.

Open data is data that is free to

access and reuse

Piloto de dados abertos no H2020 – PRINCÍPIOS

29

Discoverable AccessibleAssessable and

intelligible

Usable beyond the original purpose for

which it was collected

Interoperable to specific quality

standards

Piloto de dados abertos no H2020 – QUE DADOS?

Dados para validar os resultados

apresentados em publicações científicas.

Outros dados, conforme especificado no

plano de gestão de dados.

Piloto de dados abertos no H2020 – ÂMBITOAos beneficiários é requerido o depósito:

Dados, incluindo metadados associados, necessários para validar osresultados apresentados em publicações científicas, logo que possível;

Outros dados, incluindo metadados associados, conforme especificado e dentro dos prazos estabelecidos no plano de gestão de dados.

Não se aplica a todos os dados (os investigadores definem em função do seu projeto), havendo ainda exceções.

Piloto de dados abertos no H2020 – REQUISITOS1. Desenvolver (e atualizar) um Plano de Gestão de Dados.

2. Depositar num repositório de dados adequado.

3. Tornar possível a terceiros o acesso, a prospeção, a exploração, a reprodução e a disseminação dos dados – de forma gratuita.

4. Fornecer informações sobre as ferramentas e os instrumentos necessários para validar os resultados (ou fornecer as ferramentas).

32

Piloto de dados abertos no H2020 – OPT OUT

• Se o projeto não gerar/recolher dados.

• Em caso de conflito com a obrigação de proteção dos resultados (se é esperado que os resultados sejam comercialmente ou industrialmente explorados).

• Se a realização do objetivo principal do projeto (ação) ficar comprometido com a disponibilização aberta dos dados.

• Em caso de conflito com as obrigações de confidencialidade.

• Em caso de conflito com as obrigações nacionais de segurança.

• Em caso de conflito com as regras em matéria de proteção de dados pessoais.

33

Os projetos podem optar por sair do piloto, na fase de proposta ou durante a execução (devidamente justificado no plano de projeto), com base em:

Opting out / opting in

É possível optar por sair, quando devidamente justificado;

e optar por participar voluntariamente é igualmente possível.

Formulários no participant portal

Opt in / Opt out (+ alguns números)Open Research Data - the uptake of the Pilot in the first calls of Horizon 2020https://data.europa.eu/euodp/data/dataset/open-research-data-the-uptake-of-the-pilot-in-the-first-calls-of-horizon-2020

Number of proposals and opt-outs

Number of

Proposals

Number

opting out

Number

staying in

Not

answered

7869 1434 5214 1221

Calls not in core areas of

the ORD pilot (voluntary

opt-in)

Signed grants

Projects

funded

Opt-in

NumberOpt-In %

3268 388 11,87%

EC Conclusion: These numbers in the proposals for the first calls of H2020 are encouraging (Comprehensive follow up needed).

Razões do opting out

Just announced!

Planos deGestão de Dados

Data Management PlansPlanos de Gestão de DadosPara definir:

• Como é que os dados vão ser criados?

• Como é que os dados vão ser documentados?

• Quem irá aceder aos dados?

• Onde vão ficar armazenados?

• Quem irá manter os dados?

• Quando e como vão ser partilhados e preservados?

São usualmente submetidos em propostas ou no âmbito de projetos financiados, mas

são bastante úteis para todos no momentos da criação de conjuntos de dados

Propósito do Plano de Gestão de dados:• Define o plano para a criação e gestão dos dados (ex. que normas vão

ser usadas), e especifica que dados vão ser abertos. Planos para partilha

e preservação deverão ser referidos também.

• Disponibilizar uma análise dos principais elementos da política de

gestão de dados que será usada pelos beneficiários relativamente a

todos os conjuntos de dados (datasets) que serão gerados pelo projeto.

• A CE vê os planos como documentos “vivos” – deverão ser regularmente

atualizados.

Que aspetos da gestão de dadosdevem constar do plano

Que dados vão ser criados (formato, tipos, dimensão...).

Quais as Normas e metodologias que vão ser usadas (incl. metadados).

Como é que as questões éticas e de propriedade inteletual serão

definidas.

Que planos para a partilha e acesso aos dados.

Qual a estratégia para a preservação dos dados.CRIAR

DOCUMENTAR

USAR

ARMAZENAR

PARTILHAR

PRESERVAR

Tópicos do Plano de Gestão de Dados:Data set reference and name • Identificação do conjunto de dados..

Data set description

• Descrição com origem, natureza, tamanho, público. Informação de eventuais dados

similares, possibilidades de integração e reutilização.

Standards and metadata

• Referencia às normas de metadados disciplinares a usar para descrição, ou como é que vão

ser descritos ou criados os metadados.

Data sharing

• Descrição de como os dados vão ser partilhados, incluindo procedimentos de acesso,

períodos de embargo, indicando eventuais ferramentas necessárias para reutilização dos

dados. Incluir informação das limitações de acesso.

Archiving and preservation (including storage and backup)

• Descrição de procedimento de armazenamento e preservação, indicando quando tempo os

dados devem ser preservados.

Devenvolvimento doPlano de Gestão de Dados

Do ponto de vista da CE não é um documento

fechado – deverá evoluir e ir ganhando precisão.

• Deverá ser apresentado nos primeiros seis

meses do projeto.

• Deverá ser atualizado e apresentado com

novas versão sempre que as mudanças o

justifiquem, mas num mínimo de duas vezes

(mid-term & final review).

A CE nas orientações para a Gestão de Dados no

Horizonte 2020 disponibilizam dois templates

(anexo 1 e 2).

A CE não solicita plano no momento entrega da

proposta – portanto, o plano não é parte do

processo de avaliação da candidatura). No entanto, todas as propostas apresentadas no âmbito das

ações "Research and Innovation actions“ e "Innovation

actions“ incluem uma secção “research data” nos critérios de

avaliação do impacto.

Initial plan Mid-term Final review

DMPonline

https://dmponline.dcc.ac.uk

• Ferramenta web para ajudar os investigadores a elaborar o seu plano de

gestão de dados.

• Disponibilizada de forma gratuita pelo DCC

• Incluiu já um template para o Horizonte 2020

How to write a DMP - DEMO• Template available from https://dmponline.dcc.ac.uk/

1

2

3

4

“The DMP is not a

fixed document…”

Self-assigned ID

(NOVO) H2020 template

(Antes) Pilot template:

Briefly specify

• how data will be captured/created

• how it will be documented

• according to what standards

• who will be able to access it

• where it will be stored

• how it will be backed up, and

• where and how it will be shared and

preserved long-term

Template mid-term review DMP

Broad notions: the data and associated metadata should be managed in a way

that allows for future reuse

Several export

formats

Templates Horizon 2020

The DMP should address the points

below on a dataset by dataset

basis:

• Data set reference and name

• Data set description

• Standards and metadata

• Data sharing

• Archiving and preservation

(including storage and backup)

Annex 2 (mid-term & final review)

Scientific research data should be easily:

1. Discoverable

2. Accessible

3. Assessable and intelligible

4. Useable beyond the original purpose for

which it was collected

5. Interoperable to specific quality

standards

Annex 1 (by month 6)

http://ec.europa.eu/research/participants/data/ref/h2020/grants_manual/hi/oa_pilot/h2020-hi-oa-data-mgt_en.pdf

Recursos práticos - DMP

Data plan guidance and examples | DCC – http://www.dcc.ac.uk/resources/data-

management-plans/guidance-examples

RDM Univs Austrália – https://projects.ands.org.au/policy.php

Helpdesk e informação de suporte• Open Research Data Pilot: https://www.openaire.eu/opendatapilot

• Create a Data Management Plan: https://www.openaire.eu/opendatapilot-dmp

• Select a Data Repository: https://www.openaire.eu/opendatapilot-repository

• Factsheet: https://www.openaire.eu/or-data-pilot-factsheet

• Briefing paper: https://www.openaire.eu/briefpaper-rdm-infonoads

Obrigado!

Pedro Prí[email protected]