rumo à construção de uma infraestrutura nacional de dados sobre biodiversidade - indbio

77
Rumo à construção de uma Infraestrutura Nacional de Dados sobre Biodiversidade “INDBIO” Eduardo Dalcin Núcleo de Computação Científica e Geoprocessamento Diretoria de Pesquisas Instituto de Pesquisas Jardim Botânico do Rio de Janeiro Brasília – MCTI/CNPq – SiBBr 24 de novembro de 2014

Upload: eduardo-dalcin

Post on 11-Jul-2015

203 views

Category:

Government & Nonprofit


1 download

TRANSCRIPT

Rumo à construção de uma Infraestrutura Nacional de Dados

sobre Biodiversidade

“INDBIO”

Eduardo DalcinNúcleo de Computação Científica e Geoprocessamento

Diretoria de PesquisasInstituto de Pesquisas Jardim Botânico do Rio de Janeiro

Brasília – MCTI/CNPq – SiBBr24 de novembro de 2014

Apresentação da Proposta

• Contexto

– Motivação e Justificativa

• A Proposta

– Visão Geral

– Elementos

– Situação atual

• Estamos no rumo?

Contexto

http://www.thegef.org/gef/project_detail?projID=3722

Motivação e Justificativa

• Novembro 2011– “Reunião de Peritos em Sistemas de Informação

sobre Biodiversidade – SIBBr”, em Brasília – DF• Objetivo: apresentar aos presentes o “Projeto SiBBr” e

a “Coleta de subsídios para a definição da estratégia de elaboração, implementação e consolidação do SIBBr(“Road map”);

• Questões à serem respondidas pelos grupos de trabalho, entre elas a questão “Qual deve ser a estrutura (arquitetura) geral do sistema?”

• Criado o “Comitê Técnico Científico do SiBBr”

“...O projeto proposto irá remover as barreiras identificadas através do desenvolvimento do Sistema de Informação sobre a Biodiversidade Brasileira (SIBBr) -um sistema totalmente integrado de informação da biodiversidade com ferramentas de visualização estado da arte, tendo por objetivo apoiar efetivamente os processos de tomada de decisões que visam à conservação da biodiversidade...”

Documento do Projeto, pg. 18

“Arquitetura proposta para o SIBBr”

Documento do Projeto, pg. 20

Motivação e Justificativa

• Reuniões do CTC

– Dezembro 2011

• Demandada a criação de um “GT de arquitetura” cuja proposta era a “Revisão da arquitetura do Sistema”

– Fevereiro de 2012

• Discussão de “aspectos” da arquitetura, sem a visão de um “modelo conceitual”

– Março de 2012

• Relato dos “avanços” do GT de arquitetura

25 de abril de 2014

1ª Reunião da Arquitetura da INDBio

Instituições: EMBRAPA, GIZ, IBAMA, IBGE, ICMBIO, INPA, JBRJ, LNCC, MCTI, MMA, MPEG, RNP, USP

Convidados: FIOCRUZ, SCIELO, CI, UFRJ, BIOTA-SP, CRIA, UFG

Missão: Identificar e descrever os principais componentes da INDBio

Mapa da apresentação

Visão Geral“...Neste documento

consideramos uma visão em geral, em seu mais alto nível de abstração, onde elementos básicos

interagem entre si na forma de uma rede.”

Visão Geral

“...Consideramos neste documento as seguintes definições de “Arquitetura”:

• ‘‘The fundamental organization of a system, embodied in its components, their relationships to each other and the environment, and the principles governing its design and evolution.’’ (ISO/IEC/IEEE, 2011);

• “A formal description of a system, or a detailed plan of the system at component level to guide its implementation.” (The Open Group, 2011);

• “The structure of components, their inter-relationships, and the principles and guidelines governing their design and evolution over time”. (The Open Group, 2011).”

“...Esta visão geral, aqui descrita, não substitui, muito menos descarta uma documentação que prevê uma abordagem global ao design, planejamento, implementação e governança de uma arquitetura formal, modelada em níveis ou domínios, como: Negócios (Business), Aplicação (Application), Dados (Data) e Tecnologia (Technology). Para tal, um framework apropriado deve ser utilizado, como o TOGAF - The Open Group Architecture Framework(Haren, 2011).”

Missão e objetivos

• Missão:– “Proporcionar melhor tomada de decisão na conservação e no uso

sustentado e socialmente justo da biodiversidade por meio de uma iniciativa governamental interdisciplinar voltada para qualificação, integração e publicação de dados.”

• Objetivos:– Assegurar ampla colaboração entre instituições, especialistas e grupos

temáticos;– Assegurar o acesso aberto e público a dados de qualidade;– Evitar a duplicação de esforços e fontes de informação inconsistentes;– Garantir que o melhor conhecimento disponível e o rigor científico

sejam preponderantes na tomada de decisão.

Princípios da Arquitetura• A INDBio possui uma organização em forma de rede, não linear, não

hierárquica, formada de elementos e interações e centrada em Instituições;

• Os elementos da arquitetura podem se agregar em Unidades Funcionais;

Exemplo de Unidade Funcional provedora de dados primários

Princípios da Arquitetura (cont.)

• A arquitetura é baseada no compartilhamento e reutilização de dados e componentes entre as aplicações, e orientada a serviços, com a adoção de padrões e protocolos abertos, largamente utilizados;

Princípios da Arquitetura (cont.)

• Todo o dado sobre biodiversidade disponível na INDBio deve ter um conjunto de metadados associado, em formato aberto, padronizado e também digitalmente acessível;

• Todo o dado sobre biodiversidade disponível na INDBio deve ter um responsável pela sua qualidade, consistência e integridade;

• Todo o dado sobre biodiversidade que trafega na INDBio é considerado público, e seu uso é definido pela licença citada nos metadados correspondentes;

Elementos

• Instituições

• Atores

• Recursos

• Instrumentos

Elementos:Instituições“...As instituições 1 são consideradas os elementos fundamentais desta arquitetura, uma vez que se apresentam como agregadores de outros elementos da arquitetura. Além disto, conferem à arquitetura solidez institucional, que pode ainda ser promovida por instrumentos jurídicos e normativos apropriados.”

(1) Instituições: Organizações governamentais, das esferas federal, estadual e municipal; e sociais de direito privado, sem fins lucrativos (Lei nº 9.637, de 15 de maio de 1998; e Lei nº 9.790, de 23 de março de 1999)

Para não se perder!

Elementos:Instituições

• Provedora de Dados– Dados Mestres e de Referência– Dados de Ocorrências– Dados Ecológicos– Produção Intelectual– Dados Genéticos– Dados de Germoplasma

• Bancos de Sementes• Coleções Vivas

• Qualificadora de Dados• Provedora de Infraestrutura• Provedora de Ferramentas e Sistemas • Provedora de Análise e Síntese• ...

Instituições Provedoras de Dados Mestres e de Referência

“...Dados Mestres e de Referência são aqueles que são requeridos por diferentes grupos, processos e sistemas da INDBio, e provêm contexto para os dados transacionais (DAMA International, 2012 - adaptado).”

Instituições Provedoras de Dados sobre Ocorrências

“...As instituições detentoras de coleções biológicas são um dos pilares fundamentares da INDBio, oferecendo dados sobre ocorrência para serem:• Consumidos por outros sistemas de

integração, análise e síntese (machinereadable ou M2M);

• Consumidos por especialistas e utilizados em processos de produção intelectual e análise e síntese (human readable);

• Expostos à crítica visando à melhoria de qualidade por especialistas e ferramentas automatizadas ou assistidas (machine andhuman readable);”

Instituições Provedoras de Dados sobre Ocorrências

Instituições Provedoras de Dados sobre Ocorrências

Instituições Provedoras de Dados sobre Ocorrências

Instituições Provedoras de Dados sobre Ocorrências

• O documento necessita ainda caracterizar:

– Coleções correlatas• DNA

• Madeiras (xiloteca)

• Frutos (carpoteca)

• Etc...

– Outras fontes de dados de ocorrência– Licenciamento

– “Citizen Science”

– Etc...

– Coleções Paleontológicas

Coleções Paleontológicas

Instituições Provedoras de Dados Ecológicos

Instituições com repositórios institucionais de produção intelectual

Instituições provedoras de dados genéticos

Instituições provedoras de dados de germoplasma

Elementos:Atores“...Neste documento, reconhecemos dois grandes grupos de atores: aqueles relacionados com o conteúdo –dados e informações, e aqueles relacionados com a infraestrutura, física e lógica, que os suportam.”

“...Em relação aos atores relacionados com o conteúdo, podemos ainda agrupá-los em três grupos, à saber: Produtor, Transformador e Consumidor “

Para não se perder!

Organizações de atores

• Sociedades Científicas

• Redes temáticas

• Redes de especialistas

Elementos:Recursos

• Recursos de Infraestrutura– Armazenagem– Processamento– Conectividade– Plataformas, ferramentas e aplicativos

• Recursos de Dados– Dados sobre espécies e suas características– Dados sobre testemunhos, ocorrência e registro de

espécimes– Dados Ecológicos ou Observacionais– Dados sobre interações entre espécies– Dados sobre ameaças

Recursos de Infraestrutura

• Processamento• Armazenagem• Conectividade• Plataformas, ferramentas

e aplicativos

Recursos de Dados

• Dados sobre espécies e suas características;

• Dados sobre testemunhos, ocorrência e registro de espécimes;

• Dados ecológicos ou observacionais;

• Dados sobre interações entre espécies;

• Dados sobre ameaças;

• Dados ambientais ou abióticos;

• ...

Para não se perder!

Tipificação de Dados na DIPEQ/JBRJ

Elementos:Instrumentos

• Normas, Políticas, Decretos, Leis, etc.

• Padrões, Vocabulários e Ontologias

• Estratégia Nacional de Informação Sobre Biodiversidade

• Sistema de Informação sobre a Biodiversidade Brasileira - SiBBr

Para não se perder!

Normas, Políticas, Decretos, Leis, etc.• Política Nacional do Meio Ambiente (Lei n.º 6.938, de 31 de agosto de 1981)

• Lei n.º 10.650, de 16 de abril de 2003 (Lei de Acesso à Informação Ambiental)

• Lei n.º 9.795, de 27 de abril de 1999 (Política Nacional de Educação Ambiental)

• Lei n.º 9.610/1998 (Lei de Direitos Autorais, LDA)

• Lei n.º 9.279/96, ou Lei da Propriedade Industrial (LPI)

• Lei n.º 12.527/2011, de 18 de novembro de 2011 (Lei e Acesso à Informação – LAI)

• Decreto n.° 76.623 de 1975, que trata da Convenção sobre o Comércio Internacional de Espécies Ameaçadas de Fauna e Flora Silvestres (Cites)

• Decreto nº 6.666, de 27 de novembro de 2008: Institui a INDE

• Decretos legislativos nos. 02 e 03 de 1994, que disciplinam a Convenção da Diversidade Biológica

• Decreto Federal Nº 4.339, de 22 de agosto de 2002. - Institui princípios e diretrizes para a implementação da Política Nacional da Biodiversidade

• Resolução CONABIO no 06, de 03 de setembro de 2013 – Dispões sobre as Metas Nacionais de Biodiversidade para 2020

• Portaria no. 43, DE 31 DE JANEIRO DE 2014 – MMA Pró-espécies

• Etc...

Padrões, Vocabulários e Ontologias

“...Padrões, vocabulários e ontologias são elementos fundamentais da

interoperabilidade entre sistemas de informação e, em última instância, são

elementos que possibilitam que a INDBiofuncione como uma rede.”

Estratégia Nacional de Informação Sobre Biodiversidade

“... A Estratégia Nacional de Informação sobre Biodiversidade é um documento que estabelece diretrizes que irão orientar e priorizar as ações

nacionais e regionais para a instalação da Infraestrutura Nacional de Informação sobre

Biodiversidade, seu funcionamento, evolução e sustentabilidade.”

Estratégia Nacional de Informação Sobre Biodiversidade

• Eixos prioritários– Capacitação– Comunicação– Infraestrutura– Governança

• Ações Estruturantes– Oferta de capacitação em Informática na Biodiversidade, qualificação

e governança de dados, análise e síntese, Taxonomia, etc;– Promoção da geração de produtos oriundos dos produtos e serviços

oferecidos pelo SiBBr, e da utilização destes produtos no apoio à decisão;

– Oferta de infraestrutura de armazenagem e gestão de recursos computacionais, infraestrutura adequada ao crescimento e dinamização das coleções biológicas.

Sistema de Informação sobre a Biodiversidade Brasileira - SiBBr

“...A instalação de uma infraestrutura como a INDBio demanda um conjunto de ferramentas, produtos e serviços que, pelas suas características estruturais e transversais, atuam como o “núcleo” operacional desta Infraestrutura. Este núcleo auxilia na implementação, propagação e consolidação destas ferramentas, produtos e serviços, no momento inicial de instalação da INDBio, onde esta estrutura é precária ou inexistente. Além disso, funciona como articulador central entre a demanda e a oferta de informações sobre biodiversidade pelos diferentes atores, define e homologa padrões e protocolos de interoperabilidade entre os sistemas e garante um fluxo contínuo de dados e informações de qualidade pela rede.”

Ferramentas, produtos e serviços

• Portal agregador de produtos e serviços

• Cadastro Nacional de Coleções Biológicas

• Agregador de dados de coleções biológicas

• Serviço de imagem em alta resolução

• Serviço de Mapa

• Serviço de Modelagem

• Repositório de Produção Intelectual

• Resolvedor de nomes científicos(“taxonomic backbone”)

• Serviço de Limpeza e Mineração de Dados

• Serviço de Anotações

• Serviço de “Biodiversity LiteratureMark-up”

• Serviço de identificador único persistente para objetos de coleção biológica

• Repositório de códigos-fonte

• Repositório de “Workflow Científico”

• Registrador de Serviços

• Sistema de Suporte à Decisão

Sistema de Informação sobre a Biodiversidade Brasileira - SiBBr

Para não se perder!

SiBBr - Portal agregador de produtos e serviços

SiBBr - Portal agregador de produtos e serviços

Interface única e intuitiva

Cadastro de Coleções

Dados de Ocorrências

Dados sobre Espécies

Ferramentas de Análise e

Síntese

Produção Intelectual

Imagens em Alta

ResoluçãoMapas

Modelos

Resolvedorde Nomes

Anotações

Códigos-fonte

SiBBr - Portal agregador de produtos e serviços

SiBBr - Cadastro Nacional de Coleções Biológicas“...Coleções Biológicas desempenham um papel central, fundamental e crítico em qualquer iniciativa relacionada com a informação sobre biodiversidade...

...Entretanto, não existe um Diretório Nacional de Coleções Biológicas, nem como proposição em nenhum dos documentos acima, capaz de servir de referência quantitativa e qualitativa das coleções biológicas nacionais.

No contexto da INDBio, um diretório nacional destes repositórios da biodiversidade, seria capaz de fornecer um Identificador Persistente Único para estas coleções que, associado ao Identificador Persistente Único do testemunho do espécime (voucher) depositado na coleção, cria uma forma inequívoca de se referenciar à este testemunho depositado em uma coleção, facilitando a integração e interoperabilidades destes dados (GBIF, 2011).”

SiBBr - Agregador de dados de coleções biológicas

SiBBr - Serviço de imagem em alta resolução

SiBBr - Serviço de Mapas e Modelagem

SiBBr – Repositório de Produção Intelectual

“Agregador de produção intelectual indexada sobre biodiversidade”

SiBBr – Repositório de Dados Ecológicos

SiBBr – “Resolvedor” de nomes científicos

SiBBr - Serviço de Limpeza e Mineração de Dados

SiBBr - Serviço de “Biodiversity Literature Mark-up”

SiBBr - Serviço de “Biodiversity Literature Mark-up”

SiBBr - Serviço de “Biodiversity Literature Mark-up”

SiBBr - Serviço de identificador único persistente

SiBBr - Serviço de identificador único persistente

• Para conjuntos de dados

• Para objetos em coleções

• Para nomes científicos

• Para “taxa concept”

SiBBr - Repositório de códigos-fonte

SiBBr - Repositório de “Workflow Científico”

SiBBr -“Registrador” de Serviços

SiBBr - Sistema de Suporte à Decisão

http://siscom.ibama.gov.br/painel

“...Sistema de Suporte à Decisão (SAD) é um sistema ou subsistema interativo, baseado em computador, destinado a ajudar os tomadores de decisão a utilizarem tecnologias de comunicação, dados, documentos, conhecimento e / ou modelos para identificar e resolver problemas, concluir tarefas do processo de tomada de decisão, e tomar decisões. “Sistema de Suporte à Decisão” é um termo geral para qualquer aplicação de computador que melhora a capacidade de uma pessoa ou grupo para tomar decisões (Power, Burstein, & Sharda, 2011).

No nível conceitual, Power (2002) apud (Hättenschwiler & Gachet) enumera cinco tipos de Sistemas de Suporte à Decisão: Os dirigidos à comunicação (Communication-Driven DSS), os dirigidos à dados (Data-Driven DSS), Os dirigidos à documentos (Document-Driven DSS), os dirigidos à conhecimento (Knowledge-Driven DSS) e os dirigidos à modelos (Model-Driven DSS) ...”

SiBBr - Sistema de Suporte à Decisão

Situação Atual

http://www.sibbr.net.br/indbio/wikihttp://goo.gl/Jnk37k

“Redator” do documento final

• Foi identificada pelo GT a necessidade de se contratar um “Redator” para harmonizar as diferentes contribuições, a exemplo do que foi feito com o documento da INDE;

• Foi elaborado um ToR com os seguintes prazos:

– Assinatura do Contrato (T0)

– Plano de Trabalho (T0+7 dias)

– Primeira Versão (T0+21 dias)

– Versão Final (T0+60 dias)

Status do ToR para contratação do “Redator”

abr2014

mai jun jul ago set out nov

Today

ToR na UGP aguardando publicação no DOU9/7/14

ToR enviado pelo CGEC à UGP9/6/14

Inicio da elaboração do ToR do Redator16/5/14

Apresentação da proposta e formação do GT25/4/14

Aguardando....9/7/14 24/11/14

Estamos “rumo à construção da INDBio”?

1º componente lançado em 1998Primeiros habitantes: Novembro de 2000

• Informação sobre biodiversidade é “transversal” – multi-institucionale “multi-Ministerial”;

• Iniciativas precisam ser integradas;

• Duplicidade de esforços e inconsistências devem ser evitadas;

• A implementação da INDBio é um esforço integrado, de longo prazo;

• Um modelo de governança deve ser escolhido e implementado;

• É fundamental a formação de recursos humanos para gerir a INDBio e seus dados;

• É fundamental a digitalização e qualificação dos dados das coleções;

• Um backbone taxonômico e nomenclatural está à caminho!

• Instituições precisam reconhecer seu papel e absorver as novas responsabilidades em seu quadro de pessoal e orçamento;

• Deve haver espaço para a inovação – liderar é melhor que seguir

Rumo à construção da INDBio

• Pesquisadores precisam ser reconhecidos por métricas que também valorizem o compartilhamento e qualificação de dados, assim como a geração de dados primários inéditos (preenchimento de lacunas espaciais e taxonômicas);

• Comunicação e articulação entre os diferentes atores, instituições e gestores é fator crítico de sucesso da construção e consolidação da INDBio. Não deve ser subestimado;

• Um “sistema” em si não resolve nada;

• É necessária uma visão compartilhada e dinâmica de uma infraestrutura que englobe todos os aspectos desta apresentação – e outros aqui eventualmente esquecidos – complementando a visão de uma “e-Science” nacional, com a sua parte de “e-Biodiversity”, oferecendo um “norte” para investimentos e capacitação.

Rumo à construção da INDBio

Eduardo Dalcin, Ph.D.Instituto de Pesquisas Jardim Botânico do Rio de Janeiro

Diretoria de PesquisasNúcleo de Computação Científica e Geoprocessamento

[email protected]

Obrigado!