rede specieslink e a gestão de dados sobre biodiversidade · melhoria da qualidade de dados...

23
Dora Ann Lange Canhos Centro de Referência em Informação Ambiental - CRIA [email protected] Rede speciesLink e a gestão de dados sobre biodiversidade splink.cria.org.br

Upload: vokiet

Post on 28-Jan-2019

214 views

Category:

Documents


0 download

TRANSCRIPT

Dora Ann Lange Canhos

Centro de Referência em Informação Ambiental - CRIA

[email protected]

Rede speciesLink e a gestão de dados sobre biodiversidade

splink.cria.org.br

CRIA

• fundada em dezembro de 2000

• associação sem fins lucrativos de interesse público

• missão: disseminação do conhecimento científico visando contribuir para a conservação e utilização sustentável dos recursos naturais e a formação da cidadania

Coleções biológicas como infraestrutura básica para o conhecimento científico

o quê? onde? quando?

Registros de ocorrências de espécies

Banco de dados da

coleção

Expedição

N° catálogo

Armário

Família

Espécie

Gênero

País

Localidade

Habitat

Observação

Map

eam

en

to d

os

cam

po

s

Mo

de

lo d

e d

ado

s D

arw

inC

ore catalog number

genus

family

species

country

notes

Registros on-line

(Todos de acesso

público)

Filtro para dados sensíveis

Acesso livre e aberto a dados não sensíveis

locality

spLinker: mapeamento dos campos

BLOQUEADOLat/long

speciesLink site

Camada de apresentação

Portal DiGIR(Java)

Perl

Conectividade baixa ou instável, falta de equipamento e pessoal

Conectividade rápida e estável,

hardware, software, humanware adequados

DadosspLinker

Sistema de

Gerenciamento

da Coleção

SQL

Coleção C

Repositório

de Dados

DadosspLinker

Sistema de

Gerenciamento

da Coleção

SQL

Coleção B

Repositório

de Dados

DadosProvedor PHP

Sistema de

Gerenciamento

da Coleção

SQL

Coleção A

PostgresProvedor PHP

SOAP Server

SQL

Servidor Regional

arquitetura

Produtos

Indexador

iDigBio

Regional SP

Repositório Central

spLinker

TapirLink

Fiocruz

Taxonline SIColNet UFES …

Network Manager

openModeller

BioGeo

Lacunas

Interface de busca

IPT

TapirLink

Serviços Web

mapCRIA

TapirLink

Exsiccatae

Indicadores

Data Cleaning

Dicionáriostaxonômicos

IPT

Feedback

• 143 instituições nacionais 471 conjuntos de dados

• 31 instituições do exterior• 4 fototecas

Parceiros

16

302

42

12

2854

103

0 10 20 30 40 50 60

Empresa Privada

Instituto de Pesquisa

Museu

Rede de Pesquisa

Universidade Estadual

Universidade Privada

provedores de dados

e-infraestrutura de dados sobre biodiversidade

o quê? onde? quando?para quê?

◦ Melhoria da qualidade de dados

◦ Lacunas taxonômicas e geográficas

◦ Indicadores

Maior visibilidade, reconhecimento

◦ Cyber-taxonomy

◦ Ensino, estudos taxonômicos

◦ Modelos de distribuição de espécies

◦ Recuperação de áreas degradadas

◦ Estudos de impacto ambiental

◦ Processos de tomada de decisão

◦ Formulação de políticas públicas

Desenvolvimento mais sustentável

Banco de Dados

Serviços Web Interface de Busca

A importância das e-Infrastruturas locais

Rede Social

Centro de Inovação

Avanços em TIC

Banco de dados

• dados de ocorrência de espécies• imagens (vouchers, plantas vivas, pólen)• mapas, gráficos, sínteses, catálogos (dinâmico)

• dados de ocorrência de espécies• Imagens

Ferramentas

• qualidade dos dados• indicadores• uso

Serviços Web

• dados• imagens• mapas• modelagem de nicho ecológico

Interface de busca

• Cibertaxonomia• Sistema de Anotação• Lacunas• BioGeo

speciesLink e o Herbário Virtual

Qualidade dos dados

• Existe uma série de aplicativos que produzem o relatório denominado dataCleaning

• Objetivo: • Destacar registros suspeitos• Destacar a falta de padronização• Destacar problemas como a falta de completude

dos dados

• Os dados somente são alterados na origem!

splink.cria.org.br/dc

dataCleaning: splink.cria.org.br/dc

Interface de busca

Agregando valor ao dado

94%

Infraestrutura para pesquisa e educação e uso dos dados (convergência política)

Canhos DAL, Sousa-Baena MS, de Souza S, Maia LC, Stehmann JR, et al. (2015) The Importance of Biodiversity E-infrastructures for Megadiverse Countries. PLoS Biol 13(7): e1002204. doi:10.1371/journal.pbio.1002204http://journals.plos.org/plosbiology/article?id=info:doi/10.1371/journal.pbio.1002204

Uso - www.splink.org.br/showUsage

2 milhões de registros utilizados por dia

Equipamentos do CRIA em regime de colocationcontrole ambiental, energia, conectividade, segurança

Sistemas de informação de interesse público

- speciesLink- dataCleaning, indicadores- Flora brasiliensis online- HV Saint-Hilaire, Glaziou- Bioline Publications- Lacunas, BioGeo

serviços web- mapCRIA- Exsiccatae

servidores regionais- nordeste, sudeste, etc.

backup server

backup server

9 servers2 storages

25 VMs

Sistemas internos

AdministrativoDesenvolvimentoTratamento de imagens7 servers

11 VMs1 tape library

40GB 10GB

Brasília, DF

Campinas, SP

Topologia da rede CRIA

Desafios

• Grandes instituições resilientes a mudanças

• Como tornar dados úteis e utilizáveis para outras comunidades

• Governança de institutos virtuais

• Sustentabilidade de e-infrastruturas: apoio a projetos a suporte de longo prazo

Mensagem final

• Compartilhamento de dados não depende somente da vontade de compartilhar dados

• Depende da organização, digitação, uso de padrões e protocolos, desenvolvimento das TICs, trabalhoscontínuos com a qualidade e atualização dos dados, …

• Avanços nas TICs abrem novas possibilidades, novascombinações, novas avaliações, diferentes formas de pensar, novas demandas …

• e-infrastruturas requerem financiamento contínuo e de longo prazo

Caminho para o futuro …

Obrigada!

Dora Canhos ([email protected])speciesLink (splink.cria.org.br)

Dimorphandra mollis Benth. (speciesLink, 2016)