arquitetura do lexml resolver adaptado por joão lima

37
Arquitetura do LexML Resolver Adaptado por João Lima

Upload: luiz-henrique-marroquim-fortunato

Post on 07-Apr-2016

215 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Arquitetura do LexML Resolver Adaptado por João Lima

Arquitetura do LexML Resolver

Adaptado por João Lima

Page 2: Arquitetura do LexML Resolver Adaptado por João Lima

Definições “Resolvedor” é um agente que, dado um

identificador LexML Brasil (URN), retorna metadados das normas correspondentes. Os metadados contém, além da descrição básica da “obra”, referências (URLs) para o texto completo da norma.

URL – Universal Resource Locator (HTTP) URN – Universal Resource Name

Page 3: Arquitetura do LexML Resolver Adaptado por João Lima

Proposta de ImplementaçãoModelo Distribuído

Cliente

OAI-PMH

Resolvedor “br;sp”

Coletor deMetadados

“br;sp”

Resolvedor “br;sp;sao.paulo”

Coletor deMetadados

“br;sp;sao.paulo”

Resolvedor “br:pb”

Coletor deMetadados

“br;pb”

Resolvedor “br”

Coletor deMetadados

“br”

OAI-PMH

Legislação Federal

Legislação Estadual Legislação Municipal Legislação Estadual

Neste cenário o cliente faz a pergunta a qualquer nó, que redireciona a requisição se necessário.

Cada nó do sistema distribuído é semelhante a um sistema centralizado completo, só que neste caso o nó agrega metadados de apenas uma jurisdição.

Descoberta do nó responsável por determinada jurisdição pode ser feita usando tabelas de lookup ou até mesmo DNS

Lookup

Lookup LookupLookup

Page 4: Arquitetura do LexML Resolver Adaptado por João Lima

Modelo Distribuído:Replicação

Cliente

Resolvedor “br;sp”

Coletor deMetadados

“br;sp”OAI-PMH

Cada “resolvedor” pode ter uma ou mais réplicas do banco de metadados para permitir tolerância a falhas e balanceamento de carga

Réplica A “br;sp”

Réplica AMetadados

“br;sp”

Page 5: Arquitetura do LexML Resolver Adaptado por João Lima

Modelo Distribuído:Precauções Manter registro de “resolvedores” atualizada

Evitar laços infinitos

Gerenciar mudanças nas unidades administrativas

Page 6: Arquitetura do LexML Resolver Adaptado por João Lima

Protocolo de Resolução É necessário desenvolver um protocolo de resolução de

LexML URNs e software que implemente tal protocolo

Web Browsers e bibliotecas HTTP nunca vão dar suporte a esquemas baseados em URNs Facção diz que URN vai contra a “arquitetura web” Antiga disputa entre HTTP URL vs. URN

Ainda assim há vantagens claras em usar URNs: Distinção entre URN e HTTP URLs Geração automática a partir de metadados Persistência Compatibilidade com a “arquitetura web” através de proxies

Page 7: Arquitetura do LexML Resolver Adaptado por João Lima

Implementação do Protocolo

Outros identificadores têm bibliotecas que implementam o protocolo de resolução Suporte a várias linguagens e plataformas Bibliotecas para Clientes e Servidores

Mas identificadores LexML Brasil requerem dados para operar Melhor implementar Web Services REST (HTTP GET)

Page 8: Arquitetura do LexML Resolver Adaptado por João Lima

A Armadilha dos Protocolos Personalizados Web Browsers permitem a implementação de protocolos personalizados

Um exemplo é o protocolo lsidres: Usado pelos plugins LSID p/ Firefox e Internet Explorer lsidres:urn:lsid:herbimi.info:specimens:100069

É uma armadilha para o sistema Links só funcionam se o usuário instalar o plugin Caso contrário, os links parecerão quebrados. O browser apenas emite uma

mensagem de erro inútil, que não leva o usuário a instalar o plugin. O mesmo acontece com bibliotecas http, só que não há plugins

É preferível usar um proxy HTTP: http://lsid.tdwg.org/urn:lsid:herbimi.info:specimens:100069 http://www.lexml.gov.br/n2l?urn:lex:br:federal:lei:lei.geral.telecomunicacoes

Page 9: Arquitetura do LexML Resolver Adaptado por João Lima

O Que Retornar ao Cliente?

Uma página web (XHTML)? Conteúdo XML? XML + XSLT?

Negociação de ConteúdoCabeçalho HTTP “Accept:”

Page 10: Arquitetura do LexML Resolver Adaptado por João Lima

Arquitetura:Centralizada ou Distribuída

Decisão baseada nos parâmetros:Estimativa do tamanho do banco

Considerações políticas: Quem detém o controle sobre o sistema?

Complexidade (custo) de Implementação

Page 11: Arquitetura do LexML Resolver Adaptado por João Lima

Estimativa do Tamanho do Banco de Dados

0

500

1000

1500

2000

2500

Fed Est Mun

Fonte: Quantidade de Normas Editadas no Brasil: Período 05/10/1988 a 05/10/2004. IBPT - Instituto Brasileiro de Planejamento Tributário.Extraído de apresentação de João Lima - PRODASEN

Núm. de Registros: ~ 3.3 milhões(desde outubro/1988)

Tamanho do Registro: ~ 2-4 KB(apenas metadados)

Tamanho do Banco de Dados: ~ 13 GB (apenas dados) ~ 40 GB (incluindo “padding” – 3x)

Estimativa de acréscimo anual: ~ 800 MB/ano (apenas dados) ~ 2,5 GB/ano (incluindo “padding”)

Page 12: Arquitetura do LexML Resolver Adaptado por João Lima

Arquitetura:Centralizada ou Distribuída

Banco não é tão grande (40GB + 2,5GB/ano): Sistema poderia ser centralizado

Entretanto, sistema distribuído é mais apropriado: Controle compartilhado pelos vários parceiros Tolerância a falhas – sistema continua funcionando se um componente

falha Escalabilidade – desempenho é mantido com adição de dados e

componentes ao longo do tempo

Benefícios justificam complexidade (custo) adicional do sistema distribuído

Page 13: Arquitetura do LexML Resolver Adaptado por João Lima

Conclusões

Possível implementar “resolvedores” LexML Brasil Piloto com bases de dados representativas em 3 a 6

meses Demais nós podem ser adicionados em etapas

Sistema distribuído é mais apropriado Benefícios justificam complexidade (custo) adicional Possibilidade de utilização de DNS na resolução

Page 14: Arquitetura do LexML Resolver Adaptado por João Lima

Interface do usuárioInterface de gerência

Page 15: Arquitetura do LexML Resolver Adaptado por João Lima

Referência direta via sistemas dos portais governamentais

Portal urn palavras

Plugins

Page 16: Arquitetura do LexML Resolver Adaptado por João Lima

Referência Direta

Após incluir o http proxy (http://www.lexml.gov.br/n2l?urn), codifica-se a URN desejada

Pode ser codificada em qualquer fonte ex:

parecer legislativo referenciando normas, proposições e acórdãos

trabalho acadêmico com referências monografia no formato PDF com links externos acórdão referenciando outros acórdão, súmulas

Page 17: Arquitetura do LexML Resolver Adaptado por João Lima

Referência via sistemas dos portais governamentais Uso de ícone para identificar o serviço

Resultado poderá vir com a programação visual da origem do link

Lexml URN Resolver

Page 18: Arquitetura do LexML Resolver Adaptado por João Lima

Pesquisa por Link (SF)

Page 19: Arquitetura do LexML Resolver Adaptado por João Lima

Pesquisa por Link (STF)

Page 20: Arquitetura do LexML Resolver Adaptado por João Lima
Page 21: Arquitetura do LexML Resolver Adaptado por João Lima
Page 22: Arquitetura do LexML Resolver Adaptado por João Lima

Portal LexML Aceita

URNs Palavras significativas

Retorna se resultado = 1 ocorrência

a página diretamente se resultado > 1 ocorrência

as opções para o usuário escolher se resultado = 0 ocorrências

informa que ainda não está disponível e/ou solicita ao usuário que reveja os argumento de pesquisa

Page 23: Arquitetura do LexML Resolver Adaptado por João Lima
Page 24: Arquitetura do LexML Resolver Adaptado por João Lima
Page 25: Arquitetura do LexML Resolver Adaptado por João Lima
Page 26: Arquitetura do LexML Resolver Adaptado por João Lima
Page 27: Arquitetura do LexML Resolver Adaptado por João Lima

Obra Complexa (FRBR)

Obra Indiv. (FRBR) Manifestação e Item (FRBR)Itens (FRBR)

Page 28: Arquitetura do LexML Resolver Adaptado por João Lima

Plugins

Exemplos do projeto italiano Norme In Rete Parser no texto em tela gerando de forma

automática as URNs plugin frame

Page 29: Arquitetura do LexML Resolver Adaptado por João Lima

clique em “analisar”

NiR toolbar

Page 30: Arquitetura do LexML Resolver Adaptado por João Lima

resultado do parser

Page 31: Arquitetura do LexML Resolver Adaptado por João Lima

Parsing a partir de resultado de busca no Portal NiR

1. copia

2. cola

3. analisa

Quadro do Parser

Page 32: Arquitetura do LexML Resolver Adaptado por João Lima

Parsing a partir de resultado de busca no Portal NiR

4. Hipertexto com links URN

5. clique em um link

Resultado do parser

Page 33: Arquitetura do LexML Resolver Adaptado por João Lima

Coleta de Metadados

OAI PMH Data Providers (órgãos) Service Providers (serviço lexml)

Data Providers, opções Integração do protocolo OAI-PMH aos

sistemas existentes Inclusão (e atualização) de dados em uma

tabela no cliente padrão que será distribuído

Page 34: Arquitetura do LexML Resolver Adaptado por João Lima

Gerência da Coleta de Metadados

Estado das coletas de metadados por data providerEstatísticas

Exemplo do IBICT Biblioteca Digital de Teses e Dissertações

Page 35: Arquitetura do LexML Resolver Adaptado por João Lima
Page 36: Arquitetura do LexML Resolver Adaptado por João Lima
Page 37: Arquitetura do LexML Resolver Adaptado por João Lima