arquitetura do lexml resolver adaptado por joão lima

Post on 07-Apr-2016

215 Views

Category:

Documents

1 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Arquitetura do LexML Resolver

Adaptado por João Lima

Definições “Resolvedor” é um agente que, dado um

identificador LexML Brasil (URN), retorna metadados das normas correspondentes. Os metadados contém, além da descrição básica da “obra”, referências (URLs) para o texto completo da norma.

URL – Universal Resource Locator (HTTP) URN – Universal Resource Name

Proposta de ImplementaçãoModelo Distribuído

Cliente

OAI-PMH

Resolvedor “br;sp”

Coletor deMetadados

“br;sp”

Resolvedor “br;sp;sao.paulo”

Coletor deMetadados

“br;sp;sao.paulo”

Resolvedor “br:pb”

Coletor deMetadados

“br;pb”

Resolvedor “br”

Coletor deMetadados

“br”

OAI-PMH

Legislação Federal

Legislação Estadual Legislação Municipal Legislação Estadual

Neste cenário o cliente faz a pergunta a qualquer nó, que redireciona a requisição se necessário.

Cada nó do sistema distribuído é semelhante a um sistema centralizado completo, só que neste caso o nó agrega metadados de apenas uma jurisdição.

Descoberta do nó responsável por determinada jurisdição pode ser feita usando tabelas de lookup ou até mesmo DNS

Lookup

Lookup LookupLookup

Modelo Distribuído:Replicação

Cliente

Resolvedor “br;sp”

Coletor deMetadados

“br;sp”OAI-PMH

Cada “resolvedor” pode ter uma ou mais réplicas do banco de metadados para permitir tolerância a falhas e balanceamento de carga

Réplica A “br;sp”

Réplica AMetadados

“br;sp”

Modelo Distribuído:Precauções Manter registro de “resolvedores” atualizada

Evitar laços infinitos

Gerenciar mudanças nas unidades administrativas

Protocolo de Resolução É necessário desenvolver um protocolo de resolução de

LexML URNs e software que implemente tal protocolo

Web Browsers e bibliotecas HTTP nunca vão dar suporte a esquemas baseados em URNs Facção diz que URN vai contra a “arquitetura web” Antiga disputa entre HTTP URL vs. URN

Ainda assim há vantagens claras em usar URNs: Distinção entre URN e HTTP URLs Geração automática a partir de metadados Persistência Compatibilidade com a “arquitetura web” através de proxies

Implementação do Protocolo

Outros identificadores têm bibliotecas que implementam o protocolo de resolução Suporte a várias linguagens e plataformas Bibliotecas para Clientes e Servidores

Mas identificadores LexML Brasil requerem dados para operar Melhor implementar Web Services REST (HTTP GET)

A Armadilha dos Protocolos Personalizados Web Browsers permitem a implementação de protocolos personalizados

Um exemplo é o protocolo lsidres: Usado pelos plugins LSID p/ Firefox e Internet Explorer lsidres:urn:lsid:herbimi.info:specimens:100069

É uma armadilha para o sistema Links só funcionam se o usuário instalar o plugin Caso contrário, os links parecerão quebrados. O browser apenas emite uma

mensagem de erro inútil, que não leva o usuário a instalar o plugin. O mesmo acontece com bibliotecas http, só que não há plugins

É preferível usar um proxy HTTP: http://lsid.tdwg.org/urn:lsid:herbimi.info:specimens:100069 http://www.lexml.gov.br/n2l?urn:lex:br:federal:lei:lei.geral.telecomunicacoes

O Que Retornar ao Cliente?

Uma página web (XHTML)? Conteúdo XML? XML + XSLT?

Negociação de ConteúdoCabeçalho HTTP “Accept:”

Arquitetura:Centralizada ou Distribuída

Decisão baseada nos parâmetros:Estimativa do tamanho do banco

Considerações políticas: Quem detém o controle sobre o sistema?

Complexidade (custo) de Implementação

Estimativa do Tamanho do Banco de Dados

0

500

1000

1500

2000

2500

Fed Est Mun

Fonte: Quantidade de Normas Editadas no Brasil: Período 05/10/1988 a 05/10/2004. IBPT - Instituto Brasileiro de Planejamento Tributário.Extraído de apresentação de João Lima - PRODASEN

Núm. de Registros: ~ 3.3 milhões(desde outubro/1988)

Tamanho do Registro: ~ 2-4 KB(apenas metadados)

Tamanho do Banco de Dados: ~ 13 GB (apenas dados) ~ 40 GB (incluindo “padding” – 3x)

Estimativa de acréscimo anual: ~ 800 MB/ano (apenas dados) ~ 2,5 GB/ano (incluindo “padding”)

Arquitetura:Centralizada ou Distribuída

Banco não é tão grande (40GB + 2,5GB/ano): Sistema poderia ser centralizado

Entretanto, sistema distribuído é mais apropriado: Controle compartilhado pelos vários parceiros Tolerância a falhas – sistema continua funcionando se um componente

falha Escalabilidade – desempenho é mantido com adição de dados e

componentes ao longo do tempo

Benefícios justificam complexidade (custo) adicional do sistema distribuído

Conclusões

Possível implementar “resolvedores” LexML Brasil Piloto com bases de dados representativas em 3 a 6

meses Demais nós podem ser adicionados em etapas

Sistema distribuído é mais apropriado Benefícios justificam complexidade (custo) adicional Possibilidade de utilização de DNS na resolução

Interface do usuárioInterface de gerência

Referência direta via sistemas dos portais governamentais

Portal urn palavras

Plugins

Referência Direta

Após incluir o http proxy (http://www.lexml.gov.br/n2l?urn), codifica-se a URN desejada

Pode ser codificada em qualquer fonte ex:

parecer legislativo referenciando normas, proposições e acórdãos

trabalho acadêmico com referências monografia no formato PDF com links externos acórdão referenciando outros acórdão, súmulas

Referência via sistemas dos portais governamentais Uso de ícone para identificar o serviço

Resultado poderá vir com a programação visual da origem do link

Lexml URN Resolver

Pesquisa por Link (SF)

Pesquisa por Link (STF)

Portal LexML Aceita

URNs Palavras significativas

Retorna se resultado = 1 ocorrência

a página diretamente se resultado > 1 ocorrência

as opções para o usuário escolher se resultado = 0 ocorrências

informa que ainda não está disponível e/ou solicita ao usuário que reveja os argumento de pesquisa

Obra Complexa (FRBR)

Obra Indiv. (FRBR) Manifestação e Item (FRBR)Itens (FRBR)

Plugins

Exemplos do projeto italiano Norme In Rete Parser no texto em tela gerando de forma

automática as URNs plugin frame

clique em “analisar”

NiR toolbar

resultado do parser

Parsing a partir de resultado de busca no Portal NiR

1. copia

2. cola

3. analisa

Quadro do Parser

Parsing a partir de resultado de busca no Portal NiR

4. Hipertexto com links URN

5. clique em um link

Resultado do parser

Coleta de Metadados

OAI PMH Data Providers (órgãos) Service Providers (serviço lexml)

Data Providers, opções Integração do protocolo OAI-PMH aos

sistemas existentes Inclusão (e atualização) de dados em uma

tabela no cliente padrão que será distribuído

Gerência da Coleta de Metadados

Estado das coletas de metadados por data providerEstatísticas

Exemplo do IBICT Biblioteca Digital de Teses e Dissertações

top related