uma proposta para abertura dos dados públicos da ... · resumo o meio de comunicação humano foi...

49
Micael Lopes da Silva Uma proposta para abertura dos dados públicos da Universidade Federal do Maranhão São Luís, Brasil 2016

Upload: others

Post on 06-Oct-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Uma proposta para abertura dos dados públicos da ... · Resumo O meio de comunicação humano foi revolucionado com a criação e popularização da internet. Essa nova tecnologia

Micael Lopes da Silva

Uma proposta para abertura dos dados públicosda Universidade Federal do Maranhão

São Luís, Brasil

2016

Page 2: Uma proposta para abertura dos dados públicos da ... · Resumo O meio de comunicação humano foi revolucionado com a criação e popularização da internet. Essa nova tecnologia

Micael Lopes da Silva

Uma proposta para abertura dos dados públicos daUniversidade Federal do Maranhão

Monografia apresentada ao curso de Bachare-lado Interdisciplinar em Ciência e Tecnologia,como requisito parcial para a obtenção doTítulo de Bacharel em Ciência e Tecnologia,Centro de Ciências Exatas e Tecnológicas daUniversidade Federal do Maranhão

Universidade Federal do Maranhão – UFMA

Centro de Ciências Exatas e Tecnológicas

Bacharelado Interdisciplinar em Ciência e Tecnologia

Orientador: Prof. Dr. Sérgio Souza Costa

São Luís, Brasil2016

Page 3: Uma proposta para abertura dos dados públicos da ... · Resumo O meio de comunicação humano foi revolucionado com a criação e popularização da internet. Essa nova tecnologia

Micael Lopes da Silva

Uma proposta para abertura dos dados públicos daUniversidade Federal do Maranhão

Monografia apresentada ao curso de Bachare-lado Interdisciplinar em Ciência e Tecnologia,como requisito parcial para a obtenção doTítulo de Bacharel em Ciência e Tecnologia,Centro de Ciências Exatas e Tecnológicas daUniversidade Federal do Maranhão

Trabalho aprovado. São Luís, Brasil, 16 de agosto de 2016:

Prof. Dr. Sérgio Souza CostaOrientador

Prof. Dr. Bruno Feres de SouzaUniversidade Federal do Maranhão

Profa. Ma. Vandécia Rejane MonteiroFernandes

Universidade Federal do Maranhão

São Luís, Brasil2016

Page 4: Uma proposta para abertura dos dados públicos da ... · Resumo O meio de comunicação humano foi revolucionado com a criação e popularização da internet. Essa nova tecnologia

A Deus e a minha família.

Page 5: Uma proposta para abertura dos dados públicos da ... · Resumo O meio de comunicação humano foi revolucionado com a criação e popularização da internet. Essa nova tecnologia

Agradecimentos

Agradeço ao meu orientador, Prof. Dr. Sérgio Souza Costa por sua dedicação aeste trabalho e a todos os meus amigos do curso, em especial, ao Thalles e a Thamylapelo apoio.

Page 6: Uma proposta para abertura dos dados públicos da ... · Resumo O meio de comunicação humano foi revolucionado com a criação e popularização da internet. Essa nova tecnologia

“Não vos amoldeis às estruturas deste mundo,mas transformai-vos pela renovação da mente,a fim de distinguir qual é a vontade de Deus:

o que é bom, o que Lhe é agradável, o que é perfeito.(Bíblia Sagrada, Romanos 12, 2)

Page 7: Uma proposta para abertura dos dados públicos da ... · Resumo O meio de comunicação humano foi revolucionado com a criação e popularização da internet. Essa nova tecnologia

ResumoO meio de comunicação humano foi revolucionado com a criação e popularização dainternet. Essa nova tecnologia é em especial utilizada por diversas instituições comouniversidades que têm publicado informações não-sensíveis nessa grande teia com fins detransparência. Mas muitas dessas informações são disponíveis em formatos legíveis parahumanos e não para computadores, o que representa um empecilho em análise de massade dados, e consequentemente, na inovação e desenvolvimento de aplicações que foquemem tais dados, o que também acaba por bloquear todo um potencial de conhecimento.Logo, este projeto visa integrar e disponibilizar a quantidade máxima possível de dadosnão estruturados publicados no âmbito da Universidade Federal do Maranhão, a fim deos prover à sociedade desenvolvedora através de uma plataforma de consumo de dadosabertos eficientemente projetada.

Palavras-chaves: dados públicos. dados abertos. dados abertos em universidades.

Page 8: Uma proposta para abertura dos dados públicos da ... · Resumo O meio de comunicação humano foi revolucionado com a criação e popularização da internet. Essa nova tecnologia

AbstractThe means of human communication was revolutionized with the creation and populariza-tion of the Internet. This new technology is especially used by various institutions suchas universities that have published non-sensitive information in big Web to transparencypurposes. But much of this information is available in readable formats for humans andnot for computers, this represents a problem in mass data analysis and, consequently,to innovation and development of applications that focus on such data, which also ulti-mately block all a potential of knowledge. Therefore, this project aims to integrate andprovide the maximum possible amount of data unstructured published in the FederalUniversity of Maranhão, in order to provide them to the developer society through opendata consumption platform efficiently designed.

Key-words: public data. open data. open data in universities.

Page 9: Uma proposta para abertura dos dados públicos da ... · Resumo O meio de comunicação humano foi revolucionado com a criação e popularização da internet. Essa nova tecnologia

Lista de ilustrações

Figura 1 – Etapas para publicação de dados abertos. . . . . . . . . . . . . . . . . 22Figura 2 – Grafo RDF genérico . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26Figura 3 – Um exemplo de serializacao de dados em RDF usando Turtle . . . . . . 27Figura 4 – Em destaque, os dois blocos DAC da Web Semântica. . . . . . . . . . . 29Figura 5 – Diagrama de nuvem de todos os DAC em 2014. . . . . . . . . . . . . . 30Figura 6 – Classificação five stars para dados ou conjunto de dados. . . . . . . . . 31Figura 7 – Exemplo de consulta dos dados da Figura 3 usando SPARQL . . . . . 32Figura 8 – Workflow do projeto LUCERO aplicado à OU . . . . . . . . . . . . . . 34Figura 9 – Workflow do projeto LODUM aplicado à Universidade de Münster . . 37Figura 10 – Arquitetura do projeto de dados vinculados abertos aplicado à Univer-

sidade Pompeu Fabra . . . . . . . . . . . . . . . . . . . . . . . . . . . 38Figura 11 – Rankings de algumas Universidades por dados abertos disponíveis . . . 39Figura 12 – Ciclo de execução proposto para este projeto. . . . . . . . . . . . . . . 40

Page 10: Uma proposta para abertura dos dados públicos da ... · Resumo O meio de comunicação humano foi revolucionado com a criação e popularização da internet. Essa nova tecnologia

Lista de códigos

Código 2.1 – Um catálogo de endereços estruturado em XML . . . . . . . . . . . . . 24Código 2.2 – Catálogo de endereços serializado em JSON . . . . . . . . . . . . . . . 25

Page 11: Uma proposta para abertura dos dados públicos da ... · Resumo O meio de comunicação humano foi revolucionado com a criação e popularização da internet. Essa nova tecnologia

Lista de tabelas

Tabela 1 – Principais datasets da UFMA . . . . . . . . . . . . . . . . . . . . . . . 41Tabela 2 – Cronograma de atividades a serem executadas. . . . . . . . . . . . . . 43

Page 12: Uma proposta para abertura dos dados públicos da ... · Resumo O meio de comunicação humano foi revolucionado com a criação e popularização da internet. Essa nova tecnologia

Lista de abreviaturas e siglas

API Application Programming Interface

CSV Comma-Separated Values

DAC Dados Abertos Conectados

DAG Dados Abertos Governamentais

HTTP Hypertext Transfer Protocol

INDA Infraestrutura Nacional de Dados Abertos

JSON JavaScript Object Notation

LUCERO Linked University Content for Education and Research Online

OU Open University

PDF Portable Document Foundation

RDF Resource Description Languague

REST Representational State Transfer

UFMA Universidade Federal do Maranhão

XML eXtensible Markup Language

Page 13: Uma proposta para abertura dos dados públicos da ... · Resumo O meio de comunicação humano foi revolucionado com a criação e popularização da internet. Essa nova tecnologia

Sumário

1 INTRODUÇÃO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141.1 Considerações inicias . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141.2 Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151.3 Justificativa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

2 DADOS ABERTOS GOVERNAMENTAIS . . . . . . . . . . . . . . 172.1 Definições e características . . . . . . . . . . . . . . . . . . . . . . . . 172.1.1 A evolução da cultura de abertura de dados governamentais . . . . . . . . 192.1.2 Estímulo e consumo de dados abertos . . . . . . . . . . . . . . . . . . . . 212.2 Formatos e arquiteturas . . . . . . . . . . . . . . . . . . . . . . . . . . 212.2.1 Formatos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 222.2.1.1 XML . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

2.2.1.2 JSON . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

2.2.1.3 RDF . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

2.2.2 Arquiteturas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 282.2.2.1 RESTful API . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

2.2.2.2 Dados Conectados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

3 DADOS ABERTOS NAS UNIVERSIDADES . . . . . . . . . . . . . 333.1 Open University (Reino Unido) . . . . . . . . . . . . . . . . . . . . . . 343.2 Universidade de Oxford (Reino Unido) . . . . . . . . . . . . . . . . . 353.3 Universidade de Münster (Alemanha) . . . . . . . . . . . . . . . . . . 363.4 Universidade Pompeu Fabra (Espanha) . . . . . . . . . . . . . . . . . 383.5 Campus Data . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

4 METODOLOGIA . . . . . . . . . . . . . . . . . . . . . . . . . . . . 404.1 Escolha e modelagem de dados . . . . . . . . . . . . . . . . . . . . . 404.2 Definição de arquiteturas e formatos . . . . . . . . . . . . . . . . . . 414.3 Disponibilização de dados . . . . . . . . . . . . . . . . . . . . . . . . . 424.4 Divulgação e participação . . . . . . . . . . . . . . . . . . . . . . . . . 424.5 Identificação dos principais erros e acertos . . . . . . . . . . . . . . . 424.6 Continuidade e Manutenção . . . . . . . . . . . . . . . . . . . . . . . 424.7 Atividades e cronograma . . . . . . . . . . . . . . . . . . . . . . . . . 43

5 CONSIDERAÇÕES FINAIS . . . . . . . . . . . . . . . . . . . . . . . 44

Page 14: Uma proposta para abertura dos dados públicos da ... · Resumo O meio de comunicação humano foi revolucionado com a criação e popularização da internet. Essa nova tecnologia

REFERÊNCIAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

Page 15: Uma proposta para abertura dos dados públicos da ... · Resumo O meio de comunicação humano foi revolucionado com a criação e popularização da internet. Essa nova tecnologia

14

1 Introdução

1.1 Considerações iniciasExiste uma linha tênue entre dados públicos e dados abertos. Enquanto que o

primeiro são, em sua maioria, informações de governo e de seus órgãos, dados abertos porsua vez são uma extensão desses dados com uma característica diferencial: são publicadosem um formato alternativo seriado e padronizado de possível leitura por máquinas. Énesse ponto que a linha tênue entre ambos é eliminada.

No Brasil, o acesso à informação sobre os recursos públicos já estava previstodesde a Constituição de 1988, porém foi reforçado principalmente através Lei de Acessoà Informação (Lei no 12.527/2011). Em resposta a esta demanda, instituições públicastem disponibilizado grande volume de informações públicas através de sites na Web.Estes sites foram desenvolvidos focados na interação com usuários finais ao invés demáquinas. Durante, o processo de desenvolvimento são definidos quais os dados e comoeles serão apresentados, ou seja, nem todos os dados são publicados. Em muitos casossão disponibilizados por formatos não estruturados, proprietários e de difícil leitura pormáquinas.

A Universidade Federal do Maranhão, sendo uma fundação federal presente noestado do Maranhão distribuída por oito municípios do estado, é geradora de diversostipos de dados e, portanto, deve disponibilizar informações públicas para todos. Tendo suaestrutura organizacional composta por diversos departamentos, unidades suplementares enúcleos que geram os mais diversos tipos de dados como produção acadêmica, informaçõesde acervos da biblioteca, dados de diretores de departamentos, coordenadores de cursos,professores e discentes em geral, tem portais que disponibilizam periódicos locais, publicaçãode editais, calendário acadêmico, refeições, estre outras informações não sensíveis e quepodem ser visualizadas e redistribuídas pois são de origem pública. No entanto, esse grandeconjunto de dados da Universidade não está “democraticamente” acessível. Humanospodem facilmente encontrar, ler, reutilizar e compartilhar essas informações pelo formatonas quais elas são disponibilizadas após a consulta no banco de dados.

Um exemplo é o portal SIGRH1 da Universidade Federal do Maranhão. Nele épossível gerar diversos relatórios, todos em formato PDF. A utilização destes formatostornam a extração de uma informação específica muito difícil ou até mesmo impossível.Por fim, as instituições tem dificuldade em manter os dados atualizados. Deste modo, uminteressado precisa entrar em contato com a instituição provedora, para requisitar alguns1 Disponível em: <https://sigrh.ufma.br/>

Page 16: Uma proposta para abertura dos dados públicos da ... · Resumo O meio de comunicação humano foi revolucionado com a criação e popularização da internet. Essa nova tecnologia

Capítulo 1. Introdução 15

dados mais específicos e atualizados. Esse processo pode demandar tempo e recursos dasinstituições detentora dos dados e do solicitante. Deste modo, muitas instituições estãomudando para o paradigma de dados abertos.

Toda essa informação poderia ser mais útil se estivesse, no mínimo, disponível emum formato alternativo que fosse legível por máquinas. Além disso, se esses dados fossemvinculados entre si eles desbloqueariam todo o potencial de conhecimento preso quando háfragmentação da informação, como ocorre na Universidade até o término deste presentetrabalho.

1.2 ObjetivosÀ vista da problemática apesentada acerca dos dados públicos da UFMA, este

projeto visa integrar e estruturar a quantidade máxima possível de dados públicos geradospela Universidade como um todo, de modo a torná-los abertos e acessíveis para todos, emais especificamente:

a) Estruturar e modelar os dados públicos disponíveis em formatos de serializaçãoatravés de técnicas de raspagem de dados;

b) Disponibilizar os dados estruturados em um serviço web através de uma arqui-tetura de alimentação de dados estruturados.

1.3 JustificativaMilhões de dados são disponibilizados diariamente na internet advindos de diversas

fontes e dos mais variados tipos. Um subespaço de dados importantes nesse grande espaçode dados são os dados de origem pública que são todas as informações que não lesamleis de privacidade, integridade e segurança. Grande parte do conjunto de dados dessesubespaço vem de fontes governamentais, visto às políticas de transparência de governos dedemocracia. Mas grande parte dessas informações estão disponíveis somente para consultapor humanos, e não padronizadas para máquinas. Dessa forma, movimentos de aberturade dados e padronizações para dados abertos, como linked open data, estão transformandoa maneira como a sociedade como um todo tem “olhado” para essas informações. Com avinculação dessas informações, está ocorrendo um desbloqueio do potencial de geração deconhecimento que antes não se era fácil de obter.

Informações da empresa de consultoria estadunidense McKinsey & Company revelaque o gasto com educação básica e ensino superior no mundo ultrapassa o valor de $4 trilhõesde dólares; portanto, com tamanho valor aplicado à educação pública, há significativasoportunidades de aplicação desses recursos na melhoria dos serviços prestados. Partindo

Page 17: Uma proposta para abertura dos dados públicos da ... · Resumo O meio de comunicação humano foi revolucionado com a criação e popularização da internet. Essa nova tecnologia

Capítulo 1. Introdução 16

dos dados já existentes, o compartilhamento e padronização dessas informações impactarápositivamente na eficiência e eficácia das instituições de ensino.

Várias universidades já observaram o potencial de abertura de seus dados e imple-mentaram serviços para o seu suporte. Universidade Aberta do Reino Unido, Universidadede Oxford, Universidade de Münster, Universidade Pompeu Fabra são alguns exemplos deinstituições de ensino superior que disponibilizam serviços de suporte para dados abertos.

Page 18: Uma proposta para abertura dos dados públicos da ... · Resumo O meio de comunicação humano foi revolucionado com a criação e popularização da internet. Essa nova tecnologia

17

2 Dados Abertos Governamentais

2.1 Definições e característicasO dicionário Michaelis define dado como “representação de fatos, conceitos e ins-

truções, por meio de sinais de uma maneira formalizada, possível de ser transmitida ouprocessada pelo homem ou por máquinas” (WEISZFLOG, 2004). Eaves (2009) comple-menta seu significado como “uma informação ou gravação armazenada eletronicamente”.

Desde a revolução dos meios de comunicação com a criação e popularização da Web,a facilidade de publicação e compartilhamento de informações gerou uma explosão de dadosdisponibilizados nessa rede mundial de computadores, e muitas dessas informações estãocompreendidas em dois universos estruturalmente diferentes: informações legíveis parahumanos e informações legíveis para máquinas. Cada um desses ambientes compreendemregras e terminologias que os caracterizam como guardiões de dados privados ou dadospúblicos. (DIETRICH et al., 2009)

Focando nos dados públicos, eles nada mais são do que todas as informações que nãolesem leis de privacidade, integridade e segurança. Por conta disso, dados governamentaissão um bom exemplo de informações de interesse coletivo. (BR CGU, 2013)

Os dados abertos também são informações livres de restrições de uso e, maiscriterialmente,

(...) quando qualquer pessoa pode livremente usá-los, reutilizá-los eredistribuí-los, estando sujeito a, no máximo, a exigência de creditar asua autoria e compartilhar pela mesma licença. (OPEN DEFINITION,2013)

Eaves (2007), um especialista em políticas públicas de dados abertos, define trêsleis que caracterizam esses tipos de dados:

a) Caso o dado não possa ser encontrado ou indexado na Web, então o dado nãoexiste;

b) Não pode haver reaproveitamento do dado caso ele não esteja em um formatolegível por máquina;

c) O dado é inútil caso tenha restrição de replicação por uma ordem legal.

Inicialmente, Eaves (2007) descreveu esses três princípios em caracterização aos da-dos governamentais abertos, mas, de uma forma geral, eles identificam todas as informaçõesautodenominadas como abertas que estejam disponibilizadas na Web.

Page 19: Uma proposta para abertura dos dados públicos da ... · Resumo O meio de comunicação humano foi revolucionado com a criação e popularização da internet. Essa nova tecnologia

Capítulo 2. Dados Abertos Governamentais 18

Em uma reunião realizada em Sebastopol, Califórnia, o grupo de trabalho OpenGovernment Working Group (2007) definiu oito princípios fundamentais para os dadosabertos governamentais:

a) Precisam estar disponíveis em sua forma mais íntegra possível;

b) Devem estar em seu estado mais bruto possível;

c) Devem ser publicados o quão antes de sua geração (devem estar disponíveisantes de desatualização);

d) Devem estar acessíveis por todos e quaisquer usuários, inclusive máquinas;

e) Devem permanecer em um nível de estrutura mais simples para melhorar onível de processamento;

f) Dados abertos não precisam de identificação para serem acessados;

g) Devem estar disponíveis em formatos livres de formatos proprietários, comoCSV, XML, JSON, etc;

h) Devem estar livres de qualquer tipo de restrições (ligadas a direitos autorais).

Esses princípios se seguidos à risca pelos detentores de dados, diminuirão ou atéextinguirão, por exemplo, o muro existente entre o acesso de dados por humanos e máquinas,onde a estrutura do dado é uma das principais dificuldades existentes para máquina.

Em uma primeira vista, as definições de dados públicos e dados abertos assemelham-se de tal forma que podem dirigir a um entendimento precipitado. Porém, tendo em vistaas definições apresentadas, deve-se ter em mente que todo dado público é um principiantea um dado aberto, e por conseguinte, todo dado aberto deve ser obrigatoriamente, umdado de origem pública. Logo, a diferença está na estrutura de disponibilização dessasinformações, a exemplo, um dado público não precisa estar necessariamente presente naWeb, enquanto que um dado aberto tem de se encaixar às políticas e princípios definidosque os próprio caracterizam.

Os dados abertos, e por conseguinte, os dados abertos governamentais (DAG),segundo a organização Dietrich et al. (2009), têm seu potencial de acordo com seu conjuntocaracterístico

a) Cultural: conjunto de dados referentes à produção cultural e de artefatos.

b) Ciências: conjunto de dados referentes à produção intelectual científica, aexemplo pesquisas, que compreende todas as subáreas da ciência.

c) Finanças: dados sobre o orçamento do governo, a exemplo economias e despesas;e mercado financeiro em geral, a exemplo bolsa de valores.

d) Estatísticas: dados coletados por institutos de pesquisa e estatística, como censoe indicadores socioeconômicos.

Page 20: Uma proposta para abertura dos dados públicos da ... · Resumo O meio de comunicação humano foi revolucionado com a criação e popularização da internet. Essa nova tecnologia

Capítulo 2. Dados Abertos Governamentais 19

e) Tempo: conjunto de dados utilizados para prever o clima.

f) Ambiente: dados acerca das condições ambientais, a exemplo poluição de marese rios, desmatamento florestal.

g) Transporte: dados sobre horários e itinerários, localização e previsão de prazos.

2.1.1 A evolução da cultura de abertura de dados governamentais

Em uma democracia, é um direito fundamental dos cidadãos o acesso a toda equalquer informação gerada publicamente. Grandes organizações internacionais preveemesse direito, como a Organização das Nações Unidas, a ONU, em sua Declaração Universaldos Direitos Humanos:

Art. 19o Todo ser humano tem direito à liberdade de opinião e expressão;este direito inclui a liberdade de, sem interferência, ter opiniões e deprocurar, receber e transmitir informações e ideias por quaisquer meiose independentemente de fronteiras. (ONU, 1948)

A Controladoria Geral da União (CGU) do Brasil também descreve sucintamenteem seu “Manual da Lei de Acesso à Informação para Estados e Municípios”:

Além da evolução quanto ao reconhecimento internacional do direito deacesso à informação como um direito humano fundamental, outros fatorescontribuíram para a aceitação dessa prerrogativa. Destacam-se, a partirdos anos 90, a democratização de vários países e os grandes avanços nastecnologias de informação e comunicação, que mudaram completamentea relação das sociedades com a informação e o uso que fazem dela. (BRCGU, 2013, p. 7)

Logo, no século XXI, com o advento de novas tecnologias de informação e a inserçãode tecnólogos interessados, houve uma grande mudança no movimento de abertura dedados públicos de governos. O governo do Canadá e dos Estados Unidos foram um dospioneiros nessa mudança com a aprovação de leis para padronizar a disponibilização dedados abertos gerados pela prefeitura de Vancouver, no Canadá e Portland, nos EUAambas no ano de 2009. (TAUBERER, 2014)

A iniciativa das prefeituras de Vancouver e Portland geraram um evento em cadeiaestimulando várias prefeituras ao redor dos EUA. Mundialmente, vale citar o governo daNova Zelândia em 2011 na adoção de princípios para a gerência de dados baseados nos 8princípios anteriormente citados e leis de dados abertos promulgadas em Hamburgo naAlemanha em 2012. (TAUBERER, 2014)

No Brasil, a questão do direito à transparência e à informações públicas não é umtema relativamente recente, pois já era vaticinado na constituição federal de 1988, ondeno Título I – Dos Direitos e Garantias Fundamentais, Capítulo I – Dos Direitos e DeveresIndividuais e Coletivos:

Page 21: Uma proposta para abertura dos dados públicos da ... · Resumo O meio de comunicação humano foi revolucionado com a criação e popularização da internet. Essa nova tecnologia

Capítulo 2. Dados Abertos Governamentais 20

Art. 1o Todos são iguais perante a lei, sem distinção de qualquer natureza,garantindo-se aos brasileiros e aos estrangeiros residentes no País ainviolabilidade do direito à vida, à liberdade, à igualdade, à segurança eà propriedade, nos termos seguintes:

...

XIV - é assegurado a todos o acesso à informação e resguardado o sigiloda fonte, quando necessário ao exercício profissional;

...

XXXIII - todos têm direito a receber dos órgãos públicos informaçõesde seu interesse particular, ou de interesse coletivo ou geral, que serãoprestadas no prazo da lei, sob pena de responsabilidade, ressalvadasaquelas cujo sigilo seja imprescindível à segurança da sociedade e doEstado; (BRASIL, 1988, tit. II, cap. I).

No entanto, os maiores avanços nacionais ocorreram a partir da Brasil (2011) queregulariza o direito de acesso à informações de órgãos públicos administrativos, autarquias,fundações e empresas estatais, e todas as instituições controladas direta ou indiretamentepelo governo ou toda e qualquer instituição privada sem fins lucrativos que receba verbaspúblicas. No art. 3o, 4o e 7o fica previsto:

Art. 3o Os procedimentos previstos nesta Lei destinam-se a assegurar odireito fundamental de acesso à informação e devem ser executados emconformidade com os princípios básicos da administração pública e comas seguintes diretrizes:

...

II - divulgação de informações de interesse público, independentementede solicitações;III - utilização de meios de comunicação viabilizados pela tecnologia dainformação; (BRASIL, 2011, cap. I)

Art. 4o Para os efeitos desta Lei, considera-se:I - informação: dados, processados ou não, que podem ser utilizados paraprodução e transmissão de conhecimento, contidos em qualquer meio,suporte ou formato; (BRASIL, 2011, cap. I)

Art. 7o O acesso à informação de que trata esta Lei compreende, entreoutros, os direitos de obter:

...

II - informação contida em registros ou documentos, produzidos ouacumulados por seus órgãos ou entidades, recolhidos ou não a arquivospúblicos;

...IV - informação primária, íntegra, autêntica e atualizada;V - informação sobre atividades exercidas pelos órgãos e entidades,inclusive as relativas à sua política, organização e serviços; (BRASIL,2011, cap. II)

Page 22: Uma proposta para abertura dos dados públicos da ... · Resumo O meio de comunicação humano foi revolucionado com a criação e popularização da internet. Essa nova tecnologia

Capítulo 2. Dados Abertos Governamentais 21

2.1.2 Estímulo e consumo de dados abertos

O governo não deve apenas se atentar em disponibilizar os seus dados na Web, mastambém precisa incentivar os seus governados a reutilizar tais informações. Isso se verificano manual de Diniz (2010) onde ele afirma que “Não há valor na disponibilização de dadosgovernamentais abertos se a sociedade não tem interesse em reutilizá-los”.

Da reutilização dos dados, pode-se gerar novo conhecimento quando tais informaçõessão cruzadas com dados de outras fontes, por exemplo.

A representação dos dados de uma maneira que as pessoas possamreutilizá-los é o passo mais operacional e mais relevante para a carac-terização dos dados como Dados Governamentais Abertos. A Internetdisponibiliza hoje muitos aplicativos e serviços que permitem mistu-rar dados de vários aplicativos ou fontes de dados, produzindo novossignificados para os dados utilizados.(DINIZ, 2010, p. 5)

Há um novo pacto no horizonte: a informação produzida e em nomedos cidadãos é a força motriz da economia e da nação; o governo tema responsabilidade de tratar essa informação como um ativo nacional.Os cidadãos estão conectados como nunca antes e têm os conjuntos dehabilidades e paixão para resolver problemas que os afetam localmente,bem como a nível nacional. Informações e serviços do governo podemser prestados aos cidadãos, onde e quando eles precisam. 1 (LATHROP;RUMA, 2010, p. 12, tradução nossa)

Os agentes propulsores de valor da teia de colaboração e estruturação de dadosabertos são identificados em: órgão público, provedor de tecnologia e o agente reutiliza-dor.(DINIZ, 2010) Essa teia de produção de valor é fechada por este último, o agentereutilizador, pois ele é capaz de transformar essas informações com “habilidade em desen-volver aplicações baseadas na Web que façam uso desses dados” (DINIZ, 2010).

2.2 Formatos e arquiteturasW3C (2011) define três passos que podem ajudar governos no processo de abertura

de dados.

1. Escolha os conjuntos de dados que planeja abrir.2. Disponibilize os dados estruturados e em um formato aberto reutilizá-vel. Deve-se também considerar métodos alternativos de disponibilização,como uma API (application programming interface, ou interface de pro-gramação de aplicativo (...)).3. Torne-os mais fáceis de encontrar. Publique os dados na rede ouorganize um repositório/catálogo central para listar todos os conjuntosde dados. (W3C, 2011, p. 18)

1 There is a new compact on the horizon: information produced by and on behalf of citizens is thelifeblood of the economy and the nation; government has a responsibility to treat that information as anational asset. Citizens are connected like never before and have the skill sets and passion to solveproblems affecting them locally as well as nationally. Government information and services can beprovided to citizens where and when they need them. (LATHROP; RUMA, 2010)

Page 23: Uma proposta para abertura dos dados públicos da ... · Resumo O meio de comunicação humano foi revolucionado com a criação e popularização da internet. Essa nova tecnologia

Capítulo 2. Dados Abertos Governamentais 22

Os órgãos governamentais são os responsáveis pela publicação de seus dados públicos.Por mais que a política de “dados abertos” tenha crescido muito nos últimos anos, ela nãoé nova nas instituições governamentais brasileiras. Institutos como IBGE, DataSus, IPEA,INEP entre outros já tem a prática de disponibilizar dados na internet. (SLTI, 2011, p. 3)

A Figura 1 mostra cinco etapas gerais para a geração, exploração e publicação dedados abertos.

Figura 1: Etapas para publicação de dados abertos.

Fonte: Villazón-Terrazas et al. (2011)

2.2.1 FormatosDiversos formatos podem ser usados para a divulgação das informações na internet.

É importante lembrar da penúltima lei definida pela Open Government Working Group(2007) que se refere ao livre formato (não proprietário) do conjunto de dados e da quartareferente à sua estruturação.

É importante enfatizar a importância de dados estruturados. Um errorecorrente cometido por diversas instituições é a publicação em formatoPDF de planilhas de dados. O PDF é um formato não estruturado, e aofazer isso – desestruturação dos dados – o publicador está inviabilizando,ou dificultado, a reutilização daqueles dados.

W3C (2011) apresenta lista de formatos não proprietários que as instituiçõesgovernamentais podem utilizar para disponibilizar seus dados na internet.

a) JSON: acrônimo para JavaScript Object Notation, é um formato de estrutu-ração de dados legível por humanos. O principal diferencial do JSON está no

Page 24: Uma proposta para abertura dos dados públicos da ... · Resumo O meio de comunicação humano foi revolucionado com a criação e popularização da internet. Essa nova tecnologia

Capítulo 2. Dados Abertos Governamentais 23

encadeamento simplificado se mostrando uma alternativa ao XML quanto aeste quesito.

b) XML: acrônimo para eXtensible Markup Language, é um formato de estruturaçãode dados em hierarquia, legível para máquina.

c) CSV: abreviação de Comma-Separated Values, é um formato de estruturaçãopara representação de informações em formato de tabela. Cada linha da estruturarepresenta uma linha na tabela, as vírgulas representam o início de uma coluna.No entanto, CSV não suporta subpropriedades como XML e JSON.

d) RDF: significado para Resource Description Framework é um modelo de repre-sentação de dados poderoso tendo sua estrutura baseada em grafos e variadosformatos de serialização. Em suma, é um formato que permite o intercâmbioentre entre dados na internet (KLYNE; CARROLL, 2004).

Após o processo de publicação dos dados na internet, o próximo passo importantepara os órgãos é a criação de metadados que nada mais são do que dados que descrevemdados. Os metadados possibilitam organizar, classificar e relacionar outros dados à essedado. Em outras palavras, os metadados representam várias características de uma ouum conjunto de informações, enfatizando a relação dela com outras informações na Web.(SLTI, 2011) A exemplo, o governo do Brasil padronizou as informações básicas quedevem estar contidas em seus metadados que são título, descrição, catálogo de origem,órgão responsável, categorias no VCGE (Vocabulário Controlado de Governo Eletrônico) erecursos. (SLTI, 2011)

2.2.1.1 XML

Abreviatura para eXtensible Markup Language, descreve uma classe de dados deobjetos chamados de documentos XML. Documentos XML são compostos por unidadesde armazenamento chamadas de entidades, possuindo uma estrutura lógica e física e queespecifica três regras de sintaxe conhecidas como well-formed XML documents. (BRAY etal., 1998)

A textual object is a well-formed XML document if:1. Taken as a whole, it matches the production labeled document.2. It meets all the well-formedness constraints given in this specification.3. Each of the parsed entities which is referenced directly or indirectlywithin the document is wellformed. (BRAY et al., 1998)

Os elementos de um documento XML são delimitados por “<” e “>”, onde umpedaço de texto intercalado entre eles, como exemplo, “<curso>” e “</curso>” chamadosrespectivamente de marcação inicial e marcação final, e podendo ter internamente outrodocumento, texto bruto ou uma mistura de ambos. XML também permite associar atributosaos seus elementos objetivando, segundo Almeida (2002), especificar propriedades ou

Page 25: Uma proposta para abertura dos dados públicos da ... · Resumo O meio de comunicação humano foi revolucionado com a criação e popularização da internet. Essa nova tecnologia

Capítulo 2. Dados Abertos Governamentais 24

características do elemento, sendo que o valor desse atributo sempre é uma informaçõesliteral contida entre aspas. (ALMEIDA, 2002)

Assim como o HTML (HyperText Markup Language), XML é uma linguagem demarcação derivada da SGML (Standard Generalized Markup Language) que é, segundoAlmeida (2002), um padrão internacional para troca de informações eletrônicas, opensource, e que objetiva

(...) garantir que documentos codificados de acordo com suas regraspossam ser transportados de um ambiente de hardware e software paraoutro, sem perda de informação. (ALMEIDA, 2002)

Mas o XML difere do HTML e, segundo Almeida (2002), em três características:

a) novas marcações podem ser definidas;

b) estruturas de dados podem ser agrupadas em profundidade ilimitada;

c) um documento XML pode conter uma descrição opcional de sua gramática(DTD).

Código 2.1: Um catálogo de endereços estruturado em XML1 <?xml ve r s i on ="1.0">2 <catalogo_de_enderecos>3 <entrada>4 <nome>Fulano S i lva </nome>5 <endereco>6 <rua>Rua do Codigo</rua>7 <bair ro>Code Beach</ba i r ro>8 <cidade>Codelande</cidade>9 <estado>Maranhao</estado>

10 <pais>Bras i l </pais>11 </endereco>12 <t e l e f o n e t ipo=" c e l u l a r ">95551214</ t e l e f on e >13 <t e l e f o n e t ipo="casa ">93559874</ t e l e f on e >14 <email>fu lano . s i lva@mai l . com</email>15 </entrada>16 <entrada>17 <nome>Beltrano Santos</nome>18 <email>be l t rano . santos@mail . com</email>19 </entrada>20 </catalogo_de_enderecos>

2.2.1.2 JSON

JSON é um modelo para serialização de dados que suporta a representação dequatro tipos primitivos (strings, números, booleanos e nulo) e dois tipos de estrutura(objetos e arrays). Um objeto é uma coleção não ordenada de um ou mais pares chave/valor,

Page 26: Uma proposta para abertura dos dados públicos da ... · Resumo O meio de comunicação humano foi revolucionado com a criação e popularização da internet. Essa nova tecnologia

Capítulo 2. Dados Abertos Governamentais 25

sendo a chave uma string única e o valor um dos quatro tipos primitivos, um array ououtro objeto. Diferentemente da estrura objeto, um array é uma estrutura ordenada dezero ou mais valores. (BRAY, 2014)

Um objeto é delimitado por um par de chaves que envolve pares chave/valorseparados por dois pontos. A cada novo par chave/valor é inserido uma virgula. Array édelimitado por um par de colchetes que envolve pares chave/valor assim como um objeto(BRAY, 2014). O Código 2.2 mostra um exemplo de serialização de dados em JSON.

Código 2.2: Catálogo de endereços serializado em JSON1 {2 " catalogo_de_enderecos ":{3 " entrada ":[4 {5 "nome":"Fulano Silva",6 " endereco ":{7 "rua":"Rua do Codigo",8 "bairro":"Code Beach",9 "cidade":" Codelande ",

10 "estado":" Maranhao ",11 "pais":"Brasil"12 },13 " telefone ":[14 {"_tipo":" celular ","__text":"95551214"},15 {"_tipo":"casa","__text":"93559874"}16 ],17 "email":"fulano. silva@mail .com"18 },19 {20 "nome":" Beltrano Santos",21 "email":" beltrano . santos@mail .com"}22 ]23 }24 }

JSON foi desenvolvido para ser portátil, simples e textual, além de ser um subcon-junto do JavaScript. Em testes realizados por Fonseca e Simoes (2007), parsers JSON deaté 1MB foram suficientemente mais eficazes em velocidade do que parsers serializadosem XML. Além disso, JSON foi construído como um modelo de representação de dadosintegrado ao JavaScript, como diz Fonseca e Simoes (2007), “visto que permite transportarum objecto serializado arbitrariamente complexo, e transformá-lo num objecto JavaScript

Page 27: Uma proposta para abertura dos dados públicos da ... · Resumo O meio de comunicação humano foi revolucionado com a criação e popularização da internet. Essa nova tecnologia

Capítulo 2. Dados Abertos Governamentais 26

com um simples eval”, o que o tornou o modelo de estruturação mais usual no contextoda internet em detrimento do XML.

2.2.1.3 RDF

Através de um conjunto de terminologias e padrões, a linguagem RDF é capazde descrever relações para quaisquer recursos existentes. Sua infraestrutura nuclear érepresentada na Figura 2, sendo composta por três elementos:

a) um sujeito, que representa uma IRI2/URI ou um nó vazio;

b) um predicado, que também é uma IRI/URI;

c) e um objeto, que também é outra IRI/URI, um literal3, ou um nó vazio.

Figura 2: Grafo RDF genérico

Fonte: adaptado de Cyganiak et al. (2014)

A relação entre sujeito e objeto (ou valor) é representada na figura 3, onde apropriedade é o predicado que relaciona ambos. A exemplo, “livro” está relacionado ao seu“literal título” através da propriedade “título”. Sujeito e objeto são chamados de recursos etais recursos, assim como as propriedades, podem ser especificamente identificados atravésde URIs4 que são mais adequadas que literais na identificação para determinados casos,evitando, dessa forma, ambiguidades. (ISOTANI; BITTENCOURT, 2015) A esse conjunto<sujeito> <propriedade> <valor> denomina-se triplo. A representação de vários triploschama-se grafo RDF. (CYGANIAK et al., 2014)

A linguagem RDF necessita de uma linguagem de serialização para representarrecursos. XML foi a primeira linguagem de serialização usada para especificar recursos emRDF e relações entre eles sendo, portanto, a união entre ambas chamada de RDF/XML.Mais tarde, surgiu JSON-LD baseado na leve sintaxe do JSON. N-Triples foi outrasintaxe desenvolvida diretamente para RDF permitindo a representação mais clara, poiscada linha de um documento N-Triples representa uma tripla (sujeito, predicado, valor)finalizada por um ponto. Turtle é outra sintaxe de representação nascida para RDF que2 An IRI (Internationalized Resource Identifier) within an RDF graph is a Unicode string [UNICODE]

that conforms to the syntax defined in RFC 3987 [RFC3987]. (CYGANIAK et al., 2014)3 Literals are used for values such as strings, numbers, and dates. (CYGANIAK et al., 2014)4 Não remete necessariamente a uma localização de algum recurso, sendo portanto uma generalização

das URLs.(ISOTANI; BITTENCOURT, 2015)

Page 28: Uma proposta para abertura dos dados públicos da ... · Resumo O meio de comunicação humano foi revolucionado com a criação e popularização da internet. Essa nova tecnologia

Capítulo 2. Dados Abertos Governamentais 27

possibilita a definição de “prefixos e IRIs relativos na estrutura do documento”. (ISOTANI;BITTENCOURT, 2015)

Figura 3: Um exemplo de serializacao de dados em RDF usando Turtle

Fonte: Isotani e Bittencourt (2015)

Uma extensão da linguagem RDF é a RDFS (Resource Description LanguageSchema) que implementa a suposição sobre a semântica de recursos identificados pelasURIs. A inferência é introduzida por esse conceito extensor pois não se faz necessárioexplicitar relações se essas relações são inferidas a partir de outras relações. (ISOTANI;BITTENCOURT, 2015)

RDFS usa a noção de classe para especificar categorias que podem serusadas para classificar os recursos. A relação entre uma instância e suaclasse é indicada através da propriedade “type” de RDF. Com RDFS pode-se criar hierarquias de classes e subclasses, e hierarquias de propriedadese subpropriedades. Restrições de tipos podem ser definidas sobre ossujeitos e os objetos das triplas, por meio da especificação de domínios econtradomínios para cada um dos tipos. (ISOTANI; BITTENCOURT,2015)

OWL (Ontology Web Language), segundo Isotani e Bittencourt (2015), “é umalinguagem que estende RDF e RDFS e oferece um conjunto muito mais amplo de tiposde restrições ao conjunto de triplas definidas”. Um dos fundamentos da OWL são asDescription Logics (DL) que especificam precisamente o significado das coisas, de modológico e formal, possibilitando um intercâmbio dessas ontologias entre máquinas e humanos,sem duplo significado. (ISOTANI; BITTENCOURT, 2015)

RDF e suas extensões são capazes de representar relações entre dados na websemântica. A consulta dessas informações pode ser feita através de ferramentas apropria-das. SPARQL Query Language é uma linguagem de consulta para esses dados, estejameles nativamente representados como RDF ou visualizados pelo RDF a partir de ummiddleware. Suas consultas podem retornar um conjunto de resultados ou grafos RDF.(PRUD’HOMMEAUX; SEABORNE et al., 2008) É uma linguagem muito similar aoSQL, sendo diferenciado por estar ligado à web semântica. (ISOTANI; BITTENCOURT,2015) O simples exemplo abaixo mostra a sintaxe básica de uma consulta sobre o códigoilustrativo da Figura 3, onde o resultado deve ser “SPARQL Tutorial”.

Page 29: Uma proposta para abertura dos dados públicos da ... · Resumo O meio de comunicação humano foi revolucionado com a criação e popularização da internet. Essa nova tecnologia

Capítulo 2. Dados Abertos Governamentais 28

2.2.2 Arquiteturas

2.2.2.1 RESTful API

A interoperabilidade dos sistemas de serviço Web permite o reúso de código a partirde sistemas distribuídos garantindo a comunicação entre plataformas de origem diferentes(FILHO, 2009). Nesse quesito, a arquitetura REST é

um estilo arquitetural para sistemas hipermídia distribuídos que enfatizaa generalização das interfaces, a escalabilidade da interação entre oscomponentes e a instalação independente dos mesmos (FIELDING, 2000apud FILHO, 2009)

Leonard e Ruby (2007 apud FILHO, 2009) cunhou o termo “Serviços RESTful”para todo serviço Web que segue os paradigmas que os próprios definem, como a integraçãodo HTTP ao REST. Logo, serviços RESTful são, segundo Filho (2009) compostos porcinco concepções:

a) Recurso: uma abstração ou conceito relevante que existe no domínio tratadopelo serviço em questão;

b) Representação: qualquer informação útil sobre o estado do recurso;

c) Identificador uniforme: atua simultaneamente como nome e localizador dorecurso;

d) Interface unificada: capacidade de reunir em uma única interface várias açõesHTTP (verbos HTTP);

e) Escopo de execução.

2.2.2.2 Dados Conectados

A publicação de dados na internet e a sua estruturação para uso universal compre-ende parte da eficiência total do uso dos dados abertos. Por mais que um certo dado estejana internet, parece natural se ter uma forma de intercambia-lo com outro dado relacionado.Os humanos são perfeitamente hábeis em analisar informações e fazer associações entreelas, gerando novo conhecimento a partir dessas conexões. No entanto, as máquinas nãotem tal capacidade de associação e precisam de uma recurso que permita tal eficiência(SILVA, 2001).

O padrão de dados conectados foi desenvolvido para resolver esse problema. Ointercambio de dados facilita a tarefa de encontrar outros dados relacionados a partir desuas características que se interseccionam resultando em uma nuvem de grafos onde cadaextremo representa um conjunto de dados na Web (BERNERS-LEE, 2006). A Figura 5,criada e mantida por Schmachtenberg et al. (2014), é um resultado extraordinário sobre aquantidade de informações abertas conectadas na rede mundial de computadores.

Page 30: Uma proposta para abertura dos dados públicos da ... · Resumo O meio de comunicação humano foi revolucionado com a criação e popularização da internet. Essa nova tecnologia

Capítulo 2. Dados Abertos Governamentais 29

Figura 4: Em destaque, os dois blocos DAC da Web Semântica.

Fonte: adaptado de Gandon e Herman (2013 apud ISOTANI; BITTENCOURT, 2015, p.32)

De forma complementar, Isotani e Bittencourt (2015) definem dados conectadoscomo “um conjunto de boas práticas para publicar e conectar conjuntos de dados estrutu-rados na Web, com o intuito de criar uma Web de Dados”. Logo, o termo dados conectadosse refere a um espaço formado por todas as informações cujas relações tenham mutualidadeentre si. Mas ao se aplicar as boas práticas de dados conectados aos dados abertos, estespor sua vez adquirem um novo título: dados abertos conectados. Logo, os Dados AbertosConectados (DAC) formam um subconjunto dentro do espaço de dados abertos presentesna Web (ISOTANI; BITTENCOURT, 2015).

DAC é um padrão protagonista no bloco que constitui a chamada web 3.0 como sepode observar na Figura 4, ou ainda, web semântica que, segundo Silva (2001), “envolve oarranjo das ideias e de suas associações de forma não restritiva”, sendo portanto, construída,segundo Isotani e Bittencourt (2015), sobre três pilares básicos que são

a) um modelo de dados padronizados;

b) um conjunto de vocabulários de referência (ontologias);

c) um protocolo padrão de consulta.

Berners-Lee (2006) desenvolveu quatro princípios fundamentais de comportamentopara que a Web esteja mais conectada:

a) Use URIs as names for things;

b) Use HTTP URIs so that people can look up those names;

Page 31: Uma proposta para abertura dos dados públicos da ... · Resumo O meio de comunicação humano foi revolucionado com a criação e popularização da internet. Essa nova tecnologia

Capítulo 2. Dados Abertos Governamentais 30

Figura 5: Diagrama de nuvem de todos os DAC em 2014.

Fonte: Schmachtenberg et al. (2014)

c) When someone looks up a URI, provide useful information, using the standards(RDF, SPARQL);

d) Include links to other URIs. So that they can discover more things.

A primeira regra faz referência a identificação de qualquer coisa por uma URI deforma universal e única. A segunda faz alusão a utilização de HTTP URIs para que pessoasvejam os identificadores. A terceira afirma que quando alguém consulte uma URI, deve-lheser mostrada informações úteis sobre esse identificador a partir de um padrão. A última,mas não menos importante, refere-se a inclusão de links em outras URIs objetivando adescoberta de novas URIs.

Berners-Lee (2006) também desenvolveu um sistema de classificação “cinco estrelas”para que governos e instituições detentoras de dados vejam o nível de abertura a qual elascorrespondem. Uma estrela para dados que estejam sob Open Licence (OL) ou licençalivre; duas estrelas para dados disponibilizados em um formato legível por máquina, isto é,que podem ser reutilizados (RE); três estrelas para dados em formato não proprietário ouOpen Format (OF); quatro estrelas para dados que sigam as recomendações de abertura daW3C (RDF e SPARQL) para identificar recursos e realizar consultas (URI); e finalmentecinco estrelas para organizações que conectem seus dados com dados estrangeiros para

Page 32: Uma proposta para abertura dos dados públicos da ... · Resumo O meio de comunicação humano foi revolucionado com a criação e popularização da internet. Essa nova tecnologia

Capítulo 2. Dados Abertos Governamentais 31

Figura 6: Classificação five stars para dados ou conjunto de dados.

Fonte: Berners-Lee (2006) e Hausenblas (2012)

geração de contexto, ou seja, para que disponibilizam DAC ou Linked Open Data (LOD).(BERNERS-LEE, 2006) Esse modelo de classificação funciona como uma escada, comoexemplo, um dado público em formato legível por máquina que não tenha licença livrenão pode receber uma classificação três estrelas pois não se aplica a estrela fundamental(que é a primeira estrela).

Se as quatro leis forem adotadas como padrão de comportamento por governos,instituições em geral, e se essas organizações se espelharem na classificação de cinco estrelasdos dados abertos ligados de Berners-Lee (2006), haverá novos recursos conectados nainternet que contribuirão para o crescimento da Web semântica a partir da geração denovos conhecimentos e de seu uso por aplicações.

No âmbito da consulta de DAC, o SPARQL é um protocolo de consulta que admitediversos filtros e operadores que podem realizar uma complexa busca de dados em triplasde datasets, além de possibilitar a manipulação sobre os resultados encontrados. Na prática,as consultas SPARQL ocorrem geralmente em pontos de consultas Web denominadosSPARQL endpoints nos quais as consultas e os resultados são retornados via HTTP e emformatos legíveis por humanos ou por máquinas, dependendo da especificação feita peloconsultante (PRUD’HOMMEAUX; BUIL-ARANDA et al., 2013).

Como visto na Figura 7, a consulta via SPARQL em banco de dados de triplasRDF é muito similar a consulta de dados em banco de dados relacionais (SQL) e aindatem um diferencial em relação ao SQL pois a interconectividade entre as informações é

Page 33: Uma proposta para abertura dos dados públicos da ... · Resumo O meio de comunicação humano foi revolucionado com a criação e popularização da internet. Essa nova tecnologia

Capítulo 2. Dados Abertos Governamentais 32

Figura 7: Exemplo de consulta dos dados da Figura 3 usando SPARQL

Fonte: Isotani e Bittencourt (2015)

possível através dos parâmetros e filtros de buscas que podem ser utilizados nos maisdiversos banco de dados de triplas (PENTEADO et al., 2014).

Page 34: Uma proposta para abertura dos dados públicos da ... · Resumo O meio de comunicação humano foi revolucionado com a criação e popularização da internet. Essa nova tecnologia

33

3 Dados Abertos nas Universidades

Informações da empresa de consultoria estadunidense McKinsey & Company revelaque o gasto com educação básica e ensino superior no mundo ultrapassa o valor de $4 trilhõesde dólares; portanto, com tamanho valor aplicado à educação pública, há significativasoportunidades de aplicação desses recursos na melhoria dos serviços prestados. Partindodos dados já existentes, o compartilhamento e padronização dessas informações impactarápositivamente na eficiência e eficácia das instituições de ensino. (MANYIKA et al., 2013)

A aplicação de dados abertos já esta mudando as formas pelas quaisos professores ensinam, os alunos aprendem, os administradores fazemfinanciamento e decisões de despesas, e os graduados encontram os em-pregadores certos. Nós identificamos cinco alavancas que podem permitiro valor potencial do uso de dados abertos na educação: melhora do ensino,melhor adequação dos alunos a cursos, adequação de alunos para o em-prego, mais transparência do financiamento da educação, e administraçãodo sistema mais eficiente. (MANYIKA et al., 2013, p. 17, tradução nossa)

Manyika et al. (2013) explana cinco vertentes:

a) melhora do ensino: os milhares de dados de desempenho de alunos compartilha-dos entre instituições de ensino podem ser usados por instrutores na identificaçãoou refino de técnicas de ensino mais eficientes.

b) melhor correspondência de alunos a cursos: a construção de rankings baseadosem desempenho de escolas e universidades podem ajudar estudantes a escolheremum curso ou uma instituição de ensino que mais se encaixe com suas necessidades,habilidades e interesse.

c) adequação de alunos ao emprego: empresas que usam dados abertos podemter mais sucesso no momento de encontrar um candidato a uma função coma habilidade procurada. De modo semelhante, candidatos podem usar dadosabertos para localizar e se candidatar a cargos que exigem sua competência ehabilidade.

d) mais transparência do financiamento da educação: estudantes podem selecionarum curso a partir da análise de custos reais de diversas instituições adquirindomelhor compreensão sobre trade-offs.

e) sistema de administração mais eficiente: as redes de ensino podem melhorarsubstancialmente seus contratos a partir da exposição dos dados de custo defornecimentos e serviços prestados.

A combinação dessas cinco vertentes impactará em custo adicional para a educaçãoentre $890 bilhões a $1,2 trilhões de dólares anualmente. No entanto, os benefícios tragospor elas valem o valor de sua implementação. (MANYIKA et al., 2013)

Page 35: Uma proposta para abertura dos dados públicos da ... · Resumo O meio de comunicação humano foi revolucionado com a criação e popularização da internet. Essa nova tecnologia

Capítulo 3. Dados Abertos nas Universidades 34

Pode-se considerar que as universidades localizadas no Reino Unido foram aspioneiras no desenvolvimento e aplicação de ferramentas para a exposição de seus dadosde forma ligada. Dessa forma, um número de crescente de instituições de ensino superioreuropeias, sejam públicas ou privadas, iniciaram estudos e disponibilizam seus dados sobreadministração, cursos, geolocalizações, restaurantes, entre outros, em formatos abertos.Por mais que as universidades já tenham disponibilizado seus dados públicos na internet,não havia políticas aplicadas à abertura e muito menos de vinculação desses dados antesdo movimento ocorrido nas instituições do Reino Unido. (D’AQUIN; DIETZE, 2014)

Considerando a distribuição e variedade de provedores (universidades,escolas, governos), temas (disciplinas e tipos de dados educacionais) eusuários (alunos, professores, pais), a educação também representa umcaso de uso perfeito para Linked Open Data.1. (D’AQUIN; DIETZE,2014, tradução nossa)

3.1 Open University (Reino Unido)

Figura 8: Workflow do projeto LUCERO aplicado à OU

Fonte: The LUCERO Project (2011)

A Open University (OU) do Reino Unido disponibiliza seus repositórios de dadosatravés do padrão de dados conectados. Para tanto, o projeto LUCERO foi desenvolvidopor pesquisadores da própria universidade para elaborar mecanismos que objetivassem, apartir de uma série de fluxos de trabalho automáticos representados na Figura 8, a coleta1 Texto original: Considering the distribution and variety of providers (universities, schools, govern-

ments), topics (disciplines and types of educational data) and users (students, teachers, parents),education also represents a perfect use case for Linked Open Data.

Page 36: Uma proposta para abertura dos dados públicos da ... · Resumo O meio de comunicação humano foi revolucionado com a criação e popularização da internet. Essa nova tecnologia

Capítulo 3. Dados Abertos nas Universidades 35

e extração de dados gerados pelos seus departamentos e, em seguida, conectados ao portalcentral, o <data.open.ac.uk>. (ZABLITH et al., 2011)

A Figura 8 mostra o fluxo de trabalho empregado nos repositórios de informaçõesda OU dividido em etapas. Cada componente apresentado deve ser percebido como umserviço REST. Na primeira etapa é realizado a coleta dos dados a partir de agendadores(scheduler) que iniciam a tarefa de coleta de novas informações publicadas. Após, é iniciadoo processo de extração e atualização dos dados disponíveis em RDF das páginas coletadas.A terceira etapa é responsável pela armazenagem dessas informações no banco de dadosorientados a grafos. Na última etapa, são desenvolvidas ferramentas para exposição dessasinformações como o SPARQL endpoint e o Search. (ZABLITH; FERNANDEZ; ROWE,2011)

Segundo Daga et al. (2015), a Open University (OU) divide o conjunto de infor-mações em seu portal de dados de representação, em seis categorias principais de grafosRDF:

a) Open Educational Resources: metadados acerca de recursos educacionais produ-zidos ou co-produzidos pela OU.

b) Scientific Production: dados recolhidos da Open Research Online da OpenUniversity que é um repositória de artigos científicos produzidos na OU.

c) Social Media: conteúdos de mídia que estão frequentemente hospedados emsites de terceiros sendo portanto seus metadados extraídos a partir de APIspúblicas e agregados no padrão RDF.

d) Organizational data, courses, people, news.

e) Research Project Output: dados sobre projetos de pesquisa da OU.

f) Metadata: especifica e documenta a estrutura do banco de dados RDF parasuporte a agentes externos para descobrir, verificar características e comporta-mento apropriado de dados.

3.2 Universidade de Oxford (Reino Unido)A Universidade de Oxford, no Reino Unido, disponibiliza três conjuntos de dados:

a) Courses: repositório de dado sobre os cursos oferecidos à comunidade acadê-mica da universidades. Os dados são extraídos de três fontes principais, ITLearning Programme, Continuing Education e Careers Service. (UNIVERSITYOF OXFORD, 2012a)

b) OxPoints: reune um conjunto de informações geoespaciais completas sobre aOxford consistindo principalmente em “nomes, endereços, endereços Web e

Page 37: Uma proposta para abertura dos dados públicos da ... · Resumo O meio de comunicação humano foi revolucionado com a criação e popularização da internet. Essa nova tecnologia

Capítulo 3. Dados Abertos nas Universidades 36

coordenadas (latitude e longitude) de todos os departamentos, faculdades eoutros prédios/unidades da Universidade, além de alguns dos relacionamentosentre eles”2 (UNIVERSITY OF OXFORD, 2012c, tradução nossa).

c) Vacancies: conjunto de todos os dados acerca das vagas disponíveis nos depar-tamentos da Universidade de Oxford. As informações são extraídas do portal derecrutamento da Universidade de faculdades afiliadas ao serviço. (UNIVERSITYOF OXFORD, 2012f)

Todas essas informações, ao final, são ligadas e oferecidas para consumo através deuma API:

a) JavaScript API: providencia suporte para visualização de mapas (consumindodados do OxPoints), consultas SPARQL e autocomplete. (UNIVERSITY OFOXFORD, 2012b)

b) SPARQL

c) RESTful API: através do terminal <https://data.ox.ac.uk/doc/?uri=> qual-quer página da Universidade que tenha um identificador único (URI), pode serconsultado a partir desse terminal REST. Os metadados são apresentadas emHTML por padrão mas podem ser solicitadas em outros formatos de serialização.(UNIVERSITY OF OXFORD, 2012d)

d) Search: fornece uma busca avança de dados no banco de dados de triplasRDF do serviço de dados abertos da Universidade. O terminal de consulta<https://data.ox.ac.uk/search/> pode ser consultado utilizando parâmetros “q”inseridos nessa URL. Os resultados podem ser retornados em vários formatoscomo HTML, JSON, XML, entre outros. (UNIVERSITY OF OXFORD, 2012e)

3.3 Universidade de Münster (Alemanha)A Universidade de Münster desenvolveu o projeto Linked Open Data University

of Münster (LODUM), esquematizado na Figura 9, para coletar, minerar, armazenar elincar milhares de dados não sensíveis disponíveis nos vários datasets dos departamentosda instituição. Foi a primeira universidade da Alemanha a implementar o padrão dedados abertos ligados por influência das universidades do Reino Unido. (KESSLER;KAUPPINEN, 2012)

No núcleo dessa configuração, um banco de dados OWLIM hospeda os da-dos LODUM. As ferramentas de gerenciamento apoiam tarefas tais comogestão de vocabulário e descoberta de conexão entre os conjuntos de dados

2 Texto original: names, postal addresses, web addresses and co-ordinates (latitude and longitude) forall the departments, colleges and other buildings/units of the University, along with some of therelationships between them

Page 38: Uma proposta para abertura dos dados públicos da ... · Resumo O meio de comunicação humano foi revolucionado com a criação e popularização da internet. Essa nova tecnologia

Capítulo 3. Dados Abertos nas Universidades 37

Figura 9: Workflow do projeto LODUM aplicado à Universidade de Münster

Fonte: Keßler e Kauppinen (2012)

inicialmente desconectados importados para o LODUM. As ferramentasde recuperação expõem o LODUM via páginas HTML específicas dotipo, bem como dados RDF brutos, que também podem ser consultadosatravés do terminal SPARQL na <http://data.uni-muenster.de/sparql>.(KESSLER; KAUPPINEN, 2012, tradução nossa)

Os dados ligados da Universidade de Münster permitiram o desenvolvimento eficazde várias aplicações, a exemplo, Productivity Map of University Researchers que é umailustração em cima das imagens do campus no Google Earth onde a altura dos edifícios éproporcional à quantidade de publicações científicas vinculadas a cada departamento; oaplicativo para dispositivos móveis Westfälische Wilhelms-Universität Münster (WWU)que permite a consulta e visualização de diversas informações sobre lanchonetes, itineráriospara edifícios no campus e uma visão geoespacial sobre toda os prédios da Universidade.(KESSLER; KAUPPINEN, 2012)

Page 39: Uma proposta para abertura dos dados públicos da ... · Resumo O meio de comunicação humano foi revolucionado com a criação e popularização da internet. Essa nova tecnologia

Capítulo 3. Dados Abertos nas Universidades 38

Figura 10: Arquitetura do projeto de dados vinculados abertos aplicado à UniversidadePompeu Fabra

Fonte: Pantoja (2013, p. 67)

3.4 Universidade Pompeu Fabra (Espanha)A Universidade Pompeu Fabra utiliza CKAN3 e Virtuoso4 para fazer todo o processo

de abertura de dados e vinculação como visto na Figura 10. Alguns conjuntos de dadoscom classificação five stars de Berners-Lee (2006) são UPF academic degrees - bachelorand master, list of UPF courses for each academic degree, doctoral programs (PhD) of theUPF, entre outros. (PANTOJA, 2013)

3.5 Campus DataCampus Data5 é um website criado em julho de 2013, durante um evento patrocinado

pelo GitHub6 no qual se reuniram líderes estudantis das Universidades de Columbia, Penn,Rutgers, CMU, Duke e Waterloo, os quais já haviam trabalhado em iniciativas de aberturade dados públicos de fontes não estruturadas do campus. As experiências desses gruposde estudantes são apresentadas nesse website, mais especificamente, no seu campus data3 is used as the core platform to manage our data and at the same time as a tool to publish some content

throught the portal4 is used to publish linked data and as a tool to provide our Sparql Point5 Disponível em: <http://campusdata.org>6 É um serviço de repositório online. Disponível em: <http://github.com>

Page 40: Uma proposta para abertura dos dados públicos da ... · Resumo O meio de comunicação humano foi revolucionado com a criação e popularização da internet. Essa nova tecnologia

Capítulo 3. Dados Abertos nas Universidades 39

Figura 11: Rankings de algumas Universidades por dados abertos disponíveis

Fonte: Campus. . . (2013)

guidebook (guia de dados do campus), como livro guia para interessados. (CAMPUS. . . ,2013)

Em Campus. . . (2013), o livro guia é composto por quatro seções:

a) Problemas administrativos;

b) Coleção de dados;

c) Trabalhando com a comunidade;

d) Continuidade.

Outra relevância apresentada em Campus Data é o campus data rankings queclassifica algumas universidades de acordo com o grau de abertura de seus dados avaliando-as em várias classes como dados de edifícios, cursos, restaurante, eventos, biblioteca, mapas,pessoas, livros, entre outros. O ranking apenas apresenta as universidades que se uniramao movimento de julho de 2013. (CAMPUS. . . , 2013)

Page 41: Uma proposta para abertura dos dados públicos da ... · Resumo O meio de comunicação humano foi revolucionado com a criação e popularização da internet. Essa nova tecnologia

40

4 Metodologia

A publicação de dados abertos governamentais é um processo contínuo, pois sempreexistirá a demanda para abertura de novos dados e a manutenção e melhorais dos jáexistentes. Deste modo, esta sendo proposto seis etapas que deverão ser executadas dentrode ciclos de 12 meses. Ao término de um ciclo, todo o processo será realizado novamente,considerando agora as experiências adquiridas pela primeira execução. Onde a cada anoserão liberados novos grupos de dados. A Figura 12 apresenta as seis etapas propostaspara execução deste projeto.

Figura 12: Ciclo de execução proposto para este projeto.

Fonte: Adaptado de Brasil (2012)

Estas etapas são orientadas pelas diretrizes definidas pela Infraestrutura Nacionalde Dados Abertos (INDA) descritas em Brasil (2012). A execução deste projeto iniciará apartir das escolha dos dados, como descrito a seguir.

4.1 Escolha e modelagem de dadosEsta etapa consiste do levantamento, modelagem e autorização para a publicação

dos dados. Um aspecto importante nesta fase é analisar aspectos de privacidade, segurançae legalidade. Porém, este projeto tem como objetivo tornar abertos os dados que já são

Page 42: Uma proposta para abertura dos dados públicos da ... · Resumo O meio de comunicação humano foi revolucionado com a criação e popularização da internet. Essa nova tecnologia

Capítulo 4. Metodologia 41

atualmente públicos. Deste modo, a escolha dos dados será restrita ao conjunto de dados jádisponíveis. Incluindo não apenas páginas estáticas, mas também aquelas que são geradasdinamicamente, ou seja, que dependem de ações dos usuários para serem geradas. Para aexecução desse trabalho, serão estudas técnicas de raspagem de dados (data scrapping) eusadas na Deep Web (BERGMAN, 2001; MADHAVAN et al., 2008). Diferentemente doque é vinculada na mídia, o conceito de Deep Web não surgiu para prover a ilegalidade naWeb, mas para referir aos dados que estão inacessíveis aos mecanismos de busca, pois elese aplica a conteúdos abrangidos sob tags HTML (MADHAVAN et al., 2008).

A Universidade Federal do Maranhão já disponibiliza um grande volume de dadospúblicos. Neste trabalho, usou-se a classificação proposta por Daga et al. (2015). Osautores classificaram o dataset da Open University em cinco grandes categorias: recursoseducacionais, produção científica, mídia social, dados organizacionais e dados de projetos.Ao utilizar essa classificação, foram identificados os dados apresentados na Tabela 1.

Tabela 1: Principais datasets da UFMA

Dados Descrição Repositório

Recursos educacionais Dados do acervo das bibliotecas e turmas vir-tuais públicas do SIGAA SIGAA Público;

Produção científica Dados de produção científica produzida dentroda Universidade

Repositório digital e Portalde Periódicos.

Mídia social Links de vídeos; tv UFMA; rádio UFMA.Portal UFMA; Canais noYouTube da UFMA; Por-tal Rádio Universidade

Dados organizacionaisEstrutura organizacional da universidadade(unidades, sub-unidades, cursos, docentes, dis-centes e técnicos)

SIGAA Público; SIPACPúblico; SIGRH Público;Portal UFMA

Dados de projetos Dados ; Dados sobre todos os projetos desen-volvidos pelos docentes e discentes; SIGProj

Fonte: Produzido pelo autor

4.2 Definição de arquiteturas e formatosEsta etapa é constituída pelas principais decisões tecnológicas, sendo determinante

para o sucesso do projeto. De acordo Brasil (2012), estas decisões deverão considerarprincipalmente as restrições da infraestrutura computacional e a demanda de publicardados em quantidade e com maior qualidade possível. Nesta etapa será tomada a decisãode quais tecnologias serão utilizadas para a abertura de dados, incluindo arquiteturas e

Page 43: Uma proposta para abertura dos dados públicos da ... · Resumo O meio de comunicação humano foi revolucionado com a criação e popularização da internet. Essa nova tecnologia

Capítulo 4. Metodologia 42

formatos. As duas principais arquiteturas que deverão ser utilizadas é o Linked-Data eRestfull API

4.3 Disponibilização de dadosEsta etapa é engloba o desenvolvimento e a implantação da infraestrutura ne-

cessária para disponibilização de dados escolhidos, utilizando as interfaces e formatosescolhidos na etapa anterior. Deverá ser considerado a possibilidade de criar um domíniohttp://dados.ufma.br. Esse domínio será a base para a construção das URIs necessáriastanto para os servidores Web quanto para os dados ligados.

4.4 Divulgação e participaçãoTodo projeto implantando precisa passar por um processo de validação. No caso

de dados governamentais, a validação precisa ser realizada pela comunidade. Para isso, énecessário um plano para divulgação e para a participação na utilização dos dados abertos.Isso pode ser feito através de maratonas e hackatons, onde o objetivo é o desenvolvimentode aplicativos que utilizam os dados disponibilizados. Esta etapa pode impactar nodesenvolvimento social e econômico, através do incentivo de criações de soluções inovadorascom os dados abertos. Ela tem como objetivo maximizar o alcance e o impacto das açõesde abertura de dados. (BRASIL, 2012)

4.5 Identificação dos principais erros e acertosEsta etapa envolve a elaboração relatórios dos erros e acertos gerencias e tecnológicos

ocorridos nas etapas anteriores. Aproveitaremos esta etapa para identificar oportunidadesde pesquisas científicas, dado que um dos resultados esperados deste projeto é a iniciaçãode pesquisa em dados abertos governamentais, serviços Web e dados ligados (linked-data).

4.6 Continuidade e ManutençãoEsta etapa é constituída por um plano de continuidade é manutenção dos processo

de abertura e dos dados já disponibilizados. Vale lembrar que de acordo com (BRASIL,2012), o maior desafio dos governos que praticam a publicação de dados abertos é tornarsuas iniciativas projetos sustentáveis. Deste modo, este projeto objetiva dar condições quea universidade continue este processo usando o modelo proposto e ou sua adaptação.

Page 44: Uma proposta para abertura dos dados públicos da ... · Resumo O meio de comunicação humano foi revolucionado com a criação e popularização da internet. Essa nova tecnologia

Capítulo 4. Metodologia 43

4.7 Atividades e cronogramaO desenvolvimento completo deste projeto requer aproximadamente 12 meses. Isso

deve-se principalmente a etapa de divulgação e participação. As três primeiras etapaspodem ser realizadas dentro de 6 meses, desde que não seja escolhida um volume muitogrande dados. A Tabela 2 apresenta um cronograma previsto para o desenvolvimento doprojeto:

Tabela 2: Cronograma de atividades a serem executadas.

Mes

Atividade 1 2 3 4 5 6 7 8 9 10 11 12

Escolha e modelagem dos dados

Definição da arquitetura e formatos

Disponibilização de dados

Divulgação e participação

Identificação dos principais erros e acertos

Continuidade e manutenção

Page 45: Uma proposta para abertura dos dados públicos da ... · Resumo O meio de comunicação humano foi revolucionado com a criação e popularização da internet. Essa nova tecnologia

44

5 Considerações Finais

Uma das principais dificuldades da implementação de um serviço de dados abertosda UFMA será o processo de extração de dados não estruturados, pois nessa etapa seránecessário um estudo sobre padrões de como essas informações estão representadas para apartir de então se iniciar a construção de scrapers para o fim. Além deste, outro desafio é aconstrução da plataforma de alimentação e consumo dos dados já estruturados. Além disso,o estímulo do consumo desses dados terá tanta importância quanto o desenvolvimentotécnico deste projeto.

Espera-se que todas as dificuldades que serão enfrentadas durante a experimen-tação deste projeto possam ser mitigadas a partir da aplicação da metodologia iterativaapresentada, de forma que se alcance o objetivo pretendido.

Os benefícios que a implementação deste projeto trará envolve, em primeiro lugar,a comunidade desenvolvedora que foca discentes, docentes, técnicos e outras categoriasrelacionadas direta ou indiretamente com a UFMA, que poderão construir aplicativos apartir do uso da plataforma de disponibilização de dados abertos da Universidade. Esseenvolvimento da comunidade técnica é que irá demostrar a importância da estruturaçãodessas informações que até este momento se encontram fragmentadas nos bancos de dadossob a Universidade.

Page 46: Uma proposta para abertura dos dados públicos da ... · Resumo O meio de comunicação humano foi revolucionado com a criação e popularização da internet. Essa nova tecnologia

45

Referências

ALMEIDA, M. B. Uma introdução ao xml, sua utilização na internet e alguns conceitoscomplementares. Ciência da informação, SciELO Brasil, v. 31, n. 2, p. 5–13, 2002. Citado2 vezes nas páginas 23 e 24.

BERGMAN, M. K. White paper: the deep web: surfacing hidden value. Journal ofelectronic publishing, Michigan Publishing, University of Michigan Library, v. 7, n. 1, 2001.Citado na página 41.

BERNERS-LEE, T. Linked Data. 2006. Disponível em: <https://www.w3.org/DesignIssues/LinkedData.html>. Citado 5 vezes nas páginas 28, 29, 30, 31 e 38.

BRASIL. Congresso Nacional. Lei no 12.527, de 18 de novembro de 2011. Brasília, DF,2011. Citado na página 20.

BRASIL, Controladoria-Geral da União. Manual da Lei de Acesso à Informação paraEstados e Municípios. 1. ed. Brasília, DF, 2013. 7 p. Citado 2 vezes nas páginas 17 e 19.

BRASIL. Ministério do Planejamento, Orçamento e Gestão. Instrução Normativa no

4, 13 de abril de 2012. 2012. Disponível em: <http://www.governoeletronico.gov.br/documentos-e-arquivos/3%20-%20IN%2004%2013-04-12.pdf>. Citado 3 vezes naspáginas 40, 41 e 42.

BRASIL. Senado Federal. Constituição da República Federativa do Brasil. Brasília, DF,1988. Citado na página 20.

BRAY, T. The javascript object notation (json) data interchange format. 2014. Disponívelem: <https://tools.ietf.org/html/rfc7159>. Citado na página 25.

BRAY, T. et al. Extensible markup language (xml). World Wide Web ConsortiumRecommendation REC-xml-19980210. http://www. w3. org/TR/1998/REC-xml-19980210,v. 16, p. 16, 1998. Citado na página 23.

CAMPUS Data. 2013. Disponível em: <http://campusdata.org>. Citado na página 39.

DAGA, E. et al. The open university linked data - data.open.ac.uk. Semantic WebJournal, v. 7, n. 2, p. 183–191, 2015. Disponível em: <http://oro.open.ac.uk/45433/>.Citado 2 vezes nas páginas 35 e 41.

DIETRICH, D. et al. Open data handbook. 2009. Disponível em: <http://opendatahandbook.org>. Citado 2 vezes nas páginas 17 e 18.

DINIZ, V. Como conseguir dados governamentais abertos. In: . Brasília: III CongressoConsad de Gestão Pública, 2010. Disponível em: <https://i3gov.planejamento.gov.br/como_conseguir_dados_governamentais_abertos.pdf>. Citado na página 21.

D’AQUIN, M.; DIETZE, S. Open education: A growing, high impact area for linkedopen data. ERCIM News,(96), 2014. Disponível em: <http://ercim-news.ercim.eu/en96/special/open-education-a-growing-high-impact-area-for-linked-open-data>. Citado napágina 34.

Page 47: Uma proposta para abertura dos dados públicos da ... · Resumo O meio de comunicação humano foi revolucionado com a criação e popularização da internet. Essa nova tecnologia

Referências 46

EAVES, D. The Three Laws of Open Government Data. 2007. Disponível em:<http://eaves.ca/2009/09/30/three-law-of-open-government-data/>. Acesso em: 2 fev.2016. Citado na página 17.

EAVES, D. The Three Laws of Open Government Data. opengovernmentdata.org, 2009.Disponível em: <https://eaves.ca/2009/09/30/three-law-of-open-government-data/>.Acesso em: 20 Julho de 2016. Citado na página 17.

FIELDING, R. T. Architectural styles and the design of network-based softwarearchitectures. Tese (Doutorado) — University of California, Irvine, 2000. Citado napágina 28.

FILHO, O. F. F. Serviços semânticos: uma abordagem RESTful. Tese (Doutorado) —Universidade de São Paulo, 2009. Citado na página 28.

FONSECA, R.; SIMOES, A. Alternativas ao xml: Yaml e json. 2007. Citado na página25.

GANDON, F.; HERMAN, I. An introduction to Semantic Web and Linked Data. Rio deJaneiro, Brasil, 2013. Disponível em: <http://www-sop.inria.fr/members/Fabien.Gandon/docs/www2013/WWW2013_Tutorial_WebSem_FabienGandon.pdf>. Citado na página29.

HAUSENBLAS, M. 2012. Disponível em: <http://5stardata.info/pt-BR/>. Citado napágina 31.

ISOTANI, S.; BITTENCOURT, I. I. Dados Abertos Conectados. São Paulo, Brasil:Novatec Editora, 2015. ISBN 978-85-7522-449-6. Citado 4 vezes nas páginas 26, 27, 29e 32.

KESSLER, C.; KAUPPINEN, T. Linked open data university of münster–infrastructureand applications. In: SPRINGER. Extended Semantic Web Conference. 2012. p. 447–451.Disponível em: <http://kauppinen.net/tomi/lodum-eswc-2012.pdf>. Citado 2 vezes naspáginas 36 e 37.

KLYNE, G.; CARROLL, J. J. Resource description framework (rdf): Concepts andabstract syntax. w3c recommendation, 2004. World Wide Web Consortium, http://w3c.org/TR/rdf-concepts, 2004. Citado na página 23.

LATHROP, D.; RUMA, L. (Org.). Open Governament. 1. ed. Sebastopol, CA: O’ReillyMedia, 2010. ISBN 978-0-596-80435-0. Citado na página 21.

LEONARD, R.; RUBY, S. Restful web services. 2007. Citado na página 28.

MADHAVAN, J. et al. Google’s deep web crawl. Proceedings of the VLDB Endowment,VLDB Endowment, v. 1, n. 2, p. 1241–1252, 2008. Citado na página 41.

MANYIKA, J. et al. Open data: Unlocking innovation and performance with liquidinformation. [S.l.], 2013. Citado na página 33.

OPEN DEFINITION. The Open Definition, 2013. Disponível em: <http://opendefinition.org/od/2.0/pt-br/>. Acesso em: 2 fev. 2016. Citado na página 17.

Page 48: Uma proposta para abertura dos dados públicos da ... · Resumo O meio de comunicação humano foi revolucionado com a criação e popularização da internet. Essa nova tecnologia

Referências 47

OPEN GOVERNMENT WORKING GROUP. 8 Principles of Open Government Data.Sebastopol, CA: opengovdata.org, 2007. Disponível em: <https://public.resource.org/8_principles.html>. Acesso em: 2 fev. 2016. Citado 2 vezes nas páginas 18 e 22.

ORGANIZAÇÃO DAS NAÇÕES UNIDAS. Declaração Universal dos Direitos Humanos.New York, NY, 1948. Citado na página 19.

PANTOJA, J. Linked Open Data at the UPF. 2013. Disponível em: <http://data.upf.edu/upf/docs/2013/jorgepm/lodatupf.pdf>. Citado na página 38.

PENTEADO, R. R. et al. Um estudo sobre bancos de dados em grafos nativos. XERBD-Escola Regional de Banco de Dados, 2014. Citado na página 32.

PRUD’HOMMEAUX, E.; BUIL-ARANDA, C. et al. Sparql 1.1 federated query. W3CRecommendation, v. 21, 2013. Citado na página 31.

PRUD’HOMMEAUX, E.; SEABORNE, A. et al. Sparql query language for rdf. W3Crecommendation, v. 15, 2008. Citado na página 27.

SCHMACHTENBERG, M. et al. The Linking Open Data cloud diagram. 2014. Disponívelem: <http://lod-cloud.net/>. Citado 2 vezes nas páginas 28 e 30.

SECRETARIA DE LOGÍSTICA E TECNOLOGIA DA INFORMAÇÃO. CartilhaTécnica para Publicação de Dados Abertos no Brasil v1.0. 2011. Disponível em:<http://dados.gov.br/cartilha-publicacao-dados-abertos/>. Citado 2 vezes nas páginas22 e 23.

SILVA, G. C. da. RDF e RDFS na Infra-estrutura de Suporte à Web Semântica.Monografia (Graduação) — Universidade Federal de Juiz de Fora, Juiz de Fora, MG,2001. Disponível em: <http://www2.ic.uff.br/~gsilva/slreic.pdf>. Citado 2 vezes naspáginas 28 e 29.

TAUBERER, J. Open Government Data: The Book. 2. ed. [s.n.], 2014. Disponível em:<https://opengovdata.io/2014/the-21st-century-data-policy/>. Citado na página 19.

THE LUCERO PROJECT. Tabloid. 2011. Disponível em: <http://lucero-project.info/lb/tabloid/index.html>. Citado na página 34.

UNIVERSITY OF OXFORD. Courses. 2012. Disponível em: <https://docs.data.ox.ac.uk/datasets/courses.html#data-sources>. Citado na página 35.

UNIVERSITY OF OXFORD. JavaScript API. 2012. Disponível em: <https://docs.data.ox.ac.uk/api/javascript-api.html>. Citado na página 36.

UNIVERSITY OF OXFORD. OxPoints. 2012. Disponível em: <https://docs.data.ox.ac.uk/datasets/oxpoints/index.html>. Citado na página 36.

UNIVERSITY OF OXFORD. RESTful API. 2012. Disponível em: <https://docs.data.ox.ac.uk/api/rest.html>. Citado na página 36.

UNIVERSITY OF OXFORD. Search API. 2012. Disponível em: <https://docs.data.ox.ac.uk/api/search.html>. Citado na página 36.

UNIVERSITY OF OXFORD. Vacancies. 2012. Citado na página 36.

Page 49: Uma proposta para abertura dos dados públicos da ... · Resumo O meio de comunicação humano foi revolucionado com a criação e popularização da internet. Essa nova tecnologia

Referências 48

VILLAZÓN-TERRAZAS, B. et al. Methodological guidelines for publishing governmentlinked data. In: Linking government data. [S.l.]: Springer, 2011. p. 27–49. Citado napágina 22.

W3C. Manual dos Dados Abertos. 2011. Disponível em: <http://www.w3c.br/pub/Materiais/PublicacoesW3C/Manual_Dados_Abertos_WEB.pdf>. Citado 2 vezes naspáginas 21 e 22.

CYGANIAK, R. et al. (Ed.). RDF 1.1 Concepts and Abstract Syntax. [S.l.], 2014.Disponível em: <https://www.w3.org/TR/2014/REC-rdf11-concepts-20140225>. Citadona página 26.

WEISZFLOG, W. Dicionário. In: MELHORAMENTOS (Ed.). Michaelis ModernoDicionário da Língua Portuguesa. 1. ed. [S.l.: s.n.], 2004. Citado na página 17.

ZABLITH, F. et al. Consuming linked data within a large educational organization. In:CEUR-WS.ORG. Proceedings of the Second International Conference on ConsumingLinked Data-Volume 782. [S.l.], 2011. p. 85–96. Citado na página 35.

ZABLITH, F.; FERNANDEZ, M.; ROWE, M. The ou linked open data: production andconsumption. In: SPRINGER. Extended Semantic Web Conference. [S.l.], 2011. p. 35–49.Citado na página 35.