construção de linked data mashup: integração de dados na...

54
Construção de Linked Data Mashup: Integração de Dados na Saúde Pública Gabriel Lopes, Vânia Vidal e Mauro Oliveira.

Upload: others

Post on 04-Sep-2020

3 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Construção de Linked Data Mashup: Integração de Dados na ...sbbd2016.fpc.ufba.br/sbbd2016/slides/ST08_02.pdf · Criar programas de conscientização com as gestantes baseados

Construção de Linked Data Mashup: Integração de Dados na

Saúde Pública

Gabriel Lopes, Vânia Vidal e Mauro Oliveira.

Page 2: Construção de Linked Data Mashup: Integração de Dados na ...sbbd2016.fpc.ufba.br/sbbd2016/slides/ST08_02.pdf · Criar programas de conscientização com as gestantes baseados

● GISSA: Sistema de Apoio a Tomada de Decisões;

● Problemática: Consulta sobre bases heterogêneas;

● Framework para integração de dados;

● Construção de um Linked Data Mashup;

● Consultas sobre a Visão Integrada;

● Conclusão;

● Trabalhos Futuros;

● Referências.

Outline

Page 3: Construção de Linked Data Mashup: Integração de Dados na ...sbbd2016.fpc.ufba.br/sbbd2016/slides/ST08_02.pdf · Criar programas de conscientização com as gestantes baseados

● Projeto de pesquisa com objetivo de auxiliar gestores de Saúde Pública na tomada de decisão em diversos domínios. Prova de conceito em Tauá-CE;

GISSA

Page 4: Construção de Linked Data Mashup: Integração de Dados na ...sbbd2016.fpc.ufba.br/sbbd2016/slides/ST08_02.pdf · Criar programas de conscientização com as gestantes baseados

● Projeto de pesquisa com objetivo de auxiliar gestores de Saúde Pública na tomada de decisão em diversos domínios. Prova de conceito em Tauá-CE;

● Domínio clínico-epidemiológico: pré-natal, puericultura, nascimento e óbito.

GISSA

Page 5: Construção de Linked Data Mashup: Integração de Dados na ...sbbd2016.fpc.ufba.br/sbbd2016/slides/ST08_02.pdf · Criar programas de conscientização com as gestantes baseados

●Como identificar gestações de risco usando as fontes de dados do SUS.

Bases de Dados Heterogêneas

Page 6: Construção de Linked Data Mashup: Integração de Dados na ...sbbd2016.fpc.ufba.br/sbbd2016/slides/ST08_02.pdf · Criar programas de conscientização com as gestantes baseados

Bases de Dados Heterogêneas

Dados sobre Mortalidade no país.

●Como identificar gestações de risco usando as fontes de dados do SUS.

Page 7: Construção de Linked Data Mashup: Integração de Dados na ...sbbd2016.fpc.ufba.br/sbbd2016/slides/ST08_02.pdf · Criar programas de conscientização com as gestantes baseados

●Como identificar gestações de risco usando as fontes de dados do SUS.

Informações sobre o indivíduo: socioeconômicas, saúde, demográfica, etc.

Bases de Dados Heterogêneas

Dados sobre Mortalidade no país.

Page 8: Construção de Linked Data Mashup: Integração de Dados na ...sbbd2016.fpc.ufba.br/sbbd2016/slides/ST08_02.pdf · Criar programas de conscientização com as gestantes baseados

●Como identificar gestações de risco usando as fontes de dados do SUS.

Informações sobre o indivíduo: socioeconômicas, saúde, demográfica, etc.

Informações sobre a gestante, gestação e recém-nascido, etc.

Bases de Dados Heterogêneas

Dados sobre Mortalidade no país.

Page 9: Construção de Linked Data Mashup: Integração de Dados na ...sbbd2016.fpc.ufba.br/sbbd2016/slides/ST08_02.pdf · Criar programas de conscientização com as gestantes baseados

●Como identificar gestações de risco usando as fontes de dados do SUS.

Informações sobre o indivíduo: socioeconômicas, saúde, demográfica, etc.

Informações sobre a gestante, gestação e recém-nascido, etc.

Consulta???

Bases de Dados Heterogêneas

Informações sobre estabecimentos, equipamentos, equipes médicas, etc.

Informa o quantitativo populacional vacinado.

Dados sobre Mortalidade no país.

Page 10: Construção de Linked Data Mashup: Integração de Dados na ...sbbd2016.fpc.ufba.br/sbbd2016/slides/ST08_02.pdf · Criar programas de conscientização com as gestantes baseados

Fatores de Risco: Óbito Infantil

Page 11: Construção de Linked Data Mashup: Integração de Dados na ...sbbd2016.fpc.ufba.br/sbbd2016/slides/ST08_02.pdf · Criar programas de conscientização com as gestantes baseados

Fatores de Risco: Óbito Infantil

Page 12: Construção de Linked Data Mashup: Integração de Dados na ...sbbd2016.fpc.ufba.br/sbbd2016/slides/ST08_02.pdf · Criar programas de conscientização com as gestantes baseados

Fatores de Risco: Óbito Infantil

Page 13: Construção de Linked Data Mashup: Integração de Dados na ...sbbd2016.fpc.ufba.br/sbbd2016/slides/ST08_02.pdf · Criar programas de conscientização com as gestantes baseados

Fatores de Risco: Óbito Infantil

Page 14: Construção de Linked Data Mashup: Integração de Dados na ...sbbd2016.fpc.ufba.br/sbbd2016/slides/ST08_02.pdf · Criar programas de conscientização com as gestantes baseados

Fatores de Risco: Óbito Infantil

Page 15: Construção de Linked Data Mashup: Integração de Dados na ...sbbd2016.fpc.ufba.br/sbbd2016/slides/ST08_02.pdf · Criar programas de conscientização com as gestantes baseados

Fatores de Risco: Óbito Infantil

Page 16: Construção de Linked Data Mashup: Integração de Dados na ...sbbd2016.fpc.ufba.br/sbbd2016/slides/ST08_02.pdf · Criar programas de conscientização com as gestantes baseados

● Objetivo deste trabalho é disponibilizar ao GISSA uma visão integrada das bases e-SUS e SINASC, de forma que um gestor de Saúde possa analisar os fatores de riscos para óbitos-infantis e partos prematuros.

Objetivo

Page 17: Construção de Linked Data Mashup: Integração de Dados na ...sbbd2016.fpc.ufba.br/sbbd2016/slides/ST08_02.pdf · Criar programas de conscientização com as gestantes baseados

2. Framework de Integração

Page 18: Construção de Linked Data Mashup: Integração de Dados na ...sbbd2016.fpc.ufba.br/sbbd2016/slides/ST08_02.pdf · Criar programas de conscientização com as gestantes baseados

●O framework Linked Data Mashup Framework [4] propõe 5 passos para a integração de dados:

Framework:

Page 19: Construção de Linked Data Mashup: Integração de Dados na ...sbbd2016.fpc.ufba.br/sbbd2016/slides/ST08_02.pdf · Criar programas de conscientização com as gestantes baseados

LDMF - L.D. Mashup Framework

5 Passos:

1. Seleção das Fontes de Dados;

Fonte de Dados

Fonte de Dados

Page 20: Construção de Linked Data Mashup: Integração de Dados na ...sbbd2016.fpc.ufba.br/sbbd2016/slides/ST08_02.pdf · Criar programas de conscientização com as gestantes baseados

LDMF - L.D. Mashup Framework

5 Passos:

1. Seleção das Fontes de Dados2. Modelagem da Ontologia de

Aplicação;

Ontologia de Aplicação

Fonte de Dados

Fonte de Dados

Page 21: Construção de Linked Data Mashup: Integração de Dados na ...sbbd2016.fpc.ufba.br/sbbd2016/slides/ST08_02.pdf · Criar programas de conscientização com as gestantes baseados

LDMF - L.D. Mashup Framework

5 Passos:

1. Seleção das Fontes de Dados2. Modelagem da Ontologia de

Aplicação;3. Geração das Ontologias

Exportadas;

Ontologia de Aplicação

Ontologia Exportada

Fonte de Dados

Fonte de Dados

Mapeamentos

Ontologia Exportada

Sub-ontologias

Page 22: Construção de Linked Data Mashup: Integração de Dados na ...sbbd2016.fpc.ufba.br/sbbd2016/slides/ST08_02.pdf · Criar programas de conscientização com as gestantes baseados

LDMF - L.D. Mashup Framework

5 Passos:

1. Seleção das Fontes de Dados2. Modelagem da Ontologia de

Aplicação;3. Geração das Ontologias

Exportadas;4. Identificação das Ligações

(links owl:sameAs);

Ontologia de Aplicação

Ontologia Exportada

Ontologia Exportada

Fonte de Dados

Fonte de Dados

Mapeamentos

owl:sameAs

Page 23: Construção de Linked Data Mashup: Integração de Dados na ...sbbd2016.fpc.ufba.br/sbbd2016/slides/ST08_02.pdf · Criar programas de conscientização com as gestantes baseados

LDMF - L.D. Mashup Framework

5 Passos:

1. Seleção das Fontes de Dados2. Modelagem da Ontologia de

Aplicação;3. Geração das Ontologias

Exportadas;4. Identificação das Ligações

(links owl:sameAs);5. Regras de Fusão e Limpeza

dos Dados.

Ontologia de Aplicação

Ontologia Exportada

Ontologia Exportada

Data Source Data Source

Mapeamentos

owl:sameAs

Regras de FusãoRegras de Fusão

Page 24: Construção de Linked Data Mashup: Integração de Dados na ...sbbd2016.fpc.ufba.br/sbbd2016/slides/ST08_02.pdf · Criar programas de conscientização com as gestantes baseados

3. Construção do Mashup

Page 25: Construção de Linked Data Mashup: Integração de Dados na ...sbbd2016.fpc.ufba.br/sbbd2016/slides/ST08_02.pdf · Criar programas de conscientização com as gestantes baseados

PASSO 1: Seleção das Fontes de Dados;

PASSO 2: Modelagem da Ontologia de Aplicação;

PASSO 3: Geração da Ontologias Exportadas;

PASSO 4: Especificação das heurísticas para descoberta de same-as links;

PASSO 5: Fusão e Limpeza de dados.

Construção Mashup: Passo 1

Page 26: Construção de Linked Data Mashup: Integração de Dados na ...sbbd2016.fpc.ufba.br/sbbd2016/slides/ST08_02.pdf · Criar programas de conscientização com as gestantes baseados

SINASC: Visões Materializadas

Page 27: Construção de Linked Data Mashup: Integração de Dados na ...sbbd2016.fpc.ufba.br/sbbd2016/slides/ST08_02.pdf · Criar programas de conscientização com as gestantes baseados

e-SUS: Visões Materializadas

Page 28: Construção de Linked Data Mashup: Integração de Dados na ...sbbd2016.fpc.ufba.br/sbbd2016/slides/ST08_02.pdf · Criar programas de conscientização com as gestantes baseados

PASSO 1: Seleção das Fontes de Dados;

PASSO 2: Modelagem da Ontologia de Aplicação;

PASSO 3: Geração da Ontologias Exportadas;

PASSO 4: Especificação das heurísticas para descoberta de same-as links;

PASSO 5: Fusão e Limpeza de dados.

Construção Mashup: Passo 2

Page 29: Construção de Linked Data Mashup: Integração de Dados na ...sbbd2016.fpc.ufba.br/sbbd2016/slides/ST08_02.pdf · Criar programas de conscientização com as gestantes baseados

Ontologia de Aplicação

PREFIX gissa:<http://www.atlantico.com.br#>

Page 30: Construção de Linked Data Mashup: Integração de Dados na ...sbbd2016.fpc.ufba.br/sbbd2016/slides/ST08_02.pdf · Criar programas de conscientização com as gestantes baseados

PASSO 1: Seleção das Fontes de Dados;

PASSO 2: Modelagem da Ontologia de Aplicação;

PASSO 3: Geração da Ontologias Exportadas;

PASSO 4: Especificação das heurísticas para descoberta de same-as links;

PASSO 5: Fusão e Limpeza de dados.

Construção Mashup: Passo 2

Page 31: Construção de Linked Data Mashup: Integração de Dados na ...sbbd2016.fpc.ufba.br/sbbd2016/slides/ST08_02.pdf · Criar programas de conscientização com as gestantes baseados

● R2RML: Padrão W3C para mapeamentos de dados Relacionais em RDF [5].

Passo 3 : Mapeamentos R2RML

Page 32: Construção de Linked Data Mashup: Integração de Dados na ...sbbd2016.fpc.ufba.br/sbbd2016/slides/ST08_02.pdf · Criar programas de conscientização com as gestantes baseados

TB_Detalhe_Pessoa

CO UNICO FICHA varchar(96)- alcool- drogas- hipertensao- doenca_cardiaca- cancer- diabetes

Esquema do Banco de Dados

GISSA_REL

gissa:nomeCompleto

gissa:idadeRealgissa:cnsgissa:peso

gissa:Pessoa Mashup Ontology

GISSA_OWL

TB_Pessoa

CO UNICO FICHA varchar(96)- no_pessoa- idade int- dt_nascimento- nu_cns

Page 33: Construção de Linked Data Mashup: Integração de Dados na ...sbbd2016.fpc.ufba.br/sbbd2016/slides/ST08_02.pdf · Criar programas de conscientização com as gestantes baseados

TB_Detalhe_Pessoa

CO UNICO FICHA varchar(96)- alcool- drogas- hipertensao- doenca_cardiaca- cancer- diabetes

Esquema do Banco de Dados

GISSA_REL

gissa:nomeCompleto

gissa:idadeRealgissa:cnsgissa:peso

gissa:Pessoa Mashup Ontology

GISSA_OWL

TB_Pessoa

CO UNICO FICHA varchar(96)- no_pessoa- idade int- dt_nascimento- nu_cns

R2RML

Page 34: Construção de Linked Data Mashup: Integração de Dados na ...sbbd2016.fpc.ufba.br/sbbd2016/slides/ST08_02.pdf · Criar programas de conscientização com as gestantes baseados
Page 35: Construção de Linked Data Mashup: Integração de Dados na ...sbbd2016.fpc.ufba.br/sbbd2016/slides/ST08_02.pdf · Criar programas de conscientização com as gestantes baseados

PASSO 1: Modelagem da Ontologia de Domínio;

PASSO 2: Seleção da Fontes de Dados;

PASSO 3: Geração da Ontologias Exportadas (esquemas);

PASSO 4: Especificação das heurísticas para descobertas de links sameAs;

PASSO 5: Limpeza de dados.

Mashup DATASUS: Passo 4

Page 36: Construção de Linked Data Mashup: Integração de Dados na ...sbbd2016.fpc.ufba.br/sbbd2016/slides/ST08_02.pdf · Criar programas de conscientização com as gestantes baseados

Passo 4 : Descoberta dos Links SameAs

● Para descoberta dos links owl:sameAs, foi utilizado a ferramenta SILK[2].

● Pessoas◦Nome Completo;◦ Data de Nascimento;◦ CNS - Cartão Nacional da Saúde

Page 37: Construção de Linked Data Mashup: Integração de Dados na ...sbbd2016.fpc.ufba.br/sbbd2016/slides/ST08_02.pdf · Criar programas de conscientização com as gestantes baseados
Page 38: Construção de Linked Data Mashup: Integração de Dados na ...sbbd2016.fpc.ufba.br/sbbd2016/slides/ST08_02.pdf · Criar programas de conscientização com as gestantes baseados

PASSO 1: Modelagem da Ontologia de Domínio;

PASSO 2: Seleção da Fontes de Dados;

PASSO 3: Geração da Ontologias Exportadas (esquemas);

PASSO 4: Especificação das heuristicas para descobertas de same-as links;

PASSO 5: Fusão dos Dados.

Mashup DATASUS: Passo 5

Page 39: Construção de Linked Data Mashup: Integração de Dados na ...sbbd2016.fpc.ufba.br/sbbd2016/slides/ST08_02.pdf · Criar programas de conscientização com as gestantes baseados

Passo 5 : Fusão dos Dados

● Para a Fusão, foi utilizada a ferramenta SIEVE[3].

● Base mais confiável: e-SUS

Page 40: Construção de Linked Data Mashup: Integração de Dados na ...sbbd2016.fpc.ufba.br/sbbd2016/slides/ST08_02.pdf · Criar programas de conscientização com as gestantes baseados
Page 41: Construção de Linked Data Mashup: Integração de Dados na ...sbbd2016.fpc.ufba.br/sbbd2016/slides/ST08_02.pdf · Criar programas de conscientização com as gestantes baseados
Page 42: Construção de Linked Data Mashup: Integração de Dados na ...sbbd2016.fpc.ufba.br/sbbd2016/slides/ST08_02.pdf · Criar programas de conscientização com as gestantes baseados

3.1 Interface de Consultas

Page 43: Construção de Linked Data Mashup: Integração de Dados na ...sbbd2016.fpc.ufba.br/sbbd2016/slides/ST08_02.pdf · Criar programas de conscientização com as gestantes baseados

SPARQL EndPoint

● EndPoint criado com o Apache Fuseki[1]

Page 44: Construção de Linked Data Mashup: Integração de Dados na ...sbbd2016.fpc.ufba.br/sbbd2016/slides/ST08_02.pdf · Criar programas de conscientização com as gestantes baseados

● Todas as recém-gestantes Fumantes?

● Todas as recém-gestantes Fumantes e Hipertensas?

Consultas sobre a Visão Integrada

Page 45: Construção de Linked Data Mashup: Integração de Dados na ...sbbd2016.fpc.ufba.br/sbbd2016/slides/ST08_02.pdf · Criar programas de conscientização com as gestantes baseados

● O peso dos bebês nascidos de mães fumantes?

Consultas sobre a Visão Integrada

Page 46: Construção de Linked Data Mashup: Integração de Dados na ...sbbd2016.fpc.ufba.br/sbbd2016/slides/ST08_02.pdf · Criar programas de conscientização com as gestantes baseados

● Esse trabalho vai permitir :● analisar a relação entre maus-hábitos durante a gravidez com

problemas no parto e/ou no recém-nascido;

Conclusão e Trabalhos Futuros

Page 47: Construção de Linked Data Mashup: Integração de Dados na ...sbbd2016.fpc.ufba.br/sbbd2016/slides/ST08_02.pdf · Criar programas de conscientização com as gestantes baseados

● Esse trabalho vai permitir :● analisar a relação entre maus-hábitos durante a gravidez com

problemas no parto e/ou no recém-nascido;● Criar programas de conscientização com as gestantes baseados

em históricos de casos de problemas;

Conclusão e Trabalhos Futuros

Page 48: Construção de Linked Data Mashup: Integração de Dados na ...sbbd2016.fpc.ufba.br/sbbd2016/slides/ST08_02.pdf · Criar programas de conscientização com as gestantes baseados

● Esse trabalho vai permitir :● analisar a relação entre maus-hábitos durante a gravidez com

problemas no parto e/ou no recém-nascido;● Criar programas de conscientização com as gestantes baseados

em históricos de casos de problemas;● Potencialmente, diminuir casos de óbitos-infantis e partos

prematuros.

Conclusão e Trabalhos Futuros

Page 49: Construção de Linked Data Mashup: Integração de Dados na ...sbbd2016.fpc.ufba.br/sbbd2016/slides/ST08_02.pdf · Criar programas de conscientização com as gestantes baseados

● Esse trabalho vai permitir :● analisar a relação entre maus-hábitos durante a gravidez com

problemas no parto e/ou no recém-nascido;● Criar programas de conscientização com as gestantes baseados

em históricos de casos de problemas;● Potencialmente, diminuir casos de óbitos-infantis e partos

prematuros.● Como Trabalhos Futuros:

● Enriquecer o Mashup utilizando outras bases de dados (e.g. SIM, DBPedia);

Conclusão e Trabalhos Futuros

Page 50: Construção de Linked Data Mashup: Integração de Dados na ...sbbd2016.fpc.ufba.br/sbbd2016/slides/ST08_02.pdf · Criar programas de conscientização com as gestantes baseados

● Esse trabalho vai permitir :● analisar a relação entre maus-hábitos durante a gravidez com

problemas no parto e/ou no recém-nascido;● Criar programas de conscientização com as gestantes baseados

em históricos de casos de problemas;● Potencialmente, diminuir casos de óbitos-infantis e partos

prematuros.● Como Trabalhos Futuros:

● Enriquecer o Mashup utilizando outras bases de dados (e.g. SIM, DBPedia);

● Aplicar anonimização nos dados;

Conclusão e Trabalhos Futuros

Page 51: Construção de Linked Data Mashup: Integração de Dados na ...sbbd2016.fpc.ufba.br/sbbd2016/slides/ST08_02.pdf · Criar programas de conscientização com as gestantes baseados

● Esse trabalho vai permitir :● analisar a relação entre maus-hábitos durante a gravidez com

problemas no parto e/ou no recém-nascido;● Criar programas de conscientização com as gestantes baseados

em históricos de casos de problemas;● Potencialmente, diminuir casos de óbitos-infantis e partos

prematuros.● Como Trabalhos Futuros:

● Enriquecer o Mashup utilizando outras bases de dados (e.g. SIM, DBPedia);

● Aplicar anonimização nos dados;● Desenvolver um Framework que reutilize a especificação

gerada num Mashup.

Conclusão e Trabalhos Futuros

Page 52: Construção de Linked Data Mashup: Integração de Dados na ...sbbd2016.fpc.ufba.br/sbbd2016/slides/ST08_02.pdf · Criar programas de conscientização com as gestantes baseados

[1] Apache (2015). Apache Jena FUSEKI available at https://jena.apache.org/documentation/serving_data/[2] Bizer, C., Volz, J., Kobilarov, G., and Gaedke, M. (2009b). Silk - a link discovery framework for the web of data. In 18th International World Wide Web Conference. [3] Mendes, P. N., Muhleisen, H., and Bizer, C. (2012). Sieve: Linked Data Quality Asses- ¨ sment and Fusion. In 2nd International Workshop on Linked Web Data Management (LWDM 2012) at the 15th International Conference on Extending Database Technology, EDBT 2012, page to appear.[4] V. M. P. Vidal, M. A. Casanova, N. Arruda, M. Roberval, L. P. Leme, G. R. Lopes, and C. Renso. Advanced Information Systems Engineering: 27th International Conference, CAiSE 2015, Stockholm, Sweden, June 8-12, 2015, Proceedings, chapter Specification and Incremental Maintenance of Linked Data Mashup Views, pages 214–229. Springer International Publishing, Cham, 2015.[5] W3C (2016). R2RML RDB to RDF Mapping Language. available athttps://www.w3.org/TR/r2rml/.

Referências

Page 53: Construção de Linked Data Mashup: Integração de Dados na ...sbbd2016.fpc.ufba.br/sbbd2016/slides/ST08_02.pdf · Criar programas de conscientização com as gestantes baseados

Leiam o artigo :)

Page 54: Construção de Linked Data Mashup: Integração de Dados na ...sbbd2016.fpc.ufba.br/sbbd2016/slides/ST08_02.pdf · Criar programas de conscientização com as gestantes baseados