análise do problema

29
Multi-Dimensional Service- Oriented Ontology Mapping Nuno Alexandre Pinto da Silva

Upload: ipo

Post on 20-Mar-2016

40 views

Category:

Documents


3 download

DESCRIPTION

Análise do problema. Observações Necessidade de automatizar o processo de interoperabilidade Diferentes comunidades de informação Diferentes conceptualizações de domínios parcialmente sobrepostos Interoperabilidade baseada em dados ou informação. Problema - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Análise do problema

Multi-Dimensional Service-Oriented Ontology Mapping

Nuno Alexandre Pinto da Silva

Page 2: Análise do problema

2

Análise do problema

• Observações• Necessidade de automatizar o processo de interoperabilidade

• Diferentes comunidades de informação

• Diferentes conceptualizações de domínios parcialmente sobrepostos

• Interoperabilidade baseada em dados ou informação

Problema

É pouca e pobre a interoperabilidade automática entre

diferentes comunidades de informação

Page 3: Análise do problema

3

Objectivos

Investigação dum processo semi-automático de mapeamento de ontologias que facilite a interoperabilidade baseada em conhecimento

entre entidades heterogéneas.

Desenvolvimento de ferramentas que permitam avaliar a viabilidade e utilidade das ideias resultantes da investigação realizada,

nomeadamente no contexto da Web Semântica.

Page 4: Análise do problema

4

Requisitos identificados

• Áreas analisadas• Sistemas de informação

• Web semântica

• Organizações virtuais e Negócios electrónicos

• Gestão do conhecimento

• Requisitos• Identificação, especificação e representação de relações entre conceptualizações

• Transformação da informação das comunidades de acordo com as relações anteriores

• Negociação das relações anteriores entre comunidades de informação

• Manutenção das relações anteriores

• Integração (mas minimização da participação do) ser humano no processo

• Adopção de tecnologia do âmbito da web semântica

Page 5: Análise do problema

5

Ontologia

• “ontologia é uma especificação explícita duma conceptualização ” (Gruber, 1993)

• “ontologia é uma especificação explícita e formal duma conceptualização partilhada” (Studer et al., 1998)

• Ontologia vs. Esquema de base de dados

• Ontologia descreve um domínio de conhecimento segundo uma perspectiva

-nome-género

O1:Indivíduo

O1:Familia

-nome-sobrenome-num_casamentos-endereço

O2:Pessoa

O2:Homem

O2:Mulher

esposoEm

-rua-localidade

O1:Endereço

viveEm

Page 6: Análise do problema

6

Ontologia

Conceitos

Hierarquia de conceitos

Propriedades

Propriedades e conceitos

Nível Léxico

Nível semântico

Modelo de Ontologia

2_ ,is a Mulher Pessoa

1 : ,esposoEm Indivíduo Família

2 2 2: " " , , (" ", ,Person Person Pessoa P PL L

2 : , ,Pessoa Mulher HomemC_is a C C

: , ,esposoEm nome rua1P : 2 \ 2 \Literal CCP \

: , , , C P C PL L L ,1max_cardinality género

2 2 2 2 2 2: , _ , ,is a O C P L A

-nome-género

O1:Indivíduo

O1:Familia

-nome-sobrenome-num_casamentos-endereço

O2:Pessoa

O2:Homem

O2:Mulher

esposoEm

-rua-localidade

O1:Endereço

viveEm

: , _ , , , ,is a O C P L A

P

C

A

Page 7: Análise do problema

7

Base de Conhecimento

Instâncias de conceitos

Instanciação de conceitos

Instanciação de propriedades

Modelo de Base de Conhecimento

: , , ,inst instKB O I C P

nome = Napoleongénero = Bonapart

i1 : O1:Indivíduo

rua = Versailleslocalidade = Paris

e1 : O1:Endereço

rua = Scholburglocalidade = Wien

e2 : O1:Endereço

f1 : O1:Familia

f2 : O1:Familia

: 2inst IC C

1 1 1 1 1: , , ,inst instKB O I C P 1 : 1, 1, 2, 1, 2," "," ",...i e e f f Versailles ParisI

1 : , 1, 2 , , " "," "inst Pessoa i i Literal Paris VersaillesC 1 : 1, 1 , 1," "inst viveEm i e rua e VersaillesP: 2 2inst C CP P

I

Page 8: Análise do problema

8

Mapeamento de Ontologias

Um processo em duas fases:

1. A nível Intencional• Especificação de relações semânticas entre• Entidades da ontologia de origem (i.e. conceitos, relações, atributos), e• Entidades da ontologia de destino

2. A nível Extensional• Executar as relações semânticas especificadas,• Transformando instâncias da ontologia de origem em• Instâncias da ontologia de destino

Page 9: Análise do problema

9

Nív

el E

xten

sion

al

nome = Napoleon Bonapartgénero = M

i1 : O1:Indivíduo

nome = Joséphine de Tashergénero = F

i2 : O1:Indivíduo

Nív

el In

tenc

iona

l

-nome-género

O1:Indivíduo -nome-sobrenome-endereço-num_casamentos

O2:Pessoa

Ou seja…

O1:Indivíduo é semanticamenteequivalente a O2:PessoaeO1:Indivíduo.nomeé semanticamente equivalente aO2:Pessoa.nome eO2:Pessoa.sobrenome

Transformação

nome = Napoleonsobrenome = Bonapartendereçonum_casamentos

p1 : O2:Pessoa

nome = Joséphinesobrenome = de Tasherendereçonum_casamentos

p2 : O2:Pessoa

Page 10: Análise do problema

10

Interfacegráfica

Conhecim.&

Restriçõesdo

Domínio

Conhecim.&

Restriçõesdo

Domínio

EspecificaçãoEspecificação

Medição de SemelhançasMedição de Semelhanças

ExecuçãoExecução

MAFRA – MApping FRAmework

„Lift“ & Normalização

Pós-processamento

NegociaçãoEvolução Interfacegráfica

Page 11: Análise do problema

11

Conceptualização

• Tipos de heterogeneidade• Sintáctica• Modelo• Semântica

• Dimensões identificadas das relações semânticas:• Tipos de entidades• Transformação• Cardinalidade• Restrições• Estrutura

-nome-género

O1:Indivíduo

O1:Familia

-nome-sobrenome-num_casamentos-endereço

O2:Pessoa

O2:Homem

O2:Mulher

esposoEm

-rua-localidade

O1:Endereço

viveEm

Conceito-Conceito c/ condição

Conceito-Conceito

Conceito-Atributo

Relação-Atributo

Atributo-Atributos

Page 12: Análise do problema

12

Mapeamento

ConceptBridge (CB)

PropertyBridges (PB)

Serviços

Relação entre CBs e PBs

Hierarquia entre CBs

I2M : ConceptBridgeif género=”F”

e2nC : PropertyBridgeservice=CountRelations

I2H : ConceptBridgeif género=”M”

-nome-género

O1:Indivíduo

O1:Familia

-nome-sobrenome-num_casamentos-endereço

O2:Pessoa

O2:Homem

O2:Mulher

esposoEm

-rua-localidade

O1:Endereço

viveEm

Representação – Semantic Bridging Ontology (SBO)

1 1 2 1 1 1 1 1 1 1 1 1: , , , , , , , , , , C P C PC P B B B BM O O T B B A A

I2P : ConceptBridge

n2ns : PropertyBridge

AB : AB-of-ConceptBridge

abstract=true

12 : , , , , , , , , ,s t s tn ns B nome nome sobrenome Split P PQ K B 12 : , , , , ,s tI P B Indivíduo Pessoa C CQ K B

1: " . . ", , , ,s tSplit Service pt mafra Split sourceAttribute arrayOfAttributes T

1: , , ,Mulher Pessoa Homem Pessoa

1 : 2 ,{ 2 , 2 }I P n ns e nC

service=Split

Page 13: Análise do problema

13

Representação - Semantic Bridging Ontology (SBO)

• SBO é uma ontologia acerca do processo de mapeamento entre ontologias

• SBO é uma meta-ontologia

• Instanciação de SBO é um mapeamento entre ontologias

• Trata-se de:• Taxonomia de relações semânticas (pontes semânticas)

• Relações entre pontes semânticas

• Caracterização semântica das pontes semânticas e das suas relações

• Mecanismos de transformação

• Mecanismos de controlo do fluxo de transformação

• Mecanismos de manipulação das entidades das ontologias

• Caracterização semântica das relações entre pontes semânticas e entidades

• Implementada completamente em código Java

• Implementada parcialmente em RDFS e DAML+OIL

Page 14: Análise do problema

14

• Processo em duas fases

• Vantagens:• Inexistência de ordem de execução entre pontes semânticas

• Especificação e compreensão simples do mapeamento

• Execução determinística

Execução

Execução de

ConceptBridges

BC deorigem

BC dedestino

Execução de

PropertyBridges

Page 15: Análise do problema

15

ID da instância de

origem

ID da instância de

destino ConceptBridge

p1 pX CB1 e1 eY CB2 e2 eZ CB2

Execução – Transformation Information Table (TI2)

-nome

O1:Pessoa-nome-sobrenome

O2:Pessoa

nome

p1 : O1:Pessoa

O1:Endereço O2:Endereço

viveEm viveEm

e1 : O1:Endereço

e2 : O1:Endereço

nomesobrenome

pX : O2:Pessoa

ExecuçãoeY : O2:Endereço

eZ : O2:Endereço

PB1 : PropertyBridge

CopyRelation : Service

CB1 : ConceptBridge

CB2 : ConceptBridge

ID da instância de

origem Pessoa/ viveEm/ Endereço

p1 e1 p2 e2

Interrogação e Filtragem

Page 16: Análise do problema

16

Execução – Especificação extensional

-nome-género

O1:Indivíduo

O1:Familia

-nome-sobrenome-num_casamentos-endereço

O2:Pessoa

esposoEm

-rua-localidade

O1:Endereço

viveEm

nomesobrenomenum_casamentosendereço = Porto

Vila Real

pX : O2:Pessoa nomegénero

p3 : O1:Indivíduo

Execução

CB3 : ConceptBridge

rualocalidade

e3 : O1:Endereçorualocalidade

e4 : O1:Endereço

ID da instância de origem

Especificação extensional ID da

instância de destino

ConceptBridge

pX p3 CB3 pX Pessoa/ endereço/ Literal=”Porto” e3 CB4 pX Pessoa/ endereço/Literal=”Vila Real” e4 CB4

PB2 : PropertyBridge

ID da instância de origem

Pessoa/ endereço/ Literal

pX “Porto” pX “Vila Real”

Interrogação e Filtragem

CB4 : ConceptBridge

endereço==endereço

Page 17: Análise do problema

17

Serviços Multi-dimensionais

• Observações

• Capacidade de transformação virtualmente incompleta

• Papel central dos serviços de transformação

• Especificação

• Negociação

• Evolução

• Proposta

• Serviços competentes em diversas fases do processo (multi-dimensionais)

• Serviços independentes das fases do processo de mapeamento

• Serviços auto-caracterizados

• Serviços automaticamente interligáveis com o resto do sistema

Page 18: Análise do problema

18

Arquitectura de sistema

MAFRA Service Interface (API)

Spl

it

Cop

yIn

stan

ce

Cop

yR

elat

ion

Cop

yA

ttrib

ute

Con

cate

nate

Cur

renc

yC

onve

rter

Ser

vice

X

Attr

ibut

eTab

leTr

ansl

atio

n

EspecificaçãoManual

EspecificaçãoAutomática Execução Negociação Evolução

Instânciasorigem

Instânciade SBO

Ontologia origem Semantic BridgeOntology

Ontologia destino

Medição deSemelhanças

Esquema origem Esquema destino

Instânciasdestido

DB

Instâncias origem

DB

Instâncias destino

MAFRA Core Engine

“Lift” & Normalização

Page 19: Análise do problema

19

Processo automático de especificação

BC deorigem BC de

destino

Clustering

CopyInstance

Split

CopyAttribute

CopyRelation

serviços

Currency Converter

Matching

MOMIS like

Resnik like

Type matcher

Hyponymic

Matcher Y

matchers

Semantic Bridging

serviços

SBO

CopyInstance

Split

CopyAttribute

CopyRelation

Currency Converter

Clusters

,Service Matches

Matches

, , , ,SE TE Matcher Value Justifications

Page 20: Análise do problema

20

Implementação – MAFRA Toolkit

Page 21: Análise do problema

21

• Projectos nacionais

• Projectos internacionais

Aplicações

• OntoMapper I&D de soluções de mapeamento entre ontologias

• SANSKI I&D de soluções e interoperabilidade baseada em conhecimento na empresa virtual

• Harmonise Interligação entre grandes operadores turísticos

• Artemis Interligação de informação de repositórios de informação médica

• Satine Interligação entre pequenas e médias empresas de turismo

• Harmo-TEN follow up do projecto Harmonise, com vista a desenvolver soluções pré-comerciais

Page 22: Análise do problema

22

Experiências

• Harmonise

OntologiaAlojamento Eventos

ConceitosPropriedes

ConceitosPropriedades

Atributos Relações Atributos RelaçõesIMHO 136 340 543 86 174 328MEK 2 104 1 1 47 0TIS 26 57 26 38 41 38

WoW - - - 20 40 20

Alojamento

Ontologia origem Ontologia destino ConceptBridges

PropertyBridges

IMHO WoW 12 33WoW IMHO 26 64IMHO MEK 1 39MEK IMHO 28 70TIS IMHO 23 46

EventosOntologia origem Ontologia destino ConceptBridge

sPropertyBridge

sMEK IMHO 26 74IMHO TIS 11 45

Page 23: Análise do problema

23

Comparação

• MAFRA Toolkit vs. OntoMerge

Características OntoMerge MAFRA Toolkit

Estratégia de mapeamento Mapping através de merging Mapping puro

Representação das pontes semânticas Axiomas em Web-PDDL Instâncias RDF de SBO

Estratégia de execução Inferência Funcional

Representação de Ontologia Web-PDDL RDFS com ext. léxicas

Representação de BC Web-PDDL RDF

Input Ficheiro RDF na Web Ficheiro RDF

Output Ficheiro RDF na Web Ficheiro RDF

Ambiente de execução Web Java virtual machine

Disponibilidade Privado Público

OntoMerge MAFRA Toolkit

Pentium III 800 MHz Pentium II Pentium 4M

Experiência em 2002 Experiência em 2003 Experiências em 2003

1320 segundos 59 segundos < 120 segundos < 77 segundos

Page 24: Análise do problema

24

Conclusões (1)

• MAFRA – MApping FRAmework• Sistematiza e organiza as fases do processo de mapeamento de ontologias

• Propõe e representa um processo de mapeamento

• Processo iterativo e interactivo

• Funciona como uma ferramenta de classificação e caracterização e trabalhos relacionados

• Semantic Bridging Ontology (SBO)• Conceptualização do problema de especificação de relações semânticas

• Conceptualização simples e compacta

• Completamente formalizada

• Método declarativo da representação das relações semânticas

• Possibilidade de múltiplas notações e sintaxes

Page 25: Análise do problema

25

Conclusões (2)

• Processo de execução• Processo genérico baseado em cinco fases: interrogação-filtragem-transformação-

filtragem-instanciação

• Processo funcional suportado por serviços externos

• Restrições de execução sobre ambas as bases de conhecimento

• Formalização completa baseada em álgebra relacional

• Especificação extensional

• Arquitectura baseada em serviços multi-dimensionais• Serviço é promovido a Serviço Multi-dimensional

• Serviços independentes das fases do processo de mapeamento

• Serviços auto-descritivos e auto-caracterizáveis

• Serviços dinamicamente interligáveis

Page 26: Análise do problema

26

Conclusões (3)

• Processo automático de especificação de pontes semânticas• Caso de teste da arquitectura baseada em serviços multi-dimensionais

• Serviços parameterizáveis

• Matches são entidades genéricas e independentes do sistema

• Adopta, segue e explora a caracterização semântica proposta na SBO

• Gera um mapeamento válido

• MAFRA Toolkit

• Aplicações e Experiências• Diversas áreas de aplicação

• Diversos projectos internacionais

Page 27: Análise do problema

27

Trabalho futuro

• Combinação de serviços

• Abstração da representação da especificação extensional

• Processo automático de especificação

• Melhoria da interface gráfica

• Evolução

• Negociação

• Integração em sistemas de terceiros

• Re-engenharia do MAFRA Toolkit

• Standardização

• Experiências

Page 28: Análise do problema

28

Publicações mais relevantes

• “Multi-Dimensional Service-Oriented Ontology Mapping”; Nuno Silva e João Rocha; International Journal of Web Engineering and Technology; Inderscience Publishers; aceite para publicação.

• “Proposal for the combination of ontology assemble and ontology mapping processes”; Nuno Silva, Jorge Santos e João Rocha; ICKEDS’2004; Porto, Portugal; Julho de 2004.

• Semantic Web Complex Ontology Mapping; Nuno Silva e João Rocha; Web Intelligence and Agent Systems Journal; 1(3-4) 235-248; IOS Press; 2003.

• “Ontology Mapping for Interoperability in Semantic Web”; Nuno Silva e João Rocha; ICWI'2003; Algarve, Portugal; Novembro de 2003.

• “Service-Oriented Ontology Mapping System”; Nuno Silva e João Rocha; ISWC’2003 Workshop on Semantic Integration; Sanibel Island (FL), EUA; Outubro de 2003.

• “E-Business Interoperability through Ontology Semantic Mapping”; Nuno Silva, João Rocha e José Cardoso; PRO-VE’2003; Lugano, Suiça; Outubro de 2003.

• “Semantic Web Complex Ontology Mapping”; Nuno Silva e João Rocha; IEEE Web Intelligence 2003 conference; Halifax, Canada; Outubro de 2003.

• “MAFRA – An Ontology MApping FRAmework for the Semantic Web”; Nuno Silva e João Rocha; 6th BIS; Colorado Springs (CO), EUA; Maio de 2003.

• “MAFRA - A Mapping Framework for Distributed Ontologies”; A. Maedche, B. Motik, N. Silva, R. Volz; 13th EKAW, Madrid, Espanha, Setembro de 2002.

• “MAFRA - A Mapping Framework for Distributed Ontologies in the Semantic Web”; A. Maedche, B. Motik, N. Silva, R. Volz; ECAI WS on Knowledge Transformation; Lyon, França, Julho de 2002.

• “Merging Ontologies using a Bottom-up Lexical and Structural Approach”; Nuno Silva e João Rocha; 7th ISKO; Granada, Espanha; Julho de 2002.

Page 29: Análise do problema

Multi-Dimensional Service-Oriented Ontology Mapping

Nuno Alexandre Pinto da Silva