utilização de ontologias para integração de heterogeneidade semântica leandro alves da silva...

30
Utilização de Ontologias para Integração de Heterogeneidade Semântica Leandro Alves da Silva email : [email protected]

Upload: joao-guilherme-carlos-eduardo-da-cunha-rijo

Post on 07-Apr-2016

217 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Utilização de Ontologias para Integração de Heterogeneidade Semântica Leandro Alves da Silva email : leandroa@ipt.br

Utilização de Ontologias para Integração de Heterogeneidade

Semântica

Leandro Alves da Silva

email : [email protected]

Page 2: Utilização de Ontologias para Integração de Heterogeneidade Semântica Leandro Alves da Silva email : leandroa@ipt.br

Internet

Redes

Inter-Relacionadas

página

email

arquivos de dados

imagem

vídeo

bancos de dados

som

Recursos

Page 3: Utilização de Ontologias para Integração de Heterogeneidade Semântica Leandro Alves da Silva email : leandroa@ipt.br

Estudo do significado da palavra, que nos explica a origem e as variações da significação vocabular

Semântica

Monossemia : Representa apenas um conceito. O termo nesta condição é chamado monosema. Esta é a relação ideal entre conceitos, pois reduz a ambigüidade

Page 4: Utilização de Ontologias para Integração de Heterogeneidade Semântica Leandro Alves da Silva email : leandroa@ipt.br

Semântica

Homonímia : Termos idênticos na forma fonética (homófonos) e ou, na forma gráfica (termos homógrafos) e ou em ambas.

Seção (corte) , Sessão (reunião) Termos homófonosManga (fruta) , Manga (paletó) Termos homófonos e

homógrafos

Sinonímia : Termos diferentes (sinônimos), que representam o mesmo conceito

Carro , Automóvel

Page 5: Utilização de Ontologias para Integração de Heterogeneidade Semântica Leandro Alves da Silva email : leandroa@ipt.br

Como ontologias podem ajudar a resolver problemas de heterogeneidade semântica ?

Disponibilizar aos usuários da Internet padrões de criação derecursos.

Mudar de HTML para XML, RDF e RDFS

Disseminar o conhecimento sobre : Metadados, Ontologias eTesauro

Page 6: Utilização de Ontologias para Integração de Heterogeneidade Semântica Leandro Alves da Silva email : leandroa@ipt.br

Metadados

Metadados, também conhecidos como “dados sobre dados”, são utilizados para descrever as características de recursos e seus relacionamentos

Padrões de Metadados

O padrão Dublin Core (W3C)

Page 7: Utilização de Ontologias para Integração de Heterogeneidade Semântica Leandro Alves da Silva email : leandroa@ipt.br

DescriçãoTitle Título do recursoCreator Pessoa ou organização responsável pela criação do conteúdo intelectual do

recursoContribuitor Pessoa ou Organização que contribui intelectualmente na criação do recurso

(ex.: editor, ilustrador, tradutor, etc)Publisher Identifica a entidade responsável por tornar o recurso disponível.Date Data da criação ou publicação do recursoSource Informação sobre os recursos que contribuíram para a elaboração do recurso

correnteRelation Recursos que possuem relacionamentos com o recurso correnteDescription Descrição do conteúdoSubject Tema do recursoType Forma como o conteúdo é expresso (relatório técnico, dissertação, etc).Format Formato em que o recurso é materializado (postScript, HTML, DOC, PDF,

etc).Identifier Possui um identificador único do recursoLanguage IdiomaCaverage Características Espaciais ou temporaisRights Informações sobre os direitos autorais do recurso

Page 8: Utilização de Ontologias para Integração de Heterogeneidade Semântica Leandro Alves da Silva email : leandroa@ipt.br

Ontologia

O termo ontologia tem sua origem na Filosofia, onde é definida como “a especificação explícita de uma conceitualização”, isto é, tem como pressuposto a existência de algo.

Ontologia é a descrição explícita e precisa de conceitos e relações que existem em um domínio particular, tal como uma dada organização, um domínio de estudo, uma área de aplicação.

Page 9: Utilização de Ontologias para Integração de Heterogeneidade Semântica Leandro Alves da Silva email : leandroa@ipt.br

A principal propriedade de uma ontologia é o compartilhamento e filtragem.

Compartilhamento significa que um acordo deve existir entre diferentes agentes, estes baseados no acordo de ontologias comuns, isto é, devem ter o mesmo entendimento sobre um dado conceito.

Ontologia

Page 10: Utilização de Ontologias para Integração de Heterogeneidade Semântica Leandro Alves da Silva email : leandroa@ipt.br

Ontologia OIL (Ontology Inference Layer)

ontology-containertitle “Meios de Transporte”creator “Leandro Alves da Silva”subject “carro, trem, transportes em geral”description“exemplo de especificação de ontologia descrevendo meios de

transporte no Rio de Janeiro”...language “OIL”language “Português”

Page 11: Utilização de Ontologias para Integração de Heterogeneidade Semântica Leandro Alves da Silva email : leandroa@ipt.br

Ontologia OIL (Ontology Inference Layer)

ontology-definitionsclass-def transporte /*define hierarquia entre classes */

class-def carrosubclass-of transporte

class-def aviãosubclass-of transporte

class-def ônibussubclass-of transporte

class-def tremsubclass-of transporte

Page 12: Utilização de Ontologias para Integração de Heterogeneidade Semântica Leandro Alves da Silva email : leandroa@ipt.br

Ontologia OIL (Ontology Inference Layer)

class-def terrestresubclass-of transporteslot-constraint tem_pneus /* define relacionamento entre classes */value-type carro, ônibus /* enumeração de valores */slot-constraint total

has-value (min 4) /* estabelece cardinalidade mínima = 4 */

class-def aéreosubclass-of transporteslot-constraint tem_asasvalue-type avião

Page 13: Utilização de Ontologias para Integração de Heterogeneidade Semântica Leandro Alves da Silva email : leandroa@ipt.br

Tesauro

Um Tesauro é um índice controlado utilizado tanto na indexação, quanto na recuperação de documentos. A hierarquia dos termos contidos em um Tesauro e seus conceitos, são percebidos na forma como os mesmos são classificados (área do conhecimento).

Um Tesauro é um exemplo prático da aplicação da Ontologia. Pode-se descrevê-lo como uma lista de termos, usados para a representação de conceitos.

Page 14: Utilização de Ontologias para Integração de Heterogeneidade Semântica Leandro Alves da Silva email : leandroa@ipt.br

Sua maior vantagem é unificar os termos de busca, normalmente diferenciados na linguagem natural.

Geralmente, é desenvolvido por uma equipe, composta por especialistas da informação em conjunto com especialistas da área do conhecimento que se quer abranger.

Segue uma classificação baseada em Taxonomia (i.e., uma classificação de elementos dentro de um domínio. Distribui e estabelece relacionamentos entre os elementos que podem ser objetos ou conceitos)

Tesauro

Page 15: Utilização de Ontologias para Integração de Heterogeneidade Semântica Leandro Alves da Silva email : leandroa@ipt.br

XML (extensible markup language)

HTML (Hiper Text Markup Language)

A XML supre as deficiências da HTML, permitindo a criação de marcações definidas pelo próprio usuário e, desta forma, proporcionar uma maior descrição dos recursos em termos de metadados.

Page 16: Utilização de Ontologias para Integração de Heterogeneidade Semântica Leandro Alves da Silva email : leandroa@ipt.br

<pessoa><nome>Leandro</nome><idade>26</idade><e-mail>[email protected]</email>

</pessoa>

<livro><titulo idioma=”Ingles”>Data on the web</titulo><preço moeda=”Dolar”>40.25</preço><editora pais=”Brasil”>McGrawHill</editora>

</livro>

XML (extensible markup language)

Page 17: Utilização de Ontologias para Integração de Heterogeneidade Semântica Leandro Alves da Silva email : leandroa@ipt.br

RDF (Resource Description FrameWork)

O RDF pode especificar o relacionamento entre entidades e prover interoperabilidade estrutural

Page 18: Utilização de Ontologias para Integração de Heterogeneidade Semântica Leandro Alves da Silva email : leandroa@ipt.br

http://www.ipt.br/leandro/paper.htm Metadados

Mod:título

Mod:Agente Criador

Mod:Nome Mod:e-mail

Leandro [email protected]

RDF (Resource Description FrameWork)

Page 19: Utilização de Ontologias para Integração de Heterogeneidade Semântica Leandro Alves da Silva email : leandroa@ipt.br

<?xml version=”1.0”?><rdf:RDFxmlns:rdf= xmlns:mod=”http://www.ipt.br/sgdc_w/moddec/definition”>

<rdf: Description about = ”><mod:titulo> Metadados </mod:titulo><mod:Agente_Criador><mod:nome>Leandro</mod:nome><mod:e-mail>[email protected]</mod:e-mail></mod:Agente_Criador>

</rdf:Description></rdf:RDF>

RDF (Resource Description FrameWork)

Page 20: Utilização de Ontologias para Integração de Heterogeneidade Semântica Leandro Alves da Silva email : leandroa@ipt.br

RDFS (Resource Description Framework Schemas)

Fornece mecanismos para declaração de propriedades e definição de relacionamento entre tais propriedades e outros recursos.

O esquema RDF é especificado como um conjunto de classes, propriedades e restrições entre seus relacionamentos, e pode ser usado em conjunto com outros vocabulários específicos.

Page 21: Utilização de Ontologias para Integração de Heterogeneidade Semântica Leandro Alves da Silva email : leandroa@ipt.br

RDFS (Resource Description Framework Schemas)

<rdf:RDFxmlns: rdf=”http://www.w3c.org/1999/02/22-rdf-syntax-ns#”xmlns: rdfs=””>

<rdf:Description ID=”Animal”><rdf:type resource=”Class”/><rdf:subClassOf resource=”Resource”/>

</rdf:description ID=”Animal”>

<rdf:Description ID=”Mamífero”><rdf:type resource=”Class”/><rdf:subClassOf resource=”#Animal”/>

</rdf:description>

<rdf:Description ID=”Ave”><rdf:type resource=”Class”/><rdf:subClassOf resource=”#Animal”/>

</rdf:description>

Page 22: Utilização de Ontologias para Integração de Heterogeneidade Semântica Leandro Alves da Silva email : leandroa@ipt.br

RDFS (Resource Description Framework Schemas)

<rdfs:Property rdf:ID=”cor”><rdfs:comment>Cor da penugem</rdfs:comment><rdfs:domain rdf:resource=”#Ave”<rdfs:range rdf:resource=””></rdfs:Property>

<rdfs:Property rdf:ID=”habitat><rdfs:comment>Local onde é encontrado</rdfs:comment><rdfs:domain rdf:resource=”#Mamífero”<rdfs:range rdf:resource=””></rdfs:Property>

</rdf:RDF>

Page 23: Utilização de Ontologias para Integração de Heterogeneidade Semântica Leandro Alves da Silva email : leandroa@ipt.br

Aplicação de ontologias na resolução de problemas de heterogeneidade semântica

Coleção deRecursos P

Integração BaseadaOntologia p Coleção de em Ontologia

Recursos Q

DB p1 Ontologia q Sistema baseado em IAEsquema p1 para integração de

DB q1 de OntologiaDB p2 Esquema q1Esquema p2

Resultado da IntegraçãoBaseado em Similaridade

Esquema de Integração Global Integrador de EsquemaBaseado em Ontologia

Page 24: Utilização de Ontologias para Integração de Heterogeneidade Semântica Leandro Alves da Silva email : leandroa@ipt.br

Ontologia p

Inquilino

Cidadão Estrangeiro

pago por Salário

Ontologia q

Pessoa ganha Ordenado

pessoal

Administradorde Pessoal

Técnico dePessoal

Faculdade

Conferencista Professor

Utilização de Ontologias para Integração de Heterogeneidade Semântica - Exemplo 1

Resultado da Integração de Parte das Ontologias por Conceitos iguais

Page 25: Utilização de Ontologias para Integração de Heterogeneidade Semântica Leandro Alves da Silva email : leandroa@ipt.br

Inquilinoe Pessoa

Cidadão Estrangeiro

pago por eganha

Salário@p eSalário@q

pessoal

Administradorde Pessoal

Técnico dePessoal

Faculdade

Conferencista Professor

Utilização de Ontologias para Integração de Heterogeneidade Semântica - Exemplo 1

Resultado da Integração de Parte das Ontologias por Conceitos iguais

Page 26: Utilização de Ontologias para Integração de Heterogeneidade Semântica Leandro Alves da Silva email : leandroa@ipt.br

Esquema p1 Esquema q1

Cidadão Estrangeiro Conferencista ProfessorOrdenado Ordenado Salário Salário

PessoaEsquema Global

Salário

Cidadão Estrangeiro Conferencista Professor

Utilização de Ontologias para Integração de Heterogeneidade Semântica - Exemplo 1

Criando uma Classe Pessoa em um Esquema Global

Page 27: Utilização de Ontologias para Integração de Heterogeneidade Semântica Leandro Alves da Silva email : leandroa@ipt.br

Ontologia q

Ontologia p

pessoal

Administradorde Pessoal

Técnico dePessoal

Faculdade

Conferencista Professor

Estudante

Estudante nãoGraduado

EstudanteGraduado

Pessoa

Utilização de Ontologias para Integração de Heterogeneidade Semântica - Exemplo 2

Estabelecimento de Relações de Similaridade, Criando um Novo Conceito

Page 28: Utilização de Ontologias para Integração de Heterogeneidade Semântica Leandro Alves da Silva email : leandroa@ipt.br

pessoal

Técnico dePessoal

Faculdade

Conferencista Professor

Estudante

Estudante nãoGraduado

EstudanteGraduado

Pessoa

Administradorde Pessoal

Professor Assistente

Utilização de Ontologias para Integração de Heterogeneidade Semântica - Exemplo 2

Estabelecimento de Relações de Similaridade, Criando um Novo Conceito

Page 29: Utilização de Ontologias para Integração de Heterogeneidade Semântica Leandro Alves da Silva email : leandroa@ipt.br

Utilização de Ontologias para Integração de Heterogeneidade Semântica - Exemplo 2

Criando uma nova Classe Global em um Esquema Baseado em Ontologia

Esquema p2 Esquema q1

Estudante de Graduação Conferencista

Estudante de Graduação Conferencista

Esquema Global

Professor Assistente

Page 30: Utilização de Ontologias para Integração de Heterogeneidade Semântica Leandro Alves da Silva email : leandroa@ipt.br

Perguntas

Leandro Alves da Silva

email : [email protected]