utilização de ontologias para integração de heterogeneidade semântica leandro alves da silva...
TRANSCRIPT
Utilização de Ontologias para Integração de Heterogeneidade
Semântica
Leandro Alves da Silva
email : [email protected]
Internet
Redes
Inter-Relacionadas
página
arquivos de dados
imagem
vídeo
bancos de dados
som
Recursos
Estudo do significado da palavra, que nos explica a origem e as variações da significação vocabular
Semântica
Monossemia : Representa apenas um conceito. O termo nesta condição é chamado monosema. Esta é a relação ideal entre conceitos, pois reduz a ambigüidade
Semântica
Homonímia : Termos idênticos na forma fonética (homófonos) e ou, na forma gráfica (termos homógrafos) e ou em ambas.
Seção (corte) , Sessão (reunião) Termos homófonosManga (fruta) , Manga (paletó) Termos homófonos e
homógrafos
Sinonímia : Termos diferentes (sinônimos), que representam o mesmo conceito
Carro , Automóvel
Como ontologias podem ajudar a resolver problemas de heterogeneidade semântica ?
Disponibilizar aos usuários da Internet padrões de criação derecursos.
Mudar de HTML para XML, RDF e RDFS
Disseminar o conhecimento sobre : Metadados, Ontologias eTesauro
Metadados
Metadados, também conhecidos como “dados sobre dados”, são utilizados para descrever as características de recursos e seus relacionamentos
Padrões de Metadados
O padrão Dublin Core (W3C)
DescriçãoTitle Título do recursoCreator Pessoa ou organização responsável pela criação do conteúdo intelectual do
recursoContribuitor Pessoa ou Organização que contribui intelectualmente na criação do recurso
(ex.: editor, ilustrador, tradutor, etc)Publisher Identifica a entidade responsável por tornar o recurso disponível.Date Data da criação ou publicação do recursoSource Informação sobre os recursos que contribuíram para a elaboração do recurso
correnteRelation Recursos que possuem relacionamentos com o recurso correnteDescription Descrição do conteúdoSubject Tema do recursoType Forma como o conteúdo é expresso (relatório técnico, dissertação, etc).Format Formato em que o recurso é materializado (postScript, HTML, DOC, PDF,
etc).Identifier Possui um identificador único do recursoLanguage IdiomaCaverage Características Espaciais ou temporaisRights Informações sobre os direitos autorais do recurso
Ontologia
O termo ontologia tem sua origem na Filosofia, onde é definida como “a especificação explícita de uma conceitualização”, isto é, tem como pressuposto a existência de algo.
Ontologia é a descrição explícita e precisa de conceitos e relações que existem em um domínio particular, tal como uma dada organização, um domínio de estudo, uma área de aplicação.
A principal propriedade de uma ontologia é o compartilhamento e filtragem.
Compartilhamento significa que um acordo deve existir entre diferentes agentes, estes baseados no acordo de ontologias comuns, isto é, devem ter o mesmo entendimento sobre um dado conceito.
Ontologia
Ontologia OIL (Ontology Inference Layer)
ontology-containertitle “Meios de Transporte”creator “Leandro Alves da Silva”subject “carro, trem, transportes em geral”description“exemplo de especificação de ontologia descrevendo meios de
transporte no Rio de Janeiro”...language “OIL”language “Português”
Ontologia OIL (Ontology Inference Layer)
ontology-definitionsclass-def transporte /*define hierarquia entre classes */
class-def carrosubclass-of transporte
class-def aviãosubclass-of transporte
class-def ônibussubclass-of transporte
class-def tremsubclass-of transporte
Ontologia OIL (Ontology Inference Layer)
class-def terrestresubclass-of transporteslot-constraint tem_pneus /* define relacionamento entre classes */value-type carro, ônibus /* enumeração de valores */slot-constraint total
has-value (min 4) /* estabelece cardinalidade mínima = 4 */
class-def aéreosubclass-of transporteslot-constraint tem_asasvalue-type avião
Tesauro
Um Tesauro é um índice controlado utilizado tanto na indexação, quanto na recuperação de documentos. A hierarquia dos termos contidos em um Tesauro e seus conceitos, são percebidos na forma como os mesmos são classificados (área do conhecimento).
Um Tesauro é um exemplo prático da aplicação da Ontologia. Pode-se descrevê-lo como uma lista de termos, usados para a representação de conceitos.
Sua maior vantagem é unificar os termos de busca, normalmente diferenciados na linguagem natural.
Geralmente, é desenvolvido por uma equipe, composta por especialistas da informação em conjunto com especialistas da área do conhecimento que se quer abranger.
Segue uma classificação baseada em Taxonomia (i.e., uma classificação de elementos dentro de um domínio. Distribui e estabelece relacionamentos entre os elementos que podem ser objetos ou conceitos)
Tesauro
XML (extensible markup language)
HTML (Hiper Text Markup Language)
A XML supre as deficiências da HTML, permitindo a criação de marcações definidas pelo próprio usuário e, desta forma, proporcionar uma maior descrição dos recursos em termos de metadados.
<pessoa><nome>Leandro</nome><idade>26</idade><e-mail>[email protected]</email>
</pessoa>
<livro><titulo idioma=”Ingles”>Data on the web</titulo><preço moeda=”Dolar”>40.25</preço><editora pais=”Brasil”>McGrawHill</editora>
</livro>
XML (extensible markup language)
RDF (Resource Description FrameWork)
O RDF pode especificar o relacionamento entre entidades e prover interoperabilidade estrutural
http://www.ipt.br/leandro/paper.htm Metadados
Mod:título
Mod:Agente Criador
Mod:Nome Mod:e-mail
Leandro [email protected]
RDF (Resource Description FrameWork)
<?xml version=”1.0”?><rdf:RDFxmlns:rdf= xmlns:mod=”http://www.ipt.br/sgdc_w/moddec/definition”>
<rdf: Description about = ”><mod:titulo> Metadados </mod:titulo><mod:Agente_Criador><mod:nome>Leandro</mod:nome><mod:e-mail>[email protected]</mod:e-mail></mod:Agente_Criador>
</rdf:Description></rdf:RDF>
RDF (Resource Description FrameWork)
RDFS (Resource Description Framework Schemas)
Fornece mecanismos para declaração de propriedades e definição de relacionamento entre tais propriedades e outros recursos.
O esquema RDF é especificado como um conjunto de classes, propriedades e restrições entre seus relacionamentos, e pode ser usado em conjunto com outros vocabulários específicos.
RDFS (Resource Description Framework Schemas)
<rdf:RDFxmlns: rdf=”http://www.w3c.org/1999/02/22-rdf-syntax-ns#”xmlns: rdfs=””>
<rdf:Description ID=”Animal”><rdf:type resource=”Class”/><rdf:subClassOf resource=”Resource”/>
</rdf:description ID=”Animal”>
<rdf:Description ID=”Mamífero”><rdf:type resource=”Class”/><rdf:subClassOf resource=”#Animal”/>
</rdf:description>
<rdf:Description ID=”Ave”><rdf:type resource=”Class”/><rdf:subClassOf resource=”#Animal”/>
</rdf:description>
RDFS (Resource Description Framework Schemas)
<rdfs:Property rdf:ID=”cor”><rdfs:comment>Cor da penugem</rdfs:comment><rdfs:domain rdf:resource=”#Ave”<rdfs:range rdf:resource=””></rdfs:Property>
<rdfs:Property rdf:ID=”habitat><rdfs:comment>Local onde é encontrado</rdfs:comment><rdfs:domain rdf:resource=”#Mamífero”<rdfs:range rdf:resource=””></rdfs:Property>
</rdf:RDF>
Aplicação de ontologias na resolução de problemas de heterogeneidade semântica
Coleção deRecursos P
Integração BaseadaOntologia p Coleção de em Ontologia
Recursos Q
DB p1 Ontologia q Sistema baseado em IAEsquema p1 para integração de
DB q1 de OntologiaDB p2 Esquema q1Esquema p2
Resultado da IntegraçãoBaseado em Similaridade
Esquema de Integração Global Integrador de EsquemaBaseado em Ontologia
Ontologia p
Inquilino
Cidadão Estrangeiro
pago por Salário
Ontologia q
Pessoa ganha Ordenado
pessoal
Administradorde Pessoal
Técnico dePessoal
Faculdade
Conferencista Professor
Utilização de Ontologias para Integração de Heterogeneidade Semântica - Exemplo 1
Resultado da Integração de Parte das Ontologias por Conceitos iguais
Inquilinoe Pessoa
Cidadão Estrangeiro
pago por eganha
Salário@p eSalário@q
pessoal
Administradorde Pessoal
Técnico dePessoal
Faculdade
Conferencista Professor
Utilização de Ontologias para Integração de Heterogeneidade Semântica - Exemplo 1
Resultado da Integração de Parte das Ontologias por Conceitos iguais
Esquema p1 Esquema q1
Cidadão Estrangeiro Conferencista ProfessorOrdenado Ordenado Salário Salário
PessoaEsquema Global
Salário
Cidadão Estrangeiro Conferencista Professor
Utilização de Ontologias para Integração de Heterogeneidade Semântica - Exemplo 1
Criando uma Classe Pessoa em um Esquema Global
Ontologia q
Ontologia p
pessoal
Administradorde Pessoal
Técnico dePessoal
Faculdade
Conferencista Professor
Estudante
Estudante nãoGraduado
EstudanteGraduado
Pessoa
Utilização de Ontologias para Integração de Heterogeneidade Semântica - Exemplo 2
Estabelecimento de Relações de Similaridade, Criando um Novo Conceito
pessoal
Técnico dePessoal
Faculdade
Conferencista Professor
Estudante
Estudante nãoGraduado
EstudanteGraduado
Pessoa
Administradorde Pessoal
Professor Assistente
Utilização de Ontologias para Integração de Heterogeneidade Semântica - Exemplo 2
Estabelecimento de Relações de Similaridade, Criando um Novo Conceito
Utilização de Ontologias para Integração de Heterogeneidade Semântica - Exemplo 2
Criando uma nova Classe Global em um Esquema Baseado em Ontologia
Esquema p2 Esquema q1
Estudante de Graduação Conferencista
Estudante de Graduação Conferencista
Esquema Global
Professor Assistente