buscas semânticasfileto/talks/buscassemanticas6sp.pdf · 21/04/2010 1 1 buscas semânticas:...

31
21/04/2010 1 1 Buscas semânticas: panorama e tendências atuais minicurso ERBD 2010 Renato Fileto [email protected] Alunos Colaboradores: Caio Stein D’Agostini [email protected] Karina Fasolin [email protected] Wanderson Rigo [email protected] Programa de Pós-graduação em Ciência da Computação PPGCC Universidade Federal de Santa Catarina UFSC Conteúdo Motivação Web semântica Proposta Padrões Desafios Buscas semânticas Definição do problema Abordagens e ferramentas Tendências Conclusões Tempest Typhoon Hurricane Desert storm Tornado Motivação: Fenômenos linguísticos Homonímia: mesmo nome para coisas distintas (e.g., Tornado, Lula, São Paulo, ...) Sinonímia: nomes distintos para a mesma coisa (e.g., São Paulo time de futebol, o tricolor paulista, o campeão mundial de ...) Hipernímia / Hiponímia (IS_A): generalização / especialização (e.g., animal, mamífero, primata, ...) Meronímia / Holonímia (PART_OF): agregação (e.g., país, estado, cidade, ...) Instanciação (TYPE_OF) (e.g., Santo(São Paulo)) . . . Web semântica (Web 3) "A Web semântica é uma extensão da Web atual, em que a informação recebe significado bem definido, habilitando os computadores e as pessoas a trabalhar em cooperação." Tim Berners-Lee, James Hendler, Ora Lassila The Semantic Web, Scientific American, May 2001 Bases da Web semântica Representação formal da semântica Ontologias Padrões para representar conhecimento na Web Anotações semânticas Descrições de recursos (dados e serviços) baseadas em ontologias Inferência (processamento do conhecimento) Reasoners e agentes inteligentes

Upload: others

Post on 07-Aug-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Buscas Semânticasfileto/Talks/BuscasSemanticas6sp.pdf · 21/04/2010 1 1 Buscas semânticas: panorama e tendências atuais minicurso ERBD 2010 RenatoFileto fileto@inf.ufsc.br AlunosColaboradores:

21042010

1

1

Buscas semacircnticas panorama e tendecircncias atuais

minicurso ERBD 2010

Renato Filetofiletoinfufscbr

Alunos Colaboradores Caio Stein DrsquoAgostinicsdinfufscbr

Karina Fasolinkfasolininfufscbr

Wanderson Rigowanderinfufscbr

Programa de Poacutes-graduaccedilatildeo em Ciecircncia da Computaccedilatildeo ndash PPGCC

Universidade Federal de Santa Catarina ndash UFSC

Conteuacutedo

Motivaccedilatildeo

Web semacircnticaProposta

Padrotildees

Desafios

Buscas semacircnticasDefiniccedilatildeo do problema

Abordagens e ferramentas

Tendecircncias

Conclusotildees

TempestTyphoon

Hurricane

Desert storm

Tornado

Motivaccedilatildeo Fenocircmenos linguiacutesticos

Homoniacutemia mesmo nome para coisas distintas(eg Tornado Lula Satildeo Paulo )rlm

Sinoniacutemia nomes distintos para a mesma coisa (eg Satildeo Paulo time de futebol o tricolor paulista o

campeatildeo mundial de )rlm

Hiperniacutemia Hiponiacutemia (IS_A)

generalizaccedilatildeo especializaccedilatildeo (eg animal

mamiacutefero primata )rlm

Meroniacutemia Holoniacutemia (PART_OF)

agregaccedilatildeo (eg paiacutes estado cidade )rlm

Instanciaccedilatildeo (TYPE_OF) (eg Santo(Satildeo Paulo))rlm

Web semacircntica (Web 3)rlm

A Web semacircntica eacute uma extensatildeo da Web atual em que a informaccedilatildeo recebe

significado bem definido habilitando os computadores e as pessoas a trabalhar em cooperaccedilatildeo

Tim Berners-Lee James Hendler Ora Lassila

The Semantic Web Scientific American May 2001

Bases da Web semacircntica

Representaccedilatildeo formal da semacircntica

Ontologias

Padrotildees para representar conhecimento na Web

Anotaccedilotildees semacircnticas

Descriccedilotildees de recursos (dados e serviccedilos) baseadas em ontologias

Inferecircncia (processamento do conhecimento)rlm

Reasoners e agentes inteligentes

21042010

2

Estrutura da Introduccedilatildeo

Motivaccedilatildeo O que eacute a Web semacircntica

Objetivos

Ontologias anotaccedilotildees semacircnticas inferecircncia

Padrotildees da Web Semacircntica

RDF RDF-Schema OWL SPARQLrlm RIF

Desafios da Web semacircntica

Criaccedilatildeo de ontologias anotaccedilotildees semacircnticas

inferecircncia articulaccedilatildeo de ontologias

Desenvolvimento de aplicaccedilotildees

Buscas semacircnticas

Ontologia na Filosofia

Filosofia grega

Ontos = ser logos = ciecircncia

Conceitualizaccedilatildeo compatilhada de algum universo de discurso ou domiacutenio de interesse

Conjunto de conceitos (eg entities attributes processes) com suas definiccedilotildees e intershyrelacionamentos

Visatildeo unificada para resolver problemas envolvendo significado (eg buscas semacircnticas integraccedilatildeo de dados interoperabilidade de sistemas composiccedilatildeo de serviccedilos)

Carrega uma visatildeo de mundo

Ontologias na Computaccedilatildeo

Ontologia

Conceitualizaccedilatildeo compartilhada

de um domiacutenio

Expliacutecita e formal para permitir o

processamento por maacutequinas

Pode ter diferentes formas

Thesaurus com relaccedilotildees semacircnticas entre termos (eg sinoniacutemia )

Taxonomia

Diagrama de classes

Base de conhecimento

Classes propriedades e suas relaccedilotildees

Instacircncias de classes

Compartilhada e Expliacutecita

Compartilhada um grupo de pessoas em um certo

domiacutenio deve concordar sobre o significado de entidades e relaccedilotildees expressas em uma ontologia

Expliacutecita uma ontologia eacute uma representaccedilatildeo concreta e manipulaacutevel de (parte de) uma conceitualizaccedilatildeo

Uma conceitualizaccedilatildeo poderia ser impliacutecita

eg existente somente na cabeccedila de algueacutem ou

embutida em um moacutedulo de software

Formal

Uma ontologia [expliacutecita] pode ter diversas formas mas

sempre inclui um vocabulaacuterio de termos e alguma especificaccedilatildeo de seu significado O grau de formalizaccedilatildeo de do vocabulaacuterio e dos significados especificados pode variar

consideravelmente

Altamente informal expressa em linguagem natural

Semishyinformal expressa em uma forma restrita e estruturada de linguagem natural

Semishyformal expressa em uma linguagem artificial e formalmente definida

Rigorosamente formal termos meticulosamente definidos com semacircntica formal teoremas e provas de propriedades como consistecircncia (soundness) e completuude

Trecho de ontologia 1

Pessoa

Santo

S1

IS_A

TYPE_OF

nome

Satildeo Paulo

Time

TimeFutebol

TF1

IS_A

TYPE_OF

nome

Satildeo Paulo

ParcelaTerritoacuterio

Estado

IS_A

Cidade

E1

TYPE_OF

nome

Satildeo Paulo

C1

nome

Satildeo PauloTricolor Paulista

PART_OF

21042010

3

Trecho de ontologia 2 Travel Exemplo de ontologia 3 DeCS(Descritores em Ciecircncias da Sauacutede)

Exemplo de ontologia 3a ndash DeCS(anatomia)

Exemplo de ontologia 3b ndash DeCS(doenccedilas)

Exemplo de ontologia 3c ndash DeCS(doenccedilas) Aplicaccedilotildees de Ontologias

Buscas semacircnticas

Ex Estado(Satildeo Paulo) Cidade(Satildeo Paulo)rlm

Interoperabilidade

Agentes moacuteveis

Reuso e composiccedilatildeo de recursos

Semantic Learning Objects

Semantic Web Services

Semantically enabled services amp workflows

21042010

4

Uses of ontologies

Comunicaccedilatildeo

entre pessoas e organizaccedilotildees

Interoperabilidade

Entre sistemas

Componentes Reusaacuteveis Confiabilidade

Especificaccedilatildeo

Engenharia de Sistemas

Outras distinccedilotildees pode ser importantes dentro de cada

categoria tais como a natureza do software tipo de usuaacuteriosn e domiacutenio de aplicaccedilatildeo

Ontologias como uma IntershyLingua

L1

L3

L2

L4

L1

L3

L2

L4

Interlingua

T1 T2

T3 T4

Ontologias pode ser usadas como suporte na traduccedilatildeo entre diferentes linguagens e

representaccedilotildees de informaccedilatildeoconhecimento

Padrotildees da Web semacircntica

Character Encoding

Codificaccedilatildeo de Caracteres

Exemplos de cabeccedilalhos de documentos XML com especificaccedilatildeo do

padratildeo de codificaccedilatildeo de caracteres utilizados nesses documentos

ltxml encoding=UTF-8gt

ltxml encoding=UTF-16gt

ltxml encoding=EUC-JPgt

ltxml version=ldquo10rdquo encoding=ISO-8859-1gt

URIs (Unified Resource Identifiers)rlm

httpwwww3orgAddressing

httpwwww3orgAddressingbackground

httpwwwfoldocorgUniform+Resource+Locator

ftpspysecretftpacmecompubtopsecretweapontgz

mailtofreddocicacuk

newsalthypertext

telnet19202168o

magicabcdef

ldap[2001db87]c=GBobjectClassone

tel+1-816-555-1212

urnoasisnamesspecificationdocbookdtdxml412

exampleabc7Bfoo7D

eXAMPLEabb637bfoo7d

NameSpaces

Exemplos de trechos de documentos XML com especificaccedilotildees e

uso de namespaces

ltx xmlnsedi=httpecommerceorgschemagt

lt-- the edi prefix is bound to httpecommerceorgschema

for the x element and contents --gt

ltxgt

ltbook xmlns=urnlocgovbooks

xmlnsisbn=urnISBN0-395-36341-6gt

lttitlegtCheaper by the Dozenlttitlegt

ltisbnnumbergt1568491379ltisbnnumbergt

ltbookgt

ltschema xmlnshttpwwww3org2001XMLSchemagt

ltschemagt

21042010

5

XML ndash eXtensible Makup Language

Construccedilotildees baacutesicas

ltElementogt Conteuacutedo ltElementogt

ltElemento gt

ltElemento Atributo1=ldquoValorrdquo Atributo2=ldquoValorrdquogt

ltElementorlmAtributo1=ldquoValorrdquorlmAtributo2=ldquoValorrdquogtrlm rlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlm

Conteuacutedo

ltElementogt

ltElemento1gt

ltElemento2gt

Conteuacutedo

ltElemento2gt

ltElemento1gt

ltElemento1gtltElemento2gtltElemento1gt

Um documento XML

ltxml version=10 encoding=ISO-8859-1 gt

ltElementoRaizgt

ltElemento1gt

ltElemento1_1gt Conteuacutedo ltElemento1_1gt

ltElemento1_2gt Conteuacutedo ltElemento1_2gt

ltElemento1_3gt

ltElemento1gt

ltElemento2gt

ltElemento2_1gt

ltElemento2_1_1gt Conteuacutedo ltElemento2_1_1gt

ltElemento2_1_2gt

ltElemento2_1gt

ltElemento2gt

ltElementoRaizgt

A Versatilidade do XML para Dados Semi-Estruturados

ltxml version=10 encoding=ISO-8859-1 gt

ltPessoarlmNome=ldquoJoatildeorlmderlmSouzardquorlmDataDeNascimento=ldquo12061964rdquorlmCPF=ldquo12312312rdquogt

ltEnderecosgt

ltEnderecorlmTipo=ldquoComercialrdquogtRuarlmArlm23rlm- CentroltEnderecogt

ltEnderecorlmTipo=ldquoResidencialrdquogtTorrerlmComercialrlm1923rlmSl1011rlmltEnderecogt

ltMalaDiretarlmDestino=ldquoComercialrdquogt

ltEnderecosgt

ltFormasDeContatogt

ltTelefonesgt

ltTelefonerlmTipo=ldquoComercialrdquorlmDDD=ldquo61rdquorlmRamal=ldquo211rdquogt222-8545ltTelefonegt

ltTelefonerlmTipo=ldquoCelularrdquorlmDDD=ldquo61rdquogt999-9999ltTelefonegt

ltTelefonerlmTipo=ldquoResidencialrdquorlmDDD=ldquo61rdquogt444-4444ltTelefonegt

ltTelefonesgt

ltEmailgtjoatildeoemailcombrltEmailgt

ltICQrlmNumero=rlmrdquo127653467654ldquorlmgt

ltFormasDeContatogt

ltPessoagt

Doc XML para Dados Climaacuteticos (Balanccedilo Hiacutedrico)rlm

ltxml version=10 encoding=ISO8859-1gt

ltWaterBal xmlns=httpwwwagricgovbrWaterBalxsd

location=Brotas latitude=-221500 longitude=-475800gt

ltWeatherData Date=ldquo20050823rdquogt

ltTemperaturegt 220 ltTemperaturegt

ltAvgRainFallgt 2013 ltAvgRainFallgt

ltPotETgt 1154 ltPotETgt

ltRealETgt 1154 ltRealETgt

ltStoredgt 1250 ltStoredgt

ltWaterDeficitgt 00 ltWaterDeficitgt

ltWaterExcessgt 860 ltWaterExcessgt

ltWeatherData gt

ltWaterBalgt

Arquivo texto (natildeo XML) com dados pluviomeacutetricos

weather station

year

station

code

end of file

latitude longitude altitude

Jan

Feb

Mar

Apr

May

Jun

Jul

Aug

Sep

Oct

Nov

Dec

XML-Schema

Um documento XML-Schema descreve os

elementos

atributos

relacionamentos

etc

permitidos em um ou mais documentos XML isto eacute define uma classe de documentos XML que adere a um

conjunto de restriccedilotildees estruturais e de dados

XML-Schema tem uma sintaxe XML

XML-Schema eacute mais robusta versaacutetil e poderosa que DTD (Document Type Definition)rlm

21042010

6

Um Documento XML-Schema(WaterBalxsd)rlm

ltschema xmlnshttpwwww3org2001XMLSchema gt

ltelement name=WaterBal type=WaterBalTypegt

ltattribute name=location type=stringgt

ltattribute name=latitude type=Latitudegt

ltattribute name=longitude type=Longitudegt

ltelement name=WeatherData type=AgregValuesgt

ltcomplexType name=AgregValuesgt

ltattribute name=Date type=DateTypegt

ltsequencegt

ltelement name=Temperature type=decimalgt

ltelement name=AvgRainfall type=decimalgt

ltelement name=PotET type=decimalgt

ltelement name=RealET type=decimalgt

ltelement name=Stored type=decimalgt

ltelement name=WaterDeficit type=decimalgt

ltelement name=WaterExcess type=decimalgt

ltsequencegt

ltcomplexTypegt

ltelementgt

ltschemagt

Validaccedilatildeo de documentos XML

Documento bem-formado (well-formed) satisfaz as restriccedilotildees

de formaccedilatildeo expressa na especificaccedilatildeo do XML

(httpwwww3orgTR2004REC-xml-20040204)rlm

Documento vaacutelido satisfaz as restriccedilotildees (elementos atributos

aninhamentos tipos etc) expressas em uma especificaccedilatildeo de

esquema XML em DTD ou XSL (XML-Schema) que eacute associada a

esse documento XML

Heterogeneidade semacircntica em XML

ltobject id=ldquoa1rdquo class=ldquoartifactrdquogt

lttuplegt

lttitlegt Nympheas lttitlegt

ltyeargt 1897 ltyeargt

ltcreatorgt Monet ltcreatorgt

ltpricegt 10000000 ltpricegt

ltowners refs=ldquop1p2p3rdquogt

lttuplegt

ltobjectgt

ltobject id=ldquop3rdquo class=ldquopersonrdquogt

lttuplegt

ltnamegt Claudia ltnamegt

ltagegt 17 ltagegt

lttuplegt

ltobjectgt

ltworkgt

ltartistgt Monet ltartistgt

ltnamegt Nympheas ltnamegt

ltstylegt Impressionist ltstylegt

ltsizegt 21 x 61 ltsizegt

ltcplacegt Givern ltcplacegt

ltworkgt

ltworkgt

ltartistgt Monet ltartistgt

lttitlegt Waterloo Bridge lttitlegt

ltstylegt Impressionist ltstylegt

ltsizegt 292 x 464 ltsizegt

lthistorygt

Painted with

lttechgt Oil on canvas lttechgt

in

lthistorygt

ltworkgt

XML como Padratildeo de representaccedilatildeo de dados

ldquoArtworksrdquorlmStructure

Works works

Work

Work

Field

artist title style size

string string string string

ldquoArtfactrdquorlmSchema

artifacts set

ampArtifact

Artifact class

artifact

tuple

title year creator price owners

ampPerson

string int string float list

YAT Model

YAT Any

YAT

V ampYAT

ODMG Model

Vtuple

Symbol

Type

V(int vbool v

float vstring)rlm

ampClass

Type

V

Symbol

(set vbag vlist varray)rlm

Class class

Symbol

Type

RDF ndash Resource Description Framework

Uma linguagem e modelo padronizados para expressar conhecimento na Web semacircntica

Um comando (statement) eacute uma tripla da forma

Recurso qualquer coisa referenciada por uma URL

Propriedade qualquer propriedade de um recurso

Valor um literal ou outro recurso

RDF-Schema define classes de recursos suas propriedades (que podem ser relacionamentos com outras classes) e possiacuteveis valores

Os formatos para representar ontologias na Web semacircntica (eg

DAML+OIL OWL) satildeo extensotildees do RDF

Sintaxe XML do RDF

ltxml version=10gt

ltrdfRDF xmlnsRDF httpwwww3orgRDFRDFldquo

xmlnsdc httpdublincoreorgdcldquogt

ltrdfDescription about=ldquohttpwwwagritempocnptiaembrapabrrdquogt

ltdctitlegt Nuacutecleo de Monitoramento e Anaacutelise de Dados

Meteoroloacutegicos e Climatoloacutegicos para a Agricultura ltdctitlegt

ltleadergt

rdfresource=ldquohttpwwwcnptiaembrapabr~assadrdquo

ltleadergt

ltrdfDescriptiongt

ltrdfDescription

about=ldquohttpwwwcnptiaembrapabr~assadrdquogt

ltdctitlegt Eduardo D Assad ltdctitlegt

ltemailgt Assadcnptiaembrapabr ltemailgt

ltrdfDescriptiongt

ltrdfRDF gt

21042010

7

Estrutura do conhecimento em RDF

httpwwwagritempocnptiaembrapabr

httpwwwcnptiaembrapabr~assad

Nuacutecleo de Monitoramento e

Anaacutelise de Dados

Meteoroloacutegicos e Climatoloacutegicos

para a Agricultura

assadcnptiaembrapabrEduardo D

Assad

dctitle

dctitleemail

leader

Metadata in RDFWater Balance (same place and institution)rlm

ltxml version=10gt

ltrdfRDF xmlnsRDF httpwwww3orgRDFRDFldquo

xmlns httpagricgovbrDocStdldquogt

ltrdfDescription about=httpwwwagricgovbrpublicWaterBal1234gt

ltSourcegt

rdfresource=ldquohttpwwwcepagriunicampbrrdquo

rdfresource=ldquohttpwwwciagroiacgovspbrrdquo

ltSourcegt

ltInitialDategt 28032002 ltInitialDategt

ltFinalDategt 31032002 ltFinalDategt

ltkeywordgt Water available in Soil ltkeyworkgt

ltlocalgt

rdfresource= ldquohttpwwwibgegovbrstate_SPrdquo

ltlocalgt

ltmeasument_unitgt

rdfresource= ldquohttpwwwinmetrogovbrmmrdquo

ltmeasument_unitgt

ltrdfDescriptiongt

ltrdfRDFgt

httpwwwagricgovbrpublicWaterBal1234

http

wwwcpaunicampbr

Centro de Pesquisas

Agriacutecolas (CEPAGRI)

name

source

httpwwwciagroiacg

ovspbr

httpwwwunica

mpbr

part_of

CIIAGRO

name

http

wwwiacgovspbr

part_of

InitialDate

28032002

FinalDateWater available in

Soil

http

wwwibgegovbrstate_SP

source

keyword

http

wwwinmetrogovbrmm

31032002

local

measurement_unit

RDF-Schema

ltrdfabout=ampAgricZoningCountry rdfslabel=Countrygt

ltrdfssubClassOf dfresource=ampAgricZoningTerritorialDivisiongt

ltrdfabout=ampAgricZoningState rdfslabel=ldquoStategt

ltrdfssubClassOf dfresource=ampAgricZoningTerritorialDivisiongt

ltrdfProperty rdfabout=ampAgricZoningstatesOfCountry

aminCardinality=1

rdfslabel=statesOfCountrygt

ltrdfsdomain rdfresource=ampAgricZoningCountrygt

ltrdfsrange rdfresource=ampAgricZoningStategt

ltainverseProperty rdfresource=ampAgricZoningcountryOfStategt

ltrdfPropertygt

RDF-Schema

ltrdfProperty rdfabout=ampAgricZoningcountryOfState

amaxCardinality=1

aminCardinality=1

rdfslabel=countryOfStategt

ltrdfsrange rdfresource=ampAgricZoningCountrygt

ltrdfsdomain rdfresource=ampAgricZoningStategt

ltainverseProperty

rdfresource=ampAgricZoningstatesOfCountrygt

ltrdfPropertygt

Trecho de RDF

ltAgricZoningCountry rdfabout=ampAgricZoningpais_55

AgricZoningnameBR=BRASIL rdfslabel=BRASILgt

ltAgricZoningofficialRegionsOfCountry

rdfresource=ampAgricZoningregof_1gt

ltAgricZoningofficialRegionsOfCountry

rdfresource=ampAgricZoningregof_2gt

ltAgricZoningofficialRegionsOfCountry

rdfresource=ampAgricZoningregof_3gt

ltAgricZoningofficialRegionsOfCountry

rdfresource=ampAgricZoningregof_4gt

ltAgricZoningofficialRegionsOfCountry

rdfresource=ampAgricZoningregof_5gt

ltAgricZoningstatesOfCountry rdfresource=ampAgricZoningestado_11gt

ltAgricZoningstatesOfCountry rdfresource=ampAgricZoningestado_12gt

ltAgricZoningmetroAreasOfCountry

rdfresource=ampAgricZoningmetro_5201gt

ltAgricZoningCountrygt

21042010

8

Descriccedilotildees em RDF de recursos para a coleta de dados cientiacuteficos

wwwEquipServcombrschema2rdfs

RD

F S

chem

aR

DF

Equipment Clienthas

String StringString String

category model name city

wwwAgriTempobrschema1rdfs

WeatherStation

longitudealtitude

LandParcel

CountyState

latitude

inpart_of

ampws1

ampws3

ampws4

Stringname

ampeq1

ampRio

ampUbatuba

ampCampinas

ampws2

ampUnicamp

ampEmbrapa

ampSP

ampRJ

in

in

in

in

part_of

part_of

part_of

has

has

has

has

ampws1 = httpwwwembrapabrWeatherStationX

ampws2 = httpwwwiacbrWeatherStationK

ampws3 = httpwwwunicampbrWheaterStationA

ampws4 = httpwwwunicampbrWheaterStationB

ampeq1 = httpwwwembrapabrCameraZ

subClassOf (isA)rlm

typeOf (instance)rlm

other kind of property

DegreesDecMeters

String

String

value

value

OWL ndash Ontology Web Language

Estende o RDF com vocabulaacuterio padronizado e construccedilotildees para definir

Escopo local de propriedades

Disjunccedilatildeo de classes

Combinaccedilotildees de classes

Restriccedilotildees de cardinalidade

Caracteriacutesticas especiais de propriedades (eg transitividade simetria anti-simetria propriedades inversas)rlm

The 3 flavors of OWL

OWL LiteExpressividade restrita (exclui classes enumeradas disjunccedilatildeo cardinalidade arbitraacuteria )

Faacutecil de entender e usar

OWL DL

Equivalente agrave loacutegica descritiva (DL = Description

Logics)

Ainda permite eficiecircncia e computabilidade

OWL Full

Compatiacutevel sintaacutetica e semanticamente com RDF embora mais poderosaPode ocasionar inferecircncias indecidiacuteveis

Disjunction and Equivalence of Classes

ltowlClass rdfabout=associateProfessorgt

ltowldisjointWith rdfresource=assistantProfessorgt

ltowlClassgt

ltowlClass rdfID=facultygt

ltowlequivalentClass

rdfresource=academicStaffMembergt

ltowlClassgt

Inverse properties

ltowlObjectProperty rdfID=teachesgt

ltrdfsrange rdfresource=coursegt

ltrdfsdomain rdfresource=academicStaffMembergt

ltowlinverseOf rdfresource=isTaughtBygt

ltowlObjectPropertygt

Sintaxe abstrata para OWL

Class(Person partialrestriction (hasChild allValuesFrom(Person)))rlm

Class(Parent completePersonrestriction (hasChild someValuesFrom(Person)))rlm

ObjectProperty(hasChild)rlm

Individual (John type(Person)rlmvalue(hasChild Mary))rlm

21042010

9

Busca em uma ontologia

Pessoa

Santo

S1

IS_A

TYPE_OF

nome

Satildeo Paulo

Time

TimeFutebol

TF1

IS_A

TYPE_OF

nome

Satildeo Paulo

ParcelaTerritoacuterio

Estado

IS_A

Cidade

E1

TYPE_OF

nome

Satildeo Paulo

C1

nome

Satildeo PauloTricolor Paulista

PART_OF

SPARQL (recomendaccedilatildeo W3C)rlm

Exemplo de expressatildeo em SPARQL

SELECTrlmconceptrlm propertyrlm ldquoSatildeorlmPaulordquo

WHERE

concept propertyhasProperty property

FILTER(property name)rlm

Linguagens de Regras (Prolog)

Rules

parent(x z)rlm - father(x z) v mother(x z)

sibling(x y)rlm- parent(x z) and parent(y z)

Knowledge base

father(_Maria _Joatildeo)

father(_Pedro _Joatildeo)

Query

sibling(_Maria x) rArr Yes rArr b = _PedrorArr b = _xyz1rArr b = _xyz2 rArr b = _xyz3rArr b = _xyz4

RIF (Rule Interchange Format)

A buyer buys an item from a seller if the seller sells it to the buyer John sells LeRif to Mary The fact Mary buys LeRif from John can be logically derived by a modus ponens argument

Document(

Prefix(cpt lthttpexamplecomconceptsgt)

Prefix(ppl lthttpexamplecompeoplegt)

Prefix(bks lthttpexamplecombooksgt)

Group ( Forall Buyer Item Seller (

cptbuy(Buyer Item Seller)

cptsell(Seller Item Buyer)

)

cptsell(pplJohn bksLeRif pplMary)

)

)

Controveacutersia sobre pilha de padrotildees

Peter F Patel-Schneider A Revised Architecture for Semantic

Web Reasoning Third Workshop on Principles and Practices of

Semantic Web Reasoning Dagstuhl Germany September

2005 LNCS 3703 Springer Verlag 2005

Ian Horrocks Bijan Parsia Peter F Patel-Schneider and

James Hendler Semantic Web Architecture Stack or Two

Towers Third Workshop on Principles and Practices of Semantic Web Reasoning Dagstuhl Germany September

2005 LNCS 3703 Springer Verlag 2005

Peter F Patel-Schneider Building the Semantic Web Tower

from RDF Straw Nineteenth International Joint Conference on

Artificial Intelligence Edinburgh Scotland August 2005

Proposta inicial (2000)rlm

21042010

10

Proposta regras(2005)rlm Proposta atual

Como estaacute a Web semacircntica hoje

Aacuterea de pesquisa muito ativa

Visa estender o papel dos computadores no

suporte a diversas atividades humanas

Usa ontologias e anotaccedilotildees semacircnticas para

catalogar recuperar e compor dados e serviccedilos

de processamento na Web

Desafios da Web semacircntica

Construccedilatildeo de ontologias

(Semi-)automatizada e interativa

Geraccedilatildeo de anotaccedilotildees semacircnticas de recursos

Muitas aplicaccedilotildees requerem automatizaccedilatildeo

Evoluccedilatildeo de ontologias

Checar se alteraccedilotildees natildeo introduzem inconsistecircncias e gerenciar

versotildees

Integraccedilatildeo de ontologias (ontology matching)

A obtenccedilatildeo de consenso eacute inviaacutevel em muitas domiacutenios

Deduccedilatildeoraciociacutenio

Teorias computaacuteveis e natildeo computaacuteveis ontologias inconsistentes

Ediccedilatildeo de Ontologias no Proteacutegeacute

Editor de ontologias e arcabouccedilo para o desenvolvimento de bases de conhecimento livre e de coacutedigo aberto baseado em Java

Suporta os modelos de frames (RDF) e OWL

Exporta as ontologias e bases de conhecimento para uma variedade de formatos incluindo RDF(S) OWL e XML Schema

Extensiacutevel via plugins

Construccedilatildeo de ontologias

Processo para geraccedilatildeo automatizada de

ontologias a partir de esboccedilos dados e

documentos (nova geraccedilatildeo de ferramentas)rlm

Entendimento do domiacutenio

Entendimento dos dados

Definiccedilatildeo das tarefas

Geraccedilatildeo semi-automaacutetica

Avaliaccedilatildeo de qualidade

Refinamento com interaccedilatildeo humana

21042010

11

Definiccedilotildees de ldquogeraccedilatildeo de ontologiardquoGrobenik and Mladenic 2006

Induccedilatildeo de conceitos (a partir das instacircncias)rlm

Induccedilatildeo de relaccedilotildees (a partir de conceitos e

instacircncias a eles associadas)rlm

Popular ontologia (dada uma ontologia e

instacircncias de seus conceitos)rlm

Geraccedilatildeo de uma ontologia completa (a partir

das instacircncias e algum conhecimentoinformaccedilatildeo)rlm

Atualizaccedilatildeoextensatildeo de ontologias (dada

uma ontologia e informaccedilatildeo como novas

instacircncias ou padrotildees de uso da ontologia)rlm

Document Clustering - Vector Model

Vector of word occurences in the documents

bull diK = TF(Wkdi) IDF(Wk)rlm

Where

bull TF(Wkdi) = number of times Wk occurs in document di

bull IDF(Wk) = log ( D DF(Wk))rlm

bull D = number of documents

bull DF(Wk) = number of documents in which word W occurs

Document distance metric

Anotaccedilotildees Semacircnticas(Kiryakov et al 2004)rlm

21042010

12

Anotaccedilatildeo Semacircntica de Documentos

Atribui agraves entidades que aparecem no documento ligaccedilotildees com suas descriccedilotildees semacircnticas na ontologia

Aplicaacutevel a qualquer tipo de texto (documentos HTML documentos de texto comuns campos de banco de dados entre outros)

Representaccedilatildeo das anotaccedilotildees

Intrusiva

Natildeo intrusiva

Confecccedilatildeo das anotaccedilotildees

bull Semi-Automaacutetica Associa palavras do texto a classes

instacircncias e propriedades da ontologia utilizando-se do

julgamento humano Esta associaccedilatildeo geralmente eacute efetuada

atraveacutes de interfaces ldquoarraste-e-solterdquo (eg OntoMat)rlm

bull Automaacutetica Aplica teacutecnicas de processamento de

linguagem natural aprendizado de maacutequina e extraccedilatildeo de

informaccedilatildeo entre outras para associar palavras agrave ontologia

Essas ferramentas podem utilizar ontologias padratildeo (eg

IEEE Standard Upper Ontology) ou ontologias de domiacutenios

especiacuteficos (eg Unified Medical Language System)

bull Hiacutebrida Combinaccedilatildeo das teacutecnicas acima

Geraccedilatildeo de anotaccedilotildees semacircnticas (Reeve e Han 2005)rlm

Ferramentas para anotaccedilatildeo

Annozilla Funciona sobre o Mozzila Firefox

Annotea projeto da W3C - servidor de anotaccedilotildees em RDF

Armadillo

Muse

Pankol

Semantic Word anotaccedilatildeo interativa de porccedilotildees de documentos

Word

OntoMat Annotizer anotaccedilatildeo interativa de paacuteginas Web com

ontologias em OWL

Smore marcaccedilotildees sobre HTML com ontologias em OWL

Melita ferramenta de anotaccedilatildeo semi-automaacutetica que usa algoritmo

de IE para ajudar o usuaacuterio no processo de anotaccedilatildeo

MnM anotaccedilatildeo semacircntica de paacuteginas Web com metadados

descritos em RDFOCMLDAML+OIL

KIM permite criar metadados armazenar e buscar informaccedilotildees e

pode ser usada para anotaccedilatildeo e procura de documentos

21042010

13

O processo automatizado de anotaccedilatildeo semacircntica de documentos

Tokenizaccedilatildeo e Eliminaccedilatildeo de StopWords

Etiquetagem

Stemmer

Corpus Anotado

Identificaccedilatildeo EN

Associaccedilatildeo atermos da ontologia

RepositoacuterioSemacircntico

Tokensrelevantes

Palavras +Classificaccedilatildeo Gramatical

Radicais das Palavras +Classificaccedilatildeo Gramatical

Entidades Nomeadas

Anotaccedilatildeo Semacircntica

Dados Metadados Documento

s

Ontologia do Domiacutenio

Valida

Valida

Especialista

RepositoacuterioInformaccedilatildeo

Annotation example(Davies et al 2006)

Consider the phrase

There are deliverables

The tokens are

[There] [are] [deliverables] []

The tagger finds out what kind of a word each of the tokens

is (whether it is a noun an adjective a verb etc)rlm

[There] existential quantifier

[are] verbmdash3rd person singular present

[deliverables] nounmdashplural

Annotation example (cont)rlm

The morphological analyser gives the roots of all the words

[There] rootmdashthere

[are] rootmdashbe

[deliverables] rootmdashdeliverable

There are mdash mdashmdash

triggers the creation of one or more new classes in the

ontology

There are projects

There are workpackages tasks and deliverables

SEKT is a project

MUSINGrlmbdquoKnowledgerlmWeb‟rlmandrlmbdquoPrestorlmSpace‟rlmarerlmprojects

Projects have workpackages

Workpackages can have tasks

WP1 WP2 WP3 WP4 WP5 and WP6 are workpackages

SEKT has WP1

MUSING has WP2 WP3 and WP4

bdquoKnowledgerlmWeb‟rlmhasrlmWP5 and WP6

Annotation example (cont)rlm

Ontologia resultante Quadro Comparativo(Nunes e Fileto 2007)rlm

21042010

14

Dependecircncias entre plataformas(Rui Tramontin Junior 2007)rlm

Comparaccedilatildeo de desempenho(Reeve e Han 2005)rlm

Prataforma Categoria Precisatildeo Cobertura Medida F

Armadillo Descoberta de padrotildees

910 740 870

KIM Regras 860 820 840

MnM Induccedilatildeo 950 900 nd

MUSE Regras 935 923 929

PANKOW Descoberta de padrotildees

650 282 249

SemTag Regras 820 nd nd

Evoluccedilatildeo de ontologias(Bloehdorn et al 2006)rlm

Exemplo Uso natildeo uniforme de conceitos

Alternativas para remoccedilatildeo do conceito C que tem sub-conceitos

Processo de evoluccedilatildeo de ontologias

CapturaCaptura

da

Mudanccedila

Representaccedilatildeo Semacircntica Propagaccedilatildeo Implementaccedilatildeo Validaccedilatildeo

Fases Elementares

21042010

15

Mapeamentos entre ontologias(Ontology Matching)

Fusatildeo de ontologias

Processo semi-automatico de alinhamento(Huang at al 2006)rlm

Referecircncia

Jerome Euzenat INRIA Rhone-Alpes France

Pavel Shvaiko University of Trento Italy

Ontology Matching

URL httpbookontologymatchingorg

Springer-Verlag Heidelberg (DE) 2007

343 p 67 illus Hardcover

ISBN 978-3-540-49611-3

E as buscas semacircnticas

Recuperaccedilatildeo da informaccedilatildeo de documentosrlm

Medidas da eficaacutecia das soluccedilotildees

precisatildeo = nro de docs relevantes recuperadosnro de docs recuperados

cobertura = nro de docs relevantes recuperadosnro de docs relevantes

21042010

16

Classificaccedilatildeo de abordagens para buscas semacircnticas (Mangold 2007)

Arquitetura

Acoplamento entre ontologias e documentos

Transparecircncia

Contexto do usuaacuterio

Modificaccedilatildeo de consultas

Estrutura das ontologias

Tecnologia para representar as ontologias

Desempenho escalabilidade e distribuiccedilatildeo

Adaptabilidade

Ranking

Arquiteturas para buscas semacircnticas

Maacutequina de busca stand_alone armazenametadados sobre os documentos em iacutendicescom os quais avalia as consultas

Meta-maacutequina de busca distribui asconsultas para outras maacutequinas de busca ecombina os resultados

Acoplamento ontologias-documentos

Acoplamento forte os metadados dosdocumentos referem-se explicitamente aosconceitos de uma ontologia e vice-versa(requer anotaccedilatildeo semacircntica)rlm

Acoplamento fraco os documentos satildeoindependentes de quaisquer ontologiasdisponiacuteveis (pode restringir a capacidade debusca)rlm

Contexto do usuaacuterio

Learning extraiacutedo na interaccedilotildees do usuaacuteriocom o sistema (histoacuterico das consultas erefinamentos de consultas)rlm

Hard-coded as consultas satildeo organizadas emcategorias que definem a informaccedilatildeo solicitada(eg ldquolocation ofrdquo ldquoresources forrdquo rlm(

Modificaccedilatildeo de consultas

Manual o sistema retorna um trechoapropriado da ontologia junto com a respostapermitindo ao usuaacuterio navegar na ontologia ereformular a consulta pela adiccedilatildeo e remoccedilatildeo determos

Re-escrita automaacutetica a consulta eacuteotimizada automaticamente pelo sistema

Baseada em grafo considera conceitos edocumentos como nodos de um grafoefetuando propagaccedilatildeo da consulta a partir dosnodos correspondentes a termos de busca

Modificaccedilatildeo de consultas

Modificaccedilatildeo de consulta

Manual

Re-escrita de consulta

Baseada em grafo

Inserccedilatildeo de termoRemoccedilatildeo de termo

Substituiccedilatildeo de termo

Conjuntiva

Disjuntiva

Conjuntiva Disjuntiva

21042010

17

Estrutura da ontologia

Propriedades anocircnimas as relaccedilotildees entreconceitos natildeo satildeo nomeadas indicando apenasque eles compartilham o mesmo contexto

Propriedades padronizadas sinocircniacutemiahiperniacutemia meroniacutemia negaccedilatildeo etc

Propriedades especiacuteficas de domiacutenio aleacutemdas propriedades padratildeo considerapropriedades especiacuteficas de um domiacutenio (egldquotipo de cacircmerardquo em sistema para a aacuterea defotografia)rlm

Tecnologia da ontologia

F-Logic

RDF

DAML+OIL

Frames

OWL

Comparaccedilatildeo de abordagens Comparaccedilatildeo de abordagens (cont)

Buscas semacircnticas na Web hoje

httpwwwaliprcom (imagens)rlm

httpwwwcognitioncom

httpwwwdeepdyvecom

httpwwwbingcom

httpwwwcuilcom

httpwwwfreebasecom

httpwwwgooglecom

httpwwwkosmixcom

httpwwwhakiacom

httpwwwpowersetcom

httpwwwsensebotnet

httpdeveloperyahoocomsearchmonkey

httpswoogleumbcedu (ontologias)rlm

21042010

18

21042010

19

SAO PAULO-SP

University of Sao Paulo

Sao Paulo Fashion

Sao Paulo Fashion Week

Sao Paulo State

Sao Paulo Hotel

Sao Paulo Hotels

Sao Paulo Brasilien

Sao Paulo Congonhas

21042010

20

21042010

21

Sao Paulo Airport

Sao Paulo Plane Crash

Sao Paulo Zoo

hellip

21042010

22

21042010

23

Algumas questotildees em aberto

Representaccedilatildeo de contextos de usuaacuterios emapeamento desses a ontologias

Anaacutelise dos efeitos de modificaccedilotildees de consultas

Meta-buscas semacircnticas

Anaacutelise da aceitaccedilatildeo dos usuaacuterios

Adaptabilidade a diferentes ontologias

Ranking dos resultados

Integraccedilatildeo com sistemas de gerenciamento dedocumentosconteuacutedo

Tratamento de dados multimiacuteda

Interfaces homem-maacutequina

Desempenho e escalabilidade

Contextual Semantic Search (CSS)(DAgostine Fileto ndash SBBD2007)rlm

21042010

24

General Architecture for CSSThe Weighted Topic Graph(DAgostine Fileto Dantas Gauthier - ICEIS 2008)rlm

A weighted topic graph is a graph TM(T A)rlm

T is a set of topics (vertices)rlm

A is a set of associations (edges)rlm

Let be an ontology O

Each topic t in T corresponds to a ontology term o in O

Each topic t has a weight [01] The sum from the weights from all topics with same name equals 1

Each association a has a weight [01] The sum

from all the weights from all association departing

a single topics equals 1

Topic weights used to disambiguate

Eg interest in Satildeo Paulo city instead of Satildeo Paulo

state

Association weights used to semantically

expand searches

Eg Actual interest in Guarulhos and airport while

searching for Satildeo Paulo city

The Weights in the Topic Graph Capturing the Users Context

Generated Topic Graph with the Ontological Users Context

The Contextual Semantic Search Process

21042010

25

Desambiguaccedilatildeo

Fundamento dos algoritmos de busca sobre contexto ontoloacutegico

Heuriacutesticas de estigmergia (Ant Colony Optimization - ACO)

Traccedilos de ferormocircnio

Algoritmo de busca semacircntica baseada em ACO

Entrada palavras-chave[ ]

Dados G(TA) Onto repositoacuterio

limite_de_profundidade

limite_miacutenimo_de_peso

λ fator de atenuaccedilatildeo de peso

iniacutecio Algoritmo Busca Contextual 1 Estigmeacuterica

resultados = busca_G_ou_Onto(palavras-chave[])

atenuaG (iacutendice ) λrlmisin [0 1]

manutenccedilatildeo(coleta_feedback(resultados))

fim

21042010

26

Demo Praestro ndash Karina Fasolin

Alguns trabalhos relacionados

Name Article Comments

Graupmann

et al 2005

The SphereSearch

engine for unifiedranked retrieval of

heterogeneous XML

and web documents

Searches through XML documents The context is a region in radius

around given element A data inside two regions is considered relevant

to both contexts

Made tests with large collections like DBLP INEX Wikipedia put for

stress testing regarding the size of the collection

ldquoLet us first comment on the difficulties of defining a meaningfulbenchmark for this kind of novel systemrdquo

Park e

Cheyer 2006

Just For Me Topic

Maps and Ontologies

Manages knowledge in three layers Topics Knowledge Structures and

Documents

Not implemented (at least at the time of publication)

Michlmayr

et al 2007Adaptive User Profiles

for Enterprise

Information Access

Represents context as an individual graph The graph is constructed

based on tags used to semantically annotate the content which the user

considers to be relevant

However the tags are only that only labels They are not tied-down to

a formal definition

Alguns trabalhos relacionados (cont)

Name Article Comments

Aleman-

Meza et a

2003

Context-Aware

Semantic Association

Ranking

Also defines context as regions But the regions are static defined in

the ontology which is used by the system So the contexts are defined

the same for every single user

Mani and

Sundaram

2007

Modeling user context

with applications to

media retrieval

Creates a graph representing the users context Each node

corresponds to an instance in the ontology The edges represent

relations between the instances Built to search trough multimedia

documents

However it does not associates the vocabulary the user uses with the

instances

Challam et

al 2007

Contextual Search

Using Ontology-Based

User Profiles

Monitors the users activity capturing content from open Internet

Explorer MS-Office and MSN The captured information is stored and

usedrlmtorlmbuildrlmarlmuser‟srlmcontextualrlmprofilerlmbasesrlmonrlmanrlmontology

The context is tightly coupled with the ontology

NO IMAGES WERE

PROVIDED

Vallet et al

2006

Personalized

Information Retrieval in

Context

Stores context as a graph constructed based on the ontology used by

the system Similar to Mani and Sundaram including its limitations

(mapping the vocabulary) however if built for text documents

Sieg et al

2007

Ontological User

Profiles for

Personalized Web

Search

Similar to Challam et al but it gets the context information from the

ontology terms used to annotate the retrieved relevant context

Also limited by the structure of the ontology

Alguns trabalhos relacionados(cont)

Name Deals with

objective

knowledge

(ontology)

Deals with

subjective

knowledge

(users

context)

The knowledge

management is

transparent

Idea Implemented

Graupmann et

al 2005

X IMPL

Park e Cheyer

2006

X X X IDEA

Michlmayr et al2007

X X IMPL

Aleman-Meza et

a 2003

X X IMPL

Mani eSundaram 2007

X X X IMPL

Challam et al

2007

X X X IMPL

Vallet et al 2006 X X X IMPL

Sieg et al 2007 X X X IMPL

(incomplete)

Praestro X X X IMPL

(prototype)

UnA-SUS ndash Universidade Aberta do SUS

Programa do Ministeacuterio da Sauacutede para atender necessidades de e

permanente dos

Accedilotildees focadas em

formulaccedilatildeo de conteuacutedo

bibliotecas digitais

cursos a distacircncia

21042010

27

Metas da UnA-SUS

Desenvolver um

plataforma para de

composiccedilatildeo e de

Montar e oferecer cursos para formaccedilatildeo continuada de profissionais da sauacutede

157

Metadados

O processo de produccedilatildeo catalogaccedilatildeo e reuso de OAs

Repositoacuterio

Conteuacutedo

OAs

requisiccedilotildees

Design revisatildeo e publicaccedilatildeo

OA

SGA outros reps

Busca e reuso

OAsMetadados

OAs

Concepccedilatildeo e validaccedilatildeo de OAs

O processo de produccedilatildeo catalogaccedilatildeo e reuso de OAs

OA1

Curso A

Curso B

OA2

OA3

Viacutedeo

Imagens

RepositoacuteriosConteuacutedoMultimiacutedia

SGA RepositoacuteriosOAs

Reuso eacute essencial

bull OAs satildeo caros para produzir

bull Demandas emergenciais na sauacutede puacuteblica exigem agilidade e pronta resposta com cursos para a qualificaccedilatildeo de profissionais

H1N1

Apoplexia

gripe suiacutena gripe A

influenza H1N1

hellip

21042010

28

Navegaccedilatildeo hiperboacutelica no DeCSCatalogaccedilatildeo de Objetos de Aprendizagem (OAs) usando Vocabulaacuterios Controlados

bull Seleccedilatildeo de termos do DeCS CID-10 SNOMED

ndash via fornecimento de palavras-chave que satildeo pesquisadas na base de conhecimento

ndash via navegaccedilatildeo em uma visatildeo do conhecimento em forma de aacutervore

Seleccedilatildeo via contexto ontoloacutegicoProtoacutetipo (catalogaccedilatildeo com entrada

de palavra-chave)

DSpaceCatalogaccedilatildeo de OAswf

Protoacutetipo (catalogaccedilatildeo com navegaccedilatildeo

na base de conhecimento)

DSpaceRecuperaccedilatildeo de OAswf

21042010

29

Recuperaccedilatildeo de Objetos de Aprendizagem (OAs) Baseada em Conhecimento

bull Vocabulaacuterios e relaccedilotildees semacircnticas

ndash Oriundos do DeCS

ndash Definidos pelos catalogadores de OAs

ndash Gerados pelo cruzamento de informaccedilotildees com o CID-10 (Classificaccedilatildeo Internacional de Doenccedilas)

ndash Ex sinocircnimos eacute um(a) parte de causa efeito sintoma etc

DeCs

Anatomia

Sistema Nervoso

Sistema Nervoso Central

Enceacutefalo

Prosenceacutefalo

Telencaacutefalo

Ceacuterebro

Doenccedilas

Doenccedilas do Sistema Nervoso

Doenccedilas Cardiovasculares

Doenccedilas do Sistema Nervoso Central

Encefalopatias

Transtornos Cerebrovasculares

Doenccedilas Vasculares

Transtornos Cerebrovasculares

Acidente Vascular Cerebral

Acidente Vascular Cerebral

OA 1

OA 2

AVC

IctusCerebral

Derrame Cerebral

Hemisfeacuterios Cerebrais

ApoplexiaAcidente

Cerebrovascular

IctoCerebral

Apoplexia Cerebrovascular

Apoplexia Cerebral

Acidente Vascular

Encefaacutelico

Acidente Vascular

do Ceacuterebro

Acidente Vascular Cerebral

padratildeo (sinocircnimo)

anota

especiacutefica de domiacutenio

anocircnimas (DeCs)

172

DeCs

Anatomia

Sistema Nervoso

Sistema Nervoso Central

Enceacutefalo

Prosenceacutefalo

Telencaacutefalo

Ceacuterebro (2)

Doenccedilas

Doenccedilas do Sistema Nervoso

Doenccedilas Cardiovasculares

Doenccedilas do Sistema Nervoso Central

Encefalopatias

Transtornos Cerebrovasculares

Doenccedilas Vasculares

Transtornos Cerebrovasculares

Acidente Cerebral Vascular (1)

Acidente Cerebral Vascular(1)

OA 1

OA 2

AVC

IctusCerebral

Derrame Cerebral

Hemisfeacuterios Cerebrais

ApoplexiaAcidente

Cerebrovascular

IctoCerebral

Apoplexia Cerebrovascular

Apoplexia Cerebral

Acidente Vascular

Encefaacutelico

Acidente Vascular

do Ceacuterebro

Acidente Vascular Cerebral

Busca de OAs na aacuterea de sauacutede usando conhecimento de domiacutenio

Semantic Learning Objects (VIAN J SILVEIRA R A FILETO R WCCE 2009)

21042010

30

Conclusotildees

A Web semacircntica tem potencial de contribuir naobtenccedilatildeo de melhores resultados para buscas

Suporte automatizado eacute fundamental para a construccedilatildeo evoluccedilatildeo e integraccedilatildeo de ontologias anotaccedilotildees semacircnticas e contextos de usuaacuterios

Nossos primeiros resultados focam na captura e utilizaccedilatildeo de contextos de usuaacuterios mapeados a ontologias de domiacutenios especiacuteficos paradesambiguar e estender as buscas

Trabalhos futuros

Processos parcialmente automatizados para geraccedilatildeo e atualizaccedilatildeo de ontologias e anotaccedilotildees semacircnticas

Experimentos para comprovar a eficaacutecia das teacutecnicas e ferramentas utilizadas

Validaccedilatildeo de soluccedilotildees de problemas de busca semacircntica em diversos domiacutenios de aplicaccedilatildeo

Determinaccedilatildeo de niacuteveis adequados de acoplamento entre contextos e ontologias e dessas com os recursos a serem recuperados

Notiacutecias e anaacutelises

httpnewscnetcomnew-search-engine-cuil-takes-aim-at-google

httpwwwreadwritewebcomarchivesis_google_a_semantic_search_enginephp

httpwwwreadwritewebcomarchivessemantic_search_the_myt

h_and_realityphp

httpwwwpandiacomsew1262-top-5-semantic-search-

engineshtml

httpmindsetresearchyahoocom

httpnewscnetcom8301-13953_3-9982015-80html

httpwwwsearchenginejournalcomaskcom-focuses-on-semantic-search8252

httpnewsbbccouk2hiprogrammesclick_onlinedefaultstm

httpnewsbbccouk2hiprogrammesclick_online8144765stm

Web semacircntica e buscassemacircnticas

httpwwww3org2001sw

httpsemanticweborg

httpenwikipediaorgwikiSemantic_Web

httpenwikipediaorgwikiSemantic_search

Ferramentas de desenvolvimento

httpprotegestanfordedu

httpjenasourceforgenet

httpwwww3org2001Annotea

httpwwwontotextcomkim

httpesww3orgtopicSemanticWebTools

httpwwwdamlorg200305swmu-tools-

tutorialOverviewhtml

Referecircncias em Web semacircntica

T Berners-Lee J Hendler e O Lassila The Semantic Web Scientific American May 2001

Thomas B Passing Explores Guide to the Semantic Web Manning Publications Greenwich CT 2005

Davies J Studer R Warren P (Eds) Semantic Web Technologies trends and research in ontology-based

Systems John Wiley amp Sons 2006

Breitman KK Casanova MA Truszkowski W Semantic Web

Concepts Technologies and Applications Series NASA Monographs in Systems and Software Engineering Springer 2007

Grigoris Antoniou and Frank van Harmelen A Semantic Web Primer 2nd edition The MIT Press Cambridge MA USA 2008

Kashyap V Bussler C Moran M The Semantic Web -Semantics for Data and Services on the Web Series Data-

Centric Systems and Applications Springer 2008

Hitzler P Krotzsch M Rudolph S Foundations of SemanticWeb Technologies Chapman amp HallCRC 2009

21042010

31

Referecircncias em buscas semacircnticas

Guha R McCool R and Miller E 2003 Semantic search In Proc of the 12th international Conference on World Wide Web

(WWW) Budapest Hungary ACM New York NY 2003 700-709

Reeve L and Han H 2005 Survey of semantic annotation

platforms In Proceedings of the ACM Symposium on Applied Computing Santa Fe New Mexico ACM New York NY 2005

1634-1638

Eetu Makela Survey of Semantic Search Research

Mangold C A Survey and classification of semantic search approaches Journal of Metadata Semantics and Ontology 2(1)

2007

Stephan Bloehdorn Philipp Cimiano Alistair Duke Peter Haase Joumlrg Heizmann Ian Thurlow Johanna Voumllker Ontology-BasedQuestion Answering for Digital Libraries ECDL 2007 14-25

Hai Dong Hussain FK Chang E A survey in semantic search technologies In 2nd IEEE International Conference on

Digital Ecosystems and Technologies 2008 403-408

Algumas referecircncias grupo UFSC

DAgostini C S Fileto R Capturing Users Preferences and Intentions in a Semantic Search System In 21st International

Conference on Software Engineering amp Knowledge Engineering (SEKE) Boston 2009 p 587-591

DAgostini C S Fileto R Dantas M A R Gauthier F A O

Contextual Semantic Search - Capturing using the UsersContext to Direct Semantic Search In 10th InternationalConference on Enterprise Information Systems (ICEIS) Barcelona

Spain 2008 v SAIC p 154-159

DAgostini C S Fileto R Capturing and managing usercontext for improving information retrieval In Workshop de

Teses e Dissertaccedilotildees do Simpoacutesio Brasileiro de Bancos de Dados (WTDBDSBBD) Campinas Unicamp Brazil 2008

Vian J Silveira R A Fileto R Proposal of a Multi-agent System for Indexing and Recovery applied to Learning

Objects In 9th IFIP World Conference on Computers in Education (WCCE) Bento Goncalves Brazil 2009

Alguns projetos na UFSC

httpwwwlisaufscbrprojetos

httpwwwunasusufscbr

httpwwwliteraturabrasileiraufscbr

Perguntas

Page 2: Buscas Semânticasfileto/Talks/BuscasSemanticas6sp.pdf · 21/04/2010 1 1 Buscas semânticas: panorama e tendências atuais minicurso ERBD 2010 RenatoFileto fileto@inf.ufsc.br AlunosColaboradores:

21042010

2

Estrutura da Introduccedilatildeo

Motivaccedilatildeo O que eacute a Web semacircntica

Objetivos

Ontologias anotaccedilotildees semacircnticas inferecircncia

Padrotildees da Web Semacircntica

RDF RDF-Schema OWL SPARQLrlm RIF

Desafios da Web semacircntica

Criaccedilatildeo de ontologias anotaccedilotildees semacircnticas

inferecircncia articulaccedilatildeo de ontologias

Desenvolvimento de aplicaccedilotildees

Buscas semacircnticas

Ontologia na Filosofia

Filosofia grega

Ontos = ser logos = ciecircncia

Conceitualizaccedilatildeo compatilhada de algum universo de discurso ou domiacutenio de interesse

Conjunto de conceitos (eg entities attributes processes) com suas definiccedilotildees e intershyrelacionamentos

Visatildeo unificada para resolver problemas envolvendo significado (eg buscas semacircnticas integraccedilatildeo de dados interoperabilidade de sistemas composiccedilatildeo de serviccedilos)

Carrega uma visatildeo de mundo

Ontologias na Computaccedilatildeo

Ontologia

Conceitualizaccedilatildeo compartilhada

de um domiacutenio

Expliacutecita e formal para permitir o

processamento por maacutequinas

Pode ter diferentes formas

Thesaurus com relaccedilotildees semacircnticas entre termos (eg sinoniacutemia )

Taxonomia

Diagrama de classes

Base de conhecimento

Classes propriedades e suas relaccedilotildees

Instacircncias de classes

Compartilhada e Expliacutecita

Compartilhada um grupo de pessoas em um certo

domiacutenio deve concordar sobre o significado de entidades e relaccedilotildees expressas em uma ontologia

Expliacutecita uma ontologia eacute uma representaccedilatildeo concreta e manipulaacutevel de (parte de) uma conceitualizaccedilatildeo

Uma conceitualizaccedilatildeo poderia ser impliacutecita

eg existente somente na cabeccedila de algueacutem ou

embutida em um moacutedulo de software

Formal

Uma ontologia [expliacutecita] pode ter diversas formas mas

sempre inclui um vocabulaacuterio de termos e alguma especificaccedilatildeo de seu significado O grau de formalizaccedilatildeo de do vocabulaacuterio e dos significados especificados pode variar

consideravelmente

Altamente informal expressa em linguagem natural

Semishyinformal expressa em uma forma restrita e estruturada de linguagem natural

Semishyformal expressa em uma linguagem artificial e formalmente definida

Rigorosamente formal termos meticulosamente definidos com semacircntica formal teoremas e provas de propriedades como consistecircncia (soundness) e completuude

Trecho de ontologia 1

Pessoa

Santo

S1

IS_A

TYPE_OF

nome

Satildeo Paulo

Time

TimeFutebol

TF1

IS_A

TYPE_OF

nome

Satildeo Paulo

ParcelaTerritoacuterio

Estado

IS_A

Cidade

E1

TYPE_OF

nome

Satildeo Paulo

C1

nome

Satildeo PauloTricolor Paulista

PART_OF

21042010

3

Trecho de ontologia 2 Travel Exemplo de ontologia 3 DeCS(Descritores em Ciecircncias da Sauacutede)

Exemplo de ontologia 3a ndash DeCS(anatomia)

Exemplo de ontologia 3b ndash DeCS(doenccedilas)

Exemplo de ontologia 3c ndash DeCS(doenccedilas) Aplicaccedilotildees de Ontologias

Buscas semacircnticas

Ex Estado(Satildeo Paulo) Cidade(Satildeo Paulo)rlm

Interoperabilidade

Agentes moacuteveis

Reuso e composiccedilatildeo de recursos

Semantic Learning Objects

Semantic Web Services

Semantically enabled services amp workflows

21042010

4

Uses of ontologies

Comunicaccedilatildeo

entre pessoas e organizaccedilotildees

Interoperabilidade

Entre sistemas

Componentes Reusaacuteveis Confiabilidade

Especificaccedilatildeo

Engenharia de Sistemas

Outras distinccedilotildees pode ser importantes dentro de cada

categoria tais como a natureza do software tipo de usuaacuteriosn e domiacutenio de aplicaccedilatildeo

Ontologias como uma IntershyLingua

L1

L3

L2

L4

L1

L3

L2

L4

Interlingua

T1 T2

T3 T4

Ontologias pode ser usadas como suporte na traduccedilatildeo entre diferentes linguagens e

representaccedilotildees de informaccedilatildeoconhecimento

Padrotildees da Web semacircntica

Character Encoding

Codificaccedilatildeo de Caracteres

Exemplos de cabeccedilalhos de documentos XML com especificaccedilatildeo do

padratildeo de codificaccedilatildeo de caracteres utilizados nesses documentos

ltxml encoding=UTF-8gt

ltxml encoding=UTF-16gt

ltxml encoding=EUC-JPgt

ltxml version=ldquo10rdquo encoding=ISO-8859-1gt

URIs (Unified Resource Identifiers)rlm

httpwwww3orgAddressing

httpwwww3orgAddressingbackground

httpwwwfoldocorgUniform+Resource+Locator

ftpspysecretftpacmecompubtopsecretweapontgz

mailtofreddocicacuk

newsalthypertext

telnet19202168o

magicabcdef

ldap[2001db87]c=GBobjectClassone

tel+1-816-555-1212

urnoasisnamesspecificationdocbookdtdxml412

exampleabc7Bfoo7D

eXAMPLEabb637bfoo7d

NameSpaces

Exemplos de trechos de documentos XML com especificaccedilotildees e

uso de namespaces

ltx xmlnsedi=httpecommerceorgschemagt

lt-- the edi prefix is bound to httpecommerceorgschema

for the x element and contents --gt

ltxgt

ltbook xmlns=urnlocgovbooks

xmlnsisbn=urnISBN0-395-36341-6gt

lttitlegtCheaper by the Dozenlttitlegt

ltisbnnumbergt1568491379ltisbnnumbergt

ltbookgt

ltschema xmlnshttpwwww3org2001XMLSchemagt

ltschemagt

21042010

5

XML ndash eXtensible Makup Language

Construccedilotildees baacutesicas

ltElementogt Conteuacutedo ltElementogt

ltElemento gt

ltElemento Atributo1=ldquoValorrdquo Atributo2=ldquoValorrdquogt

ltElementorlmAtributo1=ldquoValorrdquorlmAtributo2=ldquoValorrdquogtrlm rlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlm

Conteuacutedo

ltElementogt

ltElemento1gt

ltElemento2gt

Conteuacutedo

ltElemento2gt

ltElemento1gt

ltElemento1gtltElemento2gtltElemento1gt

Um documento XML

ltxml version=10 encoding=ISO-8859-1 gt

ltElementoRaizgt

ltElemento1gt

ltElemento1_1gt Conteuacutedo ltElemento1_1gt

ltElemento1_2gt Conteuacutedo ltElemento1_2gt

ltElemento1_3gt

ltElemento1gt

ltElemento2gt

ltElemento2_1gt

ltElemento2_1_1gt Conteuacutedo ltElemento2_1_1gt

ltElemento2_1_2gt

ltElemento2_1gt

ltElemento2gt

ltElementoRaizgt

A Versatilidade do XML para Dados Semi-Estruturados

ltxml version=10 encoding=ISO-8859-1 gt

ltPessoarlmNome=ldquoJoatildeorlmderlmSouzardquorlmDataDeNascimento=ldquo12061964rdquorlmCPF=ldquo12312312rdquogt

ltEnderecosgt

ltEnderecorlmTipo=ldquoComercialrdquogtRuarlmArlm23rlm- CentroltEnderecogt

ltEnderecorlmTipo=ldquoResidencialrdquogtTorrerlmComercialrlm1923rlmSl1011rlmltEnderecogt

ltMalaDiretarlmDestino=ldquoComercialrdquogt

ltEnderecosgt

ltFormasDeContatogt

ltTelefonesgt

ltTelefonerlmTipo=ldquoComercialrdquorlmDDD=ldquo61rdquorlmRamal=ldquo211rdquogt222-8545ltTelefonegt

ltTelefonerlmTipo=ldquoCelularrdquorlmDDD=ldquo61rdquogt999-9999ltTelefonegt

ltTelefonerlmTipo=ldquoResidencialrdquorlmDDD=ldquo61rdquogt444-4444ltTelefonegt

ltTelefonesgt

ltEmailgtjoatildeoemailcombrltEmailgt

ltICQrlmNumero=rlmrdquo127653467654ldquorlmgt

ltFormasDeContatogt

ltPessoagt

Doc XML para Dados Climaacuteticos (Balanccedilo Hiacutedrico)rlm

ltxml version=10 encoding=ISO8859-1gt

ltWaterBal xmlns=httpwwwagricgovbrWaterBalxsd

location=Brotas latitude=-221500 longitude=-475800gt

ltWeatherData Date=ldquo20050823rdquogt

ltTemperaturegt 220 ltTemperaturegt

ltAvgRainFallgt 2013 ltAvgRainFallgt

ltPotETgt 1154 ltPotETgt

ltRealETgt 1154 ltRealETgt

ltStoredgt 1250 ltStoredgt

ltWaterDeficitgt 00 ltWaterDeficitgt

ltWaterExcessgt 860 ltWaterExcessgt

ltWeatherData gt

ltWaterBalgt

Arquivo texto (natildeo XML) com dados pluviomeacutetricos

weather station

year

station

code

end of file

latitude longitude altitude

Jan

Feb

Mar

Apr

May

Jun

Jul

Aug

Sep

Oct

Nov

Dec

XML-Schema

Um documento XML-Schema descreve os

elementos

atributos

relacionamentos

etc

permitidos em um ou mais documentos XML isto eacute define uma classe de documentos XML que adere a um

conjunto de restriccedilotildees estruturais e de dados

XML-Schema tem uma sintaxe XML

XML-Schema eacute mais robusta versaacutetil e poderosa que DTD (Document Type Definition)rlm

21042010

6

Um Documento XML-Schema(WaterBalxsd)rlm

ltschema xmlnshttpwwww3org2001XMLSchema gt

ltelement name=WaterBal type=WaterBalTypegt

ltattribute name=location type=stringgt

ltattribute name=latitude type=Latitudegt

ltattribute name=longitude type=Longitudegt

ltelement name=WeatherData type=AgregValuesgt

ltcomplexType name=AgregValuesgt

ltattribute name=Date type=DateTypegt

ltsequencegt

ltelement name=Temperature type=decimalgt

ltelement name=AvgRainfall type=decimalgt

ltelement name=PotET type=decimalgt

ltelement name=RealET type=decimalgt

ltelement name=Stored type=decimalgt

ltelement name=WaterDeficit type=decimalgt

ltelement name=WaterExcess type=decimalgt

ltsequencegt

ltcomplexTypegt

ltelementgt

ltschemagt

Validaccedilatildeo de documentos XML

Documento bem-formado (well-formed) satisfaz as restriccedilotildees

de formaccedilatildeo expressa na especificaccedilatildeo do XML

(httpwwww3orgTR2004REC-xml-20040204)rlm

Documento vaacutelido satisfaz as restriccedilotildees (elementos atributos

aninhamentos tipos etc) expressas em uma especificaccedilatildeo de

esquema XML em DTD ou XSL (XML-Schema) que eacute associada a

esse documento XML

Heterogeneidade semacircntica em XML

ltobject id=ldquoa1rdquo class=ldquoartifactrdquogt

lttuplegt

lttitlegt Nympheas lttitlegt

ltyeargt 1897 ltyeargt

ltcreatorgt Monet ltcreatorgt

ltpricegt 10000000 ltpricegt

ltowners refs=ldquop1p2p3rdquogt

lttuplegt

ltobjectgt

ltobject id=ldquop3rdquo class=ldquopersonrdquogt

lttuplegt

ltnamegt Claudia ltnamegt

ltagegt 17 ltagegt

lttuplegt

ltobjectgt

ltworkgt

ltartistgt Monet ltartistgt

ltnamegt Nympheas ltnamegt

ltstylegt Impressionist ltstylegt

ltsizegt 21 x 61 ltsizegt

ltcplacegt Givern ltcplacegt

ltworkgt

ltworkgt

ltartistgt Monet ltartistgt

lttitlegt Waterloo Bridge lttitlegt

ltstylegt Impressionist ltstylegt

ltsizegt 292 x 464 ltsizegt

lthistorygt

Painted with

lttechgt Oil on canvas lttechgt

in

lthistorygt

ltworkgt

XML como Padratildeo de representaccedilatildeo de dados

ldquoArtworksrdquorlmStructure

Works works

Work

Work

Field

artist title style size

string string string string

ldquoArtfactrdquorlmSchema

artifacts set

ampArtifact

Artifact class

artifact

tuple

title year creator price owners

ampPerson

string int string float list

YAT Model

YAT Any

YAT

V ampYAT

ODMG Model

Vtuple

Symbol

Type

V(int vbool v

float vstring)rlm

ampClass

Type

V

Symbol

(set vbag vlist varray)rlm

Class class

Symbol

Type

RDF ndash Resource Description Framework

Uma linguagem e modelo padronizados para expressar conhecimento na Web semacircntica

Um comando (statement) eacute uma tripla da forma

Recurso qualquer coisa referenciada por uma URL

Propriedade qualquer propriedade de um recurso

Valor um literal ou outro recurso

RDF-Schema define classes de recursos suas propriedades (que podem ser relacionamentos com outras classes) e possiacuteveis valores

Os formatos para representar ontologias na Web semacircntica (eg

DAML+OIL OWL) satildeo extensotildees do RDF

Sintaxe XML do RDF

ltxml version=10gt

ltrdfRDF xmlnsRDF httpwwww3orgRDFRDFldquo

xmlnsdc httpdublincoreorgdcldquogt

ltrdfDescription about=ldquohttpwwwagritempocnptiaembrapabrrdquogt

ltdctitlegt Nuacutecleo de Monitoramento e Anaacutelise de Dados

Meteoroloacutegicos e Climatoloacutegicos para a Agricultura ltdctitlegt

ltleadergt

rdfresource=ldquohttpwwwcnptiaembrapabr~assadrdquo

ltleadergt

ltrdfDescriptiongt

ltrdfDescription

about=ldquohttpwwwcnptiaembrapabr~assadrdquogt

ltdctitlegt Eduardo D Assad ltdctitlegt

ltemailgt Assadcnptiaembrapabr ltemailgt

ltrdfDescriptiongt

ltrdfRDF gt

21042010

7

Estrutura do conhecimento em RDF

httpwwwagritempocnptiaembrapabr

httpwwwcnptiaembrapabr~assad

Nuacutecleo de Monitoramento e

Anaacutelise de Dados

Meteoroloacutegicos e Climatoloacutegicos

para a Agricultura

assadcnptiaembrapabrEduardo D

Assad

dctitle

dctitleemail

leader

Metadata in RDFWater Balance (same place and institution)rlm

ltxml version=10gt

ltrdfRDF xmlnsRDF httpwwww3orgRDFRDFldquo

xmlns httpagricgovbrDocStdldquogt

ltrdfDescription about=httpwwwagricgovbrpublicWaterBal1234gt

ltSourcegt

rdfresource=ldquohttpwwwcepagriunicampbrrdquo

rdfresource=ldquohttpwwwciagroiacgovspbrrdquo

ltSourcegt

ltInitialDategt 28032002 ltInitialDategt

ltFinalDategt 31032002 ltFinalDategt

ltkeywordgt Water available in Soil ltkeyworkgt

ltlocalgt

rdfresource= ldquohttpwwwibgegovbrstate_SPrdquo

ltlocalgt

ltmeasument_unitgt

rdfresource= ldquohttpwwwinmetrogovbrmmrdquo

ltmeasument_unitgt

ltrdfDescriptiongt

ltrdfRDFgt

httpwwwagricgovbrpublicWaterBal1234

http

wwwcpaunicampbr

Centro de Pesquisas

Agriacutecolas (CEPAGRI)

name

source

httpwwwciagroiacg

ovspbr

httpwwwunica

mpbr

part_of

CIIAGRO

name

http

wwwiacgovspbr

part_of

InitialDate

28032002

FinalDateWater available in

Soil

http

wwwibgegovbrstate_SP

source

keyword

http

wwwinmetrogovbrmm

31032002

local

measurement_unit

RDF-Schema

ltrdfabout=ampAgricZoningCountry rdfslabel=Countrygt

ltrdfssubClassOf dfresource=ampAgricZoningTerritorialDivisiongt

ltrdfabout=ampAgricZoningState rdfslabel=ldquoStategt

ltrdfssubClassOf dfresource=ampAgricZoningTerritorialDivisiongt

ltrdfProperty rdfabout=ampAgricZoningstatesOfCountry

aminCardinality=1

rdfslabel=statesOfCountrygt

ltrdfsdomain rdfresource=ampAgricZoningCountrygt

ltrdfsrange rdfresource=ampAgricZoningStategt

ltainverseProperty rdfresource=ampAgricZoningcountryOfStategt

ltrdfPropertygt

RDF-Schema

ltrdfProperty rdfabout=ampAgricZoningcountryOfState

amaxCardinality=1

aminCardinality=1

rdfslabel=countryOfStategt

ltrdfsrange rdfresource=ampAgricZoningCountrygt

ltrdfsdomain rdfresource=ampAgricZoningStategt

ltainverseProperty

rdfresource=ampAgricZoningstatesOfCountrygt

ltrdfPropertygt

Trecho de RDF

ltAgricZoningCountry rdfabout=ampAgricZoningpais_55

AgricZoningnameBR=BRASIL rdfslabel=BRASILgt

ltAgricZoningofficialRegionsOfCountry

rdfresource=ampAgricZoningregof_1gt

ltAgricZoningofficialRegionsOfCountry

rdfresource=ampAgricZoningregof_2gt

ltAgricZoningofficialRegionsOfCountry

rdfresource=ampAgricZoningregof_3gt

ltAgricZoningofficialRegionsOfCountry

rdfresource=ampAgricZoningregof_4gt

ltAgricZoningofficialRegionsOfCountry

rdfresource=ampAgricZoningregof_5gt

ltAgricZoningstatesOfCountry rdfresource=ampAgricZoningestado_11gt

ltAgricZoningstatesOfCountry rdfresource=ampAgricZoningestado_12gt

ltAgricZoningmetroAreasOfCountry

rdfresource=ampAgricZoningmetro_5201gt

ltAgricZoningCountrygt

21042010

8

Descriccedilotildees em RDF de recursos para a coleta de dados cientiacuteficos

wwwEquipServcombrschema2rdfs

RD

F S

chem

aR

DF

Equipment Clienthas

String StringString String

category model name city

wwwAgriTempobrschema1rdfs

WeatherStation

longitudealtitude

LandParcel

CountyState

latitude

inpart_of

ampws1

ampws3

ampws4

Stringname

ampeq1

ampRio

ampUbatuba

ampCampinas

ampws2

ampUnicamp

ampEmbrapa

ampSP

ampRJ

in

in

in

in

part_of

part_of

part_of

has

has

has

has

ampws1 = httpwwwembrapabrWeatherStationX

ampws2 = httpwwwiacbrWeatherStationK

ampws3 = httpwwwunicampbrWheaterStationA

ampws4 = httpwwwunicampbrWheaterStationB

ampeq1 = httpwwwembrapabrCameraZ

subClassOf (isA)rlm

typeOf (instance)rlm

other kind of property

DegreesDecMeters

String

String

value

value

OWL ndash Ontology Web Language

Estende o RDF com vocabulaacuterio padronizado e construccedilotildees para definir

Escopo local de propriedades

Disjunccedilatildeo de classes

Combinaccedilotildees de classes

Restriccedilotildees de cardinalidade

Caracteriacutesticas especiais de propriedades (eg transitividade simetria anti-simetria propriedades inversas)rlm

The 3 flavors of OWL

OWL LiteExpressividade restrita (exclui classes enumeradas disjunccedilatildeo cardinalidade arbitraacuteria )

Faacutecil de entender e usar

OWL DL

Equivalente agrave loacutegica descritiva (DL = Description

Logics)

Ainda permite eficiecircncia e computabilidade

OWL Full

Compatiacutevel sintaacutetica e semanticamente com RDF embora mais poderosaPode ocasionar inferecircncias indecidiacuteveis

Disjunction and Equivalence of Classes

ltowlClass rdfabout=associateProfessorgt

ltowldisjointWith rdfresource=assistantProfessorgt

ltowlClassgt

ltowlClass rdfID=facultygt

ltowlequivalentClass

rdfresource=academicStaffMembergt

ltowlClassgt

Inverse properties

ltowlObjectProperty rdfID=teachesgt

ltrdfsrange rdfresource=coursegt

ltrdfsdomain rdfresource=academicStaffMembergt

ltowlinverseOf rdfresource=isTaughtBygt

ltowlObjectPropertygt

Sintaxe abstrata para OWL

Class(Person partialrestriction (hasChild allValuesFrom(Person)))rlm

Class(Parent completePersonrestriction (hasChild someValuesFrom(Person)))rlm

ObjectProperty(hasChild)rlm

Individual (John type(Person)rlmvalue(hasChild Mary))rlm

21042010

9

Busca em uma ontologia

Pessoa

Santo

S1

IS_A

TYPE_OF

nome

Satildeo Paulo

Time

TimeFutebol

TF1

IS_A

TYPE_OF

nome

Satildeo Paulo

ParcelaTerritoacuterio

Estado

IS_A

Cidade

E1

TYPE_OF

nome

Satildeo Paulo

C1

nome

Satildeo PauloTricolor Paulista

PART_OF

SPARQL (recomendaccedilatildeo W3C)rlm

Exemplo de expressatildeo em SPARQL

SELECTrlmconceptrlm propertyrlm ldquoSatildeorlmPaulordquo

WHERE

concept propertyhasProperty property

FILTER(property name)rlm

Linguagens de Regras (Prolog)

Rules

parent(x z)rlm - father(x z) v mother(x z)

sibling(x y)rlm- parent(x z) and parent(y z)

Knowledge base

father(_Maria _Joatildeo)

father(_Pedro _Joatildeo)

Query

sibling(_Maria x) rArr Yes rArr b = _PedrorArr b = _xyz1rArr b = _xyz2 rArr b = _xyz3rArr b = _xyz4

RIF (Rule Interchange Format)

A buyer buys an item from a seller if the seller sells it to the buyer John sells LeRif to Mary The fact Mary buys LeRif from John can be logically derived by a modus ponens argument

Document(

Prefix(cpt lthttpexamplecomconceptsgt)

Prefix(ppl lthttpexamplecompeoplegt)

Prefix(bks lthttpexamplecombooksgt)

Group ( Forall Buyer Item Seller (

cptbuy(Buyer Item Seller)

cptsell(Seller Item Buyer)

)

cptsell(pplJohn bksLeRif pplMary)

)

)

Controveacutersia sobre pilha de padrotildees

Peter F Patel-Schneider A Revised Architecture for Semantic

Web Reasoning Third Workshop on Principles and Practices of

Semantic Web Reasoning Dagstuhl Germany September

2005 LNCS 3703 Springer Verlag 2005

Ian Horrocks Bijan Parsia Peter F Patel-Schneider and

James Hendler Semantic Web Architecture Stack or Two

Towers Third Workshop on Principles and Practices of Semantic Web Reasoning Dagstuhl Germany September

2005 LNCS 3703 Springer Verlag 2005

Peter F Patel-Schneider Building the Semantic Web Tower

from RDF Straw Nineteenth International Joint Conference on

Artificial Intelligence Edinburgh Scotland August 2005

Proposta inicial (2000)rlm

21042010

10

Proposta regras(2005)rlm Proposta atual

Como estaacute a Web semacircntica hoje

Aacuterea de pesquisa muito ativa

Visa estender o papel dos computadores no

suporte a diversas atividades humanas

Usa ontologias e anotaccedilotildees semacircnticas para

catalogar recuperar e compor dados e serviccedilos

de processamento na Web

Desafios da Web semacircntica

Construccedilatildeo de ontologias

(Semi-)automatizada e interativa

Geraccedilatildeo de anotaccedilotildees semacircnticas de recursos

Muitas aplicaccedilotildees requerem automatizaccedilatildeo

Evoluccedilatildeo de ontologias

Checar se alteraccedilotildees natildeo introduzem inconsistecircncias e gerenciar

versotildees

Integraccedilatildeo de ontologias (ontology matching)

A obtenccedilatildeo de consenso eacute inviaacutevel em muitas domiacutenios

Deduccedilatildeoraciociacutenio

Teorias computaacuteveis e natildeo computaacuteveis ontologias inconsistentes

Ediccedilatildeo de Ontologias no Proteacutegeacute

Editor de ontologias e arcabouccedilo para o desenvolvimento de bases de conhecimento livre e de coacutedigo aberto baseado em Java

Suporta os modelos de frames (RDF) e OWL

Exporta as ontologias e bases de conhecimento para uma variedade de formatos incluindo RDF(S) OWL e XML Schema

Extensiacutevel via plugins

Construccedilatildeo de ontologias

Processo para geraccedilatildeo automatizada de

ontologias a partir de esboccedilos dados e

documentos (nova geraccedilatildeo de ferramentas)rlm

Entendimento do domiacutenio

Entendimento dos dados

Definiccedilatildeo das tarefas

Geraccedilatildeo semi-automaacutetica

Avaliaccedilatildeo de qualidade

Refinamento com interaccedilatildeo humana

21042010

11

Definiccedilotildees de ldquogeraccedilatildeo de ontologiardquoGrobenik and Mladenic 2006

Induccedilatildeo de conceitos (a partir das instacircncias)rlm

Induccedilatildeo de relaccedilotildees (a partir de conceitos e

instacircncias a eles associadas)rlm

Popular ontologia (dada uma ontologia e

instacircncias de seus conceitos)rlm

Geraccedilatildeo de uma ontologia completa (a partir

das instacircncias e algum conhecimentoinformaccedilatildeo)rlm

Atualizaccedilatildeoextensatildeo de ontologias (dada

uma ontologia e informaccedilatildeo como novas

instacircncias ou padrotildees de uso da ontologia)rlm

Document Clustering - Vector Model

Vector of word occurences in the documents

bull diK = TF(Wkdi) IDF(Wk)rlm

Where

bull TF(Wkdi) = number of times Wk occurs in document di

bull IDF(Wk) = log ( D DF(Wk))rlm

bull D = number of documents

bull DF(Wk) = number of documents in which word W occurs

Document distance metric

Anotaccedilotildees Semacircnticas(Kiryakov et al 2004)rlm

21042010

12

Anotaccedilatildeo Semacircntica de Documentos

Atribui agraves entidades que aparecem no documento ligaccedilotildees com suas descriccedilotildees semacircnticas na ontologia

Aplicaacutevel a qualquer tipo de texto (documentos HTML documentos de texto comuns campos de banco de dados entre outros)

Representaccedilatildeo das anotaccedilotildees

Intrusiva

Natildeo intrusiva

Confecccedilatildeo das anotaccedilotildees

bull Semi-Automaacutetica Associa palavras do texto a classes

instacircncias e propriedades da ontologia utilizando-se do

julgamento humano Esta associaccedilatildeo geralmente eacute efetuada

atraveacutes de interfaces ldquoarraste-e-solterdquo (eg OntoMat)rlm

bull Automaacutetica Aplica teacutecnicas de processamento de

linguagem natural aprendizado de maacutequina e extraccedilatildeo de

informaccedilatildeo entre outras para associar palavras agrave ontologia

Essas ferramentas podem utilizar ontologias padratildeo (eg

IEEE Standard Upper Ontology) ou ontologias de domiacutenios

especiacuteficos (eg Unified Medical Language System)

bull Hiacutebrida Combinaccedilatildeo das teacutecnicas acima

Geraccedilatildeo de anotaccedilotildees semacircnticas (Reeve e Han 2005)rlm

Ferramentas para anotaccedilatildeo

Annozilla Funciona sobre o Mozzila Firefox

Annotea projeto da W3C - servidor de anotaccedilotildees em RDF

Armadillo

Muse

Pankol

Semantic Word anotaccedilatildeo interativa de porccedilotildees de documentos

Word

OntoMat Annotizer anotaccedilatildeo interativa de paacuteginas Web com

ontologias em OWL

Smore marcaccedilotildees sobre HTML com ontologias em OWL

Melita ferramenta de anotaccedilatildeo semi-automaacutetica que usa algoritmo

de IE para ajudar o usuaacuterio no processo de anotaccedilatildeo

MnM anotaccedilatildeo semacircntica de paacuteginas Web com metadados

descritos em RDFOCMLDAML+OIL

KIM permite criar metadados armazenar e buscar informaccedilotildees e

pode ser usada para anotaccedilatildeo e procura de documentos

21042010

13

O processo automatizado de anotaccedilatildeo semacircntica de documentos

Tokenizaccedilatildeo e Eliminaccedilatildeo de StopWords

Etiquetagem

Stemmer

Corpus Anotado

Identificaccedilatildeo EN

Associaccedilatildeo atermos da ontologia

RepositoacuterioSemacircntico

Tokensrelevantes

Palavras +Classificaccedilatildeo Gramatical

Radicais das Palavras +Classificaccedilatildeo Gramatical

Entidades Nomeadas

Anotaccedilatildeo Semacircntica

Dados Metadados Documento

s

Ontologia do Domiacutenio

Valida

Valida

Especialista

RepositoacuterioInformaccedilatildeo

Annotation example(Davies et al 2006)

Consider the phrase

There are deliverables

The tokens are

[There] [are] [deliverables] []

The tagger finds out what kind of a word each of the tokens

is (whether it is a noun an adjective a verb etc)rlm

[There] existential quantifier

[are] verbmdash3rd person singular present

[deliverables] nounmdashplural

Annotation example (cont)rlm

The morphological analyser gives the roots of all the words

[There] rootmdashthere

[are] rootmdashbe

[deliverables] rootmdashdeliverable

There are mdash mdashmdash

triggers the creation of one or more new classes in the

ontology

There are projects

There are workpackages tasks and deliverables

SEKT is a project

MUSINGrlmbdquoKnowledgerlmWeb‟rlmandrlmbdquoPrestorlmSpace‟rlmarerlmprojects

Projects have workpackages

Workpackages can have tasks

WP1 WP2 WP3 WP4 WP5 and WP6 are workpackages

SEKT has WP1

MUSING has WP2 WP3 and WP4

bdquoKnowledgerlmWeb‟rlmhasrlmWP5 and WP6

Annotation example (cont)rlm

Ontologia resultante Quadro Comparativo(Nunes e Fileto 2007)rlm

21042010

14

Dependecircncias entre plataformas(Rui Tramontin Junior 2007)rlm

Comparaccedilatildeo de desempenho(Reeve e Han 2005)rlm

Prataforma Categoria Precisatildeo Cobertura Medida F

Armadillo Descoberta de padrotildees

910 740 870

KIM Regras 860 820 840

MnM Induccedilatildeo 950 900 nd

MUSE Regras 935 923 929

PANKOW Descoberta de padrotildees

650 282 249

SemTag Regras 820 nd nd

Evoluccedilatildeo de ontologias(Bloehdorn et al 2006)rlm

Exemplo Uso natildeo uniforme de conceitos

Alternativas para remoccedilatildeo do conceito C que tem sub-conceitos

Processo de evoluccedilatildeo de ontologias

CapturaCaptura

da

Mudanccedila

Representaccedilatildeo Semacircntica Propagaccedilatildeo Implementaccedilatildeo Validaccedilatildeo

Fases Elementares

21042010

15

Mapeamentos entre ontologias(Ontology Matching)

Fusatildeo de ontologias

Processo semi-automatico de alinhamento(Huang at al 2006)rlm

Referecircncia

Jerome Euzenat INRIA Rhone-Alpes France

Pavel Shvaiko University of Trento Italy

Ontology Matching

URL httpbookontologymatchingorg

Springer-Verlag Heidelberg (DE) 2007

343 p 67 illus Hardcover

ISBN 978-3-540-49611-3

E as buscas semacircnticas

Recuperaccedilatildeo da informaccedilatildeo de documentosrlm

Medidas da eficaacutecia das soluccedilotildees

precisatildeo = nro de docs relevantes recuperadosnro de docs recuperados

cobertura = nro de docs relevantes recuperadosnro de docs relevantes

21042010

16

Classificaccedilatildeo de abordagens para buscas semacircnticas (Mangold 2007)

Arquitetura

Acoplamento entre ontologias e documentos

Transparecircncia

Contexto do usuaacuterio

Modificaccedilatildeo de consultas

Estrutura das ontologias

Tecnologia para representar as ontologias

Desempenho escalabilidade e distribuiccedilatildeo

Adaptabilidade

Ranking

Arquiteturas para buscas semacircnticas

Maacutequina de busca stand_alone armazenametadados sobre os documentos em iacutendicescom os quais avalia as consultas

Meta-maacutequina de busca distribui asconsultas para outras maacutequinas de busca ecombina os resultados

Acoplamento ontologias-documentos

Acoplamento forte os metadados dosdocumentos referem-se explicitamente aosconceitos de uma ontologia e vice-versa(requer anotaccedilatildeo semacircntica)rlm

Acoplamento fraco os documentos satildeoindependentes de quaisquer ontologiasdisponiacuteveis (pode restringir a capacidade debusca)rlm

Contexto do usuaacuterio

Learning extraiacutedo na interaccedilotildees do usuaacuteriocom o sistema (histoacuterico das consultas erefinamentos de consultas)rlm

Hard-coded as consultas satildeo organizadas emcategorias que definem a informaccedilatildeo solicitada(eg ldquolocation ofrdquo ldquoresources forrdquo rlm(

Modificaccedilatildeo de consultas

Manual o sistema retorna um trechoapropriado da ontologia junto com a respostapermitindo ao usuaacuterio navegar na ontologia ereformular a consulta pela adiccedilatildeo e remoccedilatildeo determos

Re-escrita automaacutetica a consulta eacuteotimizada automaticamente pelo sistema

Baseada em grafo considera conceitos edocumentos como nodos de um grafoefetuando propagaccedilatildeo da consulta a partir dosnodos correspondentes a termos de busca

Modificaccedilatildeo de consultas

Modificaccedilatildeo de consulta

Manual

Re-escrita de consulta

Baseada em grafo

Inserccedilatildeo de termoRemoccedilatildeo de termo

Substituiccedilatildeo de termo

Conjuntiva

Disjuntiva

Conjuntiva Disjuntiva

21042010

17

Estrutura da ontologia

Propriedades anocircnimas as relaccedilotildees entreconceitos natildeo satildeo nomeadas indicando apenasque eles compartilham o mesmo contexto

Propriedades padronizadas sinocircniacutemiahiperniacutemia meroniacutemia negaccedilatildeo etc

Propriedades especiacuteficas de domiacutenio aleacutemdas propriedades padratildeo considerapropriedades especiacuteficas de um domiacutenio (egldquotipo de cacircmerardquo em sistema para a aacuterea defotografia)rlm

Tecnologia da ontologia

F-Logic

RDF

DAML+OIL

Frames

OWL

Comparaccedilatildeo de abordagens Comparaccedilatildeo de abordagens (cont)

Buscas semacircnticas na Web hoje

httpwwwaliprcom (imagens)rlm

httpwwwcognitioncom

httpwwwdeepdyvecom

httpwwwbingcom

httpwwwcuilcom

httpwwwfreebasecom

httpwwwgooglecom

httpwwwkosmixcom

httpwwwhakiacom

httpwwwpowersetcom

httpwwwsensebotnet

httpdeveloperyahoocomsearchmonkey

httpswoogleumbcedu (ontologias)rlm

21042010

18

21042010

19

SAO PAULO-SP

University of Sao Paulo

Sao Paulo Fashion

Sao Paulo Fashion Week

Sao Paulo State

Sao Paulo Hotel

Sao Paulo Hotels

Sao Paulo Brasilien

Sao Paulo Congonhas

21042010

20

21042010

21

Sao Paulo Airport

Sao Paulo Plane Crash

Sao Paulo Zoo

hellip

21042010

22

21042010

23

Algumas questotildees em aberto

Representaccedilatildeo de contextos de usuaacuterios emapeamento desses a ontologias

Anaacutelise dos efeitos de modificaccedilotildees de consultas

Meta-buscas semacircnticas

Anaacutelise da aceitaccedilatildeo dos usuaacuterios

Adaptabilidade a diferentes ontologias

Ranking dos resultados

Integraccedilatildeo com sistemas de gerenciamento dedocumentosconteuacutedo

Tratamento de dados multimiacuteda

Interfaces homem-maacutequina

Desempenho e escalabilidade

Contextual Semantic Search (CSS)(DAgostine Fileto ndash SBBD2007)rlm

21042010

24

General Architecture for CSSThe Weighted Topic Graph(DAgostine Fileto Dantas Gauthier - ICEIS 2008)rlm

A weighted topic graph is a graph TM(T A)rlm

T is a set of topics (vertices)rlm

A is a set of associations (edges)rlm

Let be an ontology O

Each topic t in T corresponds to a ontology term o in O

Each topic t has a weight [01] The sum from the weights from all topics with same name equals 1

Each association a has a weight [01] The sum

from all the weights from all association departing

a single topics equals 1

Topic weights used to disambiguate

Eg interest in Satildeo Paulo city instead of Satildeo Paulo

state

Association weights used to semantically

expand searches

Eg Actual interest in Guarulhos and airport while

searching for Satildeo Paulo city

The Weights in the Topic Graph Capturing the Users Context

Generated Topic Graph with the Ontological Users Context

The Contextual Semantic Search Process

21042010

25

Desambiguaccedilatildeo

Fundamento dos algoritmos de busca sobre contexto ontoloacutegico

Heuriacutesticas de estigmergia (Ant Colony Optimization - ACO)

Traccedilos de ferormocircnio

Algoritmo de busca semacircntica baseada em ACO

Entrada palavras-chave[ ]

Dados G(TA) Onto repositoacuterio

limite_de_profundidade

limite_miacutenimo_de_peso

λ fator de atenuaccedilatildeo de peso

iniacutecio Algoritmo Busca Contextual 1 Estigmeacuterica

resultados = busca_G_ou_Onto(palavras-chave[])

atenuaG (iacutendice ) λrlmisin [0 1]

manutenccedilatildeo(coleta_feedback(resultados))

fim

21042010

26

Demo Praestro ndash Karina Fasolin

Alguns trabalhos relacionados

Name Article Comments

Graupmann

et al 2005

The SphereSearch

engine for unifiedranked retrieval of

heterogeneous XML

and web documents

Searches through XML documents The context is a region in radius

around given element A data inside two regions is considered relevant

to both contexts

Made tests with large collections like DBLP INEX Wikipedia put for

stress testing regarding the size of the collection

ldquoLet us first comment on the difficulties of defining a meaningfulbenchmark for this kind of novel systemrdquo

Park e

Cheyer 2006

Just For Me Topic

Maps and Ontologies

Manages knowledge in three layers Topics Knowledge Structures and

Documents

Not implemented (at least at the time of publication)

Michlmayr

et al 2007Adaptive User Profiles

for Enterprise

Information Access

Represents context as an individual graph The graph is constructed

based on tags used to semantically annotate the content which the user

considers to be relevant

However the tags are only that only labels They are not tied-down to

a formal definition

Alguns trabalhos relacionados (cont)

Name Article Comments

Aleman-

Meza et a

2003

Context-Aware

Semantic Association

Ranking

Also defines context as regions But the regions are static defined in

the ontology which is used by the system So the contexts are defined

the same for every single user

Mani and

Sundaram

2007

Modeling user context

with applications to

media retrieval

Creates a graph representing the users context Each node

corresponds to an instance in the ontology The edges represent

relations between the instances Built to search trough multimedia

documents

However it does not associates the vocabulary the user uses with the

instances

Challam et

al 2007

Contextual Search

Using Ontology-Based

User Profiles

Monitors the users activity capturing content from open Internet

Explorer MS-Office and MSN The captured information is stored and

usedrlmtorlmbuildrlmarlmuser‟srlmcontextualrlmprofilerlmbasesrlmonrlmanrlmontology

The context is tightly coupled with the ontology

NO IMAGES WERE

PROVIDED

Vallet et al

2006

Personalized

Information Retrieval in

Context

Stores context as a graph constructed based on the ontology used by

the system Similar to Mani and Sundaram including its limitations

(mapping the vocabulary) however if built for text documents

Sieg et al

2007

Ontological User

Profiles for

Personalized Web

Search

Similar to Challam et al but it gets the context information from the

ontology terms used to annotate the retrieved relevant context

Also limited by the structure of the ontology

Alguns trabalhos relacionados(cont)

Name Deals with

objective

knowledge

(ontology)

Deals with

subjective

knowledge

(users

context)

The knowledge

management is

transparent

Idea Implemented

Graupmann et

al 2005

X IMPL

Park e Cheyer

2006

X X X IDEA

Michlmayr et al2007

X X IMPL

Aleman-Meza et

a 2003

X X IMPL

Mani eSundaram 2007

X X X IMPL

Challam et al

2007

X X X IMPL

Vallet et al 2006 X X X IMPL

Sieg et al 2007 X X X IMPL

(incomplete)

Praestro X X X IMPL

(prototype)

UnA-SUS ndash Universidade Aberta do SUS

Programa do Ministeacuterio da Sauacutede para atender necessidades de e

permanente dos

Accedilotildees focadas em

formulaccedilatildeo de conteuacutedo

bibliotecas digitais

cursos a distacircncia

21042010

27

Metas da UnA-SUS

Desenvolver um

plataforma para de

composiccedilatildeo e de

Montar e oferecer cursos para formaccedilatildeo continuada de profissionais da sauacutede

157

Metadados

O processo de produccedilatildeo catalogaccedilatildeo e reuso de OAs

Repositoacuterio

Conteuacutedo

OAs

requisiccedilotildees

Design revisatildeo e publicaccedilatildeo

OA

SGA outros reps

Busca e reuso

OAsMetadados

OAs

Concepccedilatildeo e validaccedilatildeo de OAs

O processo de produccedilatildeo catalogaccedilatildeo e reuso de OAs

OA1

Curso A

Curso B

OA2

OA3

Viacutedeo

Imagens

RepositoacuteriosConteuacutedoMultimiacutedia

SGA RepositoacuteriosOAs

Reuso eacute essencial

bull OAs satildeo caros para produzir

bull Demandas emergenciais na sauacutede puacuteblica exigem agilidade e pronta resposta com cursos para a qualificaccedilatildeo de profissionais

H1N1

Apoplexia

gripe suiacutena gripe A

influenza H1N1

hellip

21042010

28

Navegaccedilatildeo hiperboacutelica no DeCSCatalogaccedilatildeo de Objetos de Aprendizagem (OAs) usando Vocabulaacuterios Controlados

bull Seleccedilatildeo de termos do DeCS CID-10 SNOMED

ndash via fornecimento de palavras-chave que satildeo pesquisadas na base de conhecimento

ndash via navegaccedilatildeo em uma visatildeo do conhecimento em forma de aacutervore

Seleccedilatildeo via contexto ontoloacutegicoProtoacutetipo (catalogaccedilatildeo com entrada

de palavra-chave)

DSpaceCatalogaccedilatildeo de OAswf

Protoacutetipo (catalogaccedilatildeo com navegaccedilatildeo

na base de conhecimento)

DSpaceRecuperaccedilatildeo de OAswf

21042010

29

Recuperaccedilatildeo de Objetos de Aprendizagem (OAs) Baseada em Conhecimento

bull Vocabulaacuterios e relaccedilotildees semacircnticas

ndash Oriundos do DeCS

ndash Definidos pelos catalogadores de OAs

ndash Gerados pelo cruzamento de informaccedilotildees com o CID-10 (Classificaccedilatildeo Internacional de Doenccedilas)

ndash Ex sinocircnimos eacute um(a) parte de causa efeito sintoma etc

DeCs

Anatomia

Sistema Nervoso

Sistema Nervoso Central

Enceacutefalo

Prosenceacutefalo

Telencaacutefalo

Ceacuterebro

Doenccedilas

Doenccedilas do Sistema Nervoso

Doenccedilas Cardiovasculares

Doenccedilas do Sistema Nervoso Central

Encefalopatias

Transtornos Cerebrovasculares

Doenccedilas Vasculares

Transtornos Cerebrovasculares

Acidente Vascular Cerebral

Acidente Vascular Cerebral

OA 1

OA 2

AVC

IctusCerebral

Derrame Cerebral

Hemisfeacuterios Cerebrais

ApoplexiaAcidente

Cerebrovascular

IctoCerebral

Apoplexia Cerebrovascular

Apoplexia Cerebral

Acidente Vascular

Encefaacutelico

Acidente Vascular

do Ceacuterebro

Acidente Vascular Cerebral

padratildeo (sinocircnimo)

anota

especiacutefica de domiacutenio

anocircnimas (DeCs)

172

DeCs

Anatomia

Sistema Nervoso

Sistema Nervoso Central

Enceacutefalo

Prosenceacutefalo

Telencaacutefalo

Ceacuterebro (2)

Doenccedilas

Doenccedilas do Sistema Nervoso

Doenccedilas Cardiovasculares

Doenccedilas do Sistema Nervoso Central

Encefalopatias

Transtornos Cerebrovasculares

Doenccedilas Vasculares

Transtornos Cerebrovasculares

Acidente Cerebral Vascular (1)

Acidente Cerebral Vascular(1)

OA 1

OA 2

AVC

IctusCerebral

Derrame Cerebral

Hemisfeacuterios Cerebrais

ApoplexiaAcidente

Cerebrovascular

IctoCerebral

Apoplexia Cerebrovascular

Apoplexia Cerebral

Acidente Vascular

Encefaacutelico

Acidente Vascular

do Ceacuterebro

Acidente Vascular Cerebral

Busca de OAs na aacuterea de sauacutede usando conhecimento de domiacutenio

Semantic Learning Objects (VIAN J SILVEIRA R A FILETO R WCCE 2009)

21042010

30

Conclusotildees

A Web semacircntica tem potencial de contribuir naobtenccedilatildeo de melhores resultados para buscas

Suporte automatizado eacute fundamental para a construccedilatildeo evoluccedilatildeo e integraccedilatildeo de ontologias anotaccedilotildees semacircnticas e contextos de usuaacuterios

Nossos primeiros resultados focam na captura e utilizaccedilatildeo de contextos de usuaacuterios mapeados a ontologias de domiacutenios especiacuteficos paradesambiguar e estender as buscas

Trabalhos futuros

Processos parcialmente automatizados para geraccedilatildeo e atualizaccedilatildeo de ontologias e anotaccedilotildees semacircnticas

Experimentos para comprovar a eficaacutecia das teacutecnicas e ferramentas utilizadas

Validaccedilatildeo de soluccedilotildees de problemas de busca semacircntica em diversos domiacutenios de aplicaccedilatildeo

Determinaccedilatildeo de niacuteveis adequados de acoplamento entre contextos e ontologias e dessas com os recursos a serem recuperados

Notiacutecias e anaacutelises

httpnewscnetcomnew-search-engine-cuil-takes-aim-at-google

httpwwwreadwritewebcomarchivesis_google_a_semantic_search_enginephp

httpwwwreadwritewebcomarchivessemantic_search_the_myt

h_and_realityphp

httpwwwpandiacomsew1262-top-5-semantic-search-

engineshtml

httpmindsetresearchyahoocom

httpnewscnetcom8301-13953_3-9982015-80html

httpwwwsearchenginejournalcomaskcom-focuses-on-semantic-search8252

httpnewsbbccouk2hiprogrammesclick_onlinedefaultstm

httpnewsbbccouk2hiprogrammesclick_online8144765stm

Web semacircntica e buscassemacircnticas

httpwwww3org2001sw

httpsemanticweborg

httpenwikipediaorgwikiSemantic_Web

httpenwikipediaorgwikiSemantic_search

Ferramentas de desenvolvimento

httpprotegestanfordedu

httpjenasourceforgenet

httpwwww3org2001Annotea

httpwwwontotextcomkim

httpesww3orgtopicSemanticWebTools

httpwwwdamlorg200305swmu-tools-

tutorialOverviewhtml

Referecircncias em Web semacircntica

T Berners-Lee J Hendler e O Lassila The Semantic Web Scientific American May 2001

Thomas B Passing Explores Guide to the Semantic Web Manning Publications Greenwich CT 2005

Davies J Studer R Warren P (Eds) Semantic Web Technologies trends and research in ontology-based

Systems John Wiley amp Sons 2006

Breitman KK Casanova MA Truszkowski W Semantic Web

Concepts Technologies and Applications Series NASA Monographs in Systems and Software Engineering Springer 2007

Grigoris Antoniou and Frank van Harmelen A Semantic Web Primer 2nd edition The MIT Press Cambridge MA USA 2008

Kashyap V Bussler C Moran M The Semantic Web -Semantics for Data and Services on the Web Series Data-

Centric Systems and Applications Springer 2008

Hitzler P Krotzsch M Rudolph S Foundations of SemanticWeb Technologies Chapman amp HallCRC 2009

21042010

31

Referecircncias em buscas semacircnticas

Guha R McCool R and Miller E 2003 Semantic search In Proc of the 12th international Conference on World Wide Web

(WWW) Budapest Hungary ACM New York NY 2003 700-709

Reeve L and Han H 2005 Survey of semantic annotation

platforms In Proceedings of the ACM Symposium on Applied Computing Santa Fe New Mexico ACM New York NY 2005

1634-1638

Eetu Makela Survey of Semantic Search Research

Mangold C A Survey and classification of semantic search approaches Journal of Metadata Semantics and Ontology 2(1)

2007

Stephan Bloehdorn Philipp Cimiano Alistair Duke Peter Haase Joumlrg Heizmann Ian Thurlow Johanna Voumllker Ontology-BasedQuestion Answering for Digital Libraries ECDL 2007 14-25

Hai Dong Hussain FK Chang E A survey in semantic search technologies In 2nd IEEE International Conference on

Digital Ecosystems and Technologies 2008 403-408

Algumas referecircncias grupo UFSC

DAgostini C S Fileto R Capturing Users Preferences and Intentions in a Semantic Search System In 21st International

Conference on Software Engineering amp Knowledge Engineering (SEKE) Boston 2009 p 587-591

DAgostini C S Fileto R Dantas M A R Gauthier F A O

Contextual Semantic Search - Capturing using the UsersContext to Direct Semantic Search In 10th InternationalConference on Enterprise Information Systems (ICEIS) Barcelona

Spain 2008 v SAIC p 154-159

DAgostini C S Fileto R Capturing and managing usercontext for improving information retrieval In Workshop de

Teses e Dissertaccedilotildees do Simpoacutesio Brasileiro de Bancos de Dados (WTDBDSBBD) Campinas Unicamp Brazil 2008

Vian J Silveira R A Fileto R Proposal of a Multi-agent System for Indexing and Recovery applied to Learning

Objects In 9th IFIP World Conference on Computers in Education (WCCE) Bento Goncalves Brazil 2009

Alguns projetos na UFSC

httpwwwlisaufscbrprojetos

httpwwwunasusufscbr

httpwwwliteraturabrasileiraufscbr

Perguntas

Page 3: Buscas Semânticasfileto/Talks/BuscasSemanticas6sp.pdf · 21/04/2010 1 1 Buscas semânticas: panorama e tendências atuais minicurso ERBD 2010 RenatoFileto fileto@inf.ufsc.br AlunosColaboradores:

21042010

3

Trecho de ontologia 2 Travel Exemplo de ontologia 3 DeCS(Descritores em Ciecircncias da Sauacutede)

Exemplo de ontologia 3a ndash DeCS(anatomia)

Exemplo de ontologia 3b ndash DeCS(doenccedilas)

Exemplo de ontologia 3c ndash DeCS(doenccedilas) Aplicaccedilotildees de Ontologias

Buscas semacircnticas

Ex Estado(Satildeo Paulo) Cidade(Satildeo Paulo)rlm

Interoperabilidade

Agentes moacuteveis

Reuso e composiccedilatildeo de recursos

Semantic Learning Objects

Semantic Web Services

Semantically enabled services amp workflows

21042010

4

Uses of ontologies

Comunicaccedilatildeo

entre pessoas e organizaccedilotildees

Interoperabilidade

Entre sistemas

Componentes Reusaacuteveis Confiabilidade

Especificaccedilatildeo

Engenharia de Sistemas

Outras distinccedilotildees pode ser importantes dentro de cada

categoria tais como a natureza do software tipo de usuaacuteriosn e domiacutenio de aplicaccedilatildeo

Ontologias como uma IntershyLingua

L1

L3

L2

L4

L1

L3

L2

L4

Interlingua

T1 T2

T3 T4

Ontologias pode ser usadas como suporte na traduccedilatildeo entre diferentes linguagens e

representaccedilotildees de informaccedilatildeoconhecimento

Padrotildees da Web semacircntica

Character Encoding

Codificaccedilatildeo de Caracteres

Exemplos de cabeccedilalhos de documentos XML com especificaccedilatildeo do

padratildeo de codificaccedilatildeo de caracteres utilizados nesses documentos

ltxml encoding=UTF-8gt

ltxml encoding=UTF-16gt

ltxml encoding=EUC-JPgt

ltxml version=ldquo10rdquo encoding=ISO-8859-1gt

URIs (Unified Resource Identifiers)rlm

httpwwww3orgAddressing

httpwwww3orgAddressingbackground

httpwwwfoldocorgUniform+Resource+Locator

ftpspysecretftpacmecompubtopsecretweapontgz

mailtofreddocicacuk

newsalthypertext

telnet19202168o

magicabcdef

ldap[2001db87]c=GBobjectClassone

tel+1-816-555-1212

urnoasisnamesspecificationdocbookdtdxml412

exampleabc7Bfoo7D

eXAMPLEabb637bfoo7d

NameSpaces

Exemplos de trechos de documentos XML com especificaccedilotildees e

uso de namespaces

ltx xmlnsedi=httpecommerceorgschemagt

lt-- the edi prefix is bound to httpecommerceorgschema

for the x element and contents --gt

ltxgt

ltbook xmlns=urnlocgovbooks

xmlnsisbn=urnISBN0-395-36341-6gt

lttitlegtCheaper by the Dozenlttitlegt

ltisbnnumbergt1568491379ltisbnnumbergt

ltbookgt

ltschema xmlnshttpwwww3org2001XMLSchemagt

ltschemagt

21042010

5

XML ndash eXtensible Makup Language

Construccedilotildees baacutesicas

ltElementogt Conteuacutedo ltElementogt

ltElemento gt

ltElemento Atributo1=ldquoValorrdquo Atributo2=ldquoValorrdquogt

ltElementorlmAtributo1=ldquoValorrdquorlmAtributo2=ldquoValorrdquogtrlm rlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlm

Conteuacutedo

ltElementogt

ltElemento1gt

ltElemento2gt

Conteuacutedo

ltElemento2gt

ltElemento1gt

ltElemento1gtltElemento2gtltElemento1gt

Um documento XML

ltxml version=10 encoding=ISO-8859-1 gt

ltElementoRaizgt

ltElemento1gt

ltElemento1_1gt Conteuacutedo ltElemento1_1gt

ltElemento1_2gt Conteuacutedo ltElemento1_2gt

ltElemento1_3gt

ltElemento1gt

ltElemento2gt

ltElemento2_1gt

ltElemento2_1_1gt Conteuacutedo ltElemento2_1_1gt

ltElemento2_1_2gt

ltElemento2_1gt

ltElemento2gt

ltElementoRaizgt

A Versatilidade do XML para Dados Semi-Estruturados

ltxml version=10 encoding=ISO-8859-1 gt

ltPessoarlmNome=ldquoJoatildeorlmderlmSouzardquorlmDataDeNascimento=ldquo12061964rdquorlmCPF=ldquo12312312rdquogt

ltEnderecosgt

ltEnderecorlmTipo=ldquoComercialrdquogtRuarlmArlm23rlm- CentroltEnderecogt

ltEnderecorlmTipo=ldquoResidencialrdquogtTorrerlmComercialrlm1923rlmSl1011rlmltEnderecogt

ltMalaDiretarlmDestino=ldquoComercialrdquogt

ltEnderecosgt

ltFormasDeContatogt

ltTelefonesgt

ltTelefonerlmTipo=ldquoComercialrdquorlmDDD=ldquo61rdquorlmRamal=ldquo211rdquogt222-8545ltTelefonegt

ltTelefonerlmTipo=ldquoCelularrdquorlmDDD=ldquo61rdquogt999-9999ltTelefonegt

ltTelefonerlmTipo=ldquoResidencialrdquorlmDDD=ldquo61rdquogt444-4444ltTelefonegt

ltTelefonesgt

ltEmailgtjoatildeoemailcombrltEmailgt

ltICQrlmNumero=rlmrdquo127653467654ldquorlmgt

ltFormasDeContatogt

ltPessoagt

Doc XML para Dados Climaacuteticos (Balanccedilo Hiacutedrico)rlm

ltxml version=10 encoding=ISO8859-1gt

ltWaterBal xmlns=httpwwwagricgovbrWaterBalxsd

location=Brotas latitude=-221500 longitude=-475800gt

ltWeatherData Date=ldquo20050823rdquogt

ltTemperaturegt 220 ltTemperaturegt

ltAvgRainFallgt 2013 ltAvgRainFallgt

ltPotETgt 1154 ltPotETgt

ltRealETgt 1154 ltRealETgt

ltStoredgt 1250 ltStoredgt

ltWaterDeficitgt 00 ltWaterDeficitgt

ltWaterExcessgt 860 ltWaterExcessgt

ltWeatherData gt

ltWaterBalgt

Arquivo texto (natildeo XML) com dados pluviomeacutetricos

weather station

year

station

code

end of file

latitude longitude altitude

Jan

Feb

Mar

Apr

May

Jun

Jul

Aug

Sep

Oct

Nov

Dec

XML-Schema

Um documento XML-Schema descreve os

elementos

atributos

relacionamentos

etc

permitidos em um ou mais documentos XML isto eacute define uma classe de documentos XML que adere a um

conjunto de restriccedilotildees estruturais e de dados

XML-Schema tem uma sintaxe XML

XML-Schema eacute mais robusta versaacutetil e poderosa que DTD (Document Type Definition)rlm

21042010

6

Um Documento XML-Schema(WaterBalxsd)rlm

ltschema xmlnshttpwwww3org2001XMLSchema gt

ltelement name=WaterBal type=WaterBalTypegt

ltattribute name=location type=stringgt

ltattribute name=latitude type=Latitudegt

ltattribute name=longitude type=Longitudegt

ltelement name=WeatherData type=AgregValuesgt

ltcomplexType name=AgregValuesgt

ltattribute name=Date type=DateTypegt

ltsequencegt

ltelement name=Temperature type=decimalgt

ltelement name=AvgRainfall type=decimalgt

ltelement name=PotET type=decimalgt

ltelement name=RealET type=decimalgt

ltelement name=Stored type=decimalgt

ltelement name=WaterDeficit type=decimalgt

ltelement name=WaterExcess type=decimalgt

ltsequencegt

ltcomplexTypegt

ltelementgt

ltschemagt

Validaccedilatildeo de documentos XML

Documento bem-formado (well-formed) satisfaz as restriccedilotildees

de formaccedilatildeo expressa na especificaccedilatildeo do XML

(httpwwww3orgTR2004REC-xml-20040204)rlm

Documento vaacutelido satisfaz as restriccedilotildees (elementos atributos

aninhamentos tipos etc) expressas em uma especificaccedilatildeo de

esquema XML em DTD ou XSL (XML-Schema) que eacute associada a

esse documento XML

Heterogeneidade semacircntica em XML

ltobject id=ldquoa1rdquo class=ldquoartifactrdquogt

lttuplegt

lttitlegt Nympheas lttitlegt

ltyeargt 1897 ltyeargt

ltcreatorgt Monet ltcreatorgt

ltpricegt 10000000 ltpricegt

ltowners refs=ldquop1p2p3rdquogt

lttuplegt

ltobjectgt

ltobject id=ldquop3rdquo class=ldquopersonrdquogt

lttuplegt

ltnamegt Claudia ltnamegt

ltagegt 17 ltagegt

lttuplegt

ltobjectgt

ltworkgt

ltartistgt Monet ltartistgt

ltnamegt Nympheas ltnamegt

ltstylegt Impressionist ltstylegt

ltsizegt 21 x 61 ltsizegt

ltcplacegt Givern ltcplacegt

ltworkgt

ltworkgt

ltartistgt Monet ltartistgt

lttitlegt Waterloo Bridge lttitlegt

ltstylegt Impressionist ltstylegt

ltsizegt 292 x 464 ltsizegt

lthistorygt

Painted with

lttechgt Oil on canvas lttechgt

in

lthistorygt

ltworkgt

XML como Padratildeo de representaccedilatildeo de dados

ldquoArtworksrdquorlmStructure

Works works

Work

Work

Field

artist title style size

string string string string

ldquoArtfactrdquorlmSchema

artifacts set

ampArtifact

Artifact class

artifact

tuple

title year creator price owners

ampPerson

string int string float list

YAT Model

YAT Any

YAT

V ampYAT

ODMG Model

Vtuple

Symbol

Type

V(int vbool v

float vstring)rlm

ampClass

Type

V

Symbol

(set vbag vlist varray)rlm

Class class

Symbol

Type

RDF ndash Resource Description Framework

Uma linguagem e modelo padronizados para expressar conhecimento na Web semacircntica

Um comando (statement) eacute uma tripla da forma

Recurso qualquer coisa referenciada por uma URL

Propriedade qualquer propriedade de um recurso

Valor um literal ou outro recurso

RDF-Schema define classes de recursos suas propriedades (que podem ser relacionamentos com outras classes) e possiacuteveis valores

Os formatos para representar ontologias na Web semacircntica (eg

DAML+OIL OWL) satildeo extensotildees do RDF

Sintaxe XML do RDF

ltxml version=10gt

ltrdfRDF xmlnsRDF httpwwww3orgRDFRDFldquo

xmlnsdc httpdublincoreorgdcldquogt

ltrdfDescription about=ldquohttpwwwagritempocnptiaembrapabrrdquogt

ltdctitlegt Nuacutecleo de Monitoramento e Anaacutelise de Dados

Meteoroloacutegicos e Climatoloacutegicos para a Agricultura ltdctitlegt

ltleadergt

rdfresource=ldquohttpwwwcnptiaembrapabr~assadrdquo

ltleadergt

ltrdfDescriptiongt

ltrdfDescription

about=ldquohttpwwwcnptiaembrapabr~assadrdquogt

ltdctitlegt Eduardo D Assad ltdctitlegt

ltemailgt Assadcnptiaembrapabr ltemailgt

ltrdfDescriptiongt

ltrdfRDF gt

21042010

7

Estrutura do conhecimento em RDF

httpwwwagritempocnptiaembrapabr

httpwwwcnptiaembrapabr~assad

Nuacutecleo de Monitoramento e

Anaacutelise de Dados

Meteoroloacutegicos e Climatoloacutegicos

para a Agricultura

assadcnptiaembrapabrEduardo D

Assad

dctitle

dctitleemail

leader

Metadata in RDFWater Balance (same place and institution)rlm

ltxml version=10gt

ltrdfRDF xmlnsRDF httpwwww3orgRDFRDFldquo

xmlns httpagricgovbrDocStdldquogt

ltrdfDescription about=httpwwwagricgovbrpublicWaterBal1234gt

ltSourcegt

rdfresource=ldquohttpwwwcepagriunicampbrrdquo

rdfresource=ldquohttpwwwciagroiacgovspbrrdquo

ltSourcegt

ltInitialDategt 28032002 ltInitialDategt

ltFinalDategt 31032002 ltFinalDategt

ltkeywordgt Water available in Soil ltkeyworkgt

ltlocalgt

rdfresource= ldquohttpwwwibgegovbrstate_SPrdquo

ltlocalgt

ltmeasument_unitgt

rdfresource= ldquohttpwwwinmetrogovbrmmrdquo

ltmeasument_unitgt

ltrdfDescriptiongt

ltrdfRDFgt

httpwwwagricgovbrpublicWaterBal1234

http

wwwcpaunicampbr

Centro de Pesquisas

Agriacutecolas (CEPAGRI)

name

source

httpwwwciagroiacg

ovspbr

httpwwwunica

mpbr

part_of

CIIAGRO

name

http

wwwiacgovspbr

part_of

InitialDate

28032002

FinalDateWater available in

Soil

http

wwwibgegovbrstate_SP

source

keyword

http

wwwinmetrogovbrmm

31032002

local

measurement_unit

RDF-Schema

ltrdfabout=ampAgricZoningCountry rdfslabel=Countrygt

ltrdfssubClassOf dfresource=ampAgricZoningTerritorialDivisiongt

ltrdfabout=ampAgricZoningState rdfslabel=ldquoStategt

ltrdfssubClassOf dfresource=ampAgricZoningTerritorialDivisiongt

ltrdfProperty rdfabout=ampAgricZoningstatesOfCountry

aminCardinality=1

rdfslabel=statesOfCountrygt

ltrdfsdomain rdfresource=ampAgricZoningCountrygt

ltrdfsrange rdfresource=ampAgricZoningStategt

ltainverseProperty rdfresource=ampAgricZoningcountryOfStategt

ltrdfPropertygt

RDF-Schema

ltrdfProperty rdfabout=ampAgricZoningcountryOfState

amaxCardinality=1

aminCardinality=1

rdfslabel=countryOfStategt

ltrdfsrange rdfresource=ampAgricZoningCountrygt

ltrdfsdomain rdfresource=ampAgricZoningStategt

ltainverseProperty

rdfresource=ampAgricZoningstatesOfCountrygt

ltrdfPropertygt

Trecho de RDF

ltAgricZoningCountry rdfabout=ampAgricZoningpais_55

AgricZoningnameBR=BRASIL rdfslabel=BRASILgt

ltAgricZoningofficialRegionsOfCountry

rdfresource=ampAgricZoningregof_1gt

ltAgricZoningofficialRegionsOfCountry

rdfresource=ampAgricZoningregof_2gt

ltAgricZoningofficialRegionsOfCountry

rdfresource=ampAgricZoningregof_3gt

ltAgricZoningofficialRegionsOfCountry

rdfresource=ampAgricZoningregof_4gt

ltAgricZoningofficialRegionsOfCountry

rdfresource=ampAgricZoningregof_5gt

ltAgricZoningstatesOfCountry rdfresource=ampAgricZoningestado_11gt

ltAgricZoningstatesOfCountry rdfresource=ampAgricZoningestado_12gt

ltAgricZoningmetroAreasOfCountry

rdfresource=ampAgricZoningmetro_5201gt

ltAgricZoningCountrygt

21042010

8

Descriccedilotildees em RDF de recursos para a coleta de dados cientiacuteficos

wwwEquipServcombrschema2rdfs

RD

F S

chem

aR

DF

Equipment Clienthas

String StringString String

category model name city

wwwAgriTempobrschema1rdfs

WeatherStation

longitudealtitude

LandParcel

CountyState

latitude

inpart_of

ampws1

ampws3

ampws4

Stringname

ampeq1

ampRio

ampUbatuba

ampCampinas

ampws2

ampUnicamp

ampEmbrapa

ampSP

ampRJ

in

in

in

in

part_of

part_of

part_of

has

has

has

has

ampws1 = httpwwwembrapabrWeatherStationX

ampws2 = httpwwwiacbrWeatherStationK

ampws3 = httpwwwunicampbrWheaterStationA

ampws4 = httpwwwunicampbrWheaterStationB

ampeq1 = httpwwwembrapabrCameraZ

subClassOf (isA)rlm

typeOf (instance)rlm

other kind of property

DegreesDecMeters

String

String

value

value

OWL ndash Ontology Web Language

Estende o RDF com vocabulaacuterio padronizado e construccedilotildees para definir

Escopo local de propriedades

Disjunccedilatildeo de classes

Combinaccedilotildees de classes

Restriccedilotildees de cardinalidade

Caracteriacutesticas especiais de propriedades (eg transitividade simetria anti-simetria propriedades inversas)rlm

The 3 flavors of OWL

OWL LiteExpressividade restrita (exclui classes enumeradas disjunccedilatildeo cardinalidade arbitraacuteria )

Faacutecil de entender e usar

OWL DL

Equivalente agrave loacutegica descritiva (DL = Description

Logics)

Ainda permite eficiecircncia e computabilidade

OWL Full

Compatiacutevel sintaacutetica e semanticamente com RDF embora mais poderosaPode ocasionar inferecircncias indecidiacuteveis

Disjunction and Equivalence of Classes

ltowlClass rdfabout=associateProfessorgt

ltowldisjointWith rdfresource=assistantProfessorgt

ltowlClassgt

ltowlClass rdfID=facultygt

ltowlequivalentClass

rdfresource=academicStaffMembergt

ltowlClassgt

Inverse properties

ltowlObjectProperty rdfID=teachesgt

ltrdfsrange rdfresource=coursegt

ltrdfsdomain rdfresource=academicStaffMembergt

ltowlinverseOf rdfresource=isTaughtBygt

ltowlObjectPropertygt

Sintaxe abstrata para OWL

Class(Person partialrestriction (hasChild allValuesFrom(Person)))rlm

Class(Parent completePersonrestriction (hasChild someValuesFrom(Person)))rlm

ObjectProperty(hasChild)rlm

Individual (John type(Person)rlmvalue(hasChild Mary))rlm

21042010

9

Busca em uma ontologia

Pessoa

Santo

S1

IS_A

TYPE_OF

nome

Satildeo Paulo

Time

TimeFutebol

TF1

IS_A

TYPE_OF

nome

Satildeo Paulo

ParcelaTerritoacuterio

Estado

IS_A

Cidade

E1

TYPE_OF

nome

Satildeo Paulo

C1

nome

Satildeo PauloTricolor Paulista

PART_OF

SPARQL (recomendaccedilatildeo W3C)rlm

Exemplo de expressatildeo em SPARQL

SELECTrlmconceptrlm propertyrlm ldquoSatildeorlmPaulordquo

WHERE

concept propertyhasProperty property

FILTER(property name)rlm

Linguagens de Regras (Prolog)

Rules

parent(x z)rlm - father(x z) v mother(x z)

sibling(x y)rlm- parent(x z) and parent(y z)

Knowledge base

father(_Maria _Joatildeo)

father(_Pedro _Joatildeo)

Query

sibling(_Maria x) rArr Yes rArr b = _PedrorArr b = _xyz1rArr b = _xyz2 rArr b = _xyz3rArr b = _xyz4

RIF (Rule Interchange Format)

A buyer buys an item from a seller if the seller sells it to the buyer John sells LeRif to Mary The fact Mary buys LeRif from John can be logically derived by a modus ponens argument

Document(

Prefix(cpt lthttpexamplecomconceptsgt)

Prefix(ppl lthttpexamplecompeoplegt)

Prefix(bks lthttpexamplecombooksgt)

Group ( Forall Buyer Item Seller (

cptbuy(Buyer Item Seller)

cptsell(Seller Item Buyer)

)

cptsell(pplJohn bksLeRif pplMary)

)

)

Controveacutersia sobre pilha de padrotildees

Peter F Patel-Schneider A Revised Architecture for Semantic

Web Reasoning Third Workshop on Principles and Practices of

Semantic Web Reasoning Dagstuhl Germany September

2005 LNCS 3703 Springer Verlag 2005

Ian Horrocks Bijan Parsia Peter F Patel-Schneider and

James Hendler Semantic Web Architecture Stack or Two

Towers Third Workshop on Principles and Practices of Semantic Web Reasoning Dagstuhl Germany September

2005 LNCS 3703 Springer Verlag 2005

Peter F Patel-Schneider Building the Semantic Web Tower

from RDF Straw Nineteenth International Joint Conference on

Artificial Intelligence Edinburgh Scotland August 2005

Proposta inicial (2000)rlm

21042010

10

Proposta regras(2005)rlm Proposta atual

Como estaacute a Web semacircntica hoje

Aacuterea de pesquisa muito ativa

Visa estender o papel dos computadores no

suporte a diversas atividades humanas

Usa ontologias e anotaccedilotildees semacircnticas para

catalogar recuperar e compor dados e serviccedilos

de processamento na Web

Desafios da Web semacircntica

Construccedilatildeo de ontologias

(Semi-)automatizada e interativa

Geraccedilatildeo de anotaccedilotildees semacircnticas de recursos

Muitas aplicaccedilotildees requerem automatizaccedilatildeo

Evoluccedilatildeo de ontologias

Checar se alteraccedilotildees natildeo introduzem inconsistecircncias e gerenciar

versotildees

Integraccedilatildeo de ontologias (ontology matching)

A obtenccedilatildeo de consenso eacute inviaacutevel em muitas domiacutenios

Deduccedilatildeoraciociacutenio

Teorias computaacuteveis e natildeo computaacuteveis ontologias inconsistentes

Ediccedilatildeo de Ontologias no Proteacutegeacute

Editor de ontologias e arcabouccedilo para o desenvolvimento de bases de conhecimento livre e de coacutedigo aberto baseado em Java

Suporta os modelos de frames (RDF) e OWL

Exporta as ontologias e bases de conhecimento para uma variedade de formatos incluindo RDF(S) OWL e XML Schema

Extensiacutevel via plugins

Construccedilatildeo de ontologias

Processo para geraccedilatildeo automatizada de

ontologias a partir de esboccedilos dados e

documentos (nova geraccedilatildeo de ferramentas)rlm

Entendimento do domiacutenio

Entendimento dos dados

Definiccedilatildeo das tarefas

Geraccedilatildeo semi-automaacutetica

Avaliaccedilatildeo de qualidade

Refinamento com interaccedilatildeo humana

21042010

11

Definiccedilotildees de ldquogeraccedilatildeo de ontologiardquoGrobenik and Mladenic 2006

Induccedilatildeo de conceitos (a partir das instacircncias)rlm

Induccedilatildeo de relaccedilotildees (a partir de conceitos e

instacircncias a eles associadas)rlm

Popular ontologia (dada uma ontologia e

instacircncias de seus conceitos)rlm

Geraccedilatildeo de uma ontologia completa (a partir

das instacircncias e algum conhecimentoinformaccedilatildeo)rlm

Atualizaccedilatildeoextensatildeo de ontologias (dada

uma ontologia e informaccedilatildeo como novas

instacircncias ou padrotildees de uso da ontologia)rlm

Document Clustering - Vector Model

Vector of word occurences in the documents

bull diK = TF(Wkdi) IDF(Wk)rlm

Where

bull TF(Wkdi) = number of times Wk occurs in document di

bull IDF(Wk) = log ( D DF(Wk))rlm

bull D = number of documents

bull DF(Wk) = number of documents in which word W occurs

Document distance metric

Anotaccedilotildees Semacircnticas(Kiryakov et al 2004)rlm

21042010

12

Anotaccedilatildeo Semacircntica de Documentos

Atribui agraves entidades que aparecem no documento ligaccedilotildees com suas descriccedilotildees semacircnticas na ontologia

Aplicaacutevel a qualquer tipo de texto (documentos HTML documentos de texto comuns campos de banco de dados entre outros)

Representaccedilatildeo das anotaccedilotildees

Intrusiva

Natildeo intrusiva

Confecccedilatildeo das anotaccedilotildees

bull Semi-Automaacutetica Associa palavras do texto a classes

instacircncias e propriedades da ontologia utilizando-se do

julgamento humano Esta associaccedilatildeo geralmente eacute efetuada

atraveacutes de interfaces ldquoarraste-e-solterdquo (eg OntoMat)rlm

bull Automaacutetica Aplica teacutecnicas de processamento de

linguagem natural aprendizado de maacutequina e extraccedilatildeo de

informaccedilatildeo entre outras para associar palavras agrave ontologia

Essas ferramentas podem utilizar ontologias padratildeo (eg

IEEE Standard Upper Ontology) ou ontologias de domiacutenios

especiacuteficos (eg Unified Medical Language System)

bull Hiacutebrida Combinaccedilatildeo das teacutecnicas acima

Geraccedilatildeo de anotaccedilotildees semacircnticas (Reeve e Han 2005)rlm

Ferramentas para anotaccedilatildeo

Annozilla Funciona sobre o Mozzila Firefox

Annotea projeto da W3C - servidor de anotaccedilotildees em RDF

Armadillo

Muse

Pankol

Semantic Word anotaccedilatildeo interativa de porccedilotildees de documentos

Word

OntoMat Annotizer anotaccedilatildeo interativa de paacuteginas Web com

ontologias em OWL

Smore marcaccedilotildees sobre HTML com ontologias em OWL

Melita ferramenta de anotaccedilatildeo semi-automaacutetica que usa algoritmo

de IE para ajudar o usuaacuterio no processo de anotaccedilatildeo

MnM anotaccedilatildeo semacircntica de paacuteginas Web com metadados

descritos em RDFOCMLDAML+OIL

KIM permite criar metadados armazenar e buscar informaccedilotildees e

pode ser usada para anotaccedilatildeo e procura de documentos

21042010

13

O processo automatizado de anotaccedilatildeo semacircntica de documentos

Tokenizaccedilatildeo e Eliminaccedilatildeo de StopWords

Etiquetagem

Stemmer

Corpus Anotado

Identificaccedilatildeo EN

Associaccedilatildeo atermos da ontologia

RepositoacuterioSemacircntico

Tokensrelevantes

Palavras +Classificaccedilatildeo Gramatical

Radicais das Palavras +Classificaccedilatildeo Gramatical

Entidades Nomeadas

Anotaccedilatildeo Semacircntica

Dados Metadados Documento

s

Ontologia do Domiacutenio

Valida

Valida

Especialista

RepositoacuterioInformaccedilatildeo

Annotation example(Davies et al 2006)

Consider the phrase

There are deliverables

The tokens are

[There] [are] [deliverables] []

The tagger finds out what kind of a word each of the tokens

is (whether it is a noun an adjective a verb etc)rlm

[There] existential quantifier

[are] verbmdash3rd person singular present

[deliverables] nounmdashplural

Annotation example (cont)rlm

The morphological analyser gives the roots of all the words

[There] rootmdashthere

[are] rootmdashbe

[deliverables] rootmdashdeliverable

There are mdash mdashmdash

triggers the creation of one or more new classes in the

ontology

There are projects

There are workpackages tasks and deliverables

SEKT is a project

MUSINGrlmbdquoKnowledgerlmWeb‟rlmandrlmbdquoPrestorlmSpace‟rlmarerlmprojects

Projects have workpackages

Workpackages can have tasks

WP1 WP2 WP3 WP4 WP5 and WP6 are workpackages

SEKT has WP1

MUSING has WP2 WP3 and WP4

bdquoKnowledgerlmWeb‟rlmhasrlmWP5 and WP6

Annotation example (cont)rlm

Ontologia resultante Quadro Comparativo(Nunes e Fileto 2007)rlm

21042010

14

Dependecircncias entre plataformas(Rui Tramontin Junior 2007)rlm

Comparaccedilatildeo de desempenho(Reeve e Han 2005)rlm

Prataforma Categoria Precisatildeo Cobertura Medida F

Armadillo Descoberta de padrotildees

910 740 870

KIM Regras 860 820 840

MnM Induccedilatildeo 950 900 nd

MUSE Regras 935 923 929

PANKOW Descoberta de padrotildees

650 282 249

SemTag Regras 820 nd nd

Evoluccedilatildeo de ontologias(Bloehdorn et al 2006)rlm

Exemplo Uso natildeo uniforme de conceitos

Alternativas para remoccedilatildeo do conceito C que tem sub-conceitos

Processo de evoluccedilatildeo de ontologias

CapturaCaptura

da

Mudanccedila

Representaccedilatildeo Semacircntica Propagaccedilatildeo Implementaccedilatildeo Validaccedilatildeo

Fases Elementares

21042010

15

Mapeamentos entre ontologias(Ontology Matching)

Fusatildeo de ontologias

Processo semi-automatico de alinhamento(Huang at al 2006)rlm

Referecircncia

Jerome Euzenat INRIA Rhone-Alpes France

Pavel Shvaiko University of Trento Italy

Ontology Matching

URL httpbookontologymatchingorg

Springer-Verlag Heidelberg (DE) 2007

343 p 67 illus Hardcover

ISBN 978-3-540-49611-3

E as buscas semacircnticas

Recuperaccedilatildeo da informaccedilatildeo de documentosrlm

Medidas da eficaacutecia das soluccedilotildees

precisatildeo = nro de docs relevantes recuperadosnro de docs recuperados

cobertura = nro de docs relevantes recuperadosnro de docs relevantes

21042010

16

Classificaccedilatildeo de abordagens para buscas semacircnticas (Mangold 2007)

Arquitetura

Acoplamento entre ontologias e documentos

Transparecircncia

Contexto do usuaacuterio

Modificaccedilatildeo de consultas

Estrutura das ontologias

Tecnologia para representar as ontologias

Desempenho escalabilidade e distribuiccedilatildeo

Adaptabilidade

Ranking

Arquiteturas para buscas semacircnticas

Maacutequina de busca stand_alone armazenametadados sobre os documentos em iacutendicescom os quais avalia as consultas

Meta-maacutequina de busca distribui asconsultas para outras maacutequinas de busca ecombina os resultados

Acoplamento ontologias-documentos

Acoplamento forte os metadados dosdocumentos referem-se explicitamente aosconceitos de uma ontologia e vice-versa(requer anotaccedilatildeo semacircntica)rlm

Acoplamento fraco os documentos satildeoindependentes de quaisquer ontologiasdisponiacuteveis (pode restringir a capacidade debusca)rlm

Contexto do usuaacuterio

Learning extraiacutedo na interaccedilotildees do usuaacuteriocom o sistema (histoacuterico das consultas erefinamentos de consultas)rlm

Hard-coded as consultas satildeo organizadas emcategorias que definem a informaccedilatildeo solicitada(eg ldquolocation ofrdquo ldquoresources forrdquo rlm(

Modificaccedilatildeo de consultas

Manual o sistema retorna um trechoapropriado da ontologia junto com a respostapermitindo ao usuaacuterio navegar na ontologia ereformular a consulta pela adiccedilatildeo e remoccedilatildeo determos

Re-escrita automaacutetica a consulta eacuteotimizada automaticamente pelo sistema

Baseada em grafo considera conceitos edocumentos como nodos de um grafoefetuando propagaccedilatildeo da consulta a partir dosnodos correspondentes a termos de busca

Modificaccedilatildeo de consultas

Modificaccedilatildeo de consulta

Manual

Re-escrita de consulta

Baseada em grafo

Inserccedilatildeo de termoRemoccedilatildeo de termo

Substituiccedilatildeo de termo

Conjuntiva

Disjuntiva

Conjuntiva Disjuntiva

21042010

17

Estrutura da ontologia

Propriedades anocircnimas as relaccedilotildees entreconceitos natildeo satildeo nomeadas indicando apenasque eles compartilham o mesmo contexto

Propriedades padronizadas sinocircniacutemiahiperniacutemia meroniacutemia negaccedilatildeo etc

Propriedades especiacuteficas de domiacutenio aleacutemdas propriedades padratildeo considerapropriedades especiacuteficas de um domiacutenio (egldquotipo de cacircmerardquo em sistema para a aacuterea defotografia)rlm

Tecnologia da ontologia

F-Logic

RDF

DAML+OIL

Frames

OWL

Comparaccedilatildeo de abordagens Comparaccedilatildeo de abordagens (cont)

Buscas semacircnticas na Web hoje

httpwwwaliprcom (imagens)rlm

httpwwwcognitioncom

httpwwwdeepdyvecom

httpwwwbingcom

httpwwwcuilcom

httpwwwfreebasecom

httpwwwgooglecom

httpwwwkosmixcom

httpwwwhakiacom

httpwwwpowersetcom

httpwwwsensebotnet

httpdeveloperyahoocomsearchmonkey

httpswoogleumbcedu (ontologias)rlm

21042010

18

21042010

19

SAO PAULO-SP

University of Sao Paulo

Sao Paulo Fashion

Sao Paulo Fashion Week

Sao Paulo State

Sao Paulo Hotel

Sao Paulo Hotels

Sao Paulo Brasilien

Sao Paulo Congonhas

21042010

20

21042010

21

Sao Paulo Airport

Sao Paulo Plane Crash

Sao Paulo Zoo

hellip

21042010

22

21042010

23

Algumas questotildees em aberto

Representaccedilatildeo de contextos de usuaacuterios emapeamento desses a ontologias

Anaacutelise dos efeitos de modificaccedilotildees de consultas

Meta-buscas semacircnticas

Anaacutelise da aceitaccedilatildeo dos usuaacuterios

Adaptabilidade a diferentes ontologias

Ranking dos resultados

Integraccedilatildeo com sistemas de gerenciamento dedocumentosconteuacutedo

Tratamento de dados multimiacuteda

Interfaces homem-maacutequina

Desempenho e escalabilidade

Contextual Semantic Search (CSS)(DAgostine Fileto ndash SBBD2007)rlm

21042010

24

General Architecture for CSSThe Weighted Topic Graph(DAgostine Fileto Dantas Gauthier - ICEIS 2008)rlm

A weighted topic graph is a graph TM(T A)rlm

T is a set of topics (vertices)rlm

A is a set of associations (edges)rlm

Let be an ontology O

Each topic t in T corresponds to a ontology term o in O

Each topic t has a weight [01] The sum from the weights from all topics with same name equals 1

Each association a has a weight [01] The sum

from all the weights from all association departing

a single topics equals 1

Topic weights used to disambiguate

Eg interest in Satildeo Paulo city instead of Satildeo Paulo

state

Association weights used to semantically

expand searches

Eg Actual interest in Guarulhos and airport while

searching for Satildeo Paulo city

The Weights in the Topic Graph Capturing the Users Context

Generated Topic Graph with the Ontological Users Context

The Contextual Semantic Search Process

21042010

25

Desambiguaccedilatildeo

Fundamento dos algoritmos de busca sobre contexto ontoloacutegico

Heuriacutesticas de estigmergia (Ant Colony Optimization - ACO)

Traccedilos de ferormocircnio

Algoritmo de busca semacircntica baseada em ACO

Entrada palavras-chave[ ]

Dados G(TA) Onto repositoacuterio

limite_de_profundidade

limite_miacutenimo_de_peso

λ fator de atenuaccedilatildeo de peso

iniacutecio Algoritmo Busca Contextual 1 Estigmeacuterica

resultados = busca_G_ou_Onto(palavras-chave[])

atenuaG (iacutendice ) λrlmisin [0 1]

manutenccedilatildeo(coleta_feedback(resultados))

fim

21042010

26

Demo Praestro ndash Karina Fasolin

Alguns trabalhos relacionados

Name Article Comments

Graupmann

et al 2005

The SphereSearch

engine for unifiedranked retrieval of

heterogeneous XML

and web documents

Searches through XML documents The context is a region in radius

around given element A data inside two regions is considered relevant

to both contexts

Made tests with large collections like DBLP INEX Wikipedia put for

stress testing regarding the size of the collection

ldquoLet us first comment on the difficulties of defining a meaningfulbenchmark for this kind of novel systemrdquo

Park e

Cheyer 2006

Just For Me Topic

Maps and Ontologies

Manages knowledge in three layers Topics Knowledge Structures and

Documents

Not implemented (at least at the time of publication)

Michlmayr

et al 2007Adaptive User Profiles

for Enterprise

Information Access

Represents context as an individual graph The graph is constructed

based on tags used to semantically annotate the content which the user

considers to be relevant

However the tags are only that only labels They are not tied-down to

a formal definition

Alguns trabalhos relacionados (cont)

Name Article Comments

Aleman-

Meza et a

2003

Context-Aware

Semantic Association

Ranking

Also defines context as regions But the regions are static defined in

the ontology which is used by the system So the contexts are defined

the same for every single user

Mani and

Sundaram

2007

Modeling user context

with applications to

media retrieval

Creates a graph representing the users context Each node

corresponds to an instance in the ontology The edges represent

relations between the instances Built to search trough multimedia

documents

However it does not associates the vocabulary the user uses with the

instances

Challam et

al 2007

Contextual Search

Using Ontology-Based

User Profiles

Monitors the users activity capturing content from open Internet

Explorer MS-Office and MSN The captured information is stored and

usedrlmtorlmbuildrlmarlmuser‟srlmcontextualrlmprofilerlmbasesrlmonrlmanrlmontology

The context is tightly coupled with the ontology

NO IMAGES WERE

PROVIDED

Vallet et al

2006

Personalized

Information Retrieval in

Context

Stores context as a graph constructed based on the ontology used by

the system Similar to Mani and Sundaram including its limitations

(mapping the vocabulary) however if built for text documents

Sieg et al

2007

Ontological User

Profiles for

Personalized Web

Search

Similar to Challam et al but it gets the context information from the

ontology terms used to annotate the retrieved relevant context

Also limited by the structure of the ontology

Alguns trabalhos relacionados(cont)

Name Deals with

objective

knowledge

(ontology)

Deals with

subjective

knowledge

(users

context)

The knowledge

management is

transparent

Idea Implemented

Graupmann et

al 2005

X IMPL

Park e Cheyer

2006

X X X IDEA

Michlmayr et al2007

X X IMPL

Aleman-Meza et

a 2003

X X IMPL

Mani eSundaram 2007

X X X IMPL

Challam et al

2007

X X X IMPL

Vallet et al 2006 X X X IMPL

Sieg et al 2007 X X X IMPL

(incomplete)

Praestro X X X IMPL

(prototype)

UnA-SUS ndash Universidade Aberta do SUS

Programa do Ministeacuterio da Sauacutede para atender necessidades de e

permanente dos

Accedilotildees focadas em

formulaccedilatildeo de conteuacutedo

bibliotecas digitais

cursos a distacircncia

21042010

27

Metas da UnA-SUS

Desenvolver um

plataforma para de

composiccedilatildeo e de

Montar e oferecer cursos para formaccedilatildeo continuada de profissionais da sauacutede

157

Metadados

O processo de produccedilatildeo catalogaccedilatildeo e reuso de OAs

Repositoacuterio

Conteuacutedo

OAs

requisiccedilotildees

Design revisatildeo e publicaccedilatildeo

OA

SGA outros reps

Busca e reuso

OAsMetadados

OAs

Concepccedilatildeo e validaccedilatildeo de OAs

O processo de produccedilatildeo catalogaccedilatildeo e reuso de OAs

OA1

Curso A

Curso B

OA2

OA3

Viacutedeo

Imagens

RepositoacuteriosConteuacutedoMultimiacutedia

SGA RepositoacuteriosOAs

Reuso eacute essencial

bull OAs satildeo caros para produzir

bull Demandas emergenciais na sauacutede puacuteblica exigem agilidade e pronta resposta com cursos para a qualificaccedilatildeo de profissionais

H1N1

Apoplexia

gripe suiacutena gripe A

influenza H1N1

hellip

21042010

28

Navegaccedilatildeo hiperboacutelica no DeCSCatalogaccedilatildeo de Objetos de Aprendizagem (OAs) usando Vocabulaacuterios Controlados

bull Seleccedilatildeo de termos do DeCS CID-10 SNOMED

ndash via fornecimento de palavras-chave que satildeo pesquisadas na base de conhecimento

ndash via navegaccedilatildeo em uma visatildeo do conhecimento em forma de aacutervore

Seleccedilatildeo via contexto ontoloacutegicoProtoacutetipo (catalogaccedilatildeo com entrada

de palavra-chave)

DSpaceCatalogaccedilatildeo de OAswf

Protoacutetipo (catalogaccedilatildeo com navegaccedilatildeo

na base de conhecimento)

DSpaceRecuperaccedilatildeo de OAswf

21042010

29

Recuperaccedilatildeo de Objetos de Aprendizagem (OAs) Baseada em Conhecimento

bull Vocabulaacuterios e relaccedilotildees semacircnticas

ndash Oriundos do DeCS

ndash Definidos pelos catalogadores de OAs

ndash Gerados pelo cruzamento de informaccedilotildees com o CID-10 (Classificaccedilatildeo Internacional de Doenccedilas)

ndash Ex sinocircnimos eacute um(a) parte de causa efeito sintoma etc

DeCs

Anatomia

Sistema Nervoso

Sistema Nervoso Central

Enceacutefalo

Prosenceacutefalo

Telencaacutefalo

Ceacuterebro

Doenccedilas

Doenccedilas do Sistema Nervoso

Doenccedilas Cardiovasculares

Doenccedilas do Sistema Nervoso Central

Encefalopatias

Transtornos Cerebrovasculares

Doenccedilas Vasculares

Transtornos Cerebrovasculares

Acidente Vascular Cerebral

Acidente Vascular Cerebral

OA 1

OA 2

AVC

IctusCerebral

Derrame Cerebral

Hemisfeacuterios Cerebrais

ApoplexiaAcidente

Cerebrovascular

IctoCerebral

Apoplexia Cerebrovascular

Apoplexia Cerebral

Acidente Vascular

Encefaacutelico

Acidente Vascular

do Ceacuterebro

Acidente Vascular Cerebral

padratildeo (sinocircnimo)

anota

especiacutefica de domiacutenio

anocircnimas (DeCs)

172

DeCs

Anatomia

Sistema Nervoso

Sistema Nervoso Central

Enceacutefalo

Prosenceacutefalo

Telencaacutefalo

Ceacuterebro (2)

Doenccedilas

Doenccedilas do Sistema Nervoso

Doenccedilas Cardiovasculares

Doenccedilas do Sistema Nervoso Central

Encefalopatias

Transtornos Cerebrovasculares

Doenccedilas Vasculares

Transtornos Cerebrovasculares

Acidente Cerebral Vascular (1)

Acidente Cerebral Vascular(1)

OA 1

OA 2

AVC

IctusCerebral

Derrame Cerebral

Hemisfeacuterios Cerebrais

ApoplexiaAcidente

Cerebrovascular

IctoCerebral

Apoplexia Cerebrovascular

Apoplexia Cerebral

Acidente Vascular

Encefaacutelico

Acidente Vascular

do Ceacuterebro

Acidente Vascular Cerebral

Busca de OAs na aacuterea de sauacutede usando conhecimento de domiacutenio

Semantic Learning Objects (VIAN J SILVEIRA R A FILETO R WCCE 2009)

21042010

30

Conclusotildees

A Web semacircntica tem potencial de contribuir naobtenccedilatildeo de melhores resultados para buscas

Suporte automatizado eacute fundamental para a construccedilatildeo evoluccedilatildeo e integraccedilatildeo de ontologias anotaccedilotildees semacircnticas e contextos de usuaacuterios

Nossos primeiros resultados focam na captura e utilizaccedilatildeo de contextos de usuaacuterios mapeados a ontologias de domiacutenios especiacuteficos paradesambiguar e estender as buscas

Trabalhos futuros

Processos parcialmente automatizados para geraccedilatildeo e atualizaccedilatildeo de ontologias e anotaccedilotildees semacircnticas

Experimentos para comprovar a eficaacutecia das teacutecnicas e ferramentas utilizadas

Validaccedilatildeo de soluccedilotildees de problemas de busca semacircntica em diversos domiacutenios de aplicaccedilatildeo

Determinaccedilatildeo de niacuteveis adequados de acoplamento entre contextos e ontologias e dessas com os recursos a serem recuperados

Notiacutecias e anaacutelises

httpnewscnetcomnew-search-engine-cuil-takes-aim-at-google

httpwwwreadwritewebcomarchivesis_google_a_semantic_search_enginephp

httpwwwreadwritewebcomarchivessemantic_search_the_myt

h_and_realityphp

httpwwwpandiacomsew1262-top-5-semantic-search-

engineshtml

httpmindsetresearchyahoocom

httpnewscnetcom8301-13953_3-9982015-80html

httpwwwsearchenginejournalcomaskcom-focuses-on-semantic-search8252

httpnewsbbccouk2hiprogrammesclick_onlinedefaultstm

httpnewsbbccouk2hiprogrammesclick_online8144765stm

Web semacircntica e buscassemacircnticas

httpwwww3org2001sw

httpsemanticweborg

httpenwikipediaorgwikiSemantic_Web

httpenwikipediaorgwikiSemantic_search

Ferramentas de desenvolvimento

httpprotegestanfordedu

httpjenasourceforgenet

httpwwww3org2001Annotea

httpwwwontotextcomkim

httpesww3orgtopicSemanticWebTools

httpwwwdamlorg200305swmu-tools-

tutorialOverviewhtml

Referecircncias em Web semacircntica

T Berners-Lee J Hendler e O Lassila The Semantic Web Scientific American May 2001

Thomas B Passing Explores Guide to the Semantic Web Manning Publications Greenwich CT 2005

Davies J Studer R Warren P (Eds) Semantic Web Technologies trends and research in ontology-based

Systems John Wiley amp Sons 2006

Breitman KK Casanova MA Truszkowski W Semantic Web

Concepts Technologies and Applications Series NASA Monographs in Systems and Software Engineering Springer 2007

Grigoris Antoniou and Frank van Harmelen A Semantic Web Primer 2nd edition The MIT Press Cambridge MA USA 2008

Kashyap V Bussler C Moran M The Semantic Web -Semantics for Data and Services on the Web Series Data-

Centric Systems and Applications Springer 2008

Hitzler P Krotzsch M Rudolph S Foundations of SemanticWeb Technologies Chapman amp HallCRC 2009

21042010

31

Referecircncias em buscas semacircnticas

Guha R McCool R and Miller E 2003 Semantic search In Proc of the 12th international Conference on World Wide Web

(WWW) Budapest Hungary ACM New York NY 2003 700-709

Reeve L and Han H 2005 Survey of semantic annotation

platforms In Proceedings of the ACM Symposium on Applied Computing Santa Fe New Mexico ACM New York NY 2005

1634-1638

Eetu Makela Survey of Semantic Search Research

Mangold C A Survey and classification of semantic search approaches Journal of Metadata Semantics and Ontology 2(1)

2007

Stephan Bloehdorn Philipp Cimiano Alistair Duke Peter Haase Joumlrg Heizmann Ian Thurlow Johanna Voumllker Ontology-BasedQuestion Answering for Digital Libraries ECDL 2007 14-25

Hai Dong Hussain FK Chang E A survey in semantic search technologies In 2nd IEEE International Conference on

Digital Ecosystems and Technologies 2008 403-408

Algumas referecircncias grupo UFSC

DAgostini C S Fileto R Capturing Users Preferences and Intentions in a Semantic Search System In 21st International

Conference on Software Engineering amp Knowledge Engineering (SEKE) Boston 2009 p 587-591

DAgostini C S Fileto R Dantas M A R Gauthier F A O

Contextual Semantic Search - Capturing using the UsersContext to Direct Semantic Search In 10th InternationalConference on Enterprise Information Systems (ICEIS) Barcelona

Spain 2008 v SAIC p 154-159

DAgostini C S Fileto R Capturing and managing usercontext for improving information retrieval In Workshop de

Teses e Dissertaccedilotildees do Simpoacutesio Brasileiro de Bancos de Dados (WTDBDSBBD) Campinas Unicamp Brazil 2008

Vian J Silveira R A Fileto R Proposal of a Multi-agent System for Indexing and Recovery applied to Learning

Objects In 9th IFIP World Conference on Computers in Education (WCCE) Bento Goncalves Brazil 2009

Alguns projetos na UFSC

httpwwwlisaufscbrprojetos

httpwwwunasusufscbr

httpwwwliteraturabrasileiraufscbr

Perguntas

Page 4: Buscas Semânticasfileto/Talks/BuscasSemanticas6sp.pdf · 21/04/2010 1 1 Buscas semânticas: panorama e tendências atuais minicurso ERBD 2010 RenatoFileto fileto@inf.ufsc.br AlunosColaboradores:

21042010

4

Uses of ontologies

Comunicaccedilatildeo

entre pessoas e organizaccedilotildees

Interoperabilidade

Entre sistemas

Componentes Reusaacuteveis Confiabilidade

Especificaccedilatildeo

Engenharia de Sistemas

Outras distinccedilotildees pode ser importantes dentro de cada

categoria tais como a natureza do software tipo de usuaacuteriosn e domiacutenio de aplicaccedilatildeo

Ontologias como uma IntershyLingua

L1

L3

L2

L4

L1

L3

L2

L4

Interlingua

T1 T2

T3 T4

Ontologias pode ser usadas como suporte na traduccedilatildeo entre diferentes linguagens e

representaccedilotildees de informaccedilatildeoconhecimento

Padrotildees da Web semacircntica

Character Encoding

Codificaccedilatildeo de Caracteres

Exemplos de cabeccedilalhos de documentos XML com especificaccedilatildeo do

padratildeo de codificaccedilatildeo de caracteres utilizados nesses documentos

ltxml encoding=UTF-8gt

ltxml encoding=UTF-16gt

ltxml encoding=EUC-JPgt

ltxml version=ldquo10rdquo encoding=ISO-8859-1gt

URIs (Unified Resource Identifiers)rlm

httpwwww3orgAddressing

httpwwww3orgAddressingbackground

httpwwwfoldocorgUniform+Resource+Locator

ftpspysecretftpacmecompubtopsecretweapontgz

mailtofreddocicacuk

newsalthypertext

telnet19202168o

magicabcdef

ldap[2001db87]c=GBobjectClassone

tel+1-816-555-1212

urnoasisnamesspecificationdocbookdtdxml412

exampleabc7Bfoo7D

eXAMPLEabb637bfoo7d

NameSpaces

Exemplos de trechos de documentos XML com especificaccedilotildees e

uso de namespaces

ltx xmlnsedi=httpecommerceorgschemagt

lt-- the edi prefix is bound to httpecommerceorgschema

for the x element and contents --gt

ltxgt

ltbook xmlns=urnlocgovbooks

xmlnsisbn=urnISBN0-395-36341-6gt

lttitlegtCheaper by the Dozenlttitlegt

ltisbnnumbergt1568491379ltisbnnumbergt

ltbookgt

ltschema xmlnshttpwwww3org2001XMLSchemagt

ltschemagt

21042010

5

XML ndash eXtensible Makup Language

Construccedilotildees baacutesicas

ltElementogt Conteuacutedo ltElementogt

ltElemento gt

ltElemento Atributo1=ldquoValorrdquo Atributo2=ldquoValorrdquogt

ltElementorlmAtributo1=ldquoValorrdquorlmAtributo2=ldquoValorrdquogtrlm rlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlm

Conteuacutedo

ltElementogt

ltElemento1gt

ltElemento2gt

Conteuacutedo

ltElemento2gt

ltElemento1gt

ltElemento1gtltElemento2gtltElemento1gt

Um documento XML

ltxml version=10 encoding=ISO-8859-1 gt

ltElementoRaizgt

ltElemento1gt

ltElemento1_1gt Conteuacutedo ltElemento1_1gt

ltElemento1_2gt Conteuacutedo ltElemento1_2gt

ltElemento1_3gt

ltElemento1gt

ltElemento2gt

ltElemento2_1gt

ltElemento2_1_1gt Conteuacutedo ltElemento2_1_1gt

ltElemento2_1_2gt

ltElemento2_1gt

ltElemento2gt

ltElementoRaizgt

A Versatilidade do XML para Dados Semi-Estruturados

ltxml version=10 encoding=ISO-8859-1 gt

ltPessoarlmNome=ldquoJoatildeorlmderlmSouzardquorlmDataDeNascimento=ldquo12061964rdquorlmCPF=ldquo12312312rdquogt

ltEnderecosgt

ltEnderecorlmTipo=ldquoComercialrdquogtRuarlmArlm23rlm- CentroltEnderecogt

ltEnderecorlmTipo=ldquoResidencialrdquogtTorrerlmComercialrlm1923rlmSl1011rlmltEnderecogt

ltMalaDiretarlmDestino=ldquoComercialrdquogt

ltEnderecosgt

ltFormasDeContatogt

ltTelefonesgt

ltTelefonerlmTipo=ldquoComercialrdquorlmDDD=ldquo61rdquorlmRamal=ldquo211rdquogt222-8545ltTelefonegt

ltTelefonerlmTipo=ldquoCelularrdquorlmDDD=ldquo61rdquogt999-9999ltTelefonegt

ltTelefonerlmTipo=ldquoResidencialrdquorlmDDD=ldquo61rdquogt444-4444ltTelefonegt

ltTelefonesgt

ltEmailgtjoatildeoemailcombrltEmailgt

ltICQrlmNumero=rlmrdquo127653467654ldquorlmgt

ltFormasDeContatogt

ltPessoagt

Doc XML para Dados Climaacuteticos (Balanccedilo Hiacutedrico)rlm

ltxml version=10 encoding=ISO8859-1gt

ltWaterBal xmlns=httpwwwagricgovbrWaterBalxsd

location=Brotas latitude=-221500 longitude=-475800gt

ltWeatherData Date=ldquo20050823rdquogt

ltTemperaturegt 220 ltTemperaturegt

ltAvgRainFallgt 2013 ltAvgRainFallgt

ltPotETgt 1154 ltPotETgt

ltRealETgt 1154 ltRealETgt

ltStoredgt 1250 ltStoredgt

ltWaterDeficitgt 00 ltWaterDeficitgt

ltWaterExcessgt 860 ltWaterExcessgt

ltWeatherData gt

ltWaterBalgt

Arquivo texto (natildeo XML) com dados pluviomeacutetricos

weather station

year

station

code

end of file

latitude longitude altitude

Jan

Feb

Mar

Apr

May

Jun

Jul

Aug

Sep

Oct

Nov

Dec

XML-Schema

Um documento XML-Schema descreve os

elementos

atributos

relacionamentos

etc

permitidos em um ou mais documentos XML isto eacute define uma classe de documentos XML que adere a um

conjunto de restriccedilotildees estruturais e de dados

XML-Schema tem uma sintaxe XML

XML-Schema eacute mais robusta versaacutetil e poderosa que DTD (Document Type Definition)rlm

21042010

6

Um Documento XML-Schema(WaterBalxsd)rlm

ltschema xmlnshttpwwww3org2001XMLSchema gt

ltelement name=WaterBal type=WaterBalTypegt

ltattribute name=location type=stringgt

ltattribute name=latitude type=Latitudegt

ltattribute name=longitude type=Longitudegt

ltelement name=WeatherData type=AgregValuesgt

ltcomplexType name=AgregValuesgt

ltattribute name=Date type=DateTypegt

ltsequencegt

ltelement name=Temperature type=decimalgt

ltelement name=AvgRainfall type=decimalgt

ltelement name=PotET type=decimalgt

ltelement name=RealET type=decimalgt

ltelement name=Stored type=decimalgt

ltelement name=WaterDeficit type=decimalgt

ltelement name=WaterExcess type=decimalgt

ltsequencegt

ltcomplexTypegt

ltelementgt

ltschemagt

Validaccedilatildeo de documentos XML

Documento bem-formado (well-formed) satisfaz as restriccedilotildees

de formaccedilatildeo expressa na especificaccedilatildeo do XML

(httpwwww3orgTR2004REC-xml-20040204)rlm

Documento vaacutelido satisfaz as restriccedilotildees (elementos atributos

aninhamentos tipos etc) expressas em uma especificaccedilatildeo de

esquema XML em DTD ou XSL (XML-Schema) que eacute associada a

esse documento XML

Heterogeneidade semacircntica em XML

ltobject id=ldquoa1rdquo class=ldquoartifactrdquogt

lttuplegt

lttitlegt Nympheas lttitlegt

ltyeargt 1897 ltyeargt

ltcreatorgt Monet ltcreatorgt

ltpricegt 10000000 ltpricegt

ltowners refs=ldquop1p2p3rdquogt

lttuplegt

ltobjectgt

ltobject id=ldquop3rdquo class=ldquopersonrdquogt

lttuplegt

ltnamegt Claudia ltnamegt

ltagegt 17 ltagegt

lttuplegt

ltobjectgt

ltworkgt

ltartistgt Monet ltartistgt

ltnamegt Nympheas ltnamegt

ltstylegt Impressionist ltstylegt

ltsizegt 21 x 61 ltsizegt

ltcplacegt Givern ltcplacegt

ltworkgt

ltworkgt

ltartistgt Monet ltartistgt

lttitlegt Waterloo Bridge lttitlegt

ltstylegt Impressionist ltstylegt

ltsizegt 292 x 464 ltsizegt

lthistorygt

Painted with

lttechgt Oil on canvas lttechgt

in

lthistorygt

ltworkgt

XML como Padratildeo de representaccedilatildeo de dados

ldquoArtworksrdquorlmStructure

Works works

Work

Work

Field

artist title style size

string string string string

ldquoArtfactrdquorlmSchema

artifacts set

ampArtifact

Artifact class

artifact

tuple

title year creator price owners

ampPerson

string int string float list

YAT Model

YAT Any

YAT

V ampYAT

ODMG Model

Vtuple

Symbol

Type

V(int vbool v

float vstring)rlm

ampClass

Type

V

Symbol

(set vbag vlist varray)rlm

Class class

Symbol

Type

RDF ndash Resource Description Framework

Uma linguagem e modelo padronizados para expressar conhecimento na Web semacircntica

Um comando (statement) eacute uma tripla da forma

Recurso qualquer coisa referenciada por uma URL

Propriedade qualquer propriedade de um recurso

Valor um literal ou outro recurso

RDF-Schema define classes de recursos suas propriedades (que podem ser relacionamentos com outras classes) e possiacuteveis valores

Os formatos para representar ontologias na Web semacircntica (eg

DAML+OIL OWL) satildeo extensotildees do RDF

Sintaxe XML do RDF

ltxml version=10gt

ltrdfRDF xmlnsRDF httpwwww3orgRDFRDFldquo

xmlnsdc httpdublincoreorgdcldquogt

ltrdfDescription about=ldquohttpwwwagritempocnptiaembrapabrrdquogt

ltdctitlegt Nuacutecleo de Monitoramento e Anaacutelise de Dados

Meteoroloacutegicos e Climatoloacutegicos para a Agricultura ltdctitlegt

ltleadergt

rdfresource=ldquohttpwwwcnptiaembrapabr~assadrdquo

ltleadergt

ltrdfDescriptiongt

ltrdfDescription

about=ldquohttpwwwcnptiaembrapabr~assadrdquogt

ltdctitlegt Eduardo D Assad ltdctitlegt

ltemailgt Assadcnptiaembrapabr ltemailgt

ltrdfDescriptiongt

ltrdfRDF gt

21042010

7

Estrutura do conhecimento em RDF

httpwwwagritempocnptiaembrapabr

httpwwwcnptiaembrapabr~assad

Nuacutecleo de Monitoramento e

Anaacutelise de Dados

Meteoroloacutegicos e Climatoloacutegicos

para a Agricultura

assadcnptiaembrapabrEduardo D

Assad

dctitle

dctitleemail

leader

Metadata in RDFWater Balance (same place and institution)rlm

ltxml version=10gt

ltrdfRDF xmlnsRDF httpwwww3orgRDFRDFldquo

xmlns httpagricgovbrDocStdldquogt

ltrdfDescription about=httpwwwagricgovbrpublicWaterBal1234gt

ltSourcegt

rdfresource=ldquohttpwwwcepagriunicampbrrdquo

rdfresource=ldquohttpwwwciagroiacgovspbrrdquo

ltSourcegt

ltInitialDategt 28032002 ltInitialDategt

ltFinalDategt 31032002 ltFinalDategt

ltkeywordgt Water available in Soil ltkeyworkgt

ltlocalgt

rdfresource= ldquohttpwwwibgegovbrstate_SPrdquo

ltlocalgt

ltmeasument_unitgt

rdfresource= ldquohttpwwwinmetrogovbrmmrdquo

ltmeasument_unitgt

ltrdfDescriptiongt

ltrdfRDFgt

httpwwwagricgovbrpublicWaterBal1234

http

wwwcpaunicampbr

Centro de Pesquisas

Agriacutecolas (CEPAGRI)

name

source

httpwwwciagroiacg

ovspbr

httpwwwunica

mpbr

part_of

CIIAGRO

name

http

wwwiacgovspbr

part_of

InitialDate

28032002

FinalDateWater available in

Soil

http

wwwibgegovbrstate_SP

source

keyword

http

wwwinmetrogovbrmm

31032002

local

measurement_unit

RDF-Schema

ltrdfabout=ampAgricZoningCountry rdfslabel=Countrygt

ltrdfssubClassOf dfresource=ampAgricZoningTerritorialDivisiongt

ltrdfabout=ampAgricZoningState rdfslabel=ldquoStategt

ltrdfssubClassOf dfresource=ampAgricZoningTerritorialDivisiongt

ltrdfProperty rdfabout=ampAgricZoningstatesOfCountry

aminCardinality=1

rdfslabel=statesOfCountrygt

ltrdfsdomain rdfresource=ampAgricZoningCountrygt

ltrdfsrange rdfresource=ampAgricZoningStategt

ltainverseProperty rdfresource=ampAgricZoningcountryOfStategt

ltrdfPropertygt

RDF-Schema

ltrdfProperty rdfabout=ampAgricZoningcountryOfState

amaxCardinality=1

aminCardinality=1

rdfslabel=countryOfStategt

ltrdfsrange rdfresource=ampAgricZoningCountrygt

ltrdfsdomain rdfresource=ampAgricZoningStategt

ltainverseProperty

rdfresource=ampAgricZoningstatesOfCountrygt

ltrdfPropertygt

Trecho de RDF

ltAgricZoningCountry rdfabout=ampAgricZoningpais_55

AgricZoningnameBR=BRASIL rdfslabel=BRASILgt

ltAgricZoningofficialRegionsOfCountry

rdfresource=ampAgricZoningregof_1gt

ltAgricZoningofficialRegionsOfCountry

rdfresource=ampAgricZoningregof_2gt

ltAgricZoningofficialRegionsOfCountry

rdfresource=ampAgricZoningregof_3gt

ltAgricZoningofficialRegionsOfCountry

rdfresource=ampAgricZoningregof_4gt

ltAgricZoningofficialRegionsOfCountry

rdfresource=ampAgricZoningregof_5gt

ltAgricZoningstatesOfCountry rdfresource=ampAgricZoningestado_11gt

ltAgricZoningstatesOfCountry rdfresource=ampAgricZoningestado_12gt

ltAgricZoningmetroAreasOfCountry

rdfresource=ampAgricZoningmetro_5201gt

ltAgricZoningCountrygt

21042010

8

Descriccedilotildees em RDF de recursos para a coleta de dados cientiacuteficos

wwwEquipServcombrschema2rdfs

RD

F S

chem

aR

DF

Equipment Clienthas

String StringString String

category model name city

wwwAgriTempobrschema1rdfs

WeatherStation

longitudealtitude

LandParcel

CountyState

latitude

inpart_of

ampws1

ampws3

ampws4

Stringname

ampeq1

ampRio

ampUbatuba

ampCampinas

ampws2

ampUnicamp

ampEmbrapa

ampSP

ampRJ

in

in

in

in

part_of

part_of

part_of

has

has

has

has

ampws1 = httpwwwembrapabrWeatherStationX

ampws2 = httpwwwiacbrWeatherStationK

ampws3 = httpwwwunicampbrWheaterStationA

ampws4 = httpwwwunicampbrWheaterStationB

ampeq1 = httpwwwembrapabrCameraZ

subClassOf (isA)rlm

typeOf (instance)rlm

other kind of property

DegreesDecMeters

String

String

value

value

OWL ndash Ontology Web Language

Estende o RDF com vocabulaacuterio padronizado e construccedilotildees para definir

Escopo local de propriedades

Disjunccedilatildeo de classes

Combinaccedilotildees de classes

Restriccedilotildees de cardinalidade

Caracteriacutesticas especiais de propriedades (eg transitividade simetria anti-simetria propriedades inversas)rlm

The 3 flavors of OWL

OWL LiteExpressividade restrita (exclui classes enumeradas disjunccedilatildeo cardinalidade arbitraacuteria )

Faacutecil de entender e usar

OWL DL

Equivalente agrave loacutegica descritiva (DL = Description

Logics)

Ainda permite eficiecircncia e computabilidade

OWL Full

Compatiacutevel sintaacutetica e semanticamente com RDF embora mais poderosaPode ocasionar inferecircncias indecidiacuteveis

Disjunction and Equivalence of Classes

ltowlClass rdfabout=associateProfessorgt

ltowldisjointWith rdfresource=assistantProfessorgt

ltowlClassgt

ltowlClass rdfID=facultygt

ltowlequivalentClass

rdfresource=academicStaffMembergt

ltowlClassgt

Inverse properties

ltowlObjectProperty rdfID=teachesgt

ltrdfsrange rdfresource=coursegt

ltrdfsdomain rdfresource=academicStaffMembergt

ltowlinverseOf rdfresource=isTaughtBygt

ltowlObjectPropertygt

Sintaxe abstrata para OWL

Class(Person partialrestriction (hasChild allValuesFrom(Person)))rlm

Class(Parent completePersonrestriction (hasChild someValuesFrom(Person)))rlm

ObjectProperty(hasChild)rlm

Individual (John type(Person)rlmvalue(hasChild Mary))rlm

21042010

9

Busca em uma ontologia

Pessoa

Santo

S1

IS_A

TYPE_OF

nome

Satildeo Paulo

Time

TimeFutebol

TF1

IS_A

TYPE_OF

nome

Satildeo Paulo

ParcelaTerritoacuterio

Estado

IS_A

Cidade

E1

TYPE_OF

nome

Satildeo Paulo

C1

nome

Satildeo PauloTricolor Paulista

PART_OF

SPARQL (recomendaccedilatildeo W3C)rlm

Exemplo de expressatildeo em SPARQL

SELECTrlmconceptrlm propertyrlm ldquoSatildeorlmPaulordquo

WHERE

concept propertyhasProperty property

FILTER(property name)rlm

Linguagens de Regras (Prolog)

Rules

parent(x z)rlm - father(x z) v mother(x z)

sibling(x y)rlm- parent(x z) and parent(y z)

Knowledge base

father(_Maria _Joatildeo)

father(_Pedro _Joatildeo)

Query

sibling(_Maria x) rArr Yes rArr b = _PedrorArr b = _xyz1rArr b = _xyz2 rArr b = _xyz3rArr b = _xyz4

RIF (Rule Interchange Format)

A buyer buys an item from a seller if the seller sells it to the buyer John sells LeRif to Mary The fact Mary buys LeRif from John can be logically derived by a modus ponens argument

Document(

Prefix(cpt lthttpexamplecomconceptsgt)

Prefix(ppl lthttpexamplecompeoplegt)

Prefix(bks lthttpexamplecombooksgt)

Group ( Forall Buyer Item Seller (

cptbuy(Buyer Item Seller)

cptsell(Seller Item Buyer)

)

cptsell(pplJohn bksLeRif pplMary)

)

)

Controveacutersia sobre pilha de padrotildees

Peter F Patel-Schneider A Revised Architecture for Semantic

Web Reasoning Third Workshop on Principles and Practices of

Semantic Web Reasoning Dagstuhl Germany September

2005 LNCS 3703 Springer Verlag 2005

Ian Horrocks Bijan Parsia Peter F Patel-Schneider and

James Hendler Semantic Web Architecture Stack or Two

Towers Third Workshop on Principles and Practices of Semantic Web Reasoning Dagstuhl Germany September

2005 LNCS 3703 Springer Verlag 2005

Peter F Patel-Schneider Building the Semantic Web Tower

from RDF Straw Nineteenth International Joint Conference on

Artificial Intelligence Edinburgh Scotland August 2005

Proposta inicial (2000)rlm

21042010

10

Proposta regras(2005)rlm Proposta atual

Como estaacute a Web semacircntica hoje

Aacuterea de pesquisa muito ativa

Visa estender o papel dos computadores no

suporte a diversas atividades humanas

Usa ontologias e anotaccedilotildees semacircnticas para

catalogar recuperar e compor dados e serviccedilos

de processamento na Web

Desafios da Web semacircntica

Construccedilatildeo de ontologias

(Semi-)automatizada e interativa

Geraccedilatildeo de anotaccedilotildees semacircnticas de recursos

Muitas aplicaccedilotildees requerem automatizaccedilatildeo

Evoluccedilatildeo de ontologias

Checar se alteraccedilotildees natildeo introduzem inconsistecircncias e gerenciar

versotildees

Integraccedilatildeo de ontologias (ontology matching)

A obtenccedilatildeo de consenso eacute inviaacutevel em muitas domiacutenios

Deduccedilatildeoraciociacutenio

Teorias computaacuteveis e natildeo computaacuteveis ontologias inconsistentes

Ediccedilatildeo de Ontologias no Proteacutegeacute

Editor de ontologias e arcabouccedilo para o desenvolvimento de bases de conhecimento livre e de coacutedigo aberto baseado em Java

Suporta os modelos de frames (RDF) e OWL

Exporta as ontologias e bases de conhecimento para uma variedade de formatos incluindo RDF(S) OWL e XML Schema

Extensiacutevel via plugins

Construccedilatildeo de ontologias

Processo para geraccedilatildeo automatizada de

ontologias a partir de esboccedilos dados e

documentos (nova geraccedilatildeo de ferramentas)rlm

Entendimento do domiacutenio

Entendimento dos dados

Definiccedilatildeo das tarefas

Geraccedilatildeo semi-automaacutetica

Avaliaccedilatildeo de qualidade

Refinamento com interaccedilatildeo humana

21042010

11

Definiccedilotildees de ldquogeraccedilatildeo de ontologiardquoGrobenik and Mladenic 2006

Induccedilatildeo de conceitos (a partir das instacircncias)rlm

Induccedilatildeo de relaccedilotildees (a partir de conceitos e

instacircncias a eles associadas)rlm

Popular ontologia (dada uma ontologia e

instacircncias de seus conceitos)rlm

Geraccedilatildeo de uma ontologia completa (a partir

das instacircncias e algum conhecimentoinformaccedilatildeo)rlm

Atualizaccedilatildeoextensatildeo de ontologias (dada

uma ontologia e informaccedilatildeo como novas

instacircncias ou padrotildees de uso da ontologia)rlm

Document Clustering - Vector Model

Vector of word occurences in the documents

bull diK = TF(Wkdi) IDF(Wk)rlm

Where

bull TF(Wkdi) = number of times Wk occurs in document di

bull IDF(Wk) = log ( D DF(Wk))rlm

bull D = number of documents

bull DF(Wk) = number of documents in which word W occurs

Document distance metric

Anotaccedilotildees Semacircnticas(Kiryakov et al 2004)rlm

21042010

12

Anotaccedilatildeo Semacircntica de Documentos

Atribui agraves entidades que aparecem no documento ligaccedilotildees com suas descriccedilotildees semacircnticas na ontologia

Aplicaacutevel a qualquer tipo de texto (documentos HTML documentos de texto comuns campos de banco de dados entre outros)

Representaccedilatildeo das anotaccedilotildees

Intrusiva

Natildeo intrusiva

Confecccedilatildeo das anotaccedilotildees

bull Semi-Automaacutetica Associa palavras do texto a classes

instacircncias e propriedades da ontologia utilizando-se do

julgamento humano Esta associaccedilatildeo geralmente eacute efetuada

atraveacutes de interfaces ldquoarraste-e-solterdquo (eg OntoMat)rlm

bull Automaacutetica Aplica teacutecnicas de processamento de

linguagem natural aprendizado de maacutequina e extraccedilatildeo de

informaccedilatildeo entre outras para associar palavras agrave ontologia

Essas ferramentas podem utilizar ontologias padratildeo (eg

IEEE Standard Upper Ontology) ou ontologias de domiacutenios

especiacuteficos (eg Unified Medical Language System)

bull Hiacutebrida Combinaccedilatildeo das teacutecnicas acima

Geraccedilatildeo de anotaccedilotildees semacircnticas (Reeve e Han 2005)rlm

Ferramentas para anotaccedilatildeo

Annozilla Funciona sobre o Mozzila Firefox

Annotea projeto da W3C - servidor de anotaccedilotildees em RDF

Armadillo

Muse

Pankol

Semantic Word anotaccedilatildeo interativa de porccedilotildees de documentos

Word

OntoMat Annotizer anotaccedilatildeo interativa de paacuteginas Web com

ontologias em OWL

Smore marcaccedilotildees sobre HTML com ontologias em OWL

Melita ferramenta de anotaccedilatildeo semi-automaacutetica que usa algoritmo

de IE para ajudar o usuaacuterio no processo de anotaccedilatildeo

MnM anotaccedilatildeo semacircntica de paacuteginas Web com metadados

descritos em RDFOCMLDAML+OIL

KIM permite criar metadados armazenar e buscar informaccedilotildees e

pode ser usada para anotaccedilatildeo e procura de documentos

21042010

13

O processo automatizado de anotaccedilatildeo semacircntica de documentos

Tokenizaccedilatildeo e Eliminaccedilatildeo de StopWords

Etiquetagem

Stemmer

Corpus Anotado

Identificaccedilatildeo EN

Associaccedilatildeo atermos da ontologia

RepositoacuterioSemacircntico

Tokensrelevantes

Palavras +Classificaccedilatildeo Gramatical

Radicais das Palavras +Classificaccedilatildeo Gramatical

Entidades Nomeadas

Anotaccedilatildeo Semacircntica

Dados Metadados Documento

s

Ontologia do Domiacutenio

Valida

Valida

Especialista

RepositoacuterioInformaccedilatildeo

Annotation example(Davies et al 2006)

Consider the phrase

There are deliverables

The tokens are

[There] [are] [deliverables] []

The tagger finds out what kind of a word each of the tokens

is (whether it is a noun an adjective a verb etc)rlm

[There] existential quantifier

[are] verbmdash3rd person singular present

[deliverables] nounmdashplural

Annotation example (cont)rlm

The morphological analyser gives the roots of all the words

[There] rootmdashthere

[are] rootmdashbe

[deliverables] rootmdashdeliverable

There are mdash mdashmdash

triggers the creation of one or more new classes in the

ontology

There are projects

There are workpackages tasks and deliverables

SEKT is a project

MUSINGrlmbdquoKnowledgerlmWeb‟rlmandrlmbdquoPrestorlmSpace‟rlmarerlmprojects

Projects have workpackages

Workpackages can have tasks

WP1 WP2 WP3 WP4 WP5 and WP6 are workpackages

SEKT has WP1

MUSING has WP2 WP3 and WP4

bdquoKnowledgerlmWeb‟rlmhasrlmWP5 and WP6

Annotation example (cont)rlm

Ontologia resultante Quadro Comparativo(Nunes e Fileto 2007)rlm

21042010

14

Dependecircncias entre plataformas(Rui Tramontin Junior 2007)rlm

Comparaccedilatildeo de desempenho(Reeve e Han 2005)rlm

Prataforma Categoria Precisatildeo Cobertura Medida F

Armadillo Descoberta de padrotildees

910 740 870

KIM Regras 860 820 840

MnM Induccedilatildeo 950 900 nd

MUSE Regras 935 923 929

PANKOW Descoberta de padrotildees

650 282 249

SemTag Regras 820 nd nd

Evoluccedilatildeo de ontologias(Bloehdorn et al 2006)rlm

Exemplo Uso natildeo uniforme de conceitos

Alternativas para remoccedilatildeo do conceito C que tem sub-conceitos

Processo de evoluccedilatildeo de ontologias

CapturaCaptura

da

Mudanccedila

Representaccedilatildeo Semacircntica Propagaccedilatildeo Implementaccedilatildeo Validaccedilatildeo

Fases Elementares

21042010

15

Mapeamentos entre ontologias(Ontology Matching)

Fusatildeo de ontologias

Processo semi-automatico de alinhamento(Huang at al 2006)rlm

Referecircncia

Jerome Euzenat INRIA Rhone-Alpes France

Pavel Shvaiko University of Trento Italy

Ontology Matching

URL httpbookontologymatchingorg

Springer-Verlag Heidelberg (DE) 2007

343 p 67 illus Hardcover

ISBN 978-3-540-49611-3

E as buscas semacircnticas

Recuperaccedilatildeo da informaccedilatildeo de documentosrlm

Medidas da eficaacutecia das soluccedilotildees

precisatildeo = nro de docs relevantes recuperadosnro de docs recuperados

cobertura = nro de docs relevantes recuperadosnro de docs relevantes

21042010

16

Classificaccedilatildeo de abordagens para buscas semacircnticas (Mangold 2007)

Arquitetura

Acoplamento entre ontologias e documentos

Transparecircncia

Contexto do usuaacuterio

Modificaccedilatildeo de consultas

Estrutura das ontologias

Tecnologia para representar as ontologias

Desempenho escalabilidade e distribuiccedilatildeo

Adaptabilidade

Ranking

Arquiteturas para buscas semacircnticas

Maacutequina de busca stand_alone armazenametadados sobre os documentos em iacutendicescom os quais avalia as consultas

Meta-maacutequina de busca distribui asconsultas para outras maacutequinas de busca ecombina os resultados

Acoplamento ontologias-documentos

Acoplamento forte os metadados dosdocumentos referem-se explicitamente aosconceitos de uma ontologia e vice-versa(requer anotaccedilatildeo semacircntica)rlm

Acoplamento fraco os documentos satildeoindependentes de quaisquer ontologiasdisponiacuteveis (pode restringir a capacidade debusca)rlm

Contexto do usuaacuterio

Learning extraiacutedo na interaccedilotildees do usuaacuteriocom o sistema (histoacuterico das consultas erefinamentos de consultas)rlm

Hard-coded as consultas satildeo organizadas emcategorias que definem a informaccedilatildeo solicitada(eg ldquolocation ofrdquo ldquoresources forrdquo rlm(

Modificaccedilatildeo de consultas

Manual o sistema retorna um trechoapropriado da ontologia junto com a respostapermitindo ao usuaacuterio navegar na ontologia ereformular a consulta pela adiccedilatildeo e remoccedilatildeo determos

Re-escrita automaacutetica a consulta eacuteotimizada automaticamente pelo sistema

Baseada em grafo considera conceitos edocumentos como nodos de um grafoefetuando propagaccedilatildeo da consulta a partir dosnodos correspondentes a termos de busca

Modificaccedilatildeo de consultas

Modificaccedilatildeo de consulta

Manual

Re-escrita de consulta

Baseada em grafo

Inserccedilatildeo de termoRemoccedilatildeo de termo

Substituiccedilatildeo de termo

Conjuntiva

Disjuntiva

Conjuntiva Disjuntiva

21042010

17

Estrutura da ontologia

Propriedades anocircnimas as relaccedilotildees entreconceitos natildeo satildeo nomeadas indicando apenasque eles compartilham o mesmo contexto

Propriedades padronizadas sinocircniacutemiahiperniacutemia meroniacutemia negaccedilatildeo etc

Propriedades especiacuteficas de domiacutenio aleacutemdas propriedades padratildeo considerapropriedades especiacuteficas de um domiacutenio (egldquotipo de cacircmerardquo em sistema para a aacuterea defotografia)rlm

Tecnologia da ontologia

F-Logic

RDF

DAML+OIL

Frames

OWL

Comparaccedilatildeo de abordagens Comparaccedilatildeo de abordagens (cont)

Buscas semacircnticas na Web hoje

httpwwwaliprcom (imagens)rlm

httpwwwcognitioncom

httpwwwdeepdyvecom

httpwwwbingcom

httpwwwcuilcom

httpwwwfreebasecom

httpwwwgooglecom

httpwwwkosmixcom

httpwwwhakiacom

httpwwwpowersetcom

httpwwwsensebotnet

httpdeveloperyahoocomsearchmonkey

httpswoogleumbcedu (ontologias)rlm

21042010

18

21042010

19

SAO PAULO-SP

University of Sao Paulo

Sao Paulo Fashion

Sao Paulo Fashion Week

Sao Paulo State

Sao Paulo Hotel

Sao Paulo Hotels

Sao Paulo Brasilien

Sao Paulo Congonhas

21042010

20

21042010

21

Sao Paulo Airport

Sao Paulo Plane Crash

Sao Paulo Zoo

hellip

21042010

22

21042010

23

Algumas questotildees em aberto

Representaccedilatildeo de contextos de usuaacuterios emapeamento desses a ontologias

Anaacutelise dos efeitos de modificaccedilotildees de consultas

Meta-buscas semacircnticas

Anaacutelise da aceitaccedilatildeo dos usuaacuterios

Adaptabilidade a diferentes ontologias

Ranking dos resultados

Integraccedilatildeo com sistemas de gerenciamento dedocumentosconteuacutedo

Tratamento de dados multimiacuteda

Interfaces homem-maacutequina

Desempenho e escalabilidade

Contextual Semantic Search (CSS)(DAgostine Fileto ndash SBBD2007)rlm

21042010

24

General Architecture for CSSThe Weighted Topic Graph(DAgostine Fileto Dantas Gauthier - ICEIS 2008)rlm

A weighted topic graph is a graph TM(T A)rlm

T is a set of topics (vertices)rlm

A is a set of associations (edges)rlm

Let be an ontology O

Each topic t in T corresponds to a ontology term o in O

Each topic t has a weight [01] The sum from the weights from all topics with same name equals 1

Each association a has a weight [01] The sum

from all the weights from all association departing

a single topics equals 1

Topic weights used to disambiguate

Eg interest in Satildeo Paulo city instead of Satildeo Paulo

state

Association weights used to semantically

expand searches

Eg Actual interest in Guarulhos and airport while

searching for Satildeo Paulo city

The Weights in the Topic Graph Capturing the Users Context

Generated Topic Graph with the Ontological Users Context

The Contextual Semantic Search Process

21042010

25

Desambiguaccedilatildeo

Fundamento dos algoritmos de busca sobre contexto ontoloacutegico

Heuriacutesticas de estigmergia (Ant Colony Optimization - ACO)

Traccedilos de ferormocircnio

Algoritmo de busca semacircntica baseada em ACO

Entrada palavras-chave[ ]

Dados G(TA) Onto repositoacuterio

limite_de_profundidade

limite_miacutenimo_de_peso

λ fator de atenuaccedilatildeo de peso

iniacutecio Algoritmo Busca Contextual 1 Estigmeacuterica

resultados = busca_G_ou_Onto(palavras-chave[])

atenuaG (iacutendice ) λrlmisin [0 1]

manutenccedilatildeo(coleta_feedback(resultados))

fim

21042010

26

Demo Praestro ndash Karina Fasolin

Alguns trabalhos relacionados

Name Article Comments

Graupmann

et al 2005

The SphereSearch

engine for unifiedranked retrieval of

heterogeneous XML

and web documents

Searches through XML documents The context is a region in radius

around given element A data inside two regions is considered relevant

to both contexts

Made tests with large collections like DBLP INEX Wikipedia put for

stress testing regarding the size of the collection

ldquoLet us first comment on the difficulties of defining a meaningfulbenchmark for this kind of novel systemrdquo

Park e

Cheyer 2006

Just For Me Topic

Maps and Ontologies

Manages knowledge in three layers Topics Knowledge Structures and

Documents

Not implemented (at least at the time of publication)

Michlmayr

et al 2007Adaptive User Profiles

for Enterprise

Information Access

Represents context as an individual graph The graph is constructed

based on tags used to semantically annotate the content which the user

considers to be relevant

However the tags are only that only labels They are not tied-down to

a formal definition

Alguns trabalhos relacionados (cont)

Name Article Comments

Aleman-

Meza et a

2003

Context-Aware

Semantic Association

Ranking

Also defines context as regions But the regions are static defined in

the ontology which is used by the system So the contexts are defined

the same for every single user

Mani and

Sundaram

2007

Modeling user context

with applications to

media retrieval

Creates a graph representing the users context Each node

corresponds to an instance in the ontology The edges represent

relations between the instances Built to search trough multimedia

documents

However it does not associates the vocabulary the user uses with the

instances

Challam et

al 2007

Contextual Search

Using Ontology-Based

User Profiles

Monitors the users activity capturing content from open Internet

Explorer MS-Office and MSN The captured information is stored and

usedrlmtorlmbuildrlmarlmuser‟srlmcontextualrlmprofilerlmbasesrlmonrlmanrlmontology

The context is tightly coupled with the ontology

NO IMAGES WERE

PROVIDED

Vallet et al

2006

Personalized

Information Retrieval in

Context

Stores context as a graph constructed based on the ontology used by

the system Similar to Mani and Sundaram including its limitations

(mapping the vocabulary) however if built for text documents

Sieg et al

2007

Ontological User

Profiles for

Personalized Web

Search

Similar to Challam et al but it gets the context information from the

ontology terms used to annotate the retrieved relevant context

Also limited by the structure of the ontology

Alguns trabalhos relacionados(cont)

Name Deals with

objective

knowledge

(ontology)

Deals with

subjective

knowledge

(users

context)

The knowledge

management is

transparent

Idea Implemented

Graupmann et

al 2005

X IMPL

Park e Cheyer

2006

X X X IDEA

Michlmayr et al2007

X X IMPL

Aleman-Meza et

a 2003

X X IMPL

Mani eSundaram 2007

X X X IMPL

Challam et al

2007

X X X IMPL

Vallet et al 2006 X X X IMPL

Sieg et al 2007 X X X IMPL

(incomplete)

Praestro X X X IMPL

(prototype)

UnA-SUS ndash Universidade Aberta do SUS

Programa do Ministeacuterio da Sauacutede para atender necessidades de e

permanente dos

Accedilotildees focadas em

formulaccedilatildeo de conteuacutedo

bibliotecas digitais

cursos a distacircncia

21042010

27

Metas da UnA-SUS

Desenvolver um

plataforma para de

composiccedilatildeo e de

Montar e oferecer cursos para formaccedilatildeo continuada de profissionais da sauacutede

157

Metadados

O processo de produccedilatildeo catalogaccedilatildeo e reuso de OAs

Repositoacuterio

Conteuacutedo

OAs

requisiccedilotildees

Design revisatildeo e publicaccedilatildeo

OA

SGA outros reps

Busca e reuso

OAsMetadados

OAs

Concepccedilatildeo e validaccedilatildeo de OAs

O processo de produccedilatildeo catalogaccedilatildeo e reuso de OAs

OA1

Curso A

Curso B

OA2

OA3

Viacutedeo

Imagens

RepositoacuteriosConteuacutedoMultimiacutedia

SGA RepositoacuteriosOAs

Reuso eacute essencial

bull OAs satildeo caros para produzir

bull Demandas emergenciais na sauacutede puacuteblica exigem agilidade e pronta resposta com cursos para a qualificaccedilatildeo de profissionais

H1N1

Apoplexia

gripe suiacutena gripe A

influenza H1N1

hellip

21042010

28

Navegaccedilatildeo hiperboacutelica no DeCSCatalogaccedilatildeo de Objetos de Aprendizagem (OAs) usando Vocabulaacuterios Controlados

bull Seleccedilatildeo de termos do DeCS CID-10 SNOMED

ndash via fornecimento de palavras-chave que satildeo pesquisadas na base de conhecimento

ndash via navegaccedilatildeo em uma visatildeo do conhecimento em forma de aacutervore

Seleccedilatildeo via contexto ontoloacutegicoProtoacutetipo (catalogaccedilatildeo com entrada

de palavra-chave)

DSpaceCatalogaccedilatildeo de OAswf

Protoacutetipo (catalogaccedilatildeo com navegaccedilatildeo

na base de conhecimento)

DSpaceRecuperaccedilatildeo de OAswf

21042010

29

Recuperaccedilatildeo de Objetos de Aprendizagem (OAs) Baseada em Conhecimento

bull Vocabulaacuterios e relaccedilotildees semacircnticas

ndash Oriundos do DeCS

ndash Definidos pelos catalogadores de OAs

ndash Gerados pelo cruzamento de informaccedilotildees com o CID-10 (Classificaccedilatildeo Internacional de Doenccedilas)

ndash Ex sinocircnimos eacute um(a) parte de causa efeito sintoma etc

DeCs

Anatomia

Sistema Nervoso

Sistema Nervoso Central

Enceacutefalo

Prosenceacutefalo

Telencaacutefalo

Ceacuterebro

Doenccedilas

Doenccedilas do Sistema Nervoso

Doenccedilas Cardiovasculares

Doenccedilas do Sistema Nervoso Central

Encefalopatias

Transtornos Cerebrovasculares

Doenccedilas Vasculares

Transtornos Cerebrovasculares

Acidente Vascular Cerebral

Acidente Vascular Cerebral

OA 1

OA 2

AVC

IctusCerebral

Derrame Cerebral

Hemisfeacuterios Cerebrais

ApoplexiaAcidente

Cerebrovascular

IctoCerebral

Apoplexia Cerebrovascular

Apoplexia Cerebral

Acidente Vascular

Encefaacutelico

Acidente Vascular

do Ceacuterebro

Acidente Vascular Cerebral

padratildeo (sinocircnimo)

anota

especiacutefica de domiacutenio

anocircnimas (DeCs)

172

DeCs

Anatomia

Sistema Nervoso

Sistema Nervoso Central

Enceacutefalo

Prosenceacutefalo

Telencaacutefalo

Ceacuterebro (2)

Doenccedilas

Doenccedilas do Sistema Nervoso

Doenccedilas Cardiovasculares

Doenccedilas do Sistema Nervoso Central

Encefalopatias

Transtornos Cerebrovasculares

Doenccedilas Vasculares

Transtornos Cerebrovasculares

Acidente Cerebral Vascular (1)

Acidente Cerebral Vascular(1)

OA 1

OA 2

AVC

IctusCerebral

Derrame Cerebral

Hemisfeacuterios Cerebrais

ApoplexiaAcidente

Cerebrovascular

IctoCerebral

Apoplexia Cerebrovascular

Apoplexia Cerebral

Acidente Vascular

Encefaacutelico

Acidente Vascular

do Ceacuterebro

Acidente Vascular Cerebral

Busca de OAs na aacuterea de sauacutede usando conhecimento de domiacutenio

Semantic Learning Objects (VIAN J SILVEIRA R A FILETO R WCCE 2009)

21042010

30

Conclusotildees

A Web semacircntica tem potencial de contribuir naobtenccedilatildeo de melhores resultados para buscas

Suporte automatizado eacute fundamental para a construccedilatildeo evoluccedilatildeo e integraccedilatildeo de ontologias anotaccedilotildees semacircnticas e contextos de usuaacuterios

Nossos primeiros resultados focam na captura e utilizaccedilatildeo de contextos de usuaacuterios mapeados a ontologias de domiacutenios especiacuteficos paradesambiguar e estender as buscas

Trabalhos futuros

Processos parcialmente automatizados para geraccedilatildeo e atualizaccedilatildeo de ontologias e anotaccedilotildees semacircnticas

Experimentos para comprovar a eficaacutecia das teacutecnicas e ferramentas utilizadas

Validaccedilatildeo de soluccedilotildees de problemas de busca semacircntica em diversos domiacutenios de aplicaccedilatildeo

Determinaccedilatildeo de niacuteveis adequados de acoplamento entre contextos e ontologias e dessas com os recursos a serem recuperados

Notiacutecias e anaacutelises

httpnewscnetcomnew-search-engine-cuil-takes-aim-at-google

httpwwwreadwritewebcomarchivesis_google_a_semantic_search_enginephp

httpwwwreadwritewebcomarchivessemantic_search_the_myt

h_and_realityphp

httpwwwpandiacomsew1262-top-5-semantic-search-

engineshtml

httpmindsetresearchyahoocom

httpnewscnetcom8301-13953_3-9982015-80html

httpwwwsearchenginejournalcomaskcom-focuses-on-semantic-search8252

httpnewsbbccouk2hiprogrammesclick_onlinedefaultstm

httpnewsbbccouk2hiprogrammesclick_online8144765stm

Web semacircntica e buscassemacircnticas

httpwwww3org2001sw

httpsemanticweborg

httpenwikipediaorgwikiSemantic_Web

httpenwikipediaorgwikiSemantic_search

Ferramentas de desenvolvimento

httpprotegestanfordedu

httpjenasourceforgenet

httpwwww3org2001Annotea

httpwwwontotextcomkim

httpesww3orgtopicSemanticWebTools

httpwwwdamlorg200305swmu-tools-

tutorialOverviewhtml

Referecircncias em Web semacircntica

T Berners-Lee J Hendler e O Lassila The Semantic Web Scientific American May 2001

Thomas B Passing Explores Guide to the Semantic Web Manning Publications Greenwich CT 2005

Davies J Studer R Warren P (Eds) Semantic Web Technologies trends and research in ontology-based

Systems John Wiley amp Sons 2006

Breitman KK Casanova MA Truszkowski W Semantic Web

Concepts Technologies and Applications Series NASA Monographs in Systems and Software Engineering Springer 2007

Grigoris Antoniou and Frank van Harmelen A Semantic Web Primer 2nd edition The MIT Press Cambridge MA USA 2008

Kashyap V Bussler C Moran M The Semantic Web -Semantics for Data and Services on the Web Series Data-

Centric Systems and Applications Springer 2008

Hitzler P Krotzsch M Rudolph S Foundations of SemanticWeb Technologies Chapman amp HallCRC 2009

21042010

31

Referecircncias em buscas semacircnticas

Guha R McCool R and Miller E 2003 Semantic search In Proc of the 12th international Conference on World Wide Web

(WWW) Budapest Hungary ACM New York NY 2003 700-709

Reeve L and Han H 2005 Survey of semantic annotation

platforms In Proceedings of the ACM Symposium on Applied Computing Santa Fe New Mexico ACM New York NY 2005

1634-1638

Eetu Makela Survey of Semantic Search Research

Mangold C A Survey and classification of semantic search approaches Journal of Metadata Semantics and Ontology 2(1)

2007

Stephan Bloehdorn Philipp Cimiano Alistair Duke Peter Haase Joumlrg Heizmann Ian Thurlow Johanna Voumllker Ontology-BasedQuestion Answering for Digital Libraries ECDL 2007 14-25

Hai Dong Hussain FK Chang E A survey in semantic search technologies In 2nd IEEE International Conference on

Digital Ecosystems and Technologies 2008 403-408

Algumas referecircncias grupo UFSC

DAgostini C S Fileto R Capturing Users Preferences and Intentions in a Semantic Search System In 21st International

Conference on Software Engineering amp Knowledge Engineering (SEKE) Boston 2009 p 587-591

DAgostini C S Fileto R Dantas M A R Gauthier F A O

Contextual Semantic Search - Capturing using the UsersContext to Direct Semantic Search In 10th InternationalConference on Enterprise Information Systems (ICEIS) Barcelona

Spain 2008 v SAIC p 154-159

DAgostini C S Fileto R Capturing and managing usercontext for improving information retrieval In Workshop de

Teses e Dissertaccedilotildees do Simpoacutesio Brasileiro de Bancos de Dados (WTDBDSBBD) Campinas Unicamp Brazil 2008

Vian J Silveira R A Fileto R Proposal of a Multi-agent System for Indexing and Recovery applied to Learning

Objects In 9th IFIP World Conference on Computers in Education (WCCE) Bento Goncalves Brazil 2009

Alguns projetos na UFSC

httpwwwlisaufscbrprojetos

httpwwwunasusufscbr

httpwwwliteraturabrasileiraufscbr

Perguntas

Page 5: Buscas Semânticasfileto/Talks/BuscasSemanticas6sp.pdf · 21/04/2010 1 1 Buscas semânticas: panorama e tendências atuais minicurso ERBD 2010 RenatoFileto fileto@inf.ufsc.br AlunosColaboradores:

21042010

5

XML ndash eXtensible Makup Language

Construccedilotildees baacutesicas

ltElementogt Conteuacutedo ltElementogt

ltElemento gt

ltElemento Atributo1=ldquoValorrdquo Atributo2=ldquoValorrdquogt

ltElementorlmAtributo1=ldquoValorrdquorlmAtributo2=ldquoValorrdquogtrlm rlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlmrlm

Conteuacutedo

ltElementogt

ltElemento1gt

ltElemento2gt

Conteuacutedo

ltElemento2gt

ltElemento1gt

ltElemento1gtltElemento2gtltElemento1gt

Um documento XML

ltxml version=10 encoding=ISO-8859-1 gt

ltElementoRaizgt

ltElemento1gt

ltElemento1_1gt Conteuacutedo ltElemento1_1gt

ltElemento1_2gt Conteuacutedo ltElemento1_2gt

ltElemento1_3gt

ltElemento1gt

ltElemento2gt

ltElemento2_1gt

ltElemento2_1_1gt Conteuacutedo ltElemento2_1_1gt

ltElemento2_1_2gt

ltElemento2_1gt

ltElemento2gt

ltElementoRaizgt

A Versatilidade do XML para Dados Semi-Estruturados

ltxml version=10 encoding=ISO-8859-1 gt

ltPessoarlmNome=ldquoJoatildeorlmderlmSouzardquorlmDataDeNascimento=ldquo12061964rdquorlmCPF=ldquo12312312rdquogt

ltEnderecosgt

ltEnderecorlmTipo=ldquoComercialrdquogtRuarlmArlm23rlm- CentroltEnderecogt

ltEnderecorlmTipo=ldquoResidencialrdquogtTorrerlmComercialrlm1923rlmSl1011rlmltEnderecogt

ltMalaDiretarlmDestino=ldquoComercialrdquogt

ltEnderecosgt

ltFormasDeContatogt

ltTelefonesgt

ltTelefonerlmTipo=ldquoComercialrdquorlmDDD=ldquo61rdquorlmRamal=ldquo211rdquogt222-8545ltTelefonegt

ltTelefonerlmTipo=ldquoCelularrdquorlmDDD=ldquo61rdquogt999-9999ltTelefonegt

ltTelefonerlmTipo=ldquoResidencialrdquorlmDDD=ldquo61rdquogt444-4444ltTelefonegt

ltTelefonesgt

ltEmailgtjoatildeoemailcombrltEmailgt

ltICQrlmNumero=rlmrdquo127653467654ldquorlmgt

ltFormasDeContatogt

ltPessoagt

Doc XML para Dados Climaacuteticos (Balanccedilo Hiacutedrico)rlm

ltxml version=10 encoding=ISO8859-1gt

ltWaterBal xmlns=httpwwwagricgovbrWaterBalxsd

location=Brotas latitude=-221500 longitude=-475800gt

ltWeatherData Date=ldquo20050823rdquogt

ltTemperaturegt 220 ltTemperaturegt

ltAvgRainFallgt 2013 ltAvgRainFallgt

ltPotETgt 1154 ltPotETgt

ltRealETgt 1154 ltRealETgt

ltStoredgt 1250 ltStoredgt

ltWaterDeficitgt 00 ltWaterDeficitgt

ltWaterExcessgt 860 ltWaterExcessgt

ltWeatherData gt

ltWaterBalgt

Arquivo texto (natildeo XML) com dados pluviomeacutetricos

weather station

year

station

code

end of file

latitude longitude altitude

Jan

Feb

Mar

Apr

May

Jun

Jul

Aug

Sep

Oct

Nov

Dec

XML-Schema

Um documento XML-Schema descreve os

elementos

atributos

relacionamentos

etc

permitidos em um ou mais documentos XML isto eacute define uma classe de documentos XML que adere a um

conjunto de restriccedilotildees estruturais e de dados

XML-Schema tem uma sintaxe XML

XML-Schema eacute mais robusta versaacutetil e poderosa que DTD (Document Type Definition)rlm

21042010

6

Um Documento XML-Schema(WaterBalxsd)rlm

ltschema xmlnshttpwwww3org2001XMLSchema gt

ltelement name=WaterBal type=WaterBalTypegt

ltattribute name=location type=stringgt

ltattribute name=latitude type=Latitudegt

ltattribute name=longitude type=Longitudegt

ltelement name=WeatherData type=AgregValuesgt

ltcomplexType name=AgregValuesgt

ltattribute name=Date type=DateTypegt

ltsequencegt

ltelement name=Temperature type=decimalgt

ltelement name=AvgRainfall type=decimalgt

ltelement name=PotET type=decimalgt

ltelement name=RealET type=decimalgt

ltelement name=Stored type=decimalgt

ltelement name=WaterDeficit type=decimalgt

ltelement name=WaterExcess type=decimalgt

ltsequencegt

ltcomplexTypegt

ltelementgt

ltschemagt

Validaccedilatildeo de documentos XML

Documento bem-formado (well-formed) satisfaz as restriccedilotildees

de formaccedilatildeo expressa na especificaccedilatildeo do XML

(httpwwww3orgTR2004REC-xml-20040204)rlm

Documento vaacutelido satisfaz as restriccedilotildees (elementos atributos

aninhamentos tipos etc) expressas em uma especificaccedilatildeo de

esquema XML em DTD ou XSL (XML-Schema) que eacute associada a

esse documento XML

Heterogeneidade semacircntica em XML

ltobject id=ldquoa1rdquo class=ldquoartifactrdquogt

lttuplegt

lttitlegt Nympheas lttitlegt

ltyeargt 1897 ltyeargt

ltcreatorgt Monet ltcreatorgt

ltpricegt 10000000 ltpricegt

ltowners refs=ldquop1p2p3rdquogt

lttuplegt

ltobjectgt

ltobject id=ldquop3rdquo class=ldquopersonrdquogt

lttuplegt

ltnamegt Claudia ltnamegt

ltagegt 17 ltagegt

lttuplegt

ltobjectgt

ltworkgt

ltartistgt Monet ltartistgt

ltnamegt Nympheas ltnamegt

ltstylegt Impressionist ltstylegt

ltsizegt 21 x 61 ltsizegt

ltcplacegt Givern ltcplacegt

ltworkgt

ltworkgt

ltartistgt Monet ltartistgt

lttitlegt Waterloo Bridge lttitlegt

ltstylegt Impressionist ltstylegt

ltsizegt 292 x 464 ltsizegt

lthistorygt

Painted with

lttechgt Oil on canvas lttechgt

in

lthistorygt

ltworkgt

XML como Padratildeo de representaccedilatildeo de dados

ldquoArtworksrdquorlmStructure

Works works

Work

Work

Field

artist title style size

string string string string

ldquoArtfactrdquorlmSchema

artifacts set

ampArtifact

Artifact class

artifact

tuple

title year creator price owners

ampPerson

string int string float list

YAT Model

YAT Any

YAT

V ampYAT

ODMG Model

Vtuple

Symbol

Type

V(int vbool v

float vstring)rlm

ampClass

Type

V

Symbol

(set vbag vlist varray)rlm

Class class

Symbol

Type

RDF ndash Resource Description Framework

Uma linguagem e modelo padronizados para expressar conhecimento na Web semacircntica

Um comando (statement) eacute uma tripla da forma

Recurso qualquer coisa referenciada por uma URL

Propriedade qualquer propriedade de um recurso

Valor um literal ou outro recurso

RDF-Schema define classes de recursos suas propriedades (que podem ser relacionamentos com outras classes) e possiacuteveis valores

Os formatos para representar ontologias na Web semacircntica (eg

DAML+OIL OWL) satildeo extensotildees do RDF

Sintaxe XML do RDF

ltxml version=10gt

ltrdfRDF xmlnsRDF httpwwww3orgRDFRDFldquo

xmlnsdc httpdublincoreorgdcldquogt

ltrdfDescription about=ldquohttpwwwagritempocnptiaembrapabrrdquogt

ltdctitlegt Nuacutecleo de Monitoramento e Anaacutelise de Dados

Meteoroloacutegicos e Climatoloacutegicos para a Agricultura ltdctitlegt

ltleadergt

rdfresource=ldquohttpwwwcnptiaembrapabr~assadrdquo

ltleadergt

ltrdfDescriptiongt

ltrdfDescription

about=ldquohttpwwwcnptiaembrapabr~assadrdquogt

ltdctitlegt Eduardo D Assad ltdctitlegt

ltemailgt Assadcnptiaembrapabr ltemailgt

ltrdfDescriptiongt

ltrdfRDF gt

21042010

7

Estrutura do conhecimento em RDF

httpwwwagritempocnptiaembrapabr

httpwwwcnptiaembrapabr~assad

Nuacutecleo de Monitoramento e

Anaacutelise de Dados

Meteoroloacutegicos e Climatoloacutegicos

para a Agricultura

assadcnptiaembrapabrEduardo D

Assad

dctitle

dctitleemail

leader

Metadata in RDFWater Balance (same place and institution)rlm

ltxml version=10gt

ltrdfRDF xmlnsRDF httpwwww3orgRDFRDFldquo

xmlns httpagricgovbrDocStdldquogt

ltrdfDescription about=httpwwwagricgovbrpublicWaterBal1234gt

ltSourcegt

rdfresource=ldquohttpwwwcepagriunicampbrrdquo

rdfresource=ldquohttpwwwciagroiacgovspbrrdquo

ltSourcegt

ltInitialDategt 28032002 ltInitialDategt

ltFinalDategt 31032002 ltFinalDategt

ltkeywordgt Water available in Soil ltkeyworkgt

ltlocalgt

rdfresource= ldquohttpwwwibgegovbrstate_SPrdquo

ltlocalgt

ltmeasument_unitgt

rdfresource= ldquohttpwwwinmetrogovbrmmrdquo

ltmeasument_unitgt

ltrdfDescriptiongt

ltrdfRDFgt

httpwwwagricgovbrpublicWaterBal1234

http

wwwcpaunicampbr

Centro de Pesquisas

Agriacutecolas (CEPAGRI)

name

source

httpwwwciagroiacg

ovspbr

httpwwwunica

mpbr

part_of

CIIAGRO

name

http

wwwiacgovspbr

part_of

InitialDate

28032002

FinalDateWater available in

Soil

http

wwwibgegovbrstate_SP

source

keyword

http

wwwinmetrogovbrmm

31032002

local

measurement_unit

RDF-Schema

ltrdfabout=ampAgricZoningCountry rdfslabel=Countrygt

ltrdfssubClassOf dfresource=ampAgricZoningTerritorialDivisiongt

ltrdfabout=ampAgricZoningState rdfslabel=ldquoStategt

ltrdfssubClassOf dfresource=ampAgricZoningTerritorialDivisiongt

ltrdfProperty rdfabout=ampAgricZoningstatesOfCountry

aminCardinality=1

rdfslabel=statesOfCountrygt

ltrdfsdomain rdfresource=ampAgricZoningCountrygt

ltrdfsrange rdfresource=ampAgricZoningStategt

ltainverseProperty rdfresource=ampAgricZoningcountryOfStategt

ltrdfPropertygt

RDF-Schema

ltrdfProperty rdfabout=ampAgricZoningcountryOfState

amaxCardinality=1

aminCardinality=1

rdfslabel=countryOfStategt

ltrdfsrange rdfresource=ampAgricZoningCountrygt

ltrdfsdomain rdfresource=ampAgricZoningStategt

ltainverseProperty

rdfresource=ampAgricZoningstatesOfCountrygt

ltrdfPropertygt

Trecho de RDF

ltAgricZoningCountry rdfabout=ampAgricZoningpais_55

AgricZoningnameBR=BRASIL rdfslabel=BRASILgt

ltAgricZoningofficialRegionsOfCountry

rdfresource=ampAgricZoningregof_1gt

ltAgricZoningofficialRegionsOfCountry

rdfresource=ampAgricZoningregof_2gt

ltAgricZoningofficialRegionsOfCountry

rdfresource=ampAgricZoningregof_3gt

ltAgricZoningofficialRegionsOfCountry

rdfresource=ampAgricZoningregof_4gt

ltAgricZoningofficialRegionsOfCountry

rdfresource=ampAgricZoningregof_5gt

ltAgricZoningstatesOfCountry rdfresource=ampAgricZoningestado_11gt

ltAgricZoningstatesOfCountry rdfresource=ampAgricZoningestado_12gt

ltAgricZoningmetroAreasOfCountry

rdfresource=ampAgricZoningmetro_5201gt

ltAgricZoningCountrygt

21042010

8

Descriccedilotildees em RDF de recursos para a coleta de dados cientiacuteficos

wwwEquipServcombrschema2rdfs

RD

F S

chem

aR

DF

Equipment Clienthas

String StringString String

category model name city

wwwAgriTempobrschema1rdfs

WeatherStation

longitudealtitude

LandParcel

CountyState

latitude

inpart_of

ampws1

ampws3

ampws4

Stringname

ampeq1

ampRio

ampUbatuba

ampCampinas

ampws2

ampUnicamp

ampEmbrapa

ampSP

ampRJ

in

in

in

in

part_of

part_of

part_of

has

has

has

has

ampws1 = httpwwwembrapabrWeatherStationX

ampws2 = httpwwwiacbrWeatherStationK

ampws3 = httpwwwunicampbrWheaterStationA

ampws4 = httpwwwunicampbrWheaterStationB

ampeq1 = httpwwwembrapabrCameraZ

subClassOf (isA)rlm

typeOf (instance)rlm

other kind of property

DegreesDecMeters

String

String

value

value

OWL ndash Ontology Web Language

Estende o RDF com vocabulaacuterio padronizado e construccedilotildees para definir

Escopo local de propriedades

Disjunccedilatildeo de classes

Combinaccedilotildees de classes

Restriccedilotildees de cardinalidade

Caracteriacutesticas especiais de propriedades (eg transitividade simetria anti-simetria propriedades inversas)rlm

The 3 flavors of OWL

OWL LiteExpressividade restrita (exclui classes enumeradas disjunccedilatildeo cardinalidade arbitraacuteria )

Faacutecil de entender e usar

OWL DL

Equivalente agrave loacutegica descritiva (DL = Description

Logics)

Ainda permite eficiecircncia e computabilidade

OWL Full

Compatiacutevel sintaacutetica e semanticamente com RDF embora mais poderosaPode ocasionar inferecircncias indecidiacuteveis

Disjunction and Equivalence of Classes

ltowlClass rdfabout=associateProfessorgt

ltowldisjointWith rdfresource=assistantProfessorgt

ltowlClassgt

ltowlClass rdfID=facultygt

ltowlequivalentClass

rdfresource=academicStaffMembergt

ltowlClassgt

Inverse properties

ltowlObjectProperty rdfID=teachesgt

ltrdfsrange rdfresource=coursegt

ltrdfsdomain rdfresource=academicStaffMembergt

ltowlinverseOf rdfresource=isTaughtBygt

ltowlObjectPropertygt

Sintaxe abstrata para OWL

Class(Person partialrestriction (hasChild allValuesFrom(Person)))rlm

Class(Parent completePersonrestriction (hasChild someValuesFrom(Person)))rlm

ObjectProperty(hasChild)rlm

Individual (John type(Person)rlmvalue(hasChild Mary))rlm

21042010

9

Busca em uma ontologia

Pessoa

Santo

S1

IS_A

TYPE_OF

nome

Satildeo Paulo

Time

TimeFutebol

TF1

IS_A

TYPE_OF

nome

Satildeo Paulo

ParcelaTerritoacuterio

Estado

IS_A

Cidade

E1

TYPE_OF

nome

Satildeo Paulo

C1

nome

Satildeo PauloTricolor Paulista

PART_OF

SPARQL (recomendaccedilatildeo W3C)rlm

Exemplo de expressatildeo em SPARQL

SELECTrlmconceptrlm propertyrlm ldquoSatildeorlmPaulordquo

WHERE

concept propertyhasProperty property

FILTER(property name)rlm

Linguagens de Regras (Prolog)

Rules

parent(x z)rlm - father(x z) v mother(x z)

sibling(x y)rlm- parent(x z) and parent(y z)

Knowledge base

father(_Maria _Joatildeo)

father(_Pedro _Joatildeo)

Query

sibling(_Maria x) rArr Yes rArr b = _PedrorArr b = _xyz1rArr b = _xyz2 rArr b = _xyz3rArr b = _xyz4

RIF (Rule Interchange Format)

A buyer buys an item from a seller if the seller sells it to the buyer John sells LeRif to Mary The fact Mary buys LeRif from John can be logically derived by a modus ponens argument

Document(

Prefix(cpt lthttpexamplecomconceptsgt)

Prefix(ppl lthttpexamplecompeoplegt)

Prefix(bks lthttpexamplecombooksgt)

Group ( Forall Buyer Item Seller (

cptbuy(Buyer Item Seller)

cptsell(Seller Item Buyer)

)

cptsell(pplJohn bksLeRif pplMary)

)

)

Controveacutersia sobre pilha de padrotildees

Peter F Patel-Schneider A Revised Architecture for Semantic

Web Reasoning Third Workshop on Principles and Practices of

Semantic Web Reasoning Dagstuhl Germany September

2005 LNCS 3703 Springer Verlag 2005

Ian Horrocks Bijan Parsia Peter F Patel-Schneider and

James Hendler Semantic Web Architecture Stack or Two

Towers Third Workshop on Principles and Practices of Semantic Web Reasoning Dagstuhl Germany September

2005 LNCS 3703 Springer Verlag 2005

Peter F Patel-Schneider Building the Semantic Web Tower

from RDF Straw Nineteenth International Joint Conference on

Artificial Intelligence Edinburgh Scotland August 2005

Proposta inicial (2000)rlm

21042010

10

Proposta regras(2005)rlm Proposta atual

Como estaacute a Web semacircntica hoje

Aacuterea de pesquisa muito ativa

Visa estender o papel dos computadores no

suporte a diversas atividades humanas

Usa ontologias e anotaccedilotildees semacircnticas para

catalogar recuperar e compor dados e serviccedilos

de processamento na Web

Desafios da Web semacircntica

Construccedilatildeo de ontologias

(Semi-)automatizada e interativa

Geraccedilatildeo de anotaccedilotildees semacircnticas de recursos

Muitas aplicaccedilotildees requerem automatizaccedilatildeo

Evoluccedilatildeo de ontologias

Checar se alteraccedilotildees natildeo introduzem inconsistecircncias e gerenciar

versotildees

Integraccedilatildeo de ontologias (ontology matching)

A obtenccedilatildeo de consenso eacute inviaacutevel em muitas domiacutenios

Deduccedilatildeoraciociacutenio

Teorias computaacuteveis e natildeo computaacuteveis ontologias inconsistentes

Ediccedilatildeo de Ontologias no Proteacutegeacute

Editor de ontologias e arcabouccedilo para o desenvolvimento de bases de conhecimento livre e de coacutedigo aberto baseado em Java

Suporta os modelos de frames (RDF) e OWL

Exporta as ontologias e bases de conhecimento para uma variedade de formatos incluindo RDF(S) OWL e XML Schema

Extensiacutevel via plugins

Construccedilatildeo de ontologias

Processo para geraccedilatildeo automatizada de

ontologias a partir de esboccedilos dados e

documentos (nova geraccedilatildeo de ferramentas)rlm

Entendimento do domiacutenio

Entendimento dos dados

Definiccedilatildeo das tarefas

Geraccedilatildeo semi-automaacutetica

Avaliaccedilatildeo de qualidade

Refinamento com interaccedilatildeo humana

21042010

11

Definiccedilotildees de ldquogeraccedilatildeo de ontologiardquoGrobenik and Mladenic 2006

Induccedilatildeo de conceitos (a partir das instacircncias)rlm

Induccedilatildeo de relaccedilotildees (a partir de conceitos e

instacircncias a eles associadas)rlm

Popular ontologia (dada uma ontologia e

instacircncias de seus conceitos)rlm

Geraccedilatildeo de uma ontologia completa (a partir

das instacircncias e algum conhecimentoinformaccedilatildeo)rlm

Atualizaccedilatildeoextensatildeo de ontologias (dada

uma ontologia e informaccedilatildeo como novas

instacircncias ou padrotildees de uso da ontologia)rlm

Document Clustering - Vector Model

Vector of word occurences in the documents

bull diK = TF(Wkdi) IDF(Wk)rlm

Where

bull TF(Wkdi) = number of times Wk occurs in document di

bull IDF(Wk) = log ( D DF(Wk))rlm

bull D = number of documents

bull DF(Wk) = number of documents in which word W occurs

Document distance metric

Anotaccedilotildees Semacircnticas(Kiryakov et al 2004)rlm

21042010

12

Anotaccedilatildeo Semacircntica de Documentos

Atribui agraves entidades que aparecem no documento ligaccedilotildees com suas descriccedilotildees semacircnticas na ontologia

Aplicaacutevel a qualquer tipo de texto (documentos HTML documentos de texto comuns campos de banco de dados entre outros)

Representaccedilatildeo das anotaccedilotildees

Intrusiva

Natildeo intrusiva

Confecccedilatildeo das anotaccedilotildees

bull Semi-Automaacutetica Associa palavras do texto a classes

instacircncias e propriedades da ontologia utilizando-se do

julgamento humano Esta associaccedilatildeo geralmente eacute efetuada

atraveacutes de interfaces ldquoarraste-e-solterdquo (eg OntoMat)rlm

bull Automaacutetica Aplica teacutecnicas de processamento de

linguagem natural aprendizado de maacutequina e extraccedilatildeo de

informaccedilatildeo entre outras para associar palavras agrave ontologia

Essas ferramentas podem utilizar ontologias padratildeo (eg

IEEE Standard Upper Ontology) ou ontologias de domiacutenios

especiacuteficos (eg Unified Medical Language System)

bull Hiacutebrida Combinaccedilatildeo das teacutecnicas acima

Geraccedilatildeo de anotaccedilotildees semacircnticas (Reeve e Han 2005)rlm

Ferramentas para anotaccedilatildeo

Annozilla Funciona sobre o Mozzila Firefox

Annotea projeto da W3C - servidor de anotaccedilotildees em RDF

Armadillo

Muse

Pankol

Semantic Word anotaccedilatildeo interativa de porccedilotildees de documentos

Word

OntoMat Annotizer anotaccedilatildeo interativa de paacuteginas Web com

ontologias em OWL

Smore marcaccedilotildees sobre HTML com ontologias em OWL

Melita ferramenta de anotaccedilatildeo semi-automaacutetica que usa algoritmo

de IE para ajudar o usuaacuterio no processo de anotaccedilatildeo

MnM anotaccedilatildeo semacircntica de paacuteginas Web com metadados

descritos em RDFOCMLDAML+OIL

KIM permite criar metadados armazenar e buscar informaccedilotildees e

pode ser usada para anotaccedilatildeo e procura de documentos

21042010

13

O processo automatizado de anotaccedilatildeo semacircntica de documentos

Tokenizaccedilatildeo e Eliminaccedilatildeo de StopWords

Etiquetagem

Stemmer

Corpus Anotado

Identificaccedilatildeo EN

Associaccedilatildeo atermos da ontologia

RepositoacuterioSemacircntico

Tokensrelevantes

Palavras +Classificaccedilatildeo Gramatical

Radicais das Palavras +Classificaccedilatildeo Gramatical

Entidades Nomeadas

Anotaccedilatildeo Semacircntica

Dados Metadados Documento

s

Ontologia do Domiacutenio

Valida

Valida

Especialista

RepositoacuterioInformaccedilatildeo

Annotation example(Davies et al 2006)

Consider the phrase

There are deliverables

The tokens are

[There] [are] [deliverables] []

The tagger finds out what kind of a word each of the tokens

is (whether it is a noun an adjective a verb etc)rlm

[There] existential quantifier

[are] verbmdash3rd person singular present

[deliverables] nounmdashplural

Annotation example (cont)rlm

The morphological analyser gives the roots of all the words

[There] rootmdashthere

[are] rootmdashbe

[deliverables] rootmdashdeliverable

There are mdash mdashmdash

triggers the creation of one or more new classes in the

ontology

There are projects

There are workpackages tasks and deliverables

SEKT is a project

MUSINGrlmbdquoKnowledgerlmWeb‟rlmandrlmbdquoPrestorlmSpace‟rlmarerlmprojects

Projects have workpackages

Workpackages can have tasks

WP1 WP2 WP3 WP4 WP5 and WP6 are workpackages

SEKT has WP1

MUSING has WP2 WP3 and WP4

bdquoKnowledgerlmWeb‟rlmhasrlmWP5 and WP6

Annotation example (cont)rlm

Ontologia resultante Quadro Comparativo(Nunes e Fileto 2007)rlm

21042010

14

Dependecircncias entre plataformas(Rui Tramontin Junior 2007)rlm

Comparaccedilatildeo de desempenho(Reeve e Han 2005)rlm

Prataforma Categoria Precisatildeo Cobertura Medida F

Armadillo Descoberta de padrotildees

910 740 870

KIM Regras 860 820 840

MnM Induccedilatildeo 950 900 nd

MUSE Regras 935 923 929

PANKOW Descoberta de padrotildees

650 282 249

SemTag Regras 820 nd nd

Evoluccedilatildeo de ontologias(Bloehdorn et al 2006)rlm

Exemplo Uso natildeo uniforme de conceitos

Alternativas para remoccedilatildeo do conceito C que tem sub-conceitos

Processo de evoluccedilatildeo de ontologias

CapturaCaptura

da

Mudanccedila

Representaccedilatildeo Semacircntica Propagaccedilatildeo Implementaccedilatildeo Validaccedilatildeo

Fases Elementares

21042010

15

Mapeamentos entre ontologias(Ontology Matching)

Fusatildeo de ontologias

Processo semi-automatico de alinhamento(Huang at al 2006)rlm

Referecircncia

Jerome Euzenat INRIA Rhone-Alpes France

Pavel Shvaiko University of Trento Italy

Ontology Matching

URL httpbookontologymatchingorg

Springer-Verlag Heidelberg (DE) 2007

343 p 67 illus Hardcover

ISBN 978-3-540-49611-3

E as buscas semacircnticas

Recuperaccedilatildeo da informaccedilatildeo de documentosrlm

Medidas da eficaacutecia das soluccedilotildees

precisatildeo = nro de docs relevantes recuperadosnro de docs recuperados

cobertura = nro de docs relevantes recuperadosnro de docs relevantes

21042010

16

Classificaccedilatildeo de abordagens para buscas semacircnticas (Mangold 2007)

Arquitetura

Acoplamento entre ontologias e documentos

Transparecircncia

Contexto do usuaacuterio

Modificaccedilatildeo de consultas

Estrutura das ontologias

Tecnologia para representar as ontologias

Desempenho escalabilidade e distribuiccedilatildeo

Adaptabilidade

Ranking

Arquiteturas para buscas semacircnticas

Maacutequina de busca stand_alone armazenametadados sobre os documentos em iacutendicescom os quais avalia as consultas

Meta-maacutequina de busca distribui asconsultas para outras maacutequinas de busca ecombina os resultados

Acoplamento ontologias-documentos

Acoplamento forte os metadados dosdocumentos referem-se explicitamente aosconceitos de uma ontologia e vice-versa(requer anotaccedilatildeo semacircntica)rlm

Acoplamento fraco os documentos satildeoindependentes de quaisquer ontologiasdisponiacuteveis (pode restringir a capacidade debusca)rlm

Contexto do usuaacuterio

Learning extraiacutedo na interaccedilotildees do usuaacuteriocom o sistema (histoacuterico das consultas erefinamentos de consultas)rlm

Hard-coded as consultas satildeo organizadas emcategorias que definem a informaccedilatildeo solicitada(eg ldquolocation ofrdquo ldquoresources forrdquo rlm(

Modificaccedilatildeo de consultas

Manual o sistema retorna um trechoapropriado da ontologia junto com a respostapermitindo ao usuaacuterio navegar na ontologia ereformular a consulta pela adiccedilatildeo e remoccedilatildeo determos

Re-escrita automaacutetica a consulta eacuteotimizada automaticamente pelo sistema

Baseada em grafo considera conceitos edocumentos como nodos de um grafoefetuando propagaccedilatildeo da consulta a partir dosnodos correspondentes a termos de busca

Modificaccedilatildeo de consultas

Modificaccedilatildeo de consulta

Manual

Re-escrita de consulta

Baseada em grafo

Inserccedilatildeo de termoRemoccedilatildeo de termo

Substituiccedilatildeo de termo

Conjuntiva

Disjuntiva

Conjuntiva Disjuntiva

21042010

17

Estrutura da ontologia

Propriedades anocircnimas as relaccedilotildees entreconceitos natildeo satildeo nomeadas indicando apenasque eles compartilham o mesmo contexto

Propriedades padronizadas sinocircniacutemiahiperniacutemia meroniacutemia negaccedilatildeo etc

Propriedades especiacuteficas de domiacutenio aleacutemdas propriedades padratildeo considerapropriedades especiacuteficas de um domiacutenio (egldquotipo de cacircmerardquo em sistema para a aacuterea defotografia)rlm

Tecnologia da ontologia

F-Logic

RDF

DAML+OIL

Frames

OWL

Comparaccedilatildeo de abordagens Comparaccedilatildeo de abordagens (cont)

Buscas semacircnticas na Web hoje

httpwwwaliprcom (imagens)rlm

httpwwwcognitioncom

httpwwwdeepdyvecom

httpwwwbingcom

httpwwwcuilcom

httpwwwfreebasecom

httpwwwgooglecom

httpwwwkosmixcom

httpwwwhakiacom

httpwwwpowersetcom

httpwwwsensebotnet

httpdeveloperyahoocomsearchmonkey

httpswoogleumbcedu (ontologias)rlm

21042010

18

21042010

19

SAO PAULO-SP

University of Sao Paulo

Sao Paulo Fashion

Sao Paulo Fashion Week

Sao Paulo State

Sao Paulo Hotel

Sao Paulo Hotels

Sao Paulo Brasilien

Sao Paulo Congonhas

21042010

20

21042010

21

Sao Paulo Airport

Sao Paulo Plane Crash

Sao Paulo Zoo

hellip

21042010

22

21042010

23

Algumas questotildees em aberto

Representaccedilatildeo de contextos de usuaacuterios emapeamento desses a ontologias

Anaacutelise dos efeitos de modificaccedilotildees de consultas

Meta-buscas semacircnticas

Anaacutelise da aceitaccedilatildeo dos usuaacuterios

Adaptabilidade a diferentes ontologias

Ranking dos resultados

Integraccedilatildeo com sistemas de gerenciamento dedocumentosconteuacutedo

Tratamento de dados multimiacuteda

Interfaces homem-maacutequina

Desempenho e escalabilidade

Contextual Semantic Search (CSS)(DAgostine Fileto ndash SBBD2007)rlm

21042010

24

General Architecture for CSSThe Weighted Topic Graph(DAgostine Fileto Dantas Gauthier - ICEIS 2008)rlm

A weighted topic graph is a graph TM(T A)rlm

T is a set of topics (vertices)rlm

A is a set of associations (edges)rlm

Let be an ontology O

Each topic t in T corresponds to a ontology term o in O

Each topic t has a weight [01] The sum from the weights from all topics with same name equals 1

Each association a has a weight [01] The sum

from all the weights from all association departing

a single topics equals 1

Topic weights used to disambiguate

Eg interest in Satildeo Paulo city instead of Satildeo Paulo

state

Association weights used to semantically

expand searches

Eg Actual interest in Guarulhos and airport while

searching for Satildeo Paulo city

The Weights in the Topic Graph Capturing the Users Context

Generated Topic Graph with the Ontological Users Context

The Contextual Semantic Search Process

21042010

25

Desambiguaccedilatildeo

Fundamento dos algoritmos de busca sobre contexto ontoloacutegico

Heuriacutesticas de estigmergia (Ant Colony Optimization - ACO)

Traccedilos de ferormocircnio

Algoritmo de busca semacircntica baseada em ACO

Entrada palavras-chave[ ]

Dados G(TA) Onto repositoacuterio

limite_de_profundidade

limite_miacutenimo_de_peso

λ fator de atenuaccedilatildeo de peso

iniacutecio Algoritmo Busca Contextual 1 Estigmeacuterica

resultados = busca_G_ou_Onto(palavras-chave[])

atenuaG (iacutendice ) λrlmisin [0 1]

manutenccedilatildeo(coleta_feedback(resultados))

fim

21042010

26

Demo Praestro ndash Karina Fasolin

Alguns trabalhos relacionados

Name Article Comments

Graupmann

et al 2005

The SphereSearch

engine for unifiedranked retrieval of

heterogeneous XML

and web documents

Searches through XML documents The context is a region in radius

around given element A data inside two regions is considered relevant

to both contexts

Made tests with large collections like DBLP INEX Wikipedia put for

stress testing regarding the size of the collection

ldquoLet us first comment on the difficulties of defining a meaningfulbenchmark for this kind of novel systemrdquo

Park e

Cheyer 2006

Just For Me Topic

Maps and Ontologies

Manages knowledge in three layers Topics Knowledge Structures and

Documents

Not implemented (at least at the time of publication)

Michlmayr

et al 2007Adaptive User Profiles

for Enterprise

Information Access

Represents context as an individual graph The graph is constructed

based on tags used to semantically annotate the content which the user

considers to be relevant

However the tags are only that only labels They are not tied-down to

a formal definition

Alguns trabalhos relacionados (cont)

Name Article Comments

Aleman-

Meza et a

2003

Context-Aware

Semantic Association

Ranking

Also defines context as regions But the regions are static defined in

the ontology which is used by the system So the contexts are defined

the same for every single user

Mani and

Sundaram

2007

Modeling user context

with applications to

media retrieval

Creates a graph representing the users context Each node

corresponds to an instance in the ontology The edges represent

relations between the instances Built to search trough multimedia

documents

However it does not associates the vocabulary the user uses with the

instances

Challam et

al 2007

Contextual Search

Using Ontology-Based

User Profiles

Monitors the users activity capturing content from open Internet

Explorer MS-Office and MSN The captured information is stored and

usedrlmtorlmbuildrlmarlmuser‟srlmcontextualrlmprofilerlmbasesrlmonrlmanrlmontology

The context is tightly coupled with the ontology

NO IMAGES WERE

PROVIDED

Vallet et al

2006

Personalized

Information Retrieval in

Context

Stores context as a graph constructed based on the ontology used by

the system Similar to Mani and Sundaram including its limitations

(mapping the vocabulary) however if built for text documents

Sieg et al

2007

Ontological User

Profiles for

Personalized Web

Search

Similar to Challam et al but it gets the context information from the

ontology terms used to annotate the retrieved relevant context

Also limited by the structure of the ontology

Alguns trabalhos relacionados(cont)

Name Deals with

objective

knowledge

(ontology)

Deals with

subjective

knowledge

(users

context)

The knowledge

management is

transparent

Idea Implemented

Graupmann et

al 2005

X IMPL

Park e Cheyer

2006

X X X IDEA

Michlmayr et al2007

X X IMPL

Aleman-Meza et

a 2003

X X IMPL

Mani eSundaram 2007

X X X IMPL

Challam et al

2007

X X X IMPL

Vallet et al 2006 X X X IMPL

Sieg et al 2007 X X X IMPL

(incomplete)

Praestro X X X IMPL

(prototype)

UnA-SUS ndash Universidade Aberta do SUS

Programa do Ministeacuterio da Sauacutede para atender necessidades de e

permanente dos

Accedilotildees focadas em

formulaccedilatildeo de conteuacutedo

bibliotecas digitais

cursos a distacircncia

21042010

27

Metas da UnA-SUS

Desenvolver um

plataforma para de

composiccedilatildeo e de

Montar e oferecer cursos para formaccedilatildeo continuada de profissionais da sauacutede

157

Metadados

O processo de produccedilatildeo catalogaccedilatildeo e reuso de OAs

Repositoacuterio

Conteuacutedo

OAs

requisiccedilotildees

Design revisatildeo e publicaccedilatildeo

OA

SGA outros reps

Busca e reuso

OAsMetadados

OAs

Concepccedilatildeo e validaccedilatildeo de OAs

O processo de produccedilatildeo catalogaccedilatildeo e reuso de OAs

OA1

Curso A

Curso B

OA2

OA3

Viacutedeo

Imagens

RepositoacuteriosConteuacutedoMultimiacutedia

SGA RepositoacuteriosOAs

Reuso eacute essencial

bull OAs satildeo caros para produzir

bull Demandas emergenciais na sauacutede puacuteblica exigem agilidade e pronta resposta com cursos para a qualificaccedilatildeo de profissionais

H1N1

Apoplexia

gripe suiacutena gripe A

influenza H1N1

hellip

21042010

28

Navegaccedilatildeo hiperboacutelica no DeCSCatalogaccedilatildeo de Objetos de Aprendizagem (OAs) usando Vocabulaacuterios Controlados

bull Seleccedilatildeo de termos do DeCS CID-10 SNOMED

ndash via fornecimento de palavras-chave que satildeo pesquisadas na base de conhecimento

ndash via navegaccedilatildeo em uma visatildeo do conhecimento em forma de aacutervore

Seleccedilatildeo via contexto ontoloacutegicoProtoacutetipo (catalogaccedilatildeo com entrada

de palavra-chave)

DSpaceCatalogaccedilatildeo de OAswf

Protoacutetipo (catalogaccedilatildeo com navegaccedilatildeo

na base de conhecimento)

DSpaceRecuperaccedilatildeo de OAswf

21042010

29

Recuperaccedilatildeo de Objetos de Aprendizagem (OAs) Baseada em Conhecimento

bull Vocabulaacuterios e relaccedilotildees semacircnticas

ndash Oriundos do DeCS

ndash Definidos pelos catalogadores de OAs

ndash Gerados pelo cruzamento de informaccedilotildees com o CID-10 (Classificaccedilatildeo Internacional de Doenccedilas)

ndash Ex sinocircnimos eacute um(a) parte de causa efeito sintoma etc

DeCs

Anatomia

Sistema Nervoso

Sistema Nervoso Central

Enceacutefalo

Prosenceacutefalo

Telencaacutefalo

Ceacuterebro

Doenccedilas

Doenccedilas do Sistema Nervoso

Doenccedilas Cardiovasculares

Doenccedilas do Sistema Nervoso Central

Encefalopatias

Transtornos Cerebrovasculares

Doenccedilas Vasculares

Transtornos Cerebrovasculares

Acidente Vascular Cerebral

Acidente Vascular Cerebral

OA 1

OA 2

AVC

IctusCerebral

Derrame Cerebral

Hemisfeacuterios Cerebrais

ApoplexiaAcidente

Cerebrovascular

IctoCerebral

Apoplexia Cerebrovascular

Apoplexia Cerebral

Acidente Vascular

Encefaacutelico

Acidente Vascular

do Ceacuterebro

Acidente Vascular Cerebral

padratildeo (sinocircnimo)

anota

especiacutefica de domiacutenio

anocircnimas (DeCs)

172

DeCs

Anatomia

Sistema Nervoso

Sistema Nervoso Central

Enceacutefalo

Prosenceacutefalo

Telencaacutefalo

Ceacuterebro (2)

Doenccedilas

Doenccedilas do Sistema Nervoso

Doenccedilas Cardiovasculares

Doenccedilas do Sistema Nervoso Central

Encefalopatias

Transtornos Cerebrovasculares

Doenccedilas Vasculares

Transtornos Cerebrovasculares

Acidente Cerebral Vascular (1)

Acidente Cerebral Vascular(1)

OA 1

OA 2

AVC

IctusCerebral

Derrame Cerebral

Hemisfeacuterios Cerebrais

ApoplexiaAcidente

Cerebrovascular

IctoCerebral

Apoplexia Cerebrovascular

Apoplexia Cerebral

Acidente Vascular

Encefaacutelico

Acidente Vascular

do Ceacuterebro

Acidente Vascular Cerebral

Busca de OAs na aacuterea de sauacutede usando conhecimento de domiacutenio

Semantic Learning Objects (VIAN J SILVEIRA R A FILETO R WCCE 2009)

21042010

30

Conclusotildees

A Web semacircntica tem potencial de contribuir naobtenccedilatildeo de melhores resultados para buscas

Suporte automatizado eacute fundamental para a construccedilatildeo evoluccedilatildeo e integraccedilatildeo de ontologias anotaccedilotildees semacircnticas e contextos de usuaacuterios

Nossos primeiros resultados focam na captura e utilizaccedilatildeo de contextos de usuaacuterios mapeados a ontologias de domiacutenios especiacuteficos paradesambiguar e estender as buscas

Trabalhos futuros

Processos parcialmente automatizados para geraccedilatildeo e atualizaccedilatildeo de ontologias e anotaccedilotildees semacircnticas

Experimentos para comprovar a eficaacutecia das teacutecnicas e ferramentas utilizadas

Validaccedilatildeo de soluccedilotildees de problemas de busca semacircntica em diversos domiacutenios de aplicaccedilatildeo

Determinaccedilatildeo de niacuteveis adequados de acoplamento entre contextos e ontologias e dessas com os recursos a serem recuperados

Notiacutecias e anaacutelises

httpnewscnetcomnew-search-engine-cuil-takes-aim-at-google

httpwwwreadwritewebcomarchivesis_google_a_semantic_search_enginephp

httpwwwreadwritewebcomarchivessemantic_search_the_myt

h_and_realityphp

httpwwwpandiacomsew1262-top-5-semantic-search-

engineshtml

httpmindsetresearchyahoocom

httpnewscnetcom8301-13953_3-9982015-80html

httpwwwsearchenginejournalcomaskcom-focuses-on-semantic-search8252

httpnewsbbccouk2hiprogrammesclick_onlinedefaultstm

httpnewsbbccouk2hiprogrammesclick_online8144765stm

Web semacircntica e buscassemacircnticas

httpwwww3org2001sw

httpsemanticweborg

httpenwikipediaorgwikiSemantic_Web

httpenwikipediaorgwikiSemantic_search

Ferramentas de desenvolvimento

httpprotegestanfordedu

httpjenasourceforgenet

httpwwww3org2001Annotea

httpwwwontotextcomkim

httpesww3orgtopicSemanticWebTools

httpwwwdamlorg200305swmu-tools-

tutorialOverviewhtml

Referecircncias em Web semacircntica

T Berners-Lee J Hendler e O Lassila The Semantic Web Scientific American May 2001

Thomas B Passing Explores Guide to the Semantic Web Manning Publications Greenwich CT 2005

Davies J Studer R Warren P (Eds) Semantic Web Technologies trends and research in ontology-based

Systems John Wiley amp Sons 2006

Breitman KK Casanova MA Truszkowski W Semantic Web

Concepts Technologies and Applications Series NASA Monographs in Systems and Software Engineering Springer 2007

Grigoris Antoniou and Frank van Harmelen A Semantic Web Primer 2nd edition The MIT Press Cambridge MA USA 2008

Kashyap V Bussler C Moran M The Semantic Web -Semantics for Data and Services on the Web Series Data-

Centric Systems and Applications Springer 2008

Hitzler P Krotzsch M Rudolph S Foundations of SemanticWeb Technologies Chapman amp HallCRC 2009

21042010

31

Referecircncias em buscas semacircnticas

Guha R McCool R and Miller E 2003 Semantic search In Proc of the 12th international Conference on World Wide Web

(WWW) Budapest Hungary ACM New York NY 2003 700-709

Reeve L and Han H 2005 Survey of semantic annotation

platforms In Proceedings of the ACM Symposium on Applied Computing Santa Fe New Mexico ACM New York NY 2005

1634-1638

Eetu Makela Survey of Semantic Search Research

Mangold C A Survey and classification of semantic search approaches Journal of Metadata Semantics and Ontology 2(1)

2007

Stephan Bloehdorn Philipp Cimiano Alistair Duke Peter Haase Joumlrg Heizmann Ian Thurlow Johanna Voumllker Ontology-BasedQuestion Answering for Digital Libraries ECDL 2007 14-25

Hai Dong Hussain FK Chang E A survey in semantic search technologies In 2nd IEEE International Conference on

Digital Ecosystems and Technologies 2008 403-408

Algumas referecircncias grupo UFSC

DAgostini C S Fileto R Capturing Users Preferences and Intentions in a Semantic Search System In 21st International

Conference on Software Engineering amp Knowledge Engineering (SEKE) Boston 2009 p 587-591

DAgostini C S Fileto R Dantas M A R Gauthier F A O

Contextual Semantic Search - Capturing using the UsersContext to Direct Semantic Search In 10th InternationalConference on Enterprise Information Systems (ICEIS) Barcelona

Spain 2008 v SAIC p 154-159

DAgostini C S Fileto R Capturing and managing usercontext for improving information retrieval In Workshop de

Teses e Dissertaccedilotildees do Simpoacutesio Brasileiro de Bancos de Dados (WTDBDSBBD) Campinas Unicamp Brazil 2008

Vian J Silveira R A Fileto R Proposal of a Multi-agent System for Indexing and Recovery applied to Learning

Objects In 9th IFIP World Conference on Computers in Education (WCCE) Bento Goncalves Brazil 2009

Alguns projetos na UFSC

httpwwwlisaufscbrprojetos

httpwwwunasusufscbr

httpwwwliteraturabrasileiraufscbr

Perguntas

Page 6: Buscas Semânticasfileto/Talks/BuscasSemanticas6sp.pdf · 21/04/2010 1 1 Buscas semânticas: panorama e tendências atuais minicurso ERBD 2010 RenatoFileto fileto@inf.ufsc.br AlunosColaboradores:

21042010

6

Um Documento XML-Schema(WaterBalxsd)rlm

ltschema xmlnshttpwwww3org2001XMLSchema gt

ltelement name=WaterBal type=WaterBalTypegt

ltattribute name=location type=stringgt

ltattribute name=latitude type=Latitudegt

ltattribute name=longitude type=Longitudegt

ltelement name=WeatherData type=AgregValuesgt

ltcomplexType name=AgregValuesgt

ltattribute name=Date type=DateTypegt

ltsequencegt

ltelement name=Temperature type=decimalgt

ltelement name=AvgRainfall type=decimalgt

ltelement name=PotET type=decimalgt

ltelement name=RealET type=decimalgt

ltelement name=Stored type=decimalgt

ltelement name=WaterDeficit type=decimalgt

ltelement name=WaterExcess type=decimalgt

ltsequencegt

ltcomplexTypegt

ltelementgt

ltschemagt

Validaccedilatildeo de documentos XML

Documento bem-formado (well-formed) satisfaz as restriccedilotildees

de formaccedilatildeo expressa na especificaccedilatildeo do XML

(httpwwww3orgTR2004REC-xml-20040204)rlm

Documento vaacutelido satisfaz as restriccedilotildees (elementos atributos

aninhamentos tipos etc) expressas em uma especificaccedilatildeo de

esquema XML em DTD ou XSL (XML-Schema) que eacute associada a

esse documento XML

Heterogeneidade semacircntica em XML

ltobject id=ldquoa1rdquo class=ldquoartifactrdquogt

lttuplegt

lttitlegt Nympheas lttitlegt

ltyeargt 1897 ltyeargt

ltcreatorgt Monet ltcreatorgt

ltpricegt 10000000 ltpricegt

ltowners refs=ldquop1p2p3rdquogt

lttuplegt

ltobjectgt

ltobject id=ldquop3rdquo class=ldquopersonrdquogt

lttuplegt

ltnamegt Claudia ltnamegt

ltagegt 17 ltagegt

lttuplegt

ltobjectgt

ltworkgt

ltartistgt Monet ltartistgt

ltnamegt Nympheas ltnamegt

ltstylegt Impressionist ltstylegt

ltsizegt 21 x 61 ltsizegt

ltcplacegt Givern ltcplacegt

ltworkgt

ltworkgt

ltartistgt Monet ltartistgt

lttitlegt Waterloo Bridge lttitlegt

ltstylegt Impressionist ltstylegt

ltsizegt 292 x 464 ltsizegt

lthistorygt

Painted with

lttechgt Oil on canvas lttechgt

in

lthistorygt

ltworkgt

XML como Padratildeo de representaccedilatildeo de dados

ldquoArtworksrdquorlmStructure

Works works

Work

Work

Field

artist title style size

string string string string

ldquoArtfactrdquorlmSchema

artifacts set

ampArtifact

Artifact class

artifact

tuple

title year creator price owners

ampPerson

string int string float list

YAT Model

YAT Any

YAT

V ampYAT

ODMG Model

Vtuple

Symbol

Type

V(int vbool v

float vstring)rlm

ampClass

Type

V

Symbol

(set vbag vlist varray)rlm

Class class

Symbol

Type

RDF ndash Resource Description Framework

Uma linguagem e modelo padronizados para expressar conhecimento na Web semacircntica

Um comando (statement) eacute uma tripla da forma

Recurso qualquer coisa referenciada por uma URL

Propriedade qualquer propriedade de um recurso

Valor um literal ou outro recurso

RDF-Schema define classes de recursos suas propriedades (que podem ser relacionamentos com outras classes) e possiacuteveis valores

Os formatos para representar ontologias na Web semacircntica (eg

DAML+OIL OWL) satildeo extensotildees do RDF

Sintaxe XML do RDF

ltxml version=10gt

ltrdfRDF xmlnsRDF httpwwww3orgRDFRDFldquo

xmlnsdc httpdublincoreorgdcldquogt

ltrdfDescription about=ldquohttpwwwagritempocnptiaembrapabrrdquogt

ltdctitlegt Nuacutecleo de Monitoramento e Anaacutelise de Dados

Meteoroloacutegicos e Climatoloacutegicos para a Agricultura ltdctitlegt

ltleadergt

rdfresource=ldquohttpwwwcnptiaembrapabr~assadrdquo

ltleadergt

ltrdfDescriptiongt

ltrdfDescription

about=ldquohttpwwwcnptiaembrapabr~assadrdquogt

ltdctitlegt Eduardo D Assad ltdctitlegt

ltemailgt Assadcnptiaembrapabr ltemailgt

ltrdfDescriptiongt

ltrdfRDF gt

21042010

7

Estrutura do conhecimento em RDF

httpwwwagritempocnptiaembrapabr

httpwwwcnptiaembrapabr~assad

Nuacutecleo de Monitoramento e

Anaacutelise de Dados

Meteoroloacutegicos e Climatoloacutegicos

para a Agricultura

assadcnptiaembrapabrEduardo D

Assad

dctitle

dctitleemail

leader

Metadata in RDFWater Balance (same place and institution)rlm

ltxml version=10gt

ltrdfRDF xmlnsRDF httpwwww3orgRDFRDFldquo

xmlns httpagricgovbrDocStdldquogt

ltrdfDescription about=httpwwwagricgovbrpublicWaterBal1234gt

ltSourcegt

rdfresource=ldquohttpwwwcepagriunicampbrrdquo

rdfresource=ldquohttpwwwciagroiacgovspbrrdquo

ltSourcegt

ltInitialDategt 28032002 ltInitialDategt

ltFinalDategt 31032002 ltFinalDategt

ltkeywordgt Water available in Soil ltkeyworkgt

ltlocalgt

rdfresource= ldquohttpwwwibgegovbrstate_SPrdquo

ltlocalgt

ltmeasument_unitgt

rdfresource= ldquohttpwwwinmetrogovbrmmrdquo

ltmeasument_unitgt

ltrdfDescriptiongt

ltrdfRDFgt

httpwwwagricgovbrpublicWaterBal1234

http

wwwcpaunicampbr

Centro de Pesquisas

Agriacutecolas (CEPAGRI)

name

source

httpwwwciagroiacg

ovspbr

httpwwwunica

mpbr

part_of

CIIAGRO

name

http

wwwiacgovspbr

part_of

InitialDate

28032002

FinalDateWater available in

Soil

http

wwwibgegovbrstate_SP

source

keyword

http

wwwinmetrogovbrmm

31032002

local

measurement_unit

RDF-Schema

ltrdfabout=ampAgricZoningCountry rdfslabel=Countrygt

ltrdfssubClassOf dfresource=ampAgricZoningTerritorialDivisiongt

ltrdfabout=ampAgricZoningState rdfslabel=ldquoStategt

ltrdfssubClassOf dfresource=ampAgricZoningTerritorialDivisiongt

ltrdfProperty rdfabout=ampAgricZoningstatesOfCountry

aminCardinality=1

rdfslabel=statesOfCountrygt

ltrdfsdomain rdfresource=ampAgricZoningCountrygt

ltrdfsrange rdfresource=ampAgricZoningStategt

ltainverseProperty rdfresource=ampAgricZoningcountryOfStategt

ltrdfPropertygt

RDF-Schema

ltrdfProperty rdfabout=ampAgricZoningcountryOfState

amaxCardinality=1

aminCardinality=1

rdfslabel=countryOfStategt

ltrdfsrange rdfresource=ampAgricZoningCountrygt

ltrdfsdomain rdfresource=ampAgricZoningStategt

ltainverseProperty

rdfresource=ampAgricZoningstatesOfCountrygt

ltrdfPropertygt

Trecho de RDF

ltAgricZoningCountry rdfabout=ampAgricZoningpais_55

AgricZoningnameBR=BRASIL rdfslabel=BRASILgt

ltAgricZoningofficialRegionsOfCountry

rdfresource=ampAgricZoningregof_1gt

ltAgricZoningofficialRegionsOfCountry

rdfresource=ampAgricZoningregof_2gt

ltAgricZoningofficialRegionsOfCountry

rdfresource=ampAgricZoningregof_3gt

ltAgricZoningofficialRegionsOfCountry

rdfresource=ampAgricZoningregof_4gt

ltAgricZoningofficialRegionsOfCountry

rdfresource=ampAgricZoningregof_5gt

ltAgricZoningstatesOfCountry rdfresource=ampAgricZoningestado_11gt

ltAgricZoningstatesOfCountry rdfresource=ampAgricZoningestado_12gt

ltAgricZoningmetroAreasOfCountry

rdfresource=ampAgricZoningmetro_5201gt

ltAgricZoningCountrygt

21042010

8

Descriccedilotildees em RDF de recursos para a coleta de dados cientiacuteficos

wwwEquipServcombrschema2rdfs

RD

F S

chem

aR

DF

Equipment Clienthas

String StringString String

category model name city

wwwAgriTempobrschema1rdfs

WeatherStation

longitudealtitude

LandParcel

CountyState

latitude

inpart_of

ampws1

ampws3

ampws4

Stringname

ampeq1

ampRio

ampUbatuba

ampCampinas

ampws2

ampUnicamp

ampEmbrapa

ampSP

ampRJ

in

in

in

in

part_of

part_of

part_of

has

has

has

has

ampws1 = httpwwwembrapabrWeatherStationX

ampws2 = httpwwwiacbrWeatherStationK

ampws3 = httpwwwunicampbrWheaterStationA

ampws4 = httpwwwunicampbrWheaterStationB

ampeq1 = httpwwwembrapabrCameraZ

subClassOf (isA)rlm

typeOf (instance)rlm

other kind of property

DegreesDecMeters

String

String

value

value

OWL ndash Ontology Web Language

Estende o RDF com vocabulaacuterio padronizado e construccedilotildees para definir

Escopo local de propriedades

Disjunccedilatildeo de classes

Combinaccedilotildees de classes

Restriccedilotildees de cardinalidade

Caracteriacutesticas especiais de propriedades (eg transitividade simetria anti-simetria propriedades inversas)rlm

The 3 flavors of OWL

OWL LiteExpressividade restrita (exclui classes enumeradas disjunccedilatildeo cardinalidade arbitraacuteria )

Faacutecil de entender e usar

OWL DL

Equivalente agrave loacutegica descritiva (DL = Description

Logics)

Ainda permite eficiecircncia e computabilidade

OWL Full

Compatiacutevel sintaacutetica e semanticamente com RDF embora mais poderosaPode ocasionar inferecircncias indecidiacuteveis

Disjunction and Equivalence of Classes

ltowlClass rdfabout=associateProfessorgt

ltowldisjointWith rdfresource=assistantProfessorgt

ltowlClassgt

ltowlClass rdfID=facultygt

ltowlequivalentClass

rdfresource=academicStaffMembergt

ltowlClassgt

Inverse properties

ltowlObjectProperty rdfID=teachesgt

ltrdfsrange rdfresource=coursegt

ltrdfsdomain rdfresource=academicStaffMembergt

ltowlinverseOf rdfresource=isTaughtBygt

ltowlObjectPropertygt

Sintaxe abstrata para OWL

Class(Person partialrestriction (hasChild allValuesFrom(Person)))rlm

Class(Parent completePersonrestriction (hasChild someValuesFrom(Person)))rlm

ObjectProperty(hasChild)rlm

Individual (John type(Person)rlmvalue(hasChild Mary))rlm

21042010

9

Busca em uma ontologia

Pessoa

Santo

S1

IS_A

TYPE_OF

nome

Satildeo Paulo

Time

TimeFutebol

TF1

IS_A

TYPE_OF

nome

Satildeo Paulo

ParcelaTerritoacuterio

Estado

IS_A

Cidade

E1

TYPE_OF

nome

Satildeo Paulo

C1

nome

Satildeo PauloTricolor Paulista

PART_OF

SPARQL (recomendaccedilatildeo W3C)rlm

Exemplo de expressatildeo em SPARQL

SELECTrlmconceptrlm propertyrlm ldquoSatildeorlmPaulordquo

WHERE

concept propertyhasProperty property

FILTER(property name)rlm

Linguagens de Regras (Prolog)

Rules

parent(x z)rlm - father(x z) v mother(x z)

sibling(x y)rlm- parent(x z) and parent(y z)

Knowledge base

father(_Maria _Joatildeo)

father(_Pedro _Joatildeo)

Query

sibling(_Maria x) rArr Yes rArr b = _PedrorArr b = _xyz1rArr b = _xyz2 rArr b = _xyz3rArr b = _xyz4

RIF (Rule Interchange Format)

A buyer buys an item from a seller if the seller sells it to the buyer John sells LeRif to Mary The fact Mary buys LeRif from John can be logically derived by a modus ponens argument

Document(

Prefix(cpt lthttpexamplecomconceptsgt)

Prefix(ppl lthttpexamplecompeoplegt)

Prefix(bks lthttpexamplecombooksgt)

Group ( Forall Buyer Item Seller (

cptbuy(Buyer Item Seller)

cptsell(Seller Item Buyer)

)

cptsell(pplJohn bksLeRif pplMary)

)

)

Controveacutersia sobre pilha de padrotildees

Peter F Patel-Schneider A Revised Architecture for Semantic

Web Reasoning Third Workshop on Principles and Practices of

Semantic Web Reasoning Dagstuhl Germany September

2005 LNCS 3703 Springer Verlag 2005

Ian Horrocks Bijan Parsia Peter F Patel-Schneider and

James Hendler Semantic Web Architecture Stack or Two

Towers Third Workshop on Principles and Practices of Semantic Web Reasoning Dagstuhl Germany September

2005 LNCS 3703 Springer Verlag 2005

Peter F Patel-Schneider Building the Semantic Web Tower

from RDF Straw Nineteenth International Joint Conference on

Artificial Intelligence Edinburgh Scotland August 2005

Proposta inicial (2000)rlm

21042010

10

Proposta regras(2005)rlm Proposta atual

Como estaacute a Web semacircntica hoje

Aacuterea de pesquisa muito ativa

Visa estender o papel dos computadores no

suporte a diversas atividades humanas

Usa ontologias e anotaccedilotildees semacircnticas para

catalogar recuperar e compor dados e serviccedilos

de processamento na Web

Desafios da Web semacircntica

Construccedilatildeo de ontologias

(Semi-)automatizada e interativa

Geraccedilatildeo de anotaccedilotildees semacircnticas de recursos

Muitas aplicaccedilotildees requerem automatizaccedilatildeo

Evoluccedilatildeo de ontologias

Checar se alteraccedilotildees natildeo introduzem inconsistecircncias e gerenciar

versotildees

Integraccedilatildeo de ontologias (ontology matching)

A obtenccedilatildeo de consenso eacute inviaacutevel em muitas domiacutenios

Deduccedilatildeoraciociacutenio

Teorias computaacuteveis e natildeo computaacuteveis ontologias inconsistentes

Ediccedilatildeo de Ontologias no Proteacutegeacute

Editor de ontologias e arcabouccedilo para o desenvolvimento de bases de conhecimento livre e de coacutedigo aberto baseado em Java

Suporta os modelos de frames (RDF) e OWL

Exporta as ontologias e bases de conhecimento para uma variedade de formatos incluindo RDF(S) OWL e XML Schema

Extensiacutevel via plugins

Construccedilatildeo de ontologias

Processo para geraccedilatildeo automatizada de

ontologias a partir de esboccedilos dados e

documentos (nova geraccedilatildeo de ferramentas)rlm

Entendimento do domiacutenio

Entendimento dos dados

Definiccedilatildeo das tarefas

Geraccedilatildeo semi-automaacutetica

Avaliaccedilatildeo de qualidade

Refinamento com interaccedilatildeo humana

21042010

11

Definiccedilotildees de ldquogeraccedilatildeo de ontologiardquoGrobenik and Mladenic 2006

Induccedilatildeo de conceitos (a partir das instacircncias)rlm

Induccedilatildeo de relaccedilotildees (a partir de conceitos e

instacircncias a eles associadas)rlm

Popular ontologia (dada uma ontologia e

instacircncias de seus conceitos)rlm

Geraccedilatildeo de uma ontologia completa (a partir

das instacircncias e algum conhecimentoinformaccedilatildeo)rlm

Atualizaccedilatildeoextensatildeo de ontologias (dada

uma ontologia e informaccedilatildeo como novas

instacircncias ou padrotildees de uso da ontologia)rlm

Document Clustering - Vector Model

Vector of word occurences in the documents

bull diK = TF(Wkdi) IDF(Wk)rlm

Where

bull TF(Wkdi) = number of times Wk occurs in document di

bull IDF(Wk) = log ( D DF(Wk))rlm

bull D = number of documents

bull DF(Wk) = number of documents in which word W occurs

Document distance metric

Anotaccedilotildees Semacircnticas(Kiryakov et al 2004)rlm

21042010

12

Anotaccedilatildeo Semacircntica de Documentos

Atribui agraves entidades que aparecem no documento ligaccedilotildees com suas descriccedilotildees semacircnticas na ontologia

Aplicaacutevel a qualquer tipo de texto (documentos HTML documentos de texto comuns campos de banco de dados entre outros)

Representaccedilatildeo das anotaccedilotildees

Intrusiva

Natildeo intrusiva

Confecccedilatildeo das anotaccedilotildees

bull Semi-Automaacutetica Associa palavras do texto a classes

instacircncias e propriedades da ontologia utilizando-se do

julgamento humano Esta associaccedilatildeo geralmente eacute efetuada

atraveacutes de interfaces ldquoarraste-e-solterdquo (eg OntoMat)rlm

bull Automaacutetica Aplica teacutecnicas de processamento de

linguagem natural aprendizado de maacutequina e extraccedilatildeo de

informaccedilatildeo entre outras para associar palavras agrave ontologia

Essas ferramentas podem utilizar ontologias padratildeo (eg

IEEE Standard Upper Ontology) ou ontologias de domiacutenios

especiacuteficos (eg Unified Medical Language System)

bull Hiacutebrida Combinaccedilatildeo das teacutecnicas acima

Geraccedilatildeo de anotaccedilotildees semacircnticas (Reeve e Han 2005)rlm

Ferramentas para anotaccedilatildeo

Annozilla Funciona sobre o Mozzila Firefox

Annotea projeto da W3C - servidor de anotaccedilotildees em RDF

Armadillo

Muse

Pankol

Semantic Word anotaccedilatildeo interativa de porccedilotildees de documentos

Word

OntoMat Annotizer anotaccedilatildeo interativa de paacuteginas Web com

ontologias em OWL

Smore marcaccedilotildees sobre HTML com ontologias em OWL

Melita ferramenta de anotaccedilatildeo semi-automaacutetica que usa algoritmo

de IE para ajudar o usuaacuterio no processo de anotaccedilatildeo

MnM anotaccedilatildeo semacircntica de paacuteginas Web com metadados

descritos em RDFOCMLDAML+OIL

KIM permite criar metadados armazenar e buscar informaccedilotildees e

pode ser usada para anotaccedilatildeo e procura de documentos

21042010

13

O processo automatizado de anotaccedilatildeo semacircntica de documentos

Tokenizaccedilatildeo e Eliminaccedilatildeo de StopWords

Etiquetagem

Stemmer

Corpus Anotado

Identificaccedilatildeo EN

Associaccedilatildeo atermos da ontologia

RepositoacuterioSemacircntico

Tokensrelevantes

Palavras +Classificaccedilatildeo Gramatical

Radicais das Palavras +Classificaccedilatildeo Gramatical

Entidades Nomeadas

Anotaccedilatildeo Semacircntica

Dados Metadados Documento

s

Ontologia do Domiacutenio

Valida

Valida

Especialista

RepositoacuterioInformaccedilatildeo

Annotation example(Davies et al 2006)

Consider the phrase

There are deliverables

The tokens are

[There] [are] [deliverables] []

The tagger finds out what kind of a word each of the tokens

is (whether it is a noun an adjective a verb etc)rlm

[There] existential quantifier

[are] verbmdash3rd person singular present

[deliverables] nounmdashplural

Annotation example (cont)rlm

The morphological analyser gives the roots of all the words

[There] rootmdashthere

[are] rootmdashbe

[deliverables] rootmdashdeliverable

There are mdash mdashmdash

triggers the creation of one or more new classes in the

ontology

There are projects

There are workpackages tasks and deliverables

SEKT is a project

MUSINGrlmbdquoKnowledgerlmWeb‟rlmandrlmbdquoPrestorlmSpace‟rlmarerlmprojects

Projects have workpackages

Workpackages can have tasks

WP1 WP2 WP3 WP4 WP5 and WP6 are workpackages

SEKT has WP1

MUSING has WP2 WP3 and WP4

bdquoKnowledgerlmWeb‟rlmhasrlmWP5 and WP6

Annotation example (cont)rlm

Ontologia resultante Quadro Comparativo(Nunes e Fileto 2007)rlm

21042010

14

Dependecircncias entre plataformas(Rui Tramontin Junior 2007)rlm

Comparaccedilatildeo de desempenho(Reeve e Han 2005)rlm

Prataforma Categoria Precisatildeo Cobertura Medida F

Armadillo Descoberta de padrotildees

910 740 870

KIM Regras 860 820 840

MnM Induccedilatildeo 950 900 nd

MUSE Regras 935 923 929

PANKOW Descoberta de padrotildees

650 282 249

SemTag Regras 820 nd nd

Evoluccedilatildeo de ontologias(Bloehdorn et al 2006)rlm

Exemplo Uso natildeo uniforme de conceitos

Alternativas para remoccedilatildeo do conceito C que tem sub-conceitos

Processo de evoluccedilatildeo de ontologias

CapturaCaptura

da

Mudanccedila

Representaccedilatildeo Semacircntica Propagaccedilatildeo Implementaccedilatildeo Validaccedilatildeo

Fases Elementares

21042010

15

Mapeamentos entre ontologias(Ontology Matching)

Fusatildeo de ontologias

Processo semi-automatico de alinhamento(Huang at al 2006)rlm

Referecircncia

Jerome Euzenat INRIA Rhone-Alpes France

Pavel Shvaiko University of Trento Italy

Ontology Matching

URL httpbookontologymatchingorg

Springer-Verlag Heidelberg (DE) 2007

343 p 67 illus Hardcover

ISBN 978-3-540-49611-3

E as buscas semacircnticas

Recuperaccedilatildeo da informaccedilatildeo de documentosrlm

Medidas da eficaacutecia das soluccedilotildees

precisatildeo = nro de docs relevantes recuperadosnro de docs recuperados

cobertura = nro de docs relevantes recuperadosnro de docs relevantes

21042010

16

Classificaccedilatildeo de abordagens para buscas semacircnticas (Mangold 2007)

Arquitetura

Acoplamento entre ontologias e documentos

Transparecircncia

Contexto do usuaacuterio

Modificaccedilatildeo de consultas

Estrutura das ontologias

Tecnologia para representar as ontologias

Desempenho escalabilidade e distribuiccedilatildeo

Adaptabilidade

Ranking

Arquiteturas para buscas semacircnticas

Maacutequina de busca stand_alone armazenametadados sobre os documentos em iacutendicescom os quais avalia as consultas

Meta-maacutequina de busca distribui asconsultas para outras maacutequinas de busca ecombina os resultados

Acoplamento ontologias-documentos

Acoplamento forte os metadados dosdocumentos referem-se explicitamente aosconceitos de uma ontologia e vice-versa(requer anotaccedilatildeo semacircntica)rlm

Acoplamento fraco os documentos satildeoindependentes de quaisquer ontologiasdisponiacuteveis (pode restringir a capacidade debusca)rlm

Contexto do usuaacuterio

Learning extraiacutedo na interaccedilotildees do usuaacuteriocom o sistema (histoacuterico das consultas erefinamentos de consultas)rlm

Hard-coded as consultas satildeo organizadas emcategorias que definem a informaccedilatildeo solicitada(eg ldquolocation ofrdquo ldquoresources forrdquo rlm(

Modificaccedilatildeo de consultas

Manual o sistema retorna um trechoapropriado da ontologia junto com a respostapermitindo ao usuaacuterio navegar na ontologia ereformular a consulta pela adiccedilatildeo e remoccedilatildeo determos

Re-escrita automaacutetica a consulta eacuteotimizada automaticamente pelo sistema

Baseada em grafo considera conceitos edocumentos como nodos de um grafoefetuando propagaccedilatildeo da consulta a partir dosnodos correspondentes a termos de busca

Modificaccedilatildeo de consultas

Modificaccedilatildeo de consulta

Manual

Re-escrita de consulta

Baseada em grafo

Inserccedilatildeo de termoRemoccedilatildeo de termo

Substituiccedilatildeo de termo

Conjuntiva

Disjuntiva

Conjuntiva Disjuntiva

21042010

17

Estrutura da ontologia

Propriedades anocircnimas as relaccedilotildees entreconceitos natildeo satildeo nomeadas indicando apenasque eles compartilham o mesmo contexto

Propriedades padronizadas sinocircniacutemiahiperniacutemia meroniacutemia negaccedilatildeo etc

Propriedades especiacuteficas de domiacutenio aleacutemdas propriedades padratildeo considerapropriedades especiacuteficas de um domiacutenio (egldquotipo de cacircmerardquo em sistema para a aacuterea defotografia)rlm

Tecnologia da ontologia

F-Logic

RDF

DAML+OIL

Frames

OWL

Comparaccedilatildeo de abordagens Comparaccedilatildeo de abordagens (cont)

Buscas semacircnticas na Web hoje

httpwwwaliprcom (imagens)rlm

httpwwwcognitioncom

httpwwwdeepdyvecom

httpwwwbingcom

httpwwwcuilcom

httpwwwfreebasecom

httpwwwgooglecom

httpwwwkosmixcom

httpwwwhakiacom

httpwwwpowersetcom

httpwwwsensebotnet

httpdeveloperyahoocomsearchmonkey

httpswoogleumbcedu (ontologias)rlm

21042010

18

21042010

19

SAO PAULO-SP

University of Sao Paulo

Sao Paulo Fashion

Sao Paulo Fashion Week

Sao Paulo State

Sao Paulo Hotel

Sao Paulo Hotels

Sao Paulo Brasilien

Sao Paulo Congonhas

21042010

20

21042010

21

Sao Paulo Airport

Sao Paulo Plane Crash

Sao Paulo Zoo

hellip

21042010

22

21042010

23

Algumas questotildees em aberto

Representaccedilatildeo de contextos de usuaacuterios emapeamento desses a ontologias

Anaacutelise dos efeitos de modificaccedilotildees de consultas

Meta-buscas semacircnticas

Anaacutelise da aceitaccedilatildeo dos usuaacuterios

Adaptabilidade a diferentes ontologias

Ranking dos resultados

Integraccedilatildeo com sistemas de gerenciamento dedocumentosconteuacutedo

Tratamento de dados multimiacuteda

Interfaces homem-maacutequina

Desempenho e escalabilidade

Contextual Semantic Search (CSS)(DAgostine Fileto ndash SBBD2007)rlm

21042010

24

General Architecture for CSSThe Weighted Topic Graph(DAgostine Fileto Dantas Gauthier - ICEIS 2008)rlm

A weighted topic graph is a graph TM(T A)rlm

T is a set of topics (vertices)rlm

A is a set of associations (edges)rlm

Let be an ontology O

Each topic t in T corresponds to a ontology term o in O

Each topic t has a weight [01] The sum from the weights from all topics with same name equals 1

Each association a has a weight [01] The sum

from all the weights from all association departing

a single topics equals 1

Topic weights used to disambiguate

Eg interest in Satildeo Paulo city instead of Satildeo Paulo

state

Association weights used to semantically

expand searches

Eg Actual interest in Guarulhos and airport while

searching for Satildeo Paulo city

The Weights in the Topic Graph Capturing the Users Context

Generated Topic Graph with the Ontological Users Context

The Contextual Semantic Search Process

21042010

25

Desambiguaccedilatildeo

Fundamento dos algoritmos de busca sobre contexto ontoloacutegico

Heuriacutesticas de estigmergia (Ant Colony Optimization - ACO)

Traccedilos de ferormocircnio

Algoritmo de busca semacircntica baseada em ACO

Entrada palavras-chave[ ]

Dados G(TA) Onto repositoacuterio

limite_de_profundidade

limite_miacutenimo_de_peso

λ fator de atenuaccedilatildeo de peso

iniacutecio Algoritmo Busca Contextual 1 Estigmeacuterica

resultados = busca_G_ou_Onto(palavras-chave[])

atenuaG (iacutendice ) λrlmisin [0 1]

manutenccedilatildeo(coleta_feedback(resultados))

fim

21042010

26

Demo Praestro ndash Karina Fasolin

Alguns trabalhos relacionados

Name Article Comments

Graupmann

et al 2005

The SphereSearch

engine for unifiedranked retrieval of

heterogeneous XML

and web documents

Searches through XML documents The context is a region in radius

around given element A data inside two regions is considered relevant

to both contexts

Made tests with large collections like DBLP INEX Wikipedia put for

stress testing regarding the size of the collection

ldquoLet us first comment on the difficulties of defining a meaningfulbenchmark for this kind of novel systemrdquo

Park e

Cheyer 2006

Just For Me Topic

Maps and Ontologies

Manages knowledge in three layers Topics Knowledge Structures and

Documents

Not implemented (at least at the time of publication)

Michlmayr

et al 2007Adaptive User Profiles

for Enterprise

Information Access

Represents context as an individual graph The graph is constructed

based on tags used to semantically annotate the content which the user

considers to be relevant

However the tags are only that only labels They are not tied-down to

a formal definition

Alguns trabalhos relacionados (cont)

Name Article Comments

Aleman-

Meza et a

2003

Context-Aware

Semantic Association

Ranking

Also defines context as regions But the regions are static defined in

the ontology which is used by the system So the contexts are defined

the same for every single user

Mani and

Sundaram

2007

Modeling user context

with applications to

media retrieval

Creates a graph representing the users context Each node

corresponds to an instance in the ontology The edges represent

relations between the instances Built to search trough multimedia

documents

However it does not associates the vocabulary the user uses with the

instances

Challam et

al 2007

Contextual Search

Using Ontology-Based

User Profiles

Monitors the users activity capturing content from open Internet

Explorer MS-Office and MSN The captured information is stored and

usedrlmtorlmbuildrlmarlmuser‟srlmcontextualrlmprofilerlmbasesrlmonrlmanrlmontology

The context is tightly coupled with the ontology

NO IMAGES WERE

PROVIDED

Vallet et al

2006

Personalized

Information Retrieval in

Context

Stores context as a graph constructed based on the ontology used by

the system Similar to Mani and Sundaram including its limitations

(mapping the vocabulary) however if built for text documents

Sieg et al

2007

Ontological User

Profiles for

Personalized Web

Search

Similar to Challam et al but it gets the context information from the

ontology terms used to annotate the retrieved relevant context

Also limited by the structure of the ontology

Alguns trabalhos relacionados(cont)

Name Deals with

objective

knowledge

(ontology)

Deals with

subjective

knowledge

(users

context)

The knowledge

management is

transparent

Idea Implemented

Graupmann et

al 2005

X IMPL

Park e Cheyer

2006

X X X IDEA

Michlmayr et al2007

X X IMPL

Aleman-Meza et

a 2003

X X IMPL

Mani eSundaram 2007

X X X IMPL

Challam et al

2007

X X X IMPL

Vallet et al 2006 X X X IMPL

Sieg et al 2007 X X X IMPL

(incomplete)

Praestro X X X IMPL

(prototype)

UnA-SUS ndash Universidade Aberta do SUS

Programa do Ministeacuterio da Sauacutede para atender necessidades de e

permanente dos

Accedilotildees focadas em

formulaccedilatildeo de conteuacutedo

bibliotecas digitais

cursos a distacircncia

21042010

27

Metas da UnA-SUS

Desenvolver um

plataforma para de

composiccedilatildeo e de

Montar e oferecer cursos para formaccedilatildeo continuada de profissionais da sauacutede

157

Metadados

O processo de produccedilatildeo catalogaccedilatildeo e reuso de OAs

Repositoacuterio

Conteuacutedo

OAs

requisiccedilotildees

Design revisatildeo e publicaccedilatildeo

OA

SGA outros reps

Busca e reuso

OAsMetadados

OAs

Concepccedilatildeo e validaccedilatildeo de OAs

O processo de produccedilatildeo catalogaccedilatildeo e reuso de OAs

OA1

Curso A

Curso B

OA2

OA3

Viacutedeo

Imagens

RepositoacuteriosConteuacutedoMultimiacutedia

SGA RepositoacuteriosOAs

Reuso eacute essencial

bull OAs satildeo caros para produzir

bull Demandas emergenciais na sauacutede puacuteblica exigem agilidade e pronta resposta com cursos para a qualificaccedilatildeo de profissionais

H1N1

Apoplexia

gripe suiacutena gripe A

influenza H1N1

hellip

21042010

28

Navegaccedilatildeo hiperboacutelica no DeCSCatalogaccedilatildeo de Objetos de Aprendizagem (OAs) usando Vocabulaacuterios Controlados

bull Seleccedilatildeo de termos do DeCS CID-10 SNOMED

ndash via fornecimento de palavras-chave que satildeo pesquisadas na base de conhecimento

ndash via navegaccedilatildeo em uma visatildeo do conhecimento em forma de aacutervore

Seleccedilatildeo via contexto ontoloacutegicoProtoacutetipo (catalogaccedilatildeo com entrada

de palavra-chave)

DSpaceCatalogaccedilatildeo de OAswf

Protoacutetipo (catalogaccedilatildeo com navegaccedilatildeo

na base de conhecimento)

DSpaceRecuperaccedilatildeo de OAswf

21042010

29

Recuperaccedilatildeo de Objetos de Aprendizagem (OAs) Baseada em Conhecimento

bull Vocabulaacuterios e relaccedilotildees semacircnticas

ndash Oriundos do DeCS

ndash Definidos pelos catalogadores de OAs

ndash Gerados pelo cruzamento de informaccedilotildees com o CID-10 (Classificaccedilatildeo Internacional de Doenccedilas)

ndash Ex sinocircnimos eacute um(a) parte de causa efeito sintoma etc

DeCs

Anatomia

Sistema Nervoso

Sistema Nervoso Central

Enceacutefalo

Prosenceacutefalo

Telencaacutefalo

Ceacuterebro

Doenccedilas

Doenccedilas do Sistema Nervoso

Doenccedilas Cardiovasculares

Doenccedilas do Sistema Nervoso Central

Encefalopatias

Transtornos Cerebrovasculares

Doenccedilas Vasculares

Transtornos Cerebrovasculares

Acidente Vascular Cerebral

Acidente Vascular Cerebral

OA 1

OA 2

AVC

IctusCerebral

Derrame Cerebral

Hemisfeacuterios Cerebrais

ApoplexiaAcidente

Cerebrovascular

IctoCerebral

Apoplexia Cerebrovascular

Apoplexia Cerebral

Acidente Vascular

Encefaacutelico

Acidente Vascular

do Ceacuterebro

Acidente Vascular Cerebral

padratildeo (sinocircnimo)

anota

especiacutefica de domiacutenio

anocircnimas (DeCs)

172

DeCs

Anatomia

Sistema Nervoso

Sistema Nervoso Central

Enceacutefalo

Prosenceacutefalo

Telencaacutefalo

Ceacuterebro (2)

Doenccedilas

Doenccedilas do Sistema Nervoso

Doenccedilas Cardiovasculares

Doenccedilas do Sistema Nervoso Central

Encefalopatias

Transtornos Cerebrovasculares

Doenccedilas Vasculares

Transtornos Cerebrovasculares

Acidente Cerebral Vascular (1)

Acidente Cerebral Vascular(1)

OA 1

OA 2

AVC

IctusCerebral

Derrame Cerebral

Hemisfeacuterios Cerebrais

ApoplexiaAcidente

Cerebrovascular

IctoCerebral

Apoplexia Cerebrovascular

Apoplexia Cerebral

Acidente Vascular

Encefaacutelico

Acidente Vascular

do Ceacuterebro

Acidente Vascular Cerebral

Busca de OAs na aacuterea de sauacutede usando conhecimento de domiacutenio

Semantic Learning Objects (VIAN J SILVEIRA R A FILETO R WCCE 2009)

21042010

30

Conclusotildees

A Web semacircntica tem potencial de contribuir naobtenccedilatildeo de melhores resultados para buscas

Suporte automatizado eacute fundamental para a construccedilatildeo evoluccedilatildeo e integraccedilatildeo de ontologias anotaccedilotildees semacircnticas e contextos de usuaacuterios

Nossos primeiros resultados focam na captura e utilizaccedilatildeo de contextos de usuaacuterios mapeados a ontologias de domiacutenios especiacuteficos paradesambiguar e estender as buscas

Trabalhos futuros

Processos parcialmente automatizados para geraccedilatildeo e atualizaccedilatildeo de ontologias e anotaccedilotildees semacircnticas

Experimentos para comprovar a eficaacutecia das teacutecnicas e ferramentas utilizadas

Validaccedilatildeo de soluccedilotildees de problemas de busca semacircntica em diversos domiacutenios de aplicaccedilatildeo

Determinaccedilatildeo de niacuteveis adequados de acoplamento entre contextos e ontologias e dessas com os recursos a serem recuperados

Notiacutecias e anaacutelises

httpnewscnetcomnew-search-engine-cuil-takes-aim-at-google

httpwwwreadwritewebcomarchivesis_google_a_semantic_search_enginephp

httpwwwreadwritewebcomarchivessemantic_search_the_myt

h_and_realityphp

httpwwwpandiacomsew1262-top-5-semantic-search-

engineshtml

httpmindsetresearchyahoocom

httpnewscnetcom8301-13953_3-9982015-80html

httpwwwsearchenginejournalcomaskcom-focuses-on-semantic-search8252

httpnewsbbccouk2hiprogrammesclick_onlinedefaultstm

httpnewsbbccouk2hiprogrammesclick_online8144765stm

Web semacircntica e buscassemacircnticas

httpwwww3org2001sw

httpsemanticweborg

httpenwikipediaorgwikiSemantic_Web

httpenwikipediaorgwikiSemantic_search

Ferramentas de desenvolvimento

httpprotegestanfordedu

httpjenasourceforgenet

httpwwww3org2001Annotea

httpwwwontotextcomkim

httpesww3orgtopicSemanticWebTools

httpwwwdamlorg200305swmu-tools-

tutorialOverviewhtml

Referecircncias em Web semacircntica

T Berners-Lee J Hendler e O Lassila The Semantic Web Scientific American May 2001

Thomas B Passing Explores Guide to the Semantic Web Manning Publications Greenwich CT 2005

Davies J Studer R Warren P (Eds) Semantic Web Technologies trends and research in ontology-based

Systems John Wiley amp Sons 2006

Breitman KK Casanova MA Truszkowski W Semantic Web

Concepts Technologies and Applications Series NASA Monographs in Systems and Software Engineering Springer 2007

Grigoris Antoniou and Frank van Harmelen A Semantic Web Primer 2nd edition The MIT Press Cambridge MA USA 2008

Kashyap V Bussler C Moran M The Semantic Web -Semantics for Data and Services on the Web Series Data-

Centric Systems and Applications Springer 2008

Hitzler P Krotzsch M Rudolph S Foundations of SemanticWeb Technologies Chapman amp HallCRC 2009

21042010

31

Referecircncias em buscas semacircnticas

Guha R McCool R and Miller E 2003 Semantic search In Proc of the 12th international Conference on World Wide Web

(WWW) Budapest Hungary ACM New York NY 2003 700-709

Reeve L and Han H 2005 Survey of semantic annotation

platforms In Proceedings of the ACM Symposium on Applied Computing Santa Fe New Mexico ACM New York NY 2005

1634-1638

Eetu Makela Survey of Semantic Search Research

Mangold C A Survey and classification of semantic search approaches Journal of Metadata Semantics and Ontology 2(1)

2007

Stephan Bloehdorn Philipp Cimiano Alistair Duke Peter Haase Joumlrg Heizmann Ian Thurlow Johanna Voumllker Ontology-BasedQuestion Answering for Digital Libraries ECDL 2007 14-25

Hai Dong Hussain FK Chang E A survey in semantic search technologies In 2nd IEEE International Conference on

Digital Ecosystems and Technologies 2008 403-408

Algumas referecircncias grupo UFSC

DAgostini C S Fileto R Capturing Users Preferences and Intentions in a Semantic Search System In 21st International

Conference on Software Engineering amp Knowledge Engineering (SEKE) Boston 2009 p 587-591

DAgostini C S Fileto R Dantas M A R Gauthier F A O

Contextual Semantic Search - Capturing using the UsersContext to Direct Semantic Search In 10th InternationalConference on Enterprise Information Systems (ICEIS) Barcelona

Spain 2008 v SAIC p 154-159

DAgostini C S Fileto R Capturing and managing usercontext for improving information retrieval In Workshop de

Teses e Dissertaccedilotildees do Simpoacutesio Brasileiro de Bancos de Dados (WTDBDSBBD) Campinas Unicamp Brazil 2008

Vian J Silveira R A Fileto R Proposal of a Multi-agent System for Indexing and Recovery applied to Learning

Objects In 9th IFIP World Conference on Computers in Education (WCCE) Bento Goncalves Brazil 2009

Alguns projetos na UFSC

httpwwwlisaufscbrprojetos

httpwwwunasusufscbr

httpwwwliteraturabrasileiraufscbr

Perguntas

Page 7: Buscas Semânticasfileto/Talks/BuscasSemanticas6sp.pdf · 21/04/2010 1 1 Buscas semânticas: panorama e tendências atuais minicurso ERBD 2010 RenatoFileto fileto@inf.ufsc.br AlunosColaboradores:

21042010

7

Estrutura do conhecimento em RDF

httpwwwagritempocnptiaembrapabr

httpwwwcnptiaembrapabr~assad

Nuacutecleo de Monitoramento e

Anaacutelise de Dados

Meteoroloacutegicos e Climatoloacutegicos

para a Agricultura

assadcnptiaembrapabrEduardo D

Assad

dctitle

dctitleemail

leader

Metadata in RDFWater Balance (same place and institution)rlm

ltxml version=10gt

ltrdfRDF xmlnsRDF httpwwww3orgRDFRDFldquo

xmlns httpagricgovbrDocStdldquogt

ltrdfDescription about=httpwwwagricgovbrpublicWaterBal1234gt

ltSourcegt

rdfresource=ldquohttpwwwcepagriunicampbrrdquo

rdfresource=ldquohttpwwwciagroiacgovspbrrdquo

ltSourcegt

ltInitialDategt 28032002 ltInitialDategt

ltFinalDategt 31032002 ltFinalDategt

ltkeywordgt Water available in Soil ltkeyworkgt

ltlocalgt

rdfresource= ldquohttpwwwibgegovbrstate_SPrdquo

ltlocalgt

ltmeasument_unitgt

rdfresource= ldquohttpwwwinmetrogovbrmmrdquo

ltmeasument_unitgt

ltrdfDescriptiongt

ltrdfRDFgt

httpwwwagricgovbrpublicWaterBal1234

http

wwwcpaunicampbr

Centro de Pesquisas

Agriacutecolas (CEPAGRI)

name

source

httpwwwciagroiacg

ovspbr

httpwwwunica

mpbr

part_of

CIIAGRO

name

http

wwwiacgovspbr

part_of

InitialDate

28032002

FinalDateWater available in

Soil

http

wwwibgegovbrstate_SP

source

keyword

http

wwwinmetrogovbrmm

31032002

local

measurement_unit

RDF-Schema

ltrdfabout=ampAgricZoningCountry rdfslabel=Countrygt

ltrdfssubClassOf dfresource=ampAgricZoningTerritorialDivisiongt

ltrdfabout=ampAgricZoningState rdfslabel=ldquoStategt

ltrdfssubClassOf dfresource=ampAgricZoningTerritorialDivisiongt

ltrdfProperty rdfabout=ampAgricZoningstatesOfCountry

aminCardinality=1

rdfslabel=statesOfCountrygt

ltrdfsdomain rdfresource=ampAgricZoningCountrygt

ltrdfsrange rdfresource=ampAgricZoningStategt

ltainverseProperty rdfresource=ampAgricZoningcountryOfStategt

ltrdfPropertygt

RDF-Schema

ltrdfProperty rdfabout=ampAgricZoningcountryOfState

amaxCardinality=1

aminCardinality=1

rdfslabel=countryOfStategt

ltrdfsrange rdfresource=ampAgricZoningCountrygt

ltrdfsdomain rdfresource=ampAgricZoningStategt

ltainverseProperty

rdfresource=ampAgricZoningstatesOfCountrygt

ltrdfPropertygt

Trecho de RDF

ltAgricZoningCountry rdfabout=ampAgricZoningpais_55

AgricZoningnameBR=BRASIL rdfslabel=BRASILgt

ltAgricZoningofficialRegionsOfCountry

rdfresource=ampAgricZoningregof_1gt

ltAgricZoningofficialRegionsOfCountry

rdfresource=ampAgricZoningregof_2gt

ltAgricZoningofficialRegionsOfCountry

rdfresource=ampAgricZoningregof_3gt

ltAgricZoningofficialRegionsOfCountry

rdfresource=ampAgricZoningregof_4gt

ltAgricZoningofficialRegionsOfCountry

rdfresource=ampAgricZoningregof_5gt

ltAgricZoningstatesOfCountry rdfresource=ampAgricZoningestado_11gt

ltAgricZoningstatesOfCountry rdfresource=ampAgricZoningestado_12gt

ltAgricZoningmetroAreasOfCountry

rdfresource=ampAgricZoningmetro_5201gt

ltAgricZoningCountrygt

21042010

8

Descriccedilotildees em RDF de recursos para a coleta de dados cientiacuteficos

wwwEquipServcombrschema2rdfs

RD

F S

chem

aR

DF

Equipment Clienthas

String StringString String

category model name city

wwwAgriTempobrschema1rdfs

WeatherStation

longitudealtitude

LandParcel

CountyState

latitude

inpart_of

ampws1

ampws3

ampws4

Stringname

ampeq1

ampRio

ampUbatuba

ampCampinas

ampws2

ampUnicamp

ampEmbrapa

ampSP

ampRJ

in

in

in

in

part_of

part_of

part_of

has

has

has

has

ampws1 = httpwwwembrapabrWeatherStationX

ampws2 = httpwwwiacbrWeatherStationK

ampws3 = httpwwwunicampbrWheaterStationA

ampws4 = httpwwwunicampbrWheaterStationB

ampeq1 = httpwwwembrapabrCameraZ

subClassOf (isA)rlm

typeOf (instance)rlm

other kind of property

DegreesDecMeters

String

String

value

value

OWL ndash Ontology Web Language

Estende o RDF com vocabulaacuterio padronizado e construccedilotildees para definir

Escopo local de propriedades

Disjunccedilatildeo de classes

Combinaccedilotildees de classes

Restriccedilotildees de cardinalidade

Caracteriacutesticas especiais de propriedades (eg transitividade simetria anti-simetria propriedades inversas)rlm

The 3 flavors of OWL

OWL LiteExpressividade restrita (exclui classes enumeradas disjunccedilatildeo cardinalidade arbitraacuteria )

Faacutecil de entender e usar

OWL DL

Equivalente agrave loacutegica descritiva (DL = Description

Logics)

Ainda permite eficiecircncia e computabilidade

OWL Full

Compatiacutevel sintaacutetica e semanticamente com RDF embora mais poderosaPode ocasionar inferecircncias indecidiacuteveis

Disjunction and Equivalence of Classes

ltowlClass rdfabout=associateProfessorgt

ltowldisjointWith rdfresource=assistantProfessorgt

ltowlClassgt

ltowlClass rdfID=facultygt

ltowlequivalentClass

rdfresource=academicStaffMembergt

ltowlClassgt

Inverse properties

ltowlObjectProperty rdfID=teachesgt

ltrdfsrange rdfresource=coursegt

ltrdfsdomain rdfresource=academicStaffMembergt

ltowlinverseOf rdfresource=isTaughtBygt

ltowlObjectPropertygt

Sintaxe abstrata para OWL

Class(Person partialrestriction (hasChild allValuesFrom(Person)))rlm

Class(Parent completePersonrestriction (hasChild someValuesFrom(Person)))rlm

ObjectProperty(hasChild)rlm

Individual (John type(Person)rlmvalue(hasChild Mary))rlm

21042010

9

Busca em uma ontologia

Pessoa

Santo

S1

IS_A

TYPE_OF

nome

Satildeo Paulo

Time

TimeFutebol

TF1

IS_A

TYPE_OF

nome

Satildeo Paulo

ParcelaTerritoacuterio

Estado

IS_A

Cidade

E1

TYPE_OF

nome

Satildeo Paulo

C1

nome

Satildeo PauloTricolor Paulista

PART_OF

SPARQL (recomendaccedilatildeo W3C)rlm

Exemplo de expressatildeo em SPARQL

SELECTrlmconceptrlm propertyrlm ldquoSatildeorlmPaulordquo

WHERE

concept propertyhasProperty property

FILTER(property name)rlm

Linguagens de Regras (Prolog)

Rules

parent(x z)rlm - father(x z) v mother(x z)

sibling(x y)rlm- parent(x z) and parent(y z)

Knowledge base

father(_Maria _Joatildeo)

father(_Pedro _Joatildeo)

Query

sibling(_Maria x) rArr Yes rArr b = _PedrorArr b = _xyz1rArr b = _xyz2 rArr b = _xyz3rArr b = _xyz4

RIF (Rule Interchange Format)

A buyer buys an item from a seller if the seller sells it to the buyer John sells LeRif to Mary The fact Mary buys LeRif from John can be logically derived by a modus ponens argument

Document(

Prefix(cpt lthttpexamplecomconceptsgt)

Prefix(ppl lthttpexamplecompeoplegt)

Prefix(bks lthttpexamplecombooksgt)

Group ( Forall Buyer Item Seller (

cptbuy(Buyer Item Seller)

cptsell(Seller Item Buyer)

)

cptsell(pplJohn bksLeRif pplMary)

)

)

Controveacutersia sobre pilha de padrotildees

Peter F Patel-Schneider A Revised Architecture for Semantic

Web Reasoning Third Workshop on Principles and Practices of

Semantic Web Reasoning Dagstuhl Germany September

2005 LNCS 3703 Springer Verlag 2005

Ian Horrocks Bijan Parsia Peter F Patel-Schneider and

James Hendler Semantic Web Architecture Stack or Two

Towers Third Workshop on Principles and Practices of Semantic Web Reasoning Dagstuhl Germany September

2005 LNCS 3703 Springer Verlag 2005

Peter F Patel-Schneider Building the Semantic Web Tower

from RDF Straw Nineteenth International Joint Conference on

Artificial Intelligence Edinburgh Scotland August 2005

Proposta inicial (2000)rlm

21042010

10

Proposta regras(2005)rlm Proposta atual

Como estaacute a Web semacircntica hoje

Aacuterea de pesquisa muito ativa

Visa estender o papel dos computadores no

suporte a diversas atividades humanas

Usa ontologias e anotaccedilotildees semacircnticas para

catalogar recuperar e compor dados e serviccedilos

de processamento na Web

Desafios da Web semacircntica

Construccedilatildeo de ontologias

(Semi-)automatizada e interativa

Geraccedilatildeo de anotaccedilotildees semacircnticas de recursos

Muitas aplicaccedilotildees requerem automatizaccedilatildeo

Evoluccedilatildeo de ontologias

Checar se alteraccedilotildees natildeo introduzem inconsistecircncias e gerenciar

versotildees

Integraccedilatildeo de ontologias (ontology matching)

A obtenccedilatildeo de consenso eacute inviaacutevel em muitas domiacutenios

Deduccedilatildeoraciociacutenio

Teorias computaacuteveis e natildeo computaacuteveis ontologias inconsistentes

Ediccedilatildeo de Ontologias no Proteacutegeacute

Editor de ontologias e arcabouccedilo para o desenvolvimento de bases de conhecimento livre e de coacutedigo aberto baseado em Java

Suporta os modelos de frames (RDF) e OWL

Exporta as ontologias e bases de conhecimento para uma variedade de formatos incluindo RDF(S) OWL e XML Schema

Extensiacutevel via plugins

Construccedilatildeo de ontologias

Processo para geraccedilatildeo automatizada de

ontologias a partir de esboccedilos dados e

documentos (nova geraccedilatildeo de ferramentas)rlm

Entendimento do domiacutenio

Entendimento dos dados

Definiccedilatildeo das tarefas

Geraccedilatildeo semi-automaacutetica

Avaliaccedilatildeo de qualidade

Refinamento com interaccedilatildeo humana

21042010

11

Definiccedilotildees de ldquogeraccedilatildeo de ontologiardquoGrobenik and Mladenic 2006

Induccedilatildeo de conceitos (a partir das instacircncias)rlm

Induccedilatildeo de relaccedilotildees (a partir de conceitos e

instacircncias a eles associadas)rlm

Popular ontologia (dada uma ontologia e

instacircncias de seus conceitos)rlm

Geraccedilatildeo de uma ontologia completa (a partir

das instacircncias e algum conhecimentoinformaccedilatildeo)rlm

Atualizaccedilatildeoextensatildeo de ontologias (dada

uma ontologia e informaccedilatildeo como novas

instacircncias ou padrotildees de uso da ontologia)rlm

Document Clustering - Vector Model

Vector of word occurences in the documents

bull diK = TF(Wkdi) IDF(Wk)rlm

Where

bull TF(Wkdi) = number of times Wk occurs in document di

bull IDF(Wk) = log ( D DF(Wk))rlm

bull D = number of documents

bull DF(Wk) = number of documents in which word W occurs

Document distance metric

Anotaccedilotildees Semacircnticas(Kiryakov et al 2004)rlm

21042010

12

Anotaccedilatildeo Semacircntica de Documentos

Atribui agraves entidades que aparecem no documento ligaccedilotildees com suas descriccedilotildees semacircnticas na ontologia

Aplicaacutevel a qualquer tipo de texto (documentos HTML documentos de texto comuns campos de banco de dados entre outros)

Representaccedilatildeo das anotaccedilotildees

Intrusiva

Natildeo intrusiva

Confecccedilatildeo das anotaccedilotildees

bull Semi-Automaacutetica Associa palavras do texto a classes

instacircncias e propriedades da ontologia utilizando-se do

julgamento humano Esta associaccedilatildeo geralmente eacute efetuada

atraveacutes de interfaces ldquoarraste-e-solterdquo (eg OntoMat)rlm

bull Automaacutetica Aplica teacutecnicas de processamento de

linguagem natural aprendizado de maacutequina e extraccedilatildeo de

informaccedilatildeo entre outras para associar palavras agrave ontologia

Essas ferramentas podem utilizar ontologias padratildeo (eg

IEEE Standard Upper Ontology) ou ontologias de domiacutenios

especiacuteficos (eg Unified Medical Language System)

bull Hiacutebrida Combinaccedilatildeo das teacutecnicas acima

Geraccedilatildeo de anotaccedilotildees semacircnticas (Reeve e Han 2005)rlm

Ferramentas para anotaccedilatildeo

Annozilla Funciona sobre o Mozzila Firefox

Annotea projeto da W3C - servidor de anotaccedilotildees em RDF

Armadillo

Muse

Pankol

Semantic Word anotaccedilatildeo interativa de porccedilotildees de documentos

Word

OntoMat Annotizer anotaccedilatildeo interativa de paacuteginas Web com

ontologias em OWL

Smore marcaccedilotildees sobre HTML com ontologias em OWL

Melita ferramenta de anotaccedilatildeo semi-automaacutetica que usa algoritmo

de IE para ajudar o usuaacuterio no processo de anotaccedilatildeo

MnM anotaccedilatildeo semacircntica de paacuteginas Web com metadados

descritos em RDFOCMLDAML+OIL

KIM permite criar metadados armazenar e buscar informaccedilotildees e

pode ser usada para anotaccedilatildeo e procura de documentos

21042010

13

O processo automatizado de anotaccedilatildeo semacircntica de documentos

Tokenizaccedilatildeo e Eliminaccedilatildeo de StopWords

Etiquetagem

Stemmer

Corpus Anotado

Identificaccedilatildeo EN

Associaccedilatildeo atermos da ontologia

RepositoacuterioSemacircntico

Tokensrelevantes

Palavras +Classificaccedilatildeo Gramatical

Radicais das Palavras +Classificaccedilatildeo Gramatical

Entidades Nomeadas

Anotaccedilatildeo Semacircntica

Dados Metadados Documento

s

Ontologia do Domiacutenio

Valida

Valida

Especialista

RepositoacuterioInformaccedilatildeo

Annotation example(Davies et al 2006)

Consider the phrase

There are deliverables

The tokens are

[There] [are] [deliverables] []

The tagger finds out what kind of a word each of the tokens

is (whether it is a noun an adjective a verb etc)rlm

[There] existential quantifier

[are] verbmdash3rd person singular present

[deliverables] nounmdashplural

Annotation example (cont)rlm

The morphological analyser gives the roots of all the words

[There] rootmdashthere

[are] rootmdashbe

[deliverables] rootmdashdeliverable

There are mdash mdashmdash

triggers the creation of one or more new classes in the

ontology

There are projects

There are workpackages tasks and deliverables

SEKT is a project

MUSINGrlmbdquoKnowledgerlmWeb‟rlmandrlmbdquoPrestorlmSpace‟rlmarerlmprojects

Projects have workpackages

Workpackages can have tasks

WP1 WP2 WP3 WP4 WP5 and WP6 are workpackages

SEKT has WP1

MUSING has WP2 WP3 and WP4

bdquoKnowledgerlmWeb‟rlmhasrlmWP5 and WP6

Annotation example (cont)rlm

Ontologia resultante Quadro Comparativo(Nunes e Fileto 2007)rlm

21042010

14

Dependecircncias entre plataformas(Rui Tramontin Junior 2007)rlm

Comparaccedilatildeo de desempenho(Reeve e Han 2005)rlm

Prataforma Categoria Precisatildeo Cobertura Medida F

Armadillo Descoberta de padrotildees

910 740 870

KIM Regras 860 820 840

MnM Induccedilatildeo 950 900 nd

MUSE Regras 935 923 929

PANKOW Descoberta de padrotildees

650 282 249

SemTag Regras 820 nd nd

Evoluccedilatildeo de ontologias(Bloehdorn et al 2006)rlm

Exemplo Uso natildeo uniforme de conceitos

Alternativas para remoccedilatildeo do conceito C que tem sub-conceitos

Processo de evoluccedilatildeo de ontologias

CapturaCaptura

da

Mudanccedila

Representaccedilatildeo Semacircntica Propagaccedilatildeo Implementaccedilatildeo Validaccedilatildeo

Fases Elementares

21042010

15

Mapeamentos entre ontologias(Ontology Matching)

Fusatildeo de ontologias

Processo semi-automatico de alinhamento(Huang at al 2006)rlm

Referecircncia

Jerome Euzenat INRIA Rhone-Alpes France

Pavel Shvaiko University of Trento Italy

Ontology Matching

URL httpbookontologymatchingorg

Springer-Verlag Heidelberg (DE) 2007

343 p 67 illus Hardcover

ISBN 978-3-540-49611-3

E as buscas semacircnticas

Recuperaccedilatildeo da informaccedilatildeo de documentosrlm

Medidas da eficaacutecia das soluccedilotildees

precisatildeo = nro de docs relevantes recuperadosnro de docs recuperados

cobertura = nro de docs relevantes recuperadosnro de docs relevantes

21042010

16

Classificaccedilatildeo de abordagens para buscas semacircnticas (Mangold 2007)

Arquitetura

Acoplamento entre ontologias e documentos

Transparecircncia

Contexto do usuaacuterio

Modificaccedilatildeo de consultas

Estrutura das ontologias

Tecnologia para representar as ontologias

Desempenho escalabilidade e distribuiccedilatildeo

Adaptabilidade

Ranking

Arquiteturas para buscas semacircnticas

Maacutequina de busca stand_alone armazenametadados sobre os documentos em iacutendicescom os quais avalia as consultas

Meta-maacutequina de busca distribui asconsultas para outras maacutequinas de busca ecombina os resultados

Acoplamento ontologias-documentos

Acoplamento forte os metadados dosdocumentos referem-se explicitamente aosconceitos de uma ontologia e vice-versa(requer anotaccedilatildeo semacircntica)rlm

Acoplamento fraco os documentos satildeoindependentes de quaisquer ontologiasdisponiacuteveis (pode restringir a capacidade debusca)rlm

Contexto do usuaacuterio

Learning extraiacutedo na interaccedilotildees do usuaacuteriocom o sistema (histoacuterico das consultas erefinamentos de consultas)rlm

Hard-coded as consultas satildeo organizadas emcategorias que definem a informaccedilatildeo solicitada(eg ldquolocation ofrdquo ldquoresources forrdquo rlm(

Modificaccedilatildeo de consultas

Manual o sistema retorna um trechoapropriado da ontologia junto com a respostapermitindo ao usuaacuterio navegar na ontologia ereformular a consulta pela adiccedilatildeo e remoccedilatildeo determos

Re-escrita automaacutetica a consulta eacuteotimizada automaticamente pelo sistema

Baseada em grafo considera conceitos edocumentos como nodos de um grafoefetuando propagaccedilatildeo da consulta a partir dosnodos correspondentes a termos de busca

Modificaccedilatildeo de consultas

Modificaccedilatildeo de consulta

Manual

Re-escrita de consulta

Baseada em grafo

Inserccedilatildeo de termoRemoccedilatildeo de termo

Substituiccedilatildeo de termo

Conjuntiva

Disjuntiva

Conjuntiva Disjuntiva

21042010

17

Estrutura da ontologia

Propriedades anocircnimas as relaccedilotildees entreconceitos natildeo satildeo nomeadas indicando apenasque eles compartilham o mesmo contexto

Propriedades padronizadas sinocircniacutemiahiperniacutemia meroniacutemia negaccedilatildeo etc

Propriedades especiacuteficas de domiacutenio aleacutemdas propriedades padratildeo considerapropriedades especiacuteficas de um domiacutenio (egldquotipo de cacircmerardquo em sistema para a aacuterea defotografia)rlm

Tecnologia da ontologia

F-Logic

RDF

DAML+OIL

Frames

OWL

Comparaccedilatildeo de abordagens Comparaccedilatildeo de abordagens (cont)

Buscas semacircnticas na Web hoje

httpwwwaliprcom (imagens)rlm

httpwwwcognitioncom

httpwwwdeepdyvecom

httpwwwbingcom

httpwwwcuilcom

httpwwwfreebasecom

httpwwwgooglecom

httpwwwkosmixcom

httpwwwhakiacom

httpwwwpowersetcom

httpwwwsensebotnet

httpdeveloperyahoocomsearchmonkey

httpswoogleumbcedu (ontologias)rlm

21042010

18

21042010

19

SAO PAULO-SP

University of Sao Paulo

Sao Paulo Fashion

Sao Paulo Fashion Week

Sao Paulo State

Sao Paulo Hotel

Sao Paulo Hotels

Sao Paulo Brasilien

Sao Paulo Congonhas

21042010

20

21042010

21

Sao Paulo Airport

Sao Paulo Plane Crash

Sao Paulo Zoo

hellip

21042010

22

21042010

23

Algumas questotildees em aberto

Representaccedilatildeo de contextos de usuaacuterios emapeamento desses a ontologias

Anaacutelise dos efeitos de modificaccedilotildees de consultas

Meta-buscas semacircnticas

Anaacutelise da aceitaccedilatildeo dos usuaacuterios

Adaptabilidade a diferentes ontologias

Ranking dos resultados

Integraccedilatildeo com sistemas de gerenciamento dedocumentosconteuacutedo

Tratamento de dados multimiacuteda

Interfaces homem-maacutequina

Desempenho e escalabilidade

Contextual Semantic Search (CSS)(DAgostine Fileto ndash SBBD2007)rlm

21042010

24

General Architecture for CSSThe Weighted Topic Graph(DAgostine Fileto Dantas Gauthier - ICEIS 2008)rlm

A weighted topic graph is a graph TM(T A)rlm

T is a set of topics (vertices)rlm

A is a set of associations (edges)rlm

Let be an ontology O

Each topic t in T corresponds to a ontology term o in O

Each topic t has a weight [01] The sum from the weights from all topics with same name equals 1

Each association a has a weight [01] The sum

from all the weights from all association departing

a single topics equals 1

Topic weights used to disambiguate

Eg interest in Satildeo Paulo city instead of Satildeo Paulo

state

Association weights used to semantically

expand searches

Eg Actual interest in Guarulhos and airport while

searching for Satildeo Paulo city

The Weights in the Topic Graph Capturing the Users Context

Generated Topic Graph with the Ontological Users Context

The Contextual Semantic Search Process

21042010

25

Desambiguaccedilatildeo

Fundamento dos algoritmos de busca sobre contexto ontoloacutegico

Heuriacutesticas de estigmergia (Ant Colony Optimization - ACO)

Traccedilos de ferormocircnio

Algoritmo de busca semacircntica baseada em ACO

Entrada palavras-chave[ ]

Dados G(TA) Onto repositoacuterio

limite_de_profundidade

limite_miacutenimo_de_peso

λ fator de atenuaccedilatildeo de peso

iniacutecio Algoritmo Busca Contextual 1 Estigmeacuterica

resultados = busca_G_ou_Onto(palavras-chave[])

atenuaG (iacutendice ) λrlmisin [0 1]

manutenccedilatildeo(coleta_feedback(resultados))

fim

21042010

26

Demo Praestro ndash Karina Fasolin

Alguns trabalhos relacionados

Name Article Comments

Graupmann

et al 2005

The SphereSearch

engine for unifiedranked retrieval of

heterogeneous XML

and web documents

Searches through XML documents The context is a region in radius

around given element A data inside two regions is considered relevant

to both contexts

Made tests with large collections like DBLP INEX Wikipedia put for

stress testing regarding the size of the collection

ldquoLet us first comment on the difficulties of defining a meaningfulbenchmark for this kind of novel systemrdquo

Park e

Cheyer 2006

Just For Me Topic

Maps and Ontologies

Manages knowledge in three layers Topics Knowledge Structures and

Documents

Not implemented (at least at the time of publication)

Michlmayr

et al 2007Adaptive User Profiles

for Enterprise

Information Access

Represents context as an individual graph The graph is constructed

based on tags used to semantically annotate the content which the user

considers to be relevant

However the tags are only that only labels They are not tied-down to

a formal definition

Alguns trabalhos relacionados (cont)

Name Article Comments

Aleman-

Meza et a

2003

Context-Aware

Semantic Association

Ranking

Also defines context as regions But the regions are static defined in

the ontology which is used by the system So the contexts are defined

the same for every single user

Mani and

Sundaram

2007

Modeling user context

with applications to

media retrieval

Creates a graph representing the users context Each node

corresponds to an instance in the ontology The edges represent

relations between the instances Built to search trough multimedia

documents

However it does not associates the vocabulary the user uses with the

instances

Challam et

al 2007

Contextual Search

Using Ontology-Based

User Profiles

Monitors the users activity capturing content from open Internet

Explorer MS-Office and MSN The captured information is stored and

usedrlmtorlmbuildrlmarlmuser‟srlmcontextualrlmprofilerlmbasesrlmonrlmanrlmontology

The context is tightly coupled with the ontology

NO IMAGES WERE

PROVIDED

Vallet et al

2006

Personalized

Information Retrieval in

Context

Stores context as a graph constructed based on the ontology used by

the system Similar to Mani and Sundaram including its limitations

(mapping the vocabulary) however if built for text documents

Sieg et al

2007

Ontological User

Profiles for

Personalized Web

Search

Similar to Challam et al but it gets the context information from the

ontology terms used to annotate the retrieved relevant context

Also limited by the structure of the ontology

Alguns trabalhos relacionados(cont)

Name Deals with

objective

knowledge

(ontology)

Deals with

subjective

knowledge

(users

context)

The knowledge

management is

transparent

Idea Implemented

Graupmann et

al 2005

X IMPL

Park e Cheyer

2006

X X X IDEA

Michlmayr et al2007

X X IMPL

Aleman-Meza et

a 2003

X X IMPL

Mani eSundaram 2007

X X X IMPL

Challam et al

2007

X X X IMPL

Vallet et al 2006 X X X IMPL

Sieg et al 2007 X X X IMPL

(incomplete)

Praestro X X X IMPL

(prototype)

UnA-SUS ndash Universidade Aberta do SUS

Programa do Ministeacuterio da Sauacutede para atender necessidades de e

permanente dos

Accedilotildees focadas em

formulaccedilatildeo de conteuacutedo

bibliotecas digitais

cursos a distacircncia

21042010

27

Metas da UnA-SUS

Desenvolver um

plataforma para de

composiccedilatildeo e de

Montar e oferecer cursos para formaccedilatildeo continuada de profissionais da sauacutede

157

Metadados

O processo de produccedilatildeo catalogaccedilatildeo e reuso de OAs

Repositoacuterio

Conteuacutedo

OAs

requisiccedilotildees

Design revisatildeo e publicaccedilatildeo

OA

SGA outros reps

Busca e reuso

OAsMetadados

OAs

Concepccedilatildeo e validaccedilatildeo de OAs

O processo de produccedilatildeo catalogaccedilatildeo e reuso de OAs

OA1

Curso A

Curso B

OA2

OA3

Viacutedeo

Imagens

RepositoacuteriosConteuacutedoMultimiacutedia

SGA RepositoacuteriosOAs

Reuso eacute essencial

bull OAs satildeo caros para produzir

bull Demandas emergenciais na sauacutede puacuteblica exigem agilidade e pronta resposta com cursos para a qualificaccedilatildeo de profissionais

H1N1

Apoplexia

gripe suiacutena gripe A

influenza H1N1

hellip

21042010

28

Navegaccedilatildeo hiperboacutelica no DeCSCatalogaccedilatildeo de Objetos de Aprendizagem (OAs) usando Vocabulaacuterios Controlados

bull Seleccedilatildeo de termos do DeCS CID-10 SNOMED

ndash via fornecimento de palavras-chave que satildeo pesquisadas na base de conhecimento

ndash via navegaccedilatildeo em uma visatildeo do conhecimento em forma de aacutervore

Seleccedilatildeo via contexto ontoloacutegicoProtoacutetipo (catalogaccedilatildeo com entrada

de palavra-chave)

DSpaceCatalogaccedilatildeo de OAswf

Protoacutetipo (catalogaccedilatildeo com navegaccedilatildeo

na base de conhecimento)

DSpaceRecuperaccedilatildeo de OAswf

21042010

29

Recuperaccedilatildeo de Objetos de Aprendizagem (OAs) Baseada em Conhecimento

bull Vocabulaacuterios e relaccedilotildees semacircnticas

ndash Oriundos do DeCS

ndash Definidos pelos catalogadores de OAs

ndash Gerados pelo cruzamento de informaccedilotildees com o CID-10 (Classificaccedilatildeo Internacional de Doenccedilas)

ndash Ex sinocircnimos eacute um(a) parte de causa efeito sintoma etc

DeCs

Anatomia

Sistema Nervoso

Sistema Nervoso Central

Enceacutefalo

Prosenceacutefalo

Telencaacutefalo

Ceacuterebro

Doenccedilas

Doenccedilas do Sistema Nervoso

Doenccedilas Cardiovasculares

Doenccedilas do Sistema Nervoso Central

Encefalopatias

Transtornos Cerebrovasculares

Doenccedilas Vasculares

Transtornos Cerebrovasculares

Acidente Vascular Cerebral

Acidente Vascular Cerebral

OA 1

OA 2

AVC

IctusCerebral

Derrame Cerebral

Hemisfeacuterios Cerebrais

ApoplexiaAcidente

Cerebrovascular

IctoCerebral

Apoplexia Cerebrovascular

Apoplexia Cerebral

Acidente Vascular

Encefaacutelico

Acidente Vascular

do Ceacuterebro

Acidente Vascular Cerebral

padratildeo (sinocircnimo)

anota

especiacutefica de domiacutenio

anocircnimas (DeCs)

172

DeCs

Anatomia

Sistema Nervoso

Sistema Nervoso Central

Enceacutefalo

Prosenceacutefalo

Telencaacutefalo

Ceacuterebro (2)

Doenccedilas

Doenccedilas do Sistema Nervoso

Doenccedilas Cardiovasculares

Doenccedilas do Sistema Nervoso Central

Encefalopatias

Transtornos Cerebrovasculares

Doenccedilas Vasculares

Transtornos Cerebrovasculares

Acidente Cerebral Vascular (1)

Acidente Cerebral Vascular(1)

OA 1

OA 2

AVC

IctusCerebral

Derrame Cerebral

Hemisfeacuterios Cerebrais

ApoplexiaAcidente

Cerebrovascular

IctoCerebral

Apoplexia Cerebrovascular

Apoplexia Cerebral

Acidente Vascular

Encefaacutelico

Acidente Vascular

do Ceacuterebro

Acidente Vascular Cerebral

Busca de OAs na aacuterea de sauacutede usando conhecimento de domiacutenio

Semantic Learning Objects (VIAN J SILVEIRA R A FILETO R WCCE 2009)

21042010

30

Conclusotildees

A Web semacircntica tem potencial de contribuir naobtenccedilatildeo de melhores resultados para buscas

Suporte automatizado eacute fundamental para a construccedilatildeo evoluccedilatildeo e integraccedilatildeo de ontologias anotaccedilotildees semacircnticas e contextos de usuaacuterios

Nossos primeiros resultados focam na captura e utilizaccedilatildeo de contextos de usuaacuterios mapeados a ontologias de domiacutenios especiacuteficos paradesambiguar e estender as buscas

Trabalhos futuros

Processos parcialmente automatizados para geraccedilatildeo e atualizaccedilatildeo de ontologias e anotaccedilotildees semacircnticas

Experimentos para comprovar a eficaacutecia das teacutecnicas e ferramentas utilizadas

Validaccedilatildeo de soluccedilotildees de problemas de busca semacircntica em diversos domiacutenios de aplicaccedilatildeo

Determinaccedilatildeo de niacuteveis adequados de acoplamento entre contextos e ontologias e dessas com os recursos a serem recuperados

Notiacutecias e anaacutelises

httpnewscnetcomnew-search-engine-cuil-takes-aim-at-google

httpwwwreadwritewebcomarchivesis_google_a_semantic_search_enginephp

httpwwwreadwritewebcomarchivessemantic_search_the_myt

h_and_realityphp

httpwwwpandiacomsew1262-top-5-semantic-search-

engineshtml

httpmindsetresearchyahoocom

httpnewscnetcom8301-13953_3-9982015-80html

httpwwwsearchenginejournalcomaskcom-focuses-on-semantic-search8252

httpnewsbbccouk2hiprogrammesclick_onlinedefaultstm

httpnewsbbccouk2hiprogrammesclick_online8144765stm

Web semacircntica e buscassemacircnticas

httpwwww3org2001sw

httpsemanticweborg

httpenwikipediaorgwikiSemantic_Web

httpenwikipediaorgwikiSemantic_search

Ferramentas de desenvolvimento

httpprotegestanfordedu

httpjenasourceforgenet

httpwwww3org2001Annotea

httpwwwontotextcomkim

httpesww3orgtopicSemanticWebTools

httpwwwdamlorg200305swmu-tools-

tutorialOverviewhtml

Referecircncias em Web semacircntica

T Berners-Lee J Hendler e O Lassila The Semantic Web Scientific American May 2001

Thomas B Passing Explores Guide to the Semantic Web Manning Publications Greenwich CT 2005

Davies J Studer R Warren P (Eds) Semantic Web Technologies trends and research in ontology-based

Systems John Wiley amp Sons 2006

Breitman KK Casanova MA Truszkowski W Semantic Web

Concepts Technologies and Applications Series NASA Monographs in Systems and Software Engineering Springer 2007

Grigoris Antoniou and Frank van Harmelen A Semantic Web Primer 2nd edition The MIT Press Cambridge MA USA 2008

Kashyap V Bussler C Moran M The Semantic Web -Semantics for Data and Services on the Web Series Data-

Centric Systems and Applications Springer 2008

Hitzler P Krotzsch M Rudolph S Foundations of SemanticWeb Technologies Chapman amp HallCRC 2009

21042010

31

Referecircncias em buscas semacircnticas

Guha R McCool R and Miller E 2003 Semantic search In Proc of the 12th international Conference on World Wide Web

(WWW) Budapest Hungary ACM New York NY 2003 700-709

Reeve L and Han H 2005 Survey of semantic annotation

platforms In Proceedings of the ACM Symposium on Applied Computing Santa Fe New Mexico ACM New York NY 2005

1634-1638

Eetu Makela Survey of Semantic Search Research

Mangold C A Survey and classification of semantic search approaches Journal of Metadata Semantics and Ontology 2(1)

2007

Stephan Bloehdorn Philipp Cimiano Alistair Duke Peter Haase Joumlrg Heizmann Ian Thurlow Johanna Voumllker Ontology-BasedQuestion Answering for Digital Libraries ECDL 2007 14-25

Hai Dong Hussain FK Chang E A survey in semantic search technologies In 2nd IEEE International Conference on

Digital Ecosystems and Technologies 2008 403-408

Algumas referecircncias grupo UFSC

DAgostini C S Fileto R Capturing Users Preferences and Intentions in a Semantic Search System In 21st International

Conference on Software Engineering amp Knowledge Engineering (SEKE) Boston 2009 p 587-591

DAgostini C S Fileto R Dantas M A R Gauthier F A O

Contextual Semantic Search - Capturing using the UsersContext to Direct Semantic Search In 10th InternationalConference on Enterprise Information Systems (ICEIS) Barcelona

Spain 2008 v SAIC p 154-159

DAgostini C S Fileto R Capturing and managing usercontext for improving information retrieval In Workshop de

Teses e Dissertaccedilotildees do Simpoacutesio Brasileiro de Bancos de Dados (WTDBDSBBD) Campinas Unicamp Brazil 2008

Vian J Silveira R A Fileto R Proposal of a Multi-agent System for Indexing and Recovery applied to Learning

Objects In 9th IFIP World Conference on Computers in Education (WCCE) Bento Goncalves Brazil 2009

Alguns projetos na UFSC

httpwwwlisaufscbrprojetos

httpwwwunasusufscbr

httpwwwliteraturabrasileiraufscbr

Perguntas

Page 8: Buscas Semânticasfileto/Talks/BuscasSemanticas6sp.pdf · 21/04/2010 1 1 Buscas semânticas: panorama e tendências atuais minicurso ERBD 2010 RenatoFileto fileto@inf.ufsc.br AlunosColaboradores:

21042010

8

Descriccedilotildees em RDF de recursos para a coleta de dados cientiacuteficos

wwwEquipServcombrschema2rdfs

RD

F S

chem

aR

DF

Equipment Clienthas

String StringString String

category model name city

wwwAgriTempobrschema1rdfs

WeatherStation

longitudealtitude

LandParcel

CountyState

latitude

inpart_of

ampws1

ampws3

ampws4

Stringname

ampeq1

ampRio

ampUbatuba

ampCampinas

ampws2

ampUnicamp

ampEmbrapa

ampSP

ampRJ

in

in

in

in

part_of

part_of

part_of

has

has

has

has

ampws1 = httpwwwembrapabrWeatherStationX

ampws2 = httpwwwiacbrWeatherStationK

ampws3 = httpwwwunicampbrWheaterStationA

ampws4 = httpwwwunicampbrWheaterStationB

ampeq1 = httpwwwembrapabrCameraZ

subClassOf (isA)rlm

typeOf (instance)rlm

other kind of property

DegreesDecMeters

String

String

value

value

OWL ndash Ontology Web Language

Estende o RDF com vocabulaacuterio padronizado e construccedilotildees para definir

Escopo local de propriedades

Disjunccedilatildeo de classes

Combinaccedilotildees de classes

Restriccedilotildees de cardinalidade

Caracteriacutesticas especiais de propriedades (eg transitividade simetria anti-simetria propriedades inversas)rlm

The 3 flavors of OWL

OWL LiteExpressividade restrita (exclui classes enumeradas disjunccedilatildeo cardinalidade arbitraacuteria )

Faacutecil de entender e usar

OWL DL

Equivalente agrave loacutegica descritiva (DL = Description

Logics)

Ainda permite eficiecircncia e computabilidade

OWL Full

Compatiacutevel sintaacutetica e semanticamente com RDF embora mais poderosaPode ocasionar inferecircncias indecidiacuteveis

Disjunction and Equivalence of Classes

ltowlClass rdfabout=associateProfessorgt

ltowldisjointWith rdfresource=assistantProfessorgt

ltowlClassgt

ltowlClass rdfID=facultygt

ltowlequivalentClass

rdfresource=academicStaffMembergt

ltowlClassgt

Inverse properties

ltowlObjectProperty rdfID=teachesgt

ltrdfsrange rdfresource=coursegt

ltrdfsdomain rdfresource=academicStaffMembergt

ltowlinverseOf rdfresource=isTaughtBygt

ltowlObjectPropertygt

Sintaxe abstrata para OWL

Class(Person partialrestriction (hasChild allValuesFrom(Person)))rlm

Class(Parent completePersonrestriction (hasChild someValuesFrom(Person)))rlm

ObjectProperty(hasChild)rlm

Individual (John type(Person)rlmvalue(hasChild Mary))rlm

21042010

9

Busca em uma ontologia

Pessoa

Santo

S1

IS_A

TYPE_OF

nome

Satildeo Paulo

Time

TimeFutebol

TF1

IS_A

TYPE_OF

nome

Satildeo Paulo

ParcelaTerritoacuterio

Estado

IS_A

Cidade

E1

TYPE_OF

nome

Satildeo Paulo

C1

nome

Satildeo PauloTricolor Paulista

PART_OF

SPARQL (recomendaccedilatildeo W3C)rlm

Exemplo de expressatildeo em SPARQL

SELECTrlmconceptrlm propertyrlm ldquoSatildeorlmPaulordquo

WHERE

concept propertyhasProperty property

FILTER(property name)rlm

Linguagens de Regras (Prolog)

Rules

parent(x z)rlm - father(x z) v mother(x z)

sibling(x y)rlm- parent(x z) and parent(y z)

Knowledge base

father(_Maria _Joatildeo)

father(_Pedro _Joatildeo)

Query

sibling(_Maria x) rArr Yes rArr b = _PedrorArr b = _xyz1rArr b = _xyz2 rArr b = _xyz3rArr b = _xyz4

RIF (Rule Interchange Format)

A buyer buys an item from a seller if the seller sells it to the buyer John sells LeRif to Mary The fact Mary buys LeRif from John can be logically derived by a modus ponens argument

Document(

Prefix(cpt lthttpexamplecomconceptsgt)

Prefix(ppl lthttpexamplecompeoplegt)

Prefix(bks lthttpexamplecombooksgt)

Group ( Forall Buyer Item Seller (

cptbuy(Buyer Item Seller)

cptsell(Seller Item Buyer)

)

cptsell(pplJohn bksLeRif pplMary)

)

)

Controveacutersia sobre pilha de padrotildees

Peter F Patel-Schneider A Revised Architecture for Semantic

Web Reasoning Third Workshop on Principles and Practices of

Semantic Web Reasoning Dagstuhl Germany September

2005 LNCS 3703 Springer Verlag 2005

Ian Horrocks Bijan Parsia Peter F Patel-Schneider and

James Hendler Semantic Web Architecture Stack or Two

Towers Third Workshop on Principles and Practices of Semantic Web Reasoning Dagstuhl Germany September

2005 LNCS 3703 Springer Verlag 2005

Peter F Patel-Schneider Building the Semantic Web Tower

from RDF Straw Nineteenth International Joint Conference on

Artificial Intelligence Edinburgh Scotland August 2005

Proposta inicial (2000)rlm

21042010

10

Proposta regras(2005)rlm Proposta atual

Como estaacute a Web semacircntica hoje

Aacuterea de pesquisa muito ativa

Visa estender o papel dos computadores no

suporte a diversas atividades humanas

Usa ontologias e anotaccedilotildees semacircnticas para

catalogar recuperar e compor dados e serviccedilos

de processamento na Web

Desafios da Web semacircntica

Construccedilatildeo de ontologias

(Semi-)automatizada e interativa

Geraccedilatildeo de anotaccedilotildees semacircnticas de recursos

Muitas aplicaccedilotildees requerem automatizaccedilatildeo

Evoluccedilatildeo de ontologias

Checar se alteraccedilotildees natildeo introduzem inconsistecircncias e gerenciar

versotildees

Integraccedilatildeo de ontologias (ontology matching)

A obtenccedilatildeo de consenso eacute inviaacutevel em muitas domiacutenios

Deduccedilatildeoraciociacutenio

Teorias computaacuteveis e natildeo computaacuteveis ontologias inconsistentes

Ediccedilatildeo de Ontologias no Proteacutegeacute

Editor de ontologias e arcabouccedilo para o desenvolvimento de bases de conhecimento livre e de coacutedigo aberto baseado em Java

Suporta os modelos de frames (RDF) e OWL

Exporta as ontologias e bases de conhecimento para uma variedade de formatos incluindo RDF(S) OWL e XML Schema

Extensiacutevel via plugins

Construccedilatildeo de ontologias

Processo para geraccedilatildeo automatizada de

ontologias a partir de esboccedilos dados e

documentos (nova geraccedilatildeo de ferramentas)rlm

Entendimento do domiacutenio

Entendimento dos dados

Definiccedilatildeo das tarefas

Geraccedilatildeo semi-automaacutetica

Avaliaccedilatildeo de qualidade

Refinamento com interaccedilatildeo humana

21042010

11

Definiccedilotildees de ldquogeraccedilatildeo de ontologiardquoGrobenik and Mladenic 2006

Induccedilatildeo de conceitos (a partir das instacircncias)rlm

Induccedilatildeo de relaccedilotildees (a partir de conceitos e

instacircncias a eles associadas)rlm

Popular ontologia (dada uma ontologia e

instacircncias de seus conceitos)rlm

Geraccedilatildeo de uma ontologia completa (a partir

das instacircncias e algum conhecimentoinformaccedilatildeo)rlm

Atualizaccedilatildeoextensatildeo de ontologias (dada

uma ontologia e informaccedilatildeo como novas

instacircncias ou padrotildees de uso da ontologia)rlm

Document Clustering - Vector Model

Vector of word occurences in the documents

bull diK = TF(Wkdi) IDF(Wk)rlm

Where

bull TF(Wkdi) = number of times Wk occurs in document di

bull IDF(Wk) = log ( D DF(Wk))rlm

bull D = number of documents

bull DF(Wk) = number of documents in which word W occurs

Document distance metric

Anotaccedilotildees Semacircnticas(Kiryakov et al 2004)rlm

21042010

12

Anotaccedilatildeo Semacircntica de Documentos

Atribui agraves entidades que aparecem no documento ligaccedilotildees com suas descriccedilotildees semacircnticas na ontologia

Aplicaacutevel a qualquer tipo de texto (documentos HTML documentos de texto comuns campos de banco de dados entre outros)

Representaccedilatildeo das anotaccedilotildees

Intrusiva

Natildeo intrusiva

Confecccedilatildeo das anotaccedilotildees

bull Semi-Automaacutetica Associa palavras do texto a classes

instacircncias e propriedades da ontologia utilizando-se do

julgamento humano Esta associaccedilatildeo geralmente eacute efetuada

atraveacutes de interfaces ldquoarraste-e-solterdquo (eg OntoMat)rlm

bull Automaacutetica Aplica teacutecnicas de processamento de

linguagem natural aprendizado de maacutequina e extraccedilatildeo de

informaccedilatildeo entre outras para associar palavras agrave ontologia

Essas ferramentas podem utilizar ontologias padratildeo (eg

IEEE Standard Upper Ontology) ou ontologias de domiacutenios

especiacuteficos (eg Unified Medical Language System)

bull Hiacutebrida Combinaccedilatildeo das teacutecnicas acima

Geraccedilatildeo de anotaccedilotildees semacircnticas (Reeve e Han 2005)rlm

Ferramentas para anotaccedilatildeo

Annozilla Funciona sobre o Mozzila Firefox

Annotea projeto da W3C - servidor de anotaccedilotildees em RDF

Armadillo

Muse

Pankol

Semantic Word anotaccedilatildeo interativa de porccedilotildees de documentos

Word

OntoMat Annotizer anotaccedilatildeo interativa de paacuteginas Web com

ontologias em OWL

Smore marcaccedilotildees sobre HTML com ontologias em OWL

Melita ferramenta de anotaccedilatildeo semi-automaacutetica que usa algoritmo

de IE para ajudar o usuaacuterio no processo de anotaccedilatildeo

MnM anotaccedilatildeo semacircntica de paacuteginas Web com metadados

descritos em RDFOCMLDAML+OIL

KIM permite criar metadados armazenar e buscar informaccedilotildees e

pode ser usada para anotaccedilatildeo e procura de documentos

21042010

13

O processo automatizado de anotaccedilatildeo semacircntica de documentos

Tokenizaccedilatildeo e Eliminaccedilatildeo de StopWords

Etiquetagem

Stemmer

Corpus Anotado

Identificaccedilatildeo EN

Associaccedilatildeo atermos da ontologia

RepositoacuterioSemacircntico

Tokensrelevantes

Palavras +Classificaccedilatildeo Gramatical

Radicais das Palavras +Classificaccedilatildeo Gramatical

Entidades Nomeadas

Anotaccedilatildeo Semacircntica

Dados Metadados Documento

s

Ontologia do Domiacutenio

Valida

Valida

Especialista

RepositoacuterioInformaccedilatildeo

Annotation example(Davies et al 2006)

Consider the phrase

There are deliverables

The tokens are

[There] [are] [deliverables] []

The tagger finds out what kind of a word each of the tokens

is (whether it is a noun an adjective a verb etc)rlm

[There] existential quantifier

[are] verbmdash3rd person singular present

[deliverables] nounmdashplural

Annotation example (cont)rlm

The morphological analyser gives the roots of all the words

[There] rootmdashthere

[are] rootmdashbe

[deliverables] rootmdashdeliverable

There are mdash mdashmdash

triggers the creation of one or more new classes in the

ontology

There are projects

There are workpackages tasks and deliverables

SEKT is a project

MUSINGrlmbdquoKnowledgerlmWeb‟rlmandrlmbdquoPrestorlmSpace‟rlmarerlmprojects

Projects have workpackages

Workpackages can have tasks

WP1 WP2 WP3 WP4 WP5 and WP6 are workpackages

SEKT has WP1

MUSING has WP2 WP3 and WP4

bdquoKnowledgerlmWeb‟rlmhasrlmWP5 and WP6

Annotation example (cont)rlm

Ontologia resultante Quadro Comparativo(Nunes e Fileto 2007)rlm

21042010

14

Dependecircncias entre plataformas(Rui Tramontin Junior 2007)rlm

Comparaccedilatildeo de desempenho(Reeve e Han 2005)rlm

Prataforma Categoria Precisatildeo Cobertura Medida F

Armadillo Descoberta de padrotildees

910 740 870

KIM Regras 860 820 840

MnM Induccedilatildeo 950 900 nd

MUSE Regras 935 923 929

PANKOW Descoberta de padrotildees

650 282 249

SemTag Regras 820 nd nd

Evoluccedilatildeo de ontologias(Bloehdorn et al 2006)rlm

Exemplo Uso natildeo uniforme de conceitos

Alternativas para remoccedilatildeo do conceito C que tem sub-conceitos

Processo de evoluccedilatildeo de ontologias

CapturaCaptura

da

Mudanccedila

Representaccedilatildeo Semacircntica Propagaccedilatildeo Implementaccedilatildeo Validaccedilatildeo

Fases Elementares

21042010

15

Mapeamentos entre ontologias(Ontology Matching)

Fusatildeo de ontologias

Processo semi-automatico de alinhamento(Huang at al 2006)rlm

Referecircncia

Jerome Euzenat INRIA Rhone-Alpes France

Pavel Shvaiko University of Trento Italy

Ontology Matching

URL httpbookontologymatchingorg

Springer-Verlag Heidelberg (DE) 2007

343 p 67 illus Hardcover

ISBN 978-3-540-49611-3

E as buscas semacircnticas

Recuperaccedilatildeo da informaccedilatildeo de documentosrlm

Medidas da eficaacutecia das soluccedilotildees

precisatildeo = nro de docs relevantes recuperadosnro de docs recuperados

cobertura = nro de docs relevantes recuperadosnro de docs relevantes

21042010

16

Classificaccedilatildeo de abordagens para buscas semacircnticas (Mangold 2007)

Arquitetura

Acoplamento entre ontologias e documentos

Transparecircncia

Contexto do usuaacuterio

Modificaccedilatildeo de consultas

Estrutura das ontologias

Tecnologia para representar as ontologias

Desempenho escalabilidade e distribuiccedilatildeo

Adaptabilidade

Ranking

Arquiteturas para buscas semacircnticas

Maacutequina de busca stand_alone armazenametadados sobre os documentos em iacutendicescom os quais avalia as consultas

Meta-maacutequina de busca distribui asconsultas para outras maacutequinas de busca ecombina os resultados

Acoplamento ontologias-documentos

Acoplamento forte os metadados dosdocumentos referem-se explicitamente aosconceitos de uma ontologia e vice-versa(requer anotaccedilatildeo semacircntica)rlm

Acoplamento fraco os documentos satildeoindependentes de quaisquer ontologiasdisponiacuteveis (pode restringir a capacidade debusca)rlm

Contexto do usuaacuterio

Learning extraiacutedo na interaccedilotildees do usuaacuteriocom o sistema (histoacuterico das consultas erefinamentos de consultas)rlm

Hard-coded as consultas satildeo organizadas emcategorias que definem a informaccedilatildeo solicitada(eg ldquolocation ofrdquo ldquoresources forrdquo rlm(

Modificaccedilatildeo de consultas

Manual o sistema retorna um trechoapropriado da ontologia junto com a respostapermitindo ao usuaacuterio navegar na ontologia ereformular a consulta pela adiccedilatildeo e remoccedilatildeo determos

Re-escrita automaacutetica a consulta eacuteotimizada automaticamente pelo sistema

Baseada em grafo considera conceitos edocumentos como nodos de um grafoefetuando propagaccedilatildeo da consulta a partir dosnodos correspondentes a termos de busca

Modificaccedilatildeo de consultas

Modificaccedilatildeo de consulta

Manual

Re-escrita de consulta

Baseada em grafo

Inserccedilatildeo de termoRemoccedilatildeo de termo

Substituiccedilatildeo de termo

Conjuntiva

Disjuntiva

Conjuntiva Disjuntiva

21042010

17

Estrutura da ontologia

Propriedades anocircnimas as relaccedilotildees entreconceitos natildeo satildeo nomeadas indicando apenasque eles compartilham o mesmo contexto

Propriedades padronizadas sinocircniacutemiahiperniacutemia meroniacutemia negaccedilatildeo etc

Propriedades especiacuteficas de domiacutenio aleacutemdas propriedades padratildeo considerapropriedades especiacuteficas de um domiacutenio (egldquotipo de cacircmerardquo em sistema para a aacuterea defotografia)rlm

Tecnologia da ontologia

F-Logic

RDF

DAML+OIL

Frames

OWL

Comparaccedilatildeo de abordagens Comparaccedilatildeo de abordagens (cont)

Buscas semacircnticas na Web hoje

httpwwwaliprcom (imagens)rlm

httpwwwcognitioncom

httpwwwdeepdyvecom

httpwwwbingcom

httpwwwcuilcom

httpwwwfreebasecom

httpwwwgooglecom

httpwwwkosmixcom

httpwwwhakiacom

httpwwwpowersetcom

httpwwwsensebotnet

httpdeveloperyahoocomsearchmonkey

httpswoogleumbcedu (ontologias)rlm

21042010

18

21042010

19

SAO PAULO-SP

University of Sao Paulo

Sao Paulo Fashion

Sao Paulo Fashion Week

Sao Paulo State

Sao Paulo Hotel

Sao Paulo Hotels

Sao Paulo Brasilien

Sao Paulo Congonhas

21042010

20

21042010

21

Sao Paulo Airport

Sao Paulo Plane Crash

Sao Paulo Zoo

hellip

21042010

22

21042010

23

Algumas questotildees em aberto

Representaccedilatildeo de contextos de usuaacuterios emapeamento desses a ontologias

Anaacutelise dos efeitos de modificaccedilotildees de consultas

Meta-buscas semacircnticas

Anaacutelise da aceitaccedilatildeo dos usuaacuterios

Adaptabilidade a diferentes ontologias

Ranking dos resultados

Integraccedilatildeo com sistemas de gerenciamento dedocumentosconteuacutedo

Tratamento de dados multimiacuteda

Interfaces homem-maacutequina

Desempenho e escalabilidade

Contextual Semantic Search (CSS)(DAgostine Fileto ndash SBBD2007)rlm

21042010

24

General Architecture for CSSThe Weighted Topic Graph(DAgostine Fileto Dantas Gauthier - ICEIS 2008)rlm

A weighted topic graph is a graph TM(T A)rlm

T is a set of topics (vertices)rlm

A is a set of associations (edges)rlm

Let be an ontology O

Each topic t in T corresponds to a ontology term o in O

Each topic t has a weight [01] The sum from the weights from all topics with same name equals 1

Each association a has a weight [01] The sum

from all the weights from all association departing

a single topics equals 1

Topic weights used to disambiguate

Eg interest in Satildeo Paulo city instead of Satildeo Paulo

state

Association weights used to semantically

expand searches

Eg Actual interest in Guarulhos and airport while

searching for Satildeo Paulo city

The Weights in the Topic Graph Capturing the Users Context

Generated Topic Graph with the Ontological Users Context

The Contextual Semantic Search Process

21042010

25

Desambiguaccedilatildeo

Fundamento dos algoritmos de busca sobre contexto ontoloacutegico

Heuriacutesticas de estigmergia (Ant Colony Optimization - ACO)

Traccedilos de ferormocircnio

Algoritmo de busca semacircntica baseada em ACO

Entrada palavras-chave[ ]

Dados G(TA) Onto repositoacuterio

limite_de_profundidade

limite_miacutenimo_de_peso

λ fator de atenuaccedilatildeo de peso

iniacutecio Algoritmo Busca Contextual 1 Estigmeacuterica

resultados = busca_G_ou_Onto(palavras-chave[])

atenuaG (iacutendice ) λrlmisin [0 1]

manutenccedilatildeo(coleta_feedback(resultados))

fim

21042010

26

Demo Praestro ndash Karina Fasolin

Alguns trabalhos relacionados

Name Article Comments

Graupmann

et al 2005

The SphereSearch

engine for unifiedranked retrieval of

heterogeneous XML

and web documents

Searches through XML documents The context is a region in radius

around given element A data inside two regions is considered relevant

to both contexts

Made tests with large collections like DBLP INEX Wikipedia put for

stress testing regarding the size of the collection

ldquoLet us first comment on the difficulties of defining a meaningfulbenchmark for this kind of novel systemrdquo

Park e

Cheyer 2006

Just For Me Topic

Maps and Ontologies

Manages knowledge in three layers Topics Knowledge Structures and

Documents

Not implemented (at least at the time of publication)

Michlmayr

et al 2007Adaptive User Profiles

for Enterprise

Information Access

Represents context as an individual graph The graph is constructed

based on tags used to semantically annotate the content which the user

considers to be relevant

However the tags are only that only labels They are not tied-down to

a formal definition

Alguns trabalhos relacionados (cont)

Name Article Comments

Aleman-

Meza et a

2003

Context-Aware

Semantic Association

Ranking

Also defines context as regions But the regions are static defined in

the ontology which is used by the system So the contexts are defined

the same for every single user

Mani and

Sundaram

2007

Modeling user context

with applications to

media retrieval

Creates a graph representing the users context Each node

corresponds to an instance in the ontology The edges represent

relations between the instances Built to search trough multimedia

documents

However it does not associates the vocabulary the user uses with the

instances

Challam et

al 2007

Contextual Search

Using Ontology-Based

User Profiles

Monitors the users activity capturing content from open Internet

Explorer MS-Office and MSN The captured information is stored and

usedrlmtorlmbuildrlmarlmuser‟srlmcontextualrlmprofilerlmbasesrlmonrlmanrlmontology

The context is tightly coupled with the ontology

NO IMAGES WERE

PROVIDED

Vallet et al

2006

Personalized

Information Retrieval in

Context

Stores context as a graph constructed based on the ontology used by

the system Similar to Mani and Sundaram including its limitations

(mapping the vocabulary) however if built for text documents

Sieg et al

2007

Ontological User

Profiles for

Personalized Web

Search

Similar to Challam et al but it gets the context information from the

ontology terms used to annotate the retrieved relevant context

Also limited by the structure of the ontology

Alguns trabalhos relacionados(cont)

Name Deals with

objective

knowledge

(ontology)

Deals with

subjective

knowledge

(users

context)

The knowledge

management is

transparent

Idea Implemented

Graupmann et

al 2005

X IMPL

Park e Cheyer

2006

X X X IDEA

Michlmayr et al2007

X X IMPL

Aleman-Meza et

a 2003

X X IMPL

Mani eSundaram 2007

X X X IMPL

Challam et al

2007

X X X IMPL

Vallet et al 2006 X X X IMPL

Sieg et al 2007 X X X IMPL

(incomplete)

Praestro X X X IMPL

(prototype)

UnA-SUS ndash Universidade Aberta do SUS

Programa do Ministeacuterio da Sauacutede para atender necessidades de e

permanente dos

Accedilotildees focadas em

formulaccedilatildeo de conteuacutedo

bibliotecas digitais

cursos a distacircncia

21042010

27

Metas da UnA-SUS

Desenvolver um

plataforma para de

composiccedilatildeo e de

Montar e oferecer cursos para formaccedilatildeo continuada de profissionais da sauacutede

157

Metadados

O processo de produccedilatildeo catalogaccedilatildeo e reuso de OAs

Repositoacuterio

Conteuacutedo

OAs

requisiccedilotildees

Design revisatildeo e publicaccedilatildeo

OA

SGA outros reps

Busca e reuso

OAsMetadados

OAs

Concepccedilatildeo e validaccedilatildeo de OAs

O processo de produccedilatildeo catalogaccedilatildeo e reuso de OAs

OA1

Curso A

Curso B

OA2

OA3

Viacutedeo

Imagens

RepositoacuteriosConteuacutedoMultimiacutedia

SGA RepositoacuteriosOAs

Reuso eacute essencial

bull OAs satildeo caros para produzir

bull Demandas emergenciais na sauacutede puacuteblica exigem agilidade e pronta resposta com cursos para a qualificaccedilatildeo de profissionais

H1N1

Apoplexia

gripe suiacutena gripe A

influenza H1N1

hellip

21042010

28

Navegaccedilatildeo hiperboacutelica no DeCSCatalogaccedilatildeo de Objetos de Aprendizagem (OAs) usando Vocabulaacuterios Controlados

bull Seleccedilatildeo de termos do DeCS CID-10 SNOMED

ndash via fornecimento de palavras-chave que satildeo pesquisadas na base de conhecimento

ndash via navegaccedilatildeo em uma visatildeo do conhecimento em forma de aacutervore

Seleccedilatildeo via contexto ontoloacutegicoProtoacutetipo (catalogaccedilatildeo com entrada

de palavra-chave)

DSpaceCatalogaccedilatildeo de OAswf

Protoacutetipo (catalogaccedilatildeo com navegaccedilatildeo

na base de conhecimento)

DSpaceRecuperaccedilatildeo de OAswf

21042010

29

Recuperaccedilatildeo de Objetos de Aprendizagem (OAs) Baseada em Conhecimento

bull Vocabulaacuterios e relaccedilotildees semacircnticas

ndash Oriundos do DeCS

ndash Definidos pelos catalogadores de OAs

ndash Gerados pelo cruzamento de informaccedilotildees com o CID-10 (Classificaccedilatildeo Internacional de Doenccedilas)

ndash Ex sinocircnimos eacute um(a) parte de causa efeito sintoma etc

DeCs

Anatomia

Sistema Nervoso

Sistema Nervoso Central

Enceacutefalo

Prosenceacutefalo

Telencaacutefalo

Ceacuterebro

Doenccedilas

Doenccedilas do Sistema Nervoso

Doenccedilas Cardiovasculares

Doenccedilas do Sistema Nervoso Central

Encefalopatias

Transtornos Cerebrovasculares

Doenccedilas Vasculares

Transtornos Cerebrovasculares

Acidente Vascular Cerebral

Acidente Vascular Cerebral

OA 1

OA 2

AVC

IctusCerebral

Derrame Cerebral

Hemisfeacuterios Cerebrais

ApoplexiaAcidente

Cerebrovascular

IctoCerebral

Apoplexia Cerebrovascular

Apoplexia Cerebral

Acidente Vascular

Encefaacutelico

Acidente Vascular

do Ceacuterebro

Acidente Vascular Cerebral

padratildeo (sinocircnimo)

anota

especiacutefica de domiacutenio

anocircnimas (DeCs)

172

DeCs

Anatomia

Sistema Nervoso

Sistema Nervoso Central

Enceacutefalo

Prosenceacutefalo

Telencaacutefalo

Ceacuterebro (2)

Doenccedilas

Doenccedilas do Sistema Nervoso

Doenccedilas Cardiovasculares

Doenccedilas do Sistema Nervoso Central

Encefalopatias

Transtornos Cerebrovasculares

Doenccedilas Vasculares

Transtornos Cerebrovasculares

Acidente Cerebral Vascular (1)

Acidente Cerebral Vascular(1)

OA 1

OA 2

AVC

IctusCerebral

Derrame Cerebral

Hemisfeacuterios Cerebrais

ApoplexiaAcidente

Cerebrovascular

IctoCerebral

Apoplexia Cerebrovascular

Apoplexia Cerebral

Acidente Vascular

Encefaacutelico

Acidente Vascular

do Ceacuterebro

Acidente Vascular Cerebral

Busca de OAs na aacuterea de sauacutede usando conhecimento de domiacutenio

Semantic Learning Objects (VIAN J SILVEIRA R A FILETO R WCCE 2009)

21042010

30

Conclusotildees

A Web semacircntica tem potencial de contribuir naobtenccedilatildeo de melhores resultados para buscas

Suporte automatizado eacute fundamental para a construccedilatildeo evoluccedilatildeo e integraccedilatildeo de ontologias anotaccedilotildees semacircnticas e contextos de usuaacuterios

Nossos primeiros resultados focam na captura e utilizaccedilatildeo de contextos de usuaacuterios mapeados a ontologias de domiacutenios especiacuteficos paradesambiguar e estender as buscas

Trabalhos futuros

Processos parcialmente automatizados para geraccedilatildeo e atualizaccedilatildeo de ontologias e anotaccedilotildees semacircnticas

Experimentos para comprovar a eficaacutecia das teacutecnicas e ferramentas utilizadas

Validaccedilatildeo de soluccedilotildees de problemas de busca semacircntica em diversos domiacutenios de aplicaccedilatildeo

Determinaccedilatildeo de niacuteveis adequados de acoplamento entre contextos e ontologias e dessas com os recursos a serem recuperados

Notiacutecias e anaacutelises

httpnewscnetcomnew-search-engine-cuil-takes-aim-at-google

httpwwwreadwritewebcomarchivesis_google_a_semantic_search_enginephp

httpwwwreadwritewebcomarchivessemantic_search_the_myt

h_and_realityphp

httpwwwpandiacomsew1262-top-5-semantic-search-

engineshtml

httpmindsetresearchyahoocom

httpnewscnetcom8301-13953_3-9982015-80html

httpwwwsearchenginejournalcomaskcom-focuses-on-semantic-search8252

httpnewsbbccouk2hiprogrammesclick_onlinedefaultstm

httpnewsbbccouk2hiprogrammesclick_online8144765stm

Web semacircntica e buscassemacircnticas

httpwwww3org2001sw

httpsemanticweborg

httpenwikipediaorgwikiSemantic_Web

httpenwikipediaorgwikiSemantic_search

Ferramentas de desenvolvimento

httpprotegestanfordedu

httpjenasourceforgenet

httpwwww3org2001Annotea

httpwwwontotextcomkim

httpesww3orgtopicSemanticWebTools

httpwwwdamlorg200305swmu-tools-

tutorialOverviewhtml

Referecircncias em Web semacircntica

T Berners-Lee J Hendler e O Lassila The Semantic Web Scientific American May 2001

Thomas B Passing Explores Guide to the Semantic Web Manning Publications Greenwich CT 2005

Davies J Studer R Warren P (Eds) Semantic Web Technologies trends and research in ontology-based

Systems John Wiley amp Sons 2006

Breitman KK Casanova MA Truszkowski W Semantic Web

Concepts Technologies and Applications Series NASA Monographs in Systems and Software Engineering Springer 2007

Grigoris Antoniou and Frank van Harmelen A Semantic Web Primer 2nd edition The MIT Press Cambridge MA USA 2008

Kashyap V Bussler C Moran M The Semantic Web -Semantics for Data and Services on the Web Series Data-

Centric Systems and Applications Springer 2008

Hitzler P Krotzsch M Rudolph S Foundations of SemanticWeb Technologies Chapman amp HallCRC 2009

21042010

31

Referecircncias em buscas semacircnticas

Guha R McCool R and Miller E 2003 Semantic search In Proc of the 12th international Conference on World Wide Web

(WWW) Budapest Hungary ACM New York NY 2003 700-709

Reeve L and Han H 2005 Survey of semantic annotation

platforms In Proceedings of the ACM Symposium on Applied Computing Santa Fe New Mexico ACM New York NY 2005

1634-1638

Eetu Makela Survey of Semantic Search Research

Mangold C A Survey and classification of semantic search approaches Journal of Metadata Semantics and Ontology 2(1)

2007

Stephan Bloehdorn Philipp Cimiano Alistair Duke Peter Haase Joumlrg Heizmann Ian Thurlow Johanna Voumllker Ontology-BasedQuestion Answering for Digital Libraries ECDL 2007 14-25

Hai Dong Hussain FK Chang E A survey in semantic search technologies In 2nd IEEE International Conference on

Digital Ecosystems and Technologies 2008 403-408

Algumas referecircncias grupo UFSC

DAgostini C S Fileto R Capturing Users Preferences and Intentions in a Semantic Search System In 21st International

Conference on Software Engineering amp Knowledge Engineering (SEKE) Boston 2009 p 587-591

DAgostini C S Fileto R Dantas M A R Gauthier F A O

Contextual Semantic Search - Capturing using the UsersContext to Direct Semantic Search In 10th InternationalConference on Enterprise Information Systems (ICEIS) Barcelona

Spain 2008 v SAIC p 154-159

DAgostini C S Fileto R Capturing and managing usercontext for improving information retrieval In Workshop de

Teses e Dissertaccedilotildees do Simpoacutesio Brasileiro de Bancos de Dados (WTDBDSBBD) Campinas Unicamp Brazil 2008

Vian J Silveira R A Fileto R Proposal of a Multi-agent System for Indexing and Recovery applied to Learning

Objects In 9th IFIP World Conference on Computers in Education (WCCE) Bento Goncalves Brazil 2009

Alguns projetos na UFSC

httpwwwlisaufscbrprojetos

httpwwwunasusufscbr

httpwwwliteraturabrasileiraufscbr

Perguntas

Page 9: Buscas Semânticasfileto/Talks/BuscasSemanticas6sp.pdf · 21/04/2010 1 1 Buscas semânticas: panorama e tendências atuais minicurso ERBD 2010 RenatoFileto fileto@inf.ufsc.br AlunosColaboradores:

21042010

9

Busca em uma ontologia

Pessoa

Santo

S1

IS_A

TYPE_OF

nome

Satildeo Paulo

Time

TimeFutebol

TF1

IS_A

TYPE_OF

nome

Satildeo Paulo

ParcelaTerritoacuterio

Estado

IS_A

Cidade

E1

TYPE_OF

nome

Satildeo Paulo

C1

nome

Satildeo PauloTricolor Paulista

PART_OF

SPARQL (recomendaccedilatildeo W3C)rlm

Exemplo de expressatildeo em SPARQL

SELECTrlmconceptrlm propertyrlm ldquoSatildeorlmPaulordquo

WHERE

concept propertyhasProperty property

FILTER(property name)rlm

Linguagens de Regras (Prolog)

Rules

parent(x z)rlm - father(x z) v mother(x z)

sibling(x y)rlm- parent(x z) and parent(y z)

Knowledge base

father(_Maria _Joatildeo)

father(_Pedro _Joatildeo)

Query

sibling(_Maria x) rArr Yes rArr b = _PedrorArr b = _xyz1rArr b = _xyz2 rArr b = _xyz3rArr b = _xyz4

RIF (Rule Interchange Format)

A buyer buys an item from a seller if the seller sells it to the buyer John sells LeRif to Mary The fact Mary buys LeRif from John can be logically derived by a modus ponens argument

Document(

Prefix(cpt lthttpexamplecomconceptsgt)

Prefix(ppl lthttpexamplecompeoplegt)

Prefix(bks lthttpexamplecombooksgt)

Group ( Forall Buyer Item Seller (

cptbuy(Buyer Item Seller)

cptsell(Seller Item Buyer)

)

cptsell(pplJohn bksLeRif pplMary)

)

)

Controveacutersia sobre pilha de padrotildees

Peter F Patel-Schneider A Revised Architecture for Semantic

Web Reasoning Third Workshop on Principles and Practices of

Semantic Web Reasoning Dagstuhl Germany September

2005 LNCS 3703 Springer Verlag 2005

Ian Horrocks Bijan Parsia Peter F Patel-Schneider and

James Hendler Semantic Web Architecture Stack or Two

Towers Third Workshop on Principles and Practices of Semantic Web Reasoning Dagstuhl Germany September

2005 LNCS 3703 Springer Verlag 2005

Peter F Patel-Schneider Building the Semantic Web Tower

from RDF Straw Nineteenth International Joint Conference on

Artificial Intelligence Edinburgh Scotland August 2005

Proposta inicial (2000)rlm

21042010

10

Proposta regras(2005)rlm Proposta atual

Como estaacute a Web semacircntica hoje

Aacuterea de pesquisa muito ativa

Visa estender o papel dos computadores no

suporte a diversas atividades humanas

Usa ontologias e anotaccedilotildees semacircnticas para

catalogar recuperar e compor dados e serviccedilos

de processamento na Web

Desafios da Web semacircntica

Construccedilatildeo de ontologias

(Semi-)automatizada e interativa

Geraccedilatildeo de anotaccedilotildees semacircnticas de recursos

Muitas aplicaccedilotildees requerem automatizaccedilatildeo

Evoluccedilatildeo de ontologias

Checar se alteraccedilotildees natildeo introduzem inconsistecircncias e gerenciar

versotildees

Integraccedilatildeo de ontologias (ontology matching)

A obtenccedilatildeo de consenso eacute inviaacutevel em muitas domiacutenios

Deduccedilatildeoraciociacutenio

Teorias computaacuteveis e natildeo computaacuteveis ontologias inconsistentes

Ediccedilatildeo de Ontologias no Proteacutegeacute

Editor de ontologias e arcabouccedilo para o desenvolvimento de bases de conhecimento livre e de coacutedigo aberto baseado em Java

Suporta os modelos de frames (RDF) e OWL

Exporta as ontologias e bases de conhecimento para uma variedade de formatos incluindo RDF(S) OWL e XML Schema

Extensiacutevel via plugins

Construccedilatildeo de ontologias

Processo para geraccedilatildeo automatizada de

ontologias a partir de esboccedilos dados e

documentos (nova geraccedilatildeo de ferramentas)rlm

Entendimento do domiacutenio

Entendimento dos dados

Definiccedilatildeo das tarefas

Geraccedilatildeo semi-automaacutetica

Avaliaccedilatildeo de qualidade

Refinamento com interaccedilatildeo humana

21042010

11

Definiccedilotildees de ldquogeraccedilatildeo de ontologiardquoGrobenik and Mladenic 2006

Induccedilatildeo de conceitos (a partir das instacircncias)rlm

Induccedilatildeo de relaccedilotildees (a partir de conceitos e

instacircncias a eles associadas)rlm

Popular ontologia (dada uma ontologia e

instacircncias de seus conceitos)rlm

Geraccedilatildeo de uma ontologia completa (a partir

das instacircncias e algum conhecimentoinformaccedilatildeo)rlm

Atualizaccedilatildeoextensatildeo de ontologias (dada

uma ontologia e informaccedilatildeo como novas

instacircncias ou padrotildees de uso da ontologia)rlm

Document Clustering - Vector Model

Vector of word occurences in the documents

bull diK = TF(Wkdi) IDF(Wk)rlm

Where

bull TF(Wkdi) = number of times Wk occurs in document di

bull IDF(Wk) = log ( D DF(Wk))rlm

bull D = number of documents

bull DF(Wk) = number of documents in which word W occurs

Document distance metric

Anotaccedilotildees Semacircnticas(Kiryakov et al 2004)rlm

21042010

12

Anotaccedilatildeo Semacircntica de Documentos

Atribui agraves entidades que aparecem no documento ligaccedilotildees com suas descriccedilotildees semacircnticas na ontologia

Aplicaacutevel a qualquer tipo de texto (documentos HTML documentos de texto comuns campos de banco de dados entre outros)

Representaccedilatildeo das anotaccedilotildees

Intrusiva

Natildeo intrusiva

Confecccedilatildeo das anotaccedilotildees

bull Semi-Automaacutetica Associa palavras do texto a classes

instacircncias e propriedades da ontologia utilizando-se do

julgamento humano Esta associaccedilatildeo geralmente eacute efetuada

atraveacutes de interfaces ldquoarraste-e-solterdquo (eg OntoMat)rlm

bull Automaacutetica Aplica teacutecnicas de processamento de

linguagem natural aprendizado de maacutequina e extraccedilatildeo de

informaccedilatildeo entre outras para associar palavras agrave ontologia

Essas ferramentas podem utilizar ontologias padratildeo (eg

IEEE Standard Upper Ontology) ou ontologias de domiacutenios

especiacuteficos (eg Unified Medical Language System)

bull Hiacutebrida Combinaccedilatildeo das teacutecnicas acima

Geraccedilatildeo de anotaccedilotildees semacircnticas (Reeve e Han 2005)rlm

Ferramentas para anotaccedilatildeo

Annozilla Funciona sobre o Mozzila Firefox

Annotea projeto da W3C - servidor de anotaccedilotildees em RDF

Armadillo

Muse

Pankol

Semantic Word anotaccedilatildeo interativa de porccedilotildees de documentos

Word

OntoMat Annotizer anotaccedilatildeo interativa de paacuteginas Web com

ontologias em OWL

Smore marcaccedilotildees sobre HTML com ontologias em OWL

Melita ferramenta de anotaccedilatildeo semi-automaacutetica que usa algoritmo

de IE para ajudar o usuaacuterio no processo de anotaccedilatildeo

MnM anotaccedilatildeo semacircntica de paacuteginas Web com metadados

descritos em RDFOCMLDAML+OIL

KIM permite criar metadados armazenar e buscar informaccedilotildees e

pode ser usada para anotaccedilatildeo e procura de documentos

21042010

13

O processo automatizado de anotaccedilatildeo semacircntica de documentos

Tokenizaccedilatildeo e Eliminaccedilatildeo de StopWords

Etiquetagem

Stemmer

Corpus Anotado

Identificaccedilatildeo EN

Associaccedilatildeo atermos da ontologia

RepositoacuterioSemacircntico

Tokensrelevantes

Palavras +Classificaccedilatildeo Gramatical

Radicais das Palavras +Classificaccedilatildeo Gramatical

Entidades Nomeadas

Anotaccedilatildeo Semacircntica

Dados Metadados Documento

s

Ontologia do Domiacutenio

Valida

Valida

Especialista

RepositoacuterioInformaccedilatildeo

Annotation example(Davies et al 2006)

Consider the phrase

There are deliverables

The tokens are

[There] [are] [deliverables] []

The tagger finds out what kind of a word each of the tokens

is (whether it is a noun an adjective a verb etc)rlm

[There] existential quantifier

[are] verbmdash3rd person singular present

[deliverables] nounmdashplural

Annotation example (cont)rlm

The morphological analyser gives the roots of all the words

[There] rootmdashthere

[are] rootmdashbe

[deliverables] rootmdashdeliverable

There are mdash mdashmdash

triggers the creation of one or more new classes in the

ontology

There are projects

There are workpackages tasks and deliverables

SEKT is a project

MUSINGrlmbdquoKnowledgerlmWeb‟rlmandrlmbdquoPrestorlmSpace‟rlmarerlmprojects

Projects have workpackages

Workpackages can have tasks

WP1 WP2 WP3 WP4 WP5 and WP6 are workpackages

SEKT has WP1

MUSING has WP2 WP3 and WP4

bdquoKnowledgerlmWeb‟rlmhasrlmWP5 and WP6

Annotation example (cont)rlm

Ontologia resultante Quadro Comparativo(Nunes e Fileto 2007)rlm

21042010

14

Dependecircncias entre plataformas(Rui Tramontin Junior 2007)rlm

Comparaccedilatildeo de desempenho(Reeve e Han 2005)rlm

Prataforma Categoria Precisatildeo Cobertura Medida F

Armadillo Descoberta de padrotildees

910 740 870

KIM Regras 860 820 840

MnM Induccedilatildeo 950 900 nd

MUSE Regras 935 923 929

PANKOW Descoberta de padrotildees

650 282 249

SemTag Regras 820 nd nd

Evoluccedilatildeo de ontologias(Bloehdorn et al 2006)rlm

Exemplo Uso natildeo uniforme de conceitos

Alternativas para remoccedilatildeo do conceito C que tem sub-conceitos

Processo de evoluccedilatildeo de ontologias

CapturaCaptura

da

Mudanccedila

Representaccedilatildeo Semacircntica Propagaccedilatildeo Implementaccedilatildeo Validaccedilatildeo

Fases Elementares

21042010

15

Mapeamentos entre ontologias(Ontology Matching)

Fusatildeo de ontologias

Processo semi-automatico de alinhamento(Huang at al 2006)rlm

Referecircncia

Jerome Euzenat INRIA Rhone-Alpes France

Pavel Shvaiko University of Trento Italy

Ontology Matching

URL httpbookontologymatchingorg

Springer-Verlag Heidelberg (DE) 2007

343 p 67 illus Hardcover

ISBN 978-3-540-49611-3

E as buscas semacircnticas

Recuperaccedilatildeo da informaccedilatildeo de documentosrlm

Medidas da eficaacutecia das soluccedilotildees

precisatildeo = nro de docs relevantes recuperadosnro de docs recuperados

cobertura = nro de docs relevantes recuperadosnro de docs relevantes

21042010

16

Classificaccedilatildeo de abordagens para buscas semacircnticas (Mangold 2007)

Arquitetura

Acoplamento entre ontologias e documentos

Transparecircncia

Contexto do usuaacuterio

Modificaccedilatildeo de consultas

Estrutura das ontologias

Tecnologia para representar as ontologias

Desempenho escalabilidade e distribuiccedilatildeo

Adaptabilidade

Ranking

Arquiteturas para buscas semacircnticas

Maacutequina de busca stand_alone armazenametadados sobre os documentos em iacutendicescom os quais avalia as consultas

Meta-maacutequina de busca distribui asconsultas para outras maacutequinas de busca ecombina os resultados

Acoplamento ontologias-documentos

Acoplamento forte os metadados dosdocumentos referem-se explicitamente aosconceitos de uma ontologia e vice-versa(requer anotaccedilatildeo semacircntica)rlm

Acoplamento fraco os documentos satildeoindependentes de quaisquer ontologiasdisponiacuteveis (pode restringir a capacidade debusca)rlm

Contexto do usuaacuterio

Learning extraiacutedo na interaccedilotildees do usuaacuteriocom o sistema (histoacuterico das consultas erefinamentos de consultas)rlm

Hard-coded as consultas satildeo organizadas emcategorias que definem a informaccedilatildeo solicitada(eg ldquolocation ofrdquo ldquoresources forrdquo rlm(

Modificaccedilatildeo de consultas

Manual o sistema retorna um trechoapropriado da ontologia junto com a respostapermitindo ao usuaacuterio navegar na ontologia ereformular a consulta pela adiccedilatildeo e remoccedilatildeo determos

Re-escrita automaacutetica a consulta eacuteotimizada automaticamente pelo sistema

Baseada em grafo considera conceitos edocumentos como nodos de um grafoefetuando propagaccedilatildeo da consulta a partir dosnodos correspondentes a termos de busca

Modificaccedilatildeo de consultas

Modificaccedilatildeo de consulta

Manual

Re-escrita de consulta

Baseada em grafo

Inserccedilatildeo de termoRemoccedilatildeo de termo

Substituiccedilatildeo de termo

Conjuntiva

Disjuntiva

Conjuntiva Disjuntiva

21042010

17

Estrutura da ontologia

Propriedades anocircnimas as relaccedilotildees entreconceitos natildeo satildeo nomeadas indicando apenasque eles compartilham o mesmo contexto

Propriedades padronizadas sinocircniacutemiahiperniacutemia meroniacutemia negaccedilatildeo etc

Propriedades especiacuteficas de domiacutenio aleacutemdas propriedades padratildeo considerapropriedades especiacuteficas de um domiacutenio (egldquotipo de cacircmerardquo em sistema para a aacuterea defotografia)rlm

Tecnologia da ontologia

F-Logic

RDF

DAML+OIL

Frames

OWL

Comparaccedilatildeo de abordagens Comparaccedilatildeo de abordagens (cont)

Buscas semacircnticas na Web hoje

httpwwwaliprcom (imagens)rlm

httpwwwcognitioncom

httpwwwdeepdyvecom

httpwwwbingcom

httpwwwcuilcom

httpwwwfreebasecom

httpwwwgooglecom

httpwwwkosmixcom

httpwwwhakiacom

httpwwwpowersetcom

httpwwwsensebotnet

httpdeveloperyahoocomsearchmonkey

httpswoogleumbcedu (ontologias)rlm

21042010

18

21042010

19

SAO PAULO-SP

University of Sao Paulo

Sao Paulo Fashion

Sao Paulo Fashion Week

Sao Paulo State

Sao Paulo Hotel

Sao Paulo Hotels

Sao Paulo Brasilien

Sao Paulo Congonhas

21042010

20

21042010

21

Sao Paulo Airport

Sao Paulo Plane Crash

Sao Paulo Zoo

hellip

21042010

22

21042010

23

Algumas questotildees em aberto

Representaccedilatildeo de contextos de usuaacuterios emapeamento desses a ontologias

Anaacutelise dos efeitos de modificaccedilotildees de consultas

Meta-buscas semacircnticas

Anaacutelise da aceitaccedilatildeo dos usuaacuterios

Adaptabilidade a diferentes ontologias

Ranking dos resultados

Integraccedilatildeo com sistemas de gerenciamento dedocumentosconteuacutedo

Tratamento de dados multimiacuteda

Interfaces homem-maacutequina

Desempenho e escalabilidade

Contextual Semantic Search (CSS)(DAgostine Fileto ndash SBBD2007)rlm

21042010

24

General Architecture for CSSThe Weighted Topic Graph(DAgostine Fileto Dantas Gauthier - ICEIS 2008)rlm

A weighted topic graph is a graph TM(T A)rlm

T is a set of topics (vertices)rlm

A is a set of associations (edges)rlm

Let be an ontology O

Each topic t in T corresponds to a ontology term o in O

Each topic t has a weight [01] The sum from the weights from all topics with same name equals 1

Each association a has a weight [01] The sum

from all the weights from all association departing

a single topics equals 1

Topic weights used to disambiguate

Eg interest in Satildeo Paulo city instead of Satildeo Paulo

state

Association weights used to semantically

expand searches

Eg Actual interest in Guarulhos and airport while

searching for Satildeo Paulo city

The Weights in the Topic Graph Capturing the Users Context

Generated Topic Graph with the Ontological Users Context

The Contextual Semantic Search Process

21042010

25

Desambiguaccedilatildeo

Fundamento dos algoritmos de busca sobre contexto ontoloacutegico

Heuriacutesticas de estigmergia (Ant Colony Optimization - ACO)

Traccedilos de ferormocircnio

Algoritmo de busca semacircntica baseada em ACO

Entrada palavras-chave[ ]

Dados G(TA) Onto repositoacuterio

limite_de_profundidade

limite_miacutenimo_de_peso

λ fator de atenuaccedilatildeo de peso

iniacutecio Algoritmo Busca Contextual 1 Estigmeacuterica

resultados = busca_G_ou_Onto(palavras-chave[])

atenuaG (iacutendice ) λrlmisin [0 1]

manutenccedilatildeo(coleta_feedback(resultados))

fim

21042010

26

Demo Praestro ndash Karina Fasolin

Alguns trabalhos relacionados

Name Article Comments

Graupmann

et al 2005

The SphereSearch

engine for unifiedranked retrieval of

heterogeneous XML

and web documents

Searches through XML documents The context is a region in radius

around given element A data inside two regions is considered relevant

to both contexts

Made tests with large collections like DBLP INEX Wikipedia put for

stress testing regarding the size of the collection

ldquoLet us first comment on the difficulties of defining a meaningfulbenchmark for this kind of novel systemrdquo

Park e

Cheyer 2006

Just For Me Topic

Maps and Ontologies

Manages knowledge in three layers Topics Knowledge Structures and

Documents

Not implemented (at least at the time of publication)

Michlmayr

et al 2007Adaptive User Profiles

for Enterprise

Information Access

Represents context as an individual graph The graph is constructed

based on tags used to semantically annotate the content which the user

considers to be relevant

However the tags are only that only labels They are not tied-down to

a formal definition

Alguns trabalhos relacionados (cont)

Name Article Comments

Aleman-

Meza et a

2003

Context-Aware

Semantic Association

Ranking

Also defines context as regions But the regions are static defined in

the ontology which is used by the system So the contexts are defined

the same for every single user

Mani and

Sundaram

2007

Modeling user context

with applications to

media retrieval

Creates a graph representing the users context Each node

corresponds to an instance in the ontology The edges represent

relations between the instances Built to search trough multimedia

documents

However it does not associates the vocabulary the user uses with the

instances

Challam et

al 2007

Contextual Search

Using Ontology-Based

User Profiles

Monitors the users activity capturing content from open Internet

Explorer MS-Office and MSN The captured information is stored and

usedrlmtorlmbuildrlmarlmuser‟srlmcontextualrlmprofilerlmbasesrlmonrlmanrlmontology

The context is tightly coupled with the ontology

NO IMAGES WERE

PROVIDED

Vallet et al

2006

Personalized

Information Retrieval in

Context

Stores context as a graph constructed based on the ontology used by

the system Similar to Mani and Sundaram including its limitations

(mapping the vocabulary) however if built for text documents

Sieg et al

2007

Ontological User

Profiles for

Personalized Web

Search

Similar to Challam et al but it gets the context information from the

ontology terms used to annotate the retrieved relevant context

Also limited by the structure of the ontology

Alguns trabalhos relacionados(cont)

Name Deals with

objective

knowledge

(ontology)

Deals with

subjective

knowledge

(users

context)

The knowledge

management is

transparent

Idea Implemented

Graupmann et

al 2005

X IMPL

Park e Cheyer

2006

X X X IDEA

Michlmayr et al2007

X X IMPL

Aleman-Meza et

a 2003

X X IMPL

Mani eSundaram 2007

X X X IMPL

Challam et al

2007

X X X IMPL

Vallet et al 2006 X X X IMPL

Sieg et al 2007 X X X IMPL

(incomplete)

Praestro X X X IMPL

(prototype)

UnA-SUS ndash Universidade Aberta do SUS

Programa do Ministeacuterio da Sauacutede para atender necessidades de e

permanente dos

Accedilotildees focadas em

formulaccedilatildeo de conteuacutedo

bibliotecas digitais

cursos a distacircncia

21042010

27

Metas da UnA-SUS

Desenvolver um

plataforma para de

composiccedilatildeo e de

Montar e oferecer cursos para formaccedilatildeo continuada de profissionais da sauacutede

157

Metadados

O processo de produccedilatildeo catalogaccedilatildeo e reuso de OAs

Repositoacuterio

Conteuacutedo

OAs

requisiccedilotildees

Design revisatildeo e publicaccedilatildeo

OA

SGA outros reps

Busca e reuso

OAsMetadados

OAs

Concepccedilatildeo e validaccedilatildeo de OAs

O processo de produccedilatildeo catalogaccedilatildeo e reuso de OAs

OA1

Curso A

Curso B

OA2

OA3

Viacutedeo

Imagens

RepositoacuteriosConteuacutedoMultimiacutedia

SGA RepositoacuteriosOAs

Reuso eacute essencial

bull OAs satildeo caros para produzir

bull Demandas emergenciais na sauacutede puacuteblica exigem agilidade e pronta resposta com cursos para a qualificaccedilatildeo de profissionais

H1N1

Apoplexia

gripe suiacutena gripe A

influenza H1N1

hellip

21042010

28

Navegaccedilatildeo hiperboacutelica no DeCSCatalogaccedilatildeo de Objetos de Aprendizagem (OAs) usando Vocabulaacuterios Controlados

bull Seleccedilatildeo de termos do DeCS CID-10 SNOMED

ndash via fornecimento de palavras-chave que satildeo pesquisadas na base de conhecimento

ndash via navegaccedilatildeo em uma visatildeo do conhecimento em forma de aacutervore

Seleccedilatildeo via contexto ontoloacutegicoProtoacutetipo (catalogaccedilatildeo com entrada

de palavra-chave)

DSpaceCatalogaccedilatildeo de OAswf

Protoacutetipo (catalogaccedilatildeo com navegaccedilatildeo

na base de conhecimento)

DSpaceRecuperaccedilatildeo de OAswf

21042010

29

Recuperaccedilatildeo de Objetos de Aprendizagem (OAs) Baseada em Conhecimento

bull Vocabulaacuterios e relaccedilotildees semacircnticas

ndash Oriundos do DeCS

ndash Definidos pelos catalogadores de OAs

ndash Gerados pelo cruzamento de informaccedilotildees com o CID-10 (Classificaccedilatildeo Internacional de Doenccedilas)

ndash Ex sinocircnimos eacute um(a) parte de causa efeito sintoma etc

DeCs

Anatomia

Sistema Nervoso

Sistema Nervoso Central

Enceacutefalo

Prosenceacutefalo

Telencaacutefalo

Ceacuterebro

Doenccedilas

Doenccedilas do Sistema Nervoso

Doenccedilas Cardiovasculares

Doenccedilas do Sistema Nervoso Central

Encefalopatias

Transtornos Cerebrovasculares

Doenccedilas Vasculares

Transtornos Cerebrovasculares

Acidente Vascular Cerebral

Acidente Vascular Cerebral

OA 1

OA 2

AVC

IctusCerebral

Derrame Cerebral

Hemisfeacuterios Cerebrais

ApoplexiaAcidente

Cerebrovascular

IctoCerebral

Apoplexia Cerebrovascular

Apoplexia Cerebral

Acidente Vascular

Encefaacutelico

Acidente Vascular

do Ceacuterebro

Acidente Vascular Cerebral

padratildeo (sinocircnimo)

anota

especiacutefica de domiacutenio

anocircnimas (DeCs)

172

DeCs

Anatomia

Sistema Nervoso

Sistema Nervoso Central

Enceacutefalo

Prosenceacutefalo

Telencaacutefalo

Ceacuterebro (2)

Doenccedilas

Doenccedilas do Sistema Nervoso

Doenccedilas Cardiovasculares

Doenccedilas do Sistema Nervoso Central

Encefalopatias

Transtornos Cerebrovasculares

Doenccedilas Vasculares

Transtornos Cerebrovasculares

Acidente Cerebral Vascular (1)

Acidente Cerebral Vascular(1)

OA 1

OA 2

AVC

IctusCerebral

Derrame Cerebral

Hemisfeacuterios Cerebrais

ApoplexiaAcidente

Cerebrovascular

IctoCerebral

Apoplexia Cerebrovascular

Apoplexia Cerebral

Acidente Vascular

Encefaacutelico

Acidente Vascular

do Ceacuterebro

Acidente Vascular Cerebral

Busca de OAs na aacuterea de sauacutede usando conhecimento de domiacutenio

Semantic Learning Objects (VIAN J SILVEIRA R A FILETO R WCCE 2009)

21042010

30

Conclusotildees

A Web semacircntica tem potencial de contribuir naobtenccedilatildeo de melhores resultados para buscas

Suporte automatizado eacute fundamental para a construccedilatildeo evoluccedilatildeo e integraccedilatildeo de ontologias anotaccedilotildees semacircnticas e contextos de usuaacuterios

Nossos primeiros resultados focam na captura e utilizaccedilatildeo de contextos de usuaacuterios mapeados a ontologias de domiacutenios especiacuteficos paradesambiguar e estender as buscas

Trabalhos futuros

Processos parcialmente automatizados para geraccedilatildeo e atualizaccedilatildeo de ontologias e anotaccedilotildees semacircnticas

Experimentos para comprovar a eficaacutecia das teacutecnicas e ferramentas utilizadas

Validaccedilatildeo de soluccedilotildees de problemas de busca semacircntica em diversos domiacutenios de aplicaccedilatildeo

Determinaccedilatildeo de niacuteveis adequados de acoplamento entre contextos e ontologias e dessas com os recursos a serem recuperados

Notiacutecias e anaacutelises

httpnewscnetcomnew-search-engine-cuil-takes-aim-at-google

httpwwwreadwritewebcomarchivesis_google_a_semantic_search_enginephp

httpwwwreadwritewebcomarchivessemantic_search_the_myt

h_and_realityphp

httpwwwpandiacomsew1262-top-5-semantic-search-

engineshtml

httpmindsetresearchyahoocom

httpnewscnetcom8301-13953_3-9982015-80html

httpwwwsearchenginejournalcomaskcom-focuses-on-semantic-search8252

httpnewsbbccouk2hiprogrammesclick_onlinedefaultstm

httpnewsbbccouk2hiprogrammesclick_online8144765stm

Web semacircntica e buscassemacircnticas

httpwwww3org2001sw

httpsemanticweborg

httpenwikipediaorgwikiSemantic_Web

httpenwikipediaorgwikiSemantic_search

Ferramentas de desenvolvimento

httpprotegestanfordedu

httpjenasourceforgenet

httpwwww3org2001Annotea

httpwwwontotextcomkim

httpesww3orgtopicSemanticWebTools

httpwwwdamlorg200305swmu-tools-

tutorialOverviewhtml

Referecircncias em Web semacircntica

T Berners-Lee J Hendler e O Lassila The Semantic Web Scientific American May 2001

Thomas B Passing Explores Guide to the Semantic Web Manning Publications Greenwich CT 2005

Davies J Studer R Warren P (Eds) Semantic Web Technologies trends and research in ontology-based

Systems John Wiley amp Sons 2006

Breitman KK Casanova MA Truszkowski W Semantic Web

Concepts Technologies and Applications Series NASA Monographs in Systems and Software Engineering Springer 2007

Grigoris Antoniou and Frank van Harmelen A Semantic Web Primer 2nd edition The MIT Press Cambridge MA USA 2008

Kashyap V Bussler C Moran M The Semantic Web -Semantics for Data and Services on the Web Series Data-

Centric Systems and Applications Springer 2008

Hitzler P Krotzsch M Rudolph S Foundations of SemanticWeb Technologies Chapman amp HallCRC 2009

21042010

31

Referecircncias em buscas semacircnticas

Guha R McCool R and Miller E 2003 Semantic search In Proc of the 12th international Conference on World Wide Web

(WWW) Budapest Hungary ACM New York NY 2003 700-709

Reeve L and Han H 2005 Survey of semantic annotation

platforms In Proceedings of the ACM Symposium on Applied Computing Santa Fe New Mexico ACM New York NY 2005

1634-1638

Eetu Makela Survey of Semantic Search Research

Mangold C A Survey and classification of semantic search approaches Journal of Metadata Semantics and Ontology 2(1)

2007

Stephan Bloehdorn Philipp Cimiano Alistair Duke Peter Haase Joumlrg Heizmann Ian Thurlow Johanna Voumllker Ontology-BasedQuestion Answering for Digital Libraries ECDL 2007 14-25

Hai Dong Hussain FK Chang E A survey in semantic search technologies In 2nd IEEE International Conference on

Digital Ecosystems and Technologies 2008 403-408

Algumas referecircncias grupo UFSC

DAgostini C S Fileto R Capturing Users Preferences and Intentions in a Semantic Search System In 21st International

Conference on Software Engineering amp Knowledge Engineering (SEKE) Boston 2009 p 587-591

DAgostini C S Fileto R Dantas M A R Gauthier F A O

Contextual Semantic Search - Capturing using the UsersContext to Direct Semantic Search In 10th InternationalConference on Enterprise Information Systems (ICEIS) Barcelona

Spain 2008 v SAIC p 154-159

DAgostini C S Fileto R Capturing and managing usercontext for improving information retrieval In Workshop de

Teses e Dissertaccedilotildees do Simpoacutesio Brasileiro de Bancos de Dados (WTDBDSBBD) Campinas Unicamp Brazil 2008

Vian J Silveira R A Fileto R Proposal of a Multi-agent System for Indexing and Recovery applied to Learning

Objects In 9th IFIP World Conference on Computers in Education (WCCE) Bento Goncalves Brazil 2009

Alguns projetos na UFSC

httpwwwlisaufscbrprojetos

httpwwwunasusufscbr

httpwwwliteraturabrasileiraufscbr

Perguntas

Page 10: Buscas Semânticasfileto/Talks/BuscasSemanticas6sp.pdf · 21/04/2010 1 1 Buscas semânticas: panorama e tendências atuais minicurso ERBD 2010 RenatoFileto fileto@inf.ufsc.br AlunosColaboradores:

21042010

10

Proposta regras(2005)rlm Proposta atual

Como estaacute a Web semacircntica hoje

Aacuterea de pesquisa muito ativa

Visa estender o papel dos computadores no

suporte a diversas atividades humanas

Usa ontologias e anotaccedilotildees semacircnticas para

catalogar recuperar e compor dados e serviccedilos

de processamento na Web

Desafios da Web semacircntica

Construccedilatildeo de ontologias

(Semi-)automatizada e interativa

Geraccedilatildeo de anotaccedilotildees semacircnticas de recursos

Muitas aplicaccedilotildees requerem automatizaccedilatildeo

Evoluccedilatildeo de ontologias

Checar se alteraccedilotildees natildeo introduzem inconsistecircncias e gerenciar

versotildees

Integraccedilatildeo de ontologias (ontology matching)

A obtenccedilatildeo de consenso eacute inviaacutevel em muitas domiacutenios

Deduccedilatildeoraciociacutenio

Teorias computaacuteveis e natildeo computaacuteveis ontologias inconsistentes

Ediccedilatildeo de Ontologias no Proteacutegeacute

Editor de ontologias e arcabouccedilo para o desenvolvimento de bases de conhecimento livre e de coacutedigo aberto baseado em Java

Suporta os modelos de frames (RDF) e OWL

Exporta as ontologias e bases de conhecimento para uma variedade de formatos incluindo RDF(S) OWL e XML Schema

Extensiacutevel via plugins

Construccedilatildeo de ontologias

Processo para geraccedilatildeo automatizada de

ontologias a partir de esboccedilos dados e

documentos (nova geraccedilatildeo de ferramentas)rlm

Entendimento do domiacutenio

Entendimento dos dados

Definiccedilatildeo das tarefas

Geraccedilatildeo semi-automaacutetica

Avaliaccedilatildeo de qualidade

Refinamento com interaccedilatildeo humana

21042010

11

Definiccedilotildees de ldquogeraccedilatildeo de ontologiardquoGrobenik and Mladenic 2006

Induccedilatildeo de conceitos (a partir das instacircncias)rlm

Induccedilatildeo de relaccedilotildees (a partir de conceitos e

instacircncias a eles associadas)rlm

Popular ontologia (dada uma ontologia e

instacircncias de seus conceitos)rlm

Geraccedilatildeo de uma ontologia completa (a partir

das instacircncias e algum conhecimentoinformaccedilatildeo)rlm

Atualizaccedilatildeoextensatildeo de ontologias (dada

uma ontologia e informaccedilatildeo como novas

instacircncias ou padrotildees de uso da ontologia)rlm

Document Clustering - Vector Model

Vector of word occurences in the documents

bull diK = TF(Wkdi) IDF(Wk)rlm

Where

bull TF(Wkdi) = number of times Wk occurs in document di

bull IDF(Wk) = log ( D DF(Wk))rlm

bull D = number of documents

bull DF(Wk) = number of documents in which word W occurs

Document distance metric

Anotaccedilotildees Semacircnticas(Kiryakov et al 2004)rlm

21042010

12

Anotaccedilatildeo Semacircntica de Documentos

Atribui agraves entidades que aparecem no documento ligaccedilotildees com suas descriccedilotildees semacircnticas na ontologia

Aplicaacutevel a qualquer tipo de texto (documentos HTML documentos de texto comuns campos de banco de dados entre outros)

Representaccedilatildeo das anotaccedilotildees

Intrusiva

Natildeo intrusiva

Confecccedilatildeo das anotaccedilotildees

bull Semi-Automaacutetica Associa palavras do texto a classes

instacircncias e propriedades da ontologia utilizando-se do

julgamento humano Esta associaccedilatildeo geralmente eacute efetuada

atraveacutes de interfaces ldquoarraste-e-solterdquo (eg OntoMat)rlm

bull Automaacutetica Aplica teacutecnicas de processamento de

linguagem natural aprendizado de maacutequina e extraccedilatildeo de

informaccedilatildeo entre outras para associar palavras agrave ontologia

Essas ferramentas podem utilizar ontologias padratildeo (eg

IEEE Standard Upper Ontology) ou ontologias de domiacutenios

especiacuteficos (eg Unified Medical Language System)

bull Hiacutebrida Combinaccedilatildeo das teacutecnicas acima

Geraccedilatildeo de anotaccedilotildees semacircnticas (Reeve e Han 2005)rlm

Ferramentas para anotaccedilatildeo

Annozilla Funciona sobre o Mozzila Firefox

Annotea projeto da W3C - servidor de anotaccedilotildees em RDF

Armadillo

Muse

Pankol

Semantic Word anotaccedilatildeo interativa de porccedilotildees de documentos

Word

OntoMat Annotizer anotaccedilatildeo interativa de paacuteginas Web com

ontologias em OWL

Smore marcaccedilotildees sobre HTML com ontologias em OWL

Melita ferramenta de anotaccedilatildeo semi-automaacutetica que usa algoritmo

de IE para ajudar o usuaacuterio no processo de anotaccedilatildeo

MnM anotaccedilatildeo semacircntica de paacuteginas Web com metadados

descritos em RDFOCMLDAML+OIL

KIM permite criar metadados armazenar e buscar informaccedilotildees e

pode ser usada para anotaccedilatildeo e procura de documentos

21042010

13

O processo automatizado de anotaccedilatildeo semacircntica de documentos

Tokenizaccedilatildeo e Eliminaccedilatildeo de StopWords

Etiquetagem

Stemmer

Corpus Anotado

Identificaccedilatildeo EN

Associaccedilatildeo atermos da ontologia

RepositoacuterioSemacircntico

Tokensrelevantes

Palavras +Classificaccedilatildeo Gramatical

Radicais das Palavras +Classificaccedilatildeo Gramatical

Entidades Nomeadas

Anotaccedilatildeo Semacircntica

Dados Metadados Documento

s

Ontologia do Domiacutenio

Valida

Valida

Especialista

RepositoacuterioInformaccedilatildeo

Annotation example(Davies et al 2006)

Consider the phrase

There are deliverables

The tokens are

[There] [are] [deliverables] []

The tagger finds out what kind of a word each of the tokens

is (whether it is a noun an adjective a verb etc)rlm

[There] existential quantifier

[are] verbmdash3rd person singular present

[deliverables] nounmdashplural

Annotation example (cont)rlm

The morphological analyser gives the roots of all the words

[There] rootmdashthere

[are] rootmdashbe

[deliverables] rootmdashdeliverable

There are mdash mdashmdash

triggers the creation of one or more new classes in the

ontology

There are projects

There are workpackages tasks and deliverables

SEKT is a project

MUSINGrlmbdquoKnowledgerlmWeb‟rlmandrlmbdquoPrestorlmSpace‟rlmarerlmprojects

Projects have workpackages

Workpackages can have tasks

WP1 WP2 WP3 WP4 WP5 and WP6 are workpackages

SEKT has WP1

MUSING has WP2 WP3 and WP4

bdquoKnowledgerlmWeb‟rlmhasrlmWP5 and WP6

Annotation example (cont)rlm

Ontologia resultante Quadro Comparativo(Nunes e Fileto 2007)rlm

21042010

14

Dependecircncias entre plataformas(Rui Tramontin Junior 2007)rlm

Comparaccedilatildeo de desempenho(Reeve e Han 2005)rlm

Prataforma Categoria Precisatildeo Cobertura Medida F

Armadillo Descoberta de padrotildees

910 740 870

KIM Regras 860 820 840

MnM Induccedilatildeo 950 900 nd

MUSE Regras 935 923 929

PANKOW Descoberta de padrotildees

650 282 249

SemTag Regras 820 nd nd

Evoluccedilatildeo de ontologias(Bloehdorn et al 2006)rlm

Exemplo Uso natildeo uniforme de conceitos

Alternativas para remoccedilatildeo do conceito C que tem sub-conceitos

Processo de evoluccedilatildeo de ontologias

CapturaCaptura

da

Mudanccedila

Representaccedilatildeo Semacircntica Propagaccedilatildeo Implementaccedilatildeo Validaccedilatildeo

Fases Elementares

21042010

15

Mapeamentos entre ontologias(Ontology Matching)

Fusatildeo de ontologias

Processo semi-automatico de alinhamento(Huang at al 2006)rlm

Referecircncia

Jerome Euzenat INRIA Rhone-Alpes France

Pavel Shvaiko University of Trento Italy

Ontology Matching

URL httpbookontologymatchingorg

Springer-Verlag Heidelberg (DE) 2007

343 p 67 illus Hardcover

ISBN 978-3-540-49611-3

E as buscas semacircnticas

Recuperaccedilatildeo da informaccedilatildeo de documentosrlm

Medidas da eficaacutecia das soluccedilotildees

precisatildeo = nro de docs relevantes recuperadosnro de docs recuperados

cobertura = nro de docs relevantes recuperadosnro de docs relevantes

21042010

16

Classificaccedilatildeo de abordagens para buscas semacircnticas (Mangold 2007)

Arquitetura

Acoplamento entre ontologias e documentos

Transparecircncia

Contexto do usuaacuterio

Modificaccedilatildeo de consultas

Estrutura das ontologias

Tecnologia para representar as ontologias

Desempenho escalabilidade e distribuiccedilatildeo

Adaptabilidade

Ranking

Arquiteturas para buscas semacircnticas

Maacutequina de busca stand_alone armazenametadados sobre os documentos em iacutendicescom os quais avalia as consultas

Meta-maacutequina de busca distribui asconsultas para outras maacutequinas de busca ecombina os resultados

Acoplamento ontologias-documentos

Acoplamento forte os metadados dosdocumentos referem-se explicitamente aosconceitos de uma ontologia e vice-versa(requer anotaccedilatildeo semacircntica)rlm

Acoplamento fraco os documentos satildeoindependentes de quaisquer ontologiasdisponiacuteveis (pode restringir a capacidade debusca)rlm

Contexto do usuaacuterio

Learning extraiacutedo na interaccedilotildees do usuaacuteriocom o sistema (histoacuterico das consultas erefinamentos de consultas)rlm

Hard-coded as consultas satildeo organizadas emcategorias que definem a informaccedilatildeo solicitada(eg ldquolocation ofrdquo ldquoresources forrdquo rlm(

Modificaccedilatildeo de consultas

Manual o sistema retorna um trechoapropriado da ontologia junto com a respostapermitindo ao usuaacuterio navegar na ontologia ereformular a consulta pela adiccedilatildeo e remoccedilatildeo determos

Re-escrita automaacutetica a consulta eacuteotimizada automaticamente pelo sistema

Baseada em grafo considera conceitos edocumentos como nodos de um grafoefetuando propagaccedilatildeo da consulta a partir dosnodos correspondentes a termos de busca

Modificaccedilatildeo de consultas

Modificaccedilatildeo de consulta

Manual

Re-escrita de consulta

Baseada em grafo

Inserccedilatildeo de termoRemoccedilatildeo de termo

Substituiccedilatildeo de termo

Conjuntiva

Disjuntiva

Conjuntiva Disjuntiva

21042010

17

Estrutura da ontologia

Propriedades anocircnimas as relaccedilotildees entreconceitos natildeo satildeo nomeadas indicando apenasque eles compartilham o mesmo contexto

Propriedades padronizadas sinocircniacutemiahiperniacutemia meroniacutemia negaccedilatildeo etc

Propriedades especiacuteficas de domiacutenio aleacutemdas propriedades padratildeo considerapropriedades especiacuteficas de um domiacutenio (egldquotipo de cacircmerardquo em sistema para a aacuterea defotografia)rlm

Tecnologia da ontologia

F-Logic

RDF

DAML+OIL

Frames

OWL

Comparaccedilatildeo de abordagens Comparaccedilatildeo de abordagens (cont)

Buscas semacircnticas na Web hoje

httpwwwaliprcom (imagens)rlm

httpwwwcognitioncom

httpwwwdeepdyvecom

httpwwwbingcom

httpwwwcuilcom

httpwwwfreebasecom

httpwwwgooglecom

httpwwwkosmixcom

httpwwwhakiacom

httpwwwpowersetcom

httpwwwsensebotnet

httpdeveloperyahoocomsearchmonkey

httpswoogleumbcedu (ontologias)rlm

21042010

18

21042010

19

SAO PAULO-SP

University of Sao Paulo

Sao Paulo Fashion

Sao Paulo Fashion Week

Sao Paulo State

Sao Paulo Hotel

Sao Paulo Hotels

Sao Paulo Brasilien

Sao Paulo Congonhas

21042010

20

21042010

21

Sao Paulo Airport

Sao Paulo Plane Crash

Sao Paulo Zoo

hellip

21042010

22

21042010

23

Algumas questotildees em aberto

Representaccedilatildeo de contextos de usuaacuterios emapeamento desses a ontologias

Anaacutelise dos efeitos de modificaccedilotildees de consultas

Meta-buscas semacircnticas

Anaacutelise da aceitaccedilatildeo dos usuaacuterios

Adaptabilidade a diferentes ontologias

Ranking dos resultados

Integraccedilatildeo com sistemas de gerenciamento dedocumentosconteuacutedo

Tratamento de dados multimiacuteda

Interfaces homem-maacutequina

Desempenho e escalabilidade

Contextual Semantic Search (CSS)(DAgostine Fileto ndash SBBD2007)rlm

21042010

24

General Architecture for CSSThe Weighted Topic Graph(DAgostine Fileto Dantas Gauthier - ICEIS 2008)rlm

A weighted topic graph is a graph TM(T A)rlm

T is a set of topics (vertices)rlm

A is a set of associations (edges)rlm

Let be an ontology O

Each topic t in T corresponds to a ontology term o in O

Each topic t has a weight [01] The sum from the weights from all topics with same name equals 1

Each association a has a weight [01] The sum

from all the weights from all association departing

a single topics equals 1

Topic weights used to disambiguate

Eg interest in Satildeo Paulo city instead of Satildeo Paulo

state

Association weights used to semantically

expand searches

Eg Actual interest in Guarulhos and airport while

searching for Satildeo Paulo city

The Weights in the Topic Graph Capturing the Users Context

Generated Topic Graph with the Ontological Users Context

The Contextual Semantic Search Process

21042010

25

Desambiguaccedilatildeo

Fundamento dos algoritmos de busca sobre contexto ontoloacutegico

Heuriacutesticas de estigmergia (Ant Colony Optimization - ACO)

Traccedilos de ferormocircnio

Algoritmo de busca semacircntica baseada em ACO

Entrada palavras-chave[ ]

Dados G(TA) Onto repositoacuterio

limite_de_profundidade

limite_miacutenimo_de_peso

λ fator de atenuaccedilatildeo de peso

iniacutecio Algoritmo Busca Contextual 1 Estigmeacuterica

resultados = busca_G_ou_Onto(palavras-chave[])

atenuaG (iacutendice ) λrlmisin [0 1]

manutenccedilatildeo(coleta_feedback(resultados))

fim

21042010

26

Demo Praestro ndash Karina Fasolin

Alguns trabalhos relacionados

Name Article Comments

Graupmann

et al 2005

The SphereSearch

engine for unifiedranked retrieval of

heterogeneous XML

and web documents

Searches through XML documents The context is a region in radius

around given element A data inside two regions is considered relevant

to both contexts

Made tests with large collections like DBLP INEX Wikipedia put for

stress testing regarding the size of the collection

ldquoLet us first comment on the difficulties of defining a meaningfulbenchmark for this kind of novel systemrdquo

Park e

Cheyer 2006

Just For Me Topic

Maps and Ontologies

Manages knowledge in three layers Topics Knowledge Structures and

Documents

Not implemented (at least at the time of publication)

Michlmayr

et al 2007Adaptive User Profiles

for Enterprise

Information Access

Represents context as an individual graph The graph is constructed

based on tags used to semantically annotate the content which the user

considers to be relevant

However the tags are only that only labels They are not tied-down to

a formal definition

Alguns trabalhos relacionados (cont)

Name Article Comments

Aleman-

Meza et a

2003

Context-Aware

Semantic Association

Ranking

Also defines context as regions But the regions are static defined in

the ontology which is used by the system So the contexts are defined

the same for every single user

Mani and

Sundaram

2007

Modeling user context

with applications to

media retrieval

Creates a graph representing the users context Each node

corresponds to an instance in the ontology The edges represent

relations between the instances Built to search trough multimedia

documents

However it does not associates the vocabulary the user uses with the

instances

Challam et

al 2007

Contextual Search

Using Ontology-Based

User Profiles

Monitors the users activity capturing content from open Internet

Explorer MS-Office and MSN The captured information is stored and

usedrlmtorlmbuildrlmarlmuser‟srlmcontextualrlmprofilerlmbasesrlmonrlmanrlmontology

The context is tightly coupled with the ontology

NO IMAGES WERE

PROVIDED

Vallet et al

2006

Personalized

Information Retrieval in

Context

Stores context as a graph constructed based on the ontology used by

the system Similar to Mani and Sundaram including its limitations

(mapping the vocabulary) however if built for text documents

Sieg et al

2007

Ontological User

Profiles for

Personalized Web

Search

Similar to Challam et al but it gets the context information from the

ontology terms used to annotate the retrieved relevant context

Also limited by the structure of the ontology

Alguns trabalhos relacionados(cont)

Name Deals with

objective

knowledge

(ontology)

Deals with

subjective

knowledge

(users

context)

The knowledge

management is

transparent

Idea Implemented

Graupmann et

al 2005

X IMPL

Park e Cheyer

2006

X X X IDEA

Michlmayr et al2007

X X IMPL

Aleman-Meza et

a 2003

X X IMPL

Mani eSundaram 2007

X X X IMPL

Challam et al

2007

X X X IMPL

Vallet et al 2006 X X X IMPL

Sieg et al 2007 X X X IMPL

(incomplete)

Praestro X X X IMPL

(prototype)

UnA-SUS ndash Universidade Aberta do SUS

Programa do Ministeacuterio da Sauacutede para atender necessidades de e

permanente dos

Accedilotildees focadas em

formulaccedilatildeo de conteuacutedo

bibliotecas digitais

cursos a distacircncia

21042010

27

Metas da UnA-SUS

Desenvolver um

plataforma para de

composiccedilatildeo e de

Montar e oferecer cursos para formaccedilatildeo continuada de profissionais da sauacutede

157

Metadados

O processo de produccedilatildeo catalogaccedilatildeo e reuso de OAs

Repositoacuterio

Conteuacutedo

OAs

requisiccedilotildees

Design revisatildeo e publicaccedilatildeo

OA

SGA outros reps

Busca e reuso

OAsMetadados

OAs

Concepccedilatildeo e validaccedilatildeo de OAs

O processo de produccedilatildeo catalogaccedilatildeo e reuso de OAs

OA1

Curso A

Curso B

OA2

OA3

Viacutedeo

Imagens

RepositoacuteriosConteuacutedoMultimiacutedia

SGA RepositoacuteriosOAs

Reuso eacute essencial

bull OAs satildeo caros para produzir

bull Demandas emergenciais na sauacutede puacuteblica exigem agilidade e pronta resposta com cursos para a qualificaccedilatildeo de profissionais

H1N1

Apoplexia

gripe suiacutena gripe A

influenza H1N1

hellip

21042010

28

Navegaccedilatildeo hiperboacutelica no DeCSCatalogaccedilatildeo de Objetos de Aprendizagem (OAs) usando Vocabulaacuterios Controlados

bull Seleccedilatildeo de termos do DeCS CID-10 SNOMED

ndash via fornecimento de palavras-chave que satildeo pesquisadas na base de conhecimento

ndash via navegaccedilatildeo em uma visatildeo do conhecimento em forma de aacutervore

Seleccedilatildeo via contexto ontoloacutegicoProtoacutetipo (catalogaccedilatildeo com entrada

de palavra-chave)

DSpaceCatalogaccedilatildeo de OAswf

Protoacutetipo (catalogaccedilatildeo com navegaccedilatildeo

na base de conhecimento)

DSpaceRecuperaccedilatildeo de OAswf

21042010

29

Recuperaccedilatildeo de Objetos de Aprendizagem (OAs) Baseada em Conhecimento

bull Vocabulaacuterios e relaccedilotildees semacircnticas

ndash Oriundos do DeCS

ndash Definidos pelos catalogadores de OAs

ndash Gerados pelo cruzamento de informaccedilotildees com o CID-10 (Classificaccedilatildeo Internacional de Doenccedilas)

ndash Ex sinocircnimos eacute um(a) parte de causa efeito sintoma etc

DeCs

Anatomia

Sistema Nervoso

Sistema Nervoso Central

Enceacutefalo

Prosenceacutefalo

Telencaacutefalo

Ceacuterebro

Doenccedilas

Doenccedilas do Sistema Nervoso

Doenccedilas Cardiovasculares

Doenccedilas do Sistema Nervoso Central

Encefalopatias

Transtornos Cerebrovasculares

Doenccedilas Vasculares

Transtornos Cerebrovasculares

Acidente Vascular Cerebral

Acidente Vascular Cerebral

OA 1

OA 2

AVC

IctusCerebral

Derrame Cerebral

Hemisfeacuterios Cerebrais

ApoplexiaAcidente

Cerebrovascular

IctoCerebral

Apoplexia Cerebrovascular

Apoplexia Cerebral

Acidente Vascular

Encefaacutelico

Acidente Vascular

do Ceacuterebro

Acidente Vascular Cerebral

padratildeo (sinocircnimo)

anota

especiacutefica de domiacutenio

anocircnimas (DeCs)

172

DeCs

Anatomia

Sistema Nervoso

Sistema Nervoso Central

Enceacutefalo

Prosenceacutefalo

Telencaacutefalo

Ceacuterebro (2)

Doenccedilas

Doenccedilas do Sistema Nervoso

Doenccedilas Cardiovasculares

Doenccedilas do Sistema Nervoso Central

Encefalopatias

Transtornos Cerebrovasculares

Doenccedilas Vasculares

Transtornos Cerebrovasculares

Acidente Cerebral Vascular (1)

Acidente Cerebral Vascular(1)

OA 1

OA 2

AVC

IctusCerebral

Derrame Cerebral

Hemisfeacuterios Cerebrais

ApoplexiaAcidente

Cerebrovascular

IctoCerebral

Apoplexia Cerebrovascular

Apoplexia Cerebral

Acidente Vascular

Encefaacutelico

Acidente Vascular

do Ceacuterebro

Acidente Vascular Cerebral

Busca de OAs na aacuterea de sauacutede usando conhecimento de domiacutenio

Semantic Learning Objects (VIAN J SILVEIRA R A FILETO R WCCE 2009)

21042010

30

Conclusotildees

A Web semacircntica tem potencial de contribuir naobtenccedilatildeo de melhores resultados para buscas

Suporte automatizado eacute fundamental para a construccedilatildeo evoluccedilatildeo e integraccedilatildeo de ontologias anotaccedilotildees semacircnticas e contextos de usuaacuterios

Nossos primeiros resultados focam na captura e utilizaccedilatildeo de contextos de usuaacuterios mapeados a ontologias de domiacutenios especiacuteficos paradesambiguar e estender as buscas

Trabalhos futuros

Processos parcialmente automatizados para geraccedilatildeo e atualizaccedilatildeo de ontologias e anotaccedilotildees semacircnticas

Experimentos para comprovar a eficaacutecia das teacutecnicas e ferramentas utilizadas

Validaccedilatildeo de soluccedilotildees de problemas de busca semacircntica em diversos domiacutenios de aplicaccedilatildeo

Determinaccedilatildeo de niacuteveis adequados de acoplamento entre contextos e ontologias e dessas com os recursos a serem recuperados

Notiacutecias e anaacutelises

httpnewscnetcomnew-search-engine-cuil-takes-aim-at-google

httpwwwreadwritewebcomarchivesis_google_a_semantic_search_enginephp

httpwwwreadwritewebcomarchivessemantic_search_the_myt

h_and_realityphp

httpwwwpandiacomsew1262-top-5-semantic-search-

engineshtml

httpmindsetresearchyahoocom

httpnewscnetcom8301-13953_3-9982015-80html

httpwwwsearchenginejournalcomaskcom-focuses-on-semantic-search8252

httpnewsbbccouk2hiprogrammesclick_onlinedefaultstm

httpnewsbbccouk2hiprogrammesclick_online8144765stm

Web semacircntica e buscassemacircnticas

httpwwww3org2001sw

httpsemanticweborg

httpenwikipediaorgwikiSemantic_Web

httpenwikipediaorgwikiSemantic_search

Ferramentas de desenvolvimento

httpprotegestanfordedu

httpjenasourceforgenet

httpwwww3org2001Annotea

httpwwwontotextcomkim

httpesww3orgtopicSemanticWebTools

httpwwwdamlorg200305swmu-tools-

tutorialOverviewhtml

Referecircncias em Web semacircntica

T Berners-Lee J Hendler e O Lassila The Semantic Web Scientific American May 2001

Thomas B Passing Explores Guide to the Semantic Web Manning Publications Greenwich CT 2005

Davies J Studer R Warren P (Eds) Semantic Web Technologies trends and research in ontology-based

Systems John Wiley amp Sons 2006

Breitman KK Casanova MA Truszkowski W Semantic Web

Concepts Technologies and Applications Series NASA Monographs in Systems and Software Engineering Springer 2007

Grigoris Antoniou and Frank van Harmelen A Semantic Web Primer 2nd edition The MIT Press Cambridge MA USA 2008

Kashyap V Bussler C Moran M The Semantic Web -Semantics for Data and Services on the Web Series Data-

Centric Systems and Applications Springer 2008

Hitzler P Krotzsch M Rudolph S Foundations of SemanticWeb Technologies Chapman amp HallCRC 2009

21042010

31

Referecircncias em buscas semacircnticas

Guha R McCool R and Miller E 2003 Semantic search In Proc of the 12th international Conference on World Wide Web

(WWW) Budapest Hungary ACM New York NY 2003 700-709

Reeve L and Han H 2005 Survey of semantic annotation

platforms In Proceedings of the ACM Symposium on Applied Computing Santa Fe New Mexico ACM New York NY 2005

1634-1638

Eetu Makela Survey of Semantic Search Research

Mangold C A Survey and classification of semantic search approaches Journal of Metadata Semantics and Ontology 2(1)

2007

Stephan Bloehdorn Philipp Cimiano Alistair Duke Peter Haase Joumlrg Heizmann Ian Thurlow Johanna Voumllker Ontology-BasedQuestion Answering for Digital Libraries ECDL 2007 14-25

Hai Dong Hussain FK Chang E A survey in semantic search technologies In 2nd IEEE International Conference on

Digital Ecosystems and Technologies 2008 403-408

Algumas referecircncias grupo UFSC

DAgostini C S Fileto R Capturing Users Preferences and Intentions in a Semantic Search System In 21st International

Conference on Software Engineering amp Knowledge Engineering (SEKE) Boston 2009 p 587-591

DAgostini C S Fileto R Dantas M A R Gauthier F A O

Contextual Semantic Search - Capturing using the UsersContext to Direct Semantic Search In 10th InternationalConference on Enterprise Information Systems (ICEIS) Barcelona

Spain 2008 v SAIC p 154-159

DAgostini C S Fileto R Capturing and managing usercontext for improving information retrieval In Workshop de

Teses e Dissertaccedilotildees do Simpoacutesio Brasileiro de Bancos de Dados (WTDBDSBBD) Campinas Unicamp Brazil 2008

Vian J Silveira R A Fileto R Proposal of a Multi-agent System for Indexing and Recovery applied to Learning

Objects In 9th IFIP World Conference on Computers in Education (WCCE) Bento Goncalves Brazil 2009

Alguns projetos na UFSC

httpwwwlisaufscbrprojetos

httpwwwunasusufscbr

httpwwwliteraturabrasileiraufscbr

Perguntas

Page 11: Buscas Semânticasfileto/Talks/BuscasSemanticas6sp.pdf · 21/04/2010 1 1 Buscas semânticas: panorama e tendências atuais minicurso ERBD 2010 RenatoFileto fileto@inf.ufsc.br AlunosColaboradores:

21042010

11

Definiccedilotildees de ldquogeraccedilatildeo de ontologiardquoGrobenik and Mladenic 2006

Induccedilatildeo de conceitos (a partir das instacircncias)rlm

Induccedilatildeo de relaccedilotildees (a partir de conceitos e

instacircncias a eles associadas)rlm

Popular ontologia (dada uma ontologia e

instacircncias de seus conceitos)rlm

Geraccedilatildeo de uma ontologia completa (a partir

das instacircncias e algum conhecimentoinformaccedilatildeo)rlm

Atualizaccedilatildeoextensatildeo de ontologias (dada

uma ontologia e informaccedilatildeo como novas

instacircncias ou padrotildees de uso da ontologia)rlm

Document Clustering - Vector Model

Vector of word occurences in the documents

bull diK = TF(Wkdi) IDF(Wk)rlm

Where

bull TF(Wkdi) = number of times Wk occurs in document di

bull IDF(Wk) = log ( D DF(Wk))rlm

bull D = number of documents

bull DF(Wk) = number of documents in which word W occurs

Document distance metric

Anotaccedilotildees Semacircnticas(Kiryakov et al 2004)rlm

21042010

12

Anotaccedilatildeo Semacircntica de Documentos

Atribui agraves entidades que aparecem no documento ligaccedilotildees com suas descriccedilotildees semacircnticas na ontologia

Aplicaacutevel a qualquer tipo de texto (documentos HTML documentos de texto comuns campos de banco de dados entre outros)

Representaccedilatildeo das anotaccedilotildees

Intrusiva

Natildeo intrusiva

Confecccedilatildeo das anotaccedilotildees

bull Semi-Automaacutetica Associa palavras do texto a classes

instacircncias e propriedades da ontologia utilizando-se do

julgamento humano Esta associaccedilatildeo geralmente eacute efetuada

atraveacutes de interfaces ldquoarraste-e-solterdquo (eg OntoMat)rlm

bull Automaacutetica Aplica teacutecnicas de processamento de

linguagem natural aprendizado de maacutequina e extraccedilatildeo de

informaccedilatildeo entre outras para associar palavras agrave ontologia

Essas ferramentas podem utilizar ontologias padratildeo (eg

IEEE Standard Upper Ontology) ou ontologias de domiacutenios

especiacuteficos (eg Unified Medical Language System)

bull Hiacutebrida Combinaccedilatildeo das teacutecnicas acima

Geraccedilatildeo de anotaccedilotildees semacircnticas (Reeve e Han 2005)rlm

Ferramentas para anotaccedilatildeo

Annozilla Funciona sobre o Mozzila Firefox

Annotea projeto da W3C - servidor de anotaccedilotildees em RDF

Armadillo

Muse

Pankol

Semantic Word anotaccedilatildeo interativa de porccedilotildees de documentos

Word

OntoMat Annotizer anotaccedilatildeo interativa de paacuteginas Web com

ontologias em OWL

Smore marcaccedilotildees sobre HTML com ontologias em OWL

Melita ferramenta de anotaccedilatildeo semi-automaacutetica que usa algoritmo

de IE para ajudar o usuaacuterio no processo de anotaccedilatildeo

MnM anotaccedilatildeo semacircntica de paacuteginas Web com metadados

descritos em RDFOCMLDAML+OIL

KIM permite criar metadados armazenar e buscar informaccedilotildees e

pode ser usada para anotaccedilatildeo e procura de documentos

21042010

13

O processo automatizado de anotaccedilatildeo semacircntica de documentos

Tokenizaccedilatildeo e Eliminaccedilatildeo de StopWords

Etiquetagem

Stemmer

Corpus Anotado

Identificaccedilatildeo EN

Associaccedilatildeo atermos da ontologia

RepositoacuterioSemacircntico

Tokensrelevantes

Palavras +Classificaccedilatildeo Gramatical

Radicais das Palavras +Classificaccedilatildeo Gramatical

Entidades Nomeadas

Anotaccedilatildeo Semacircntica

Dados Metadados Documento

s

Ontologia do Domiacutenio

Valida

Valida

Especialista

RepositoacuterioInformaccedilatildeo

Annotation example(Davies et al 2006)

Consider the phrase

There are deliverables

The tokens are

[There] [are] [deliverables] []

The tagger finds out what kind of a word each of the tokens

is (whether it is a noun an adjective a verb etc)rlm

[There] existential quantifier

[are] verbmdash3rd person singular present

[deliverables] nounmdashplural

Annotation example (cont)rlm

The morphological analyser gives the roots of all the words

[There] rootmdashthere

[are] rootmdashbe

[deliverables] rootmdashdeliverable

There are mdash mdashmdash

triggers the creation of one or more new classes in the

ontology

There are projects

There are workpackages tasks and deliverables

SEKT is a project

MUSINGrlmbdquoKnowledgerlmWeb‟rlmandrlmbdquoPrestorlmSpace‟rlmarerlmprojects

Projects have workpackages

Workpackages can have tasks

WP1 WP2 WP3 WP4 WP5 and WP6 are workpackages

SEKT has WP1

MUSING has WP2 WP3 and WP4

bdquoKnowledgerlmWeb‟rlmhasrlmWP5 and WP6

Annotation example (cont)rlm

Ontologia resultante Quadro Comparativo(Nunes e Fileto 2007)rlm

21042010

14

Dependecircncias entre plataformas(Rui Tramontin Junior 2007)rlm

Comparaccedilatildeo de desempenho(Reeve e Han 2005)rlm

Prataforma Categoria Precisatildeo Cobertura Medida F

Armadillo Descoberta de padrotildees

910 740 870

KIM Regras 860 820 840

MnM Induccedilatildeo 950 900 nd

MUSE Regras 935 923 929

PANKOW Descoberta de padrotildees

650 282 249

SemTag Regras 820 nd nd

Evoluccedilatildeo de ontologias(Bloehdorn et al 2006)rlm

Exemplo Uso natildeo uniforme de conceitos

Alternativas para remoccedilatildeo do conceito C que tem sub-conceitos

Processo de evoluccedilatildeo de ontologias

CapturaCaptura

da

Mudanccedila

Representaccedilatildeo Semacircntica Propagaccedilatildeo Implementaccedilatildeo Validaccedilatildeo

Fases Elementares

21042010

15

Mapeamentos entre ontologias(Ontology Matching)

Fusatildeo de ontologias

Processo semi-automatico de alinhamento(Huang at al 2006)rlm

Referecircncia

Jerome Euzenat INRIA Rhone-Alpes France

Pavel Shvaiko University of Trento Italy

Ontology Matching

URL httpbookontologymatchingorg

Springer-Verlag Heidelberg (DE) 2007

343 p 67 illus Hardcover

ISBN 978-3-540-49611-3

E as buscas semacircnticas

Recuperaccedilatildeo da informaccedilatildeo de documentosrlm

Medidas da eficaacutecia das soluccedilotildees

precisatildeo = nro de docs relevantes recuperadosnro de docs recuperados

cobertura = nro de docs relevantes recuperadosnro de docs relevantes

21042010

16

Classificaccedilatildeo de abordagens para buscas semacircnticas (Mangold 2007)

Arquitetura

Acoplamento entre ontologias e documentos

Transparecircncia

Contexto do usuaacuterio

Modificaccedilatildeo de consultas

Estrutura das ontologias

Tecnologia para representar as ontologias

Desempenho escalabilidade e distribuiccedilatildeo

Adaptabilidade

Ranking

Arquiteturas para buscas semacircnticas

Maacutequina de busca stand_alone armazenametadados sobre os documentos em iacutendicescom os quais avalia as consultas

Meta-maacutequina de busca distribui asconsultas para outras maacutequinas de busca ecombina os resultados

Acoplamento ontologias-documentos

Acoplamento forte os metadados dosdocumentos referem-se explicitamente aosconceitos de uma ontologia e vice-versa(requer anotaccedilatildeo semacircntica)rlm

Acoplamento fraco os documentos satildeoindependentes de quaisquer ontologiasdisponiacuteveis (pode restringir a capacidade debusca)rlm

Contexto do usuaacuterio

Learning extraiacutedo na interaccedilotildees do usuaacuteriocom o sistema (histoacuterico das consultas erefinamentos de consultas)rlm

Hard-coded as consultas satildeo organizadas emcategorias que definem a informaccedilatildeo solicitada(eg ldquolocation ofrdquo ldquoresources forrdquo rlm(

Modificaccedilatildeo de consultas

Manual o sistema retorna um trechoapropriado da ontologia junto com a respostapermitindo ao usuaacuterio navegar na ontologia ereformular a consulta pela adiccedilatildeo e remoccedilatildeo determos

Re-escrita automaacutetica a consulta eacuteotimizada automaticamente pelo sistema

Baseada em grafo considera conceitos edocumentos como nodos de um grafoefetuando propagaccedilatildeo da consulta a partir dosnodos correspondentes a termos de busca

Modificaccedilatildeo de consultas

Modificaccedilatildeo de consulta

Manual

Re-escrita de consulta

Baseada em grafo

Inserccedilatildeo de termoRemoccedilatildeo de termo

Substituiccedilatildeo de termo

Conjuntiva

Disjuntiva

Conjuntiva Disjuntiva

21042010

17

Estrutura da ontologia

Propriedades anocircnimas as relaccedilotildees entreconceitos natildeo satildeo nomeadas indicando apenasque eles compartilham o mesmo contexto

Propriedades padronizadas sinocircniacutemiahiperniacutemia meroniacutemia negaccedilatildeo etc

Propriedades especiacuteficas de domiacutenio aleacutemdas propriedades padratildeo considerapropriedades especiacuteficas de um domiacutenio (egldquotipo de cacircmerardquo em sistema para a aacuterea defotografia)rlm

Tecnologia da ontologia

F-Logic

RDF

DAML+OIL

Frames

OWL

Comparaccedilatildeo de abordagens Comparaccedilatildeo de abordagens (cont)

Buscas semacircnticas na Web hoje

httpwwwaliprcom (imagens)rlm

httpwwwcognitioncom

httpwwwdeepdyvecom

httpwwwbingcom

httpwwwcuilcom

httpwwwfreebasecom

httpwwwgooglecom

httpwwwkosmixcom

httpwwwhakiacom

httpwwwpowersetcom

httpwwwsensebotnet

httpdeveloperyahoocomsearchmonkey

httpswoogleumbcedu (ontologias)rlm

21042010

18

21042010

19

SAO PAULO-SP

University of Sao Paulo

Sao Paulo Fashion

Sao Paulo Fashion Week

Sao Paulo State

Sao Paulo Hotel

Sao Paulo Hotels

Sao Paulo Brasilien

Sao Paulo Congonhas

21042010

20

21042010

21

Sao Paulo Airport

Sao Paulo Plane Crash

Sao Paulo Zoo

hellip

21042010

22

21042010

23

Algumas questotildees em aberto

Representaccedilatildeo de contextos de usuaacuterios emapeamento desses a ontologias

Anaacutelise dos efeitos de modificaccedilotildees de consultas

Meta-buscas semacircnticas

Anaacutelise da aceitaccedilatildeo dos usuaacuterios

Adaptabilidade a diferentes ontologias

Ranking dos resultados

Integraccedilatildeo com sistemas de gerenciamento dedocumentosconteuacutedo

Tratamento de dados multimiacuteda

Interfaces homem-maacutequina

Desempenho e escalabilidade

Contextual Semantic Search (CSS)(DAgostine Fileto ndash SBBD2007)rlm

21042010

24

General Architecture for CSSThe Weighted Topic Graph(DAgostine Fileto Dantas Gauthier - ICEIS 2008)rlm

A weighted topic graph is a graph TM(T A)rlm

T is a set of topics (vertices)rlm

A is a set of associations (edges)rlm

Let be an ontology O

Each topic t in T corresponds to a ontology term o in O

Each topic t has a weight [01] The sum from the weights from all topics with same name equals 1

Each association a has a weight [01] The sum

from all the weights from all association departing

a single topics equals 1

Topic weights used to disambiguate

Eg interest in Satildeo Paulo city instead of Satildeo Paulo

state

Association weights used to semantically

expand searches

Eg Actual interest in Guarulhos and airport while

searching for Satildeo Paulo city

The Weights in the Topic Graph Capturing the Users Context

Generated Topic Graph with the Ontological Users Context

The Contextual Semantic Search Process

21042010

25

Desambiguaccedilatildeo

Fundamento dos algoritmos de busca sobre contexto ontoloacutegico

Heuriacutesticas de estigmergia (Ant Colony Optimization - ACO)

Traccedilos de ferormocircnio

Algoritmo de busca semacircntica baseada em ACO

Entrada palavras-chave[ ]

Dados G(TA) Onto repositoacuterio

limite_de_profundidade

limite_miacutenimo_de_peso

λ fator de atenuaccedilatildeo de peso

iniacutecio Algoritmo Busca Contextual 1 Estigmeacuterica

resultados = busca_G_ou_Onto(palavras-chave[])

atenuaG (iacutendice ) λrlmisin [0 1]

manutenccedilatildeo(coleta_feedback(resultados))

fim

21042010

26

Demo Praestro ndash Karina Fasolin

Alguns trabalhos relacionados

Name Article Comments

Graupmann

et al 2005

The SphereSearch

engine for unifiedranked retrieval of

heterogeneous XML

and web documents

Searches through XML documents The context is a region in radius

around given element A data inside two regions is considered relevant

to both contexts

Made tests with large collections like DBLP INEX Wikipedia put for

stress testing regarding the size of the collection

ldquoLet us first comment on the difficulties of defining a meaningfulbenchmark for this kind of novel systemrdquo

Park e

Cheyer 2006

Just For Me Topic

Maps and Ontologies

Manages knowledge in three layers Topics Knowledge Structures and

Documents

Not implemented (at least at the time of publication)

Michlmayr

et al 2007Adaptive User Profiles

for Enterprise

Information Access

Represents context as an individual graph The graph is constructed

based on tags used to semantically annotate the content which the user

considers to be relevant

However the tags are only that only labels They are not tied-down to

a formal definition

Alguns trabalhos relacionados (cont)

Name Article Comments

Aleman-

Meza et a

2003

Context-Aware

Semantic Association

Ranking

Also defines context as regions But the regions are static defined in

the ontology which is used by the system So the contexts are defined

the same for every single user

Mani and

Sundaram

2007

Modeling user context

with applications to

media retrieval

Creates a graph representing the users context Each node

corresponds to an instance in the ontology The edges represent

relations between the instances Built to search trough multimedia

documents

However it does not associates the vocabulary the user uses with the

instances

Challam et

al 2007

Contextual Search

Using Ontology-Based

User Profiles

Monitors the users activity capturing content from open Internet

Explorer MS-Office and MSN The captured information is stored and

usedrlmtorlmbuildrlmarlmuser‟srlmcontextualrlmprofilerlmbasesrlmonrlmanrlmontology

The context is tightly coupled with the ontology

NO IMAGES WERE

PROVIDED

Vallet et al

2006

Personalized

Information Retrieval in

Context

Stores context as a graph constructed based on the ontology used by

the system Similar to Mani and Sundaram including its limitations

(mapping the vocabulary) however if built for text documents

Sieg et al

2007

Ontological User

Profiles for

Personalized Web

Search

Similar to Challam et al but it gets the context information from the

ontology terms used to annotate the retrieved relevant context

Also limited by the structure of the ontology

Alguns trabalhos relacionados(cont)

Name Deals with

objective

knowledge

(ontology)

Deals with

subjective

knowledge

(users

context)

The knowledge

management is

transparent

Idea Implemented

Graupmann et

al 2005

X IMPL

Park e Cheyer

2006

X X X IDEA

Michlmayr et al2007

X X IMPL

Aleman-Meza et

a 2003

X X IMPL

Mani eSundaram 2007

X X X IMPL

Challam et al

2007

X X X IMPL

Vallet et al 2006 X X X IMPL

Sieg et al 2007 X X X IMPL

(incomplete)

Praestro X X X IMPL

(prototype)

UnA-SUS ndash Universidade Aberta do SUS

Programa do Ministeacuterio da Sauacutede para atender necessidades de e

permanente dos

Accedilotildees focadas em

formulaccedilatildeo de conteuacutedo

bibliotecas digitais

cursos a distacircncia

21042010

27

Metas da UnA-SUS

Desenvolver um

plataforma para de

composiccedilatildeo e de

Montar e oferecer cursos para formaccedilatildeo continuada de profissionais da sauacutede

157

Metadados

O processo de produccedilatildeo catalogaccedilatildeo e reuso de OAs

Repositoacuterio

Conteuacutedo

OAs

requisiccedilotildees

Design revisatildeo e publicaccedilatildeo

OA

SGA outros reps

Busca e reuso

OAsMetadados

OAs

Concepccedilatildeo e validaccedilatildeo de OAs

O processo de produccedilatildeo catalogaccedilatildeo e reuso de OAs

OA1

Curso A

Curso B

OA2

OA3

Viacutedeo

Imagens

RepositoacuteriosConteuacutedoMultimiacutedia

SGA RepositoacuteriosOAs

Reuso eacute essencial

bull OAs satildeo caros para produzir

bull Demandas emergenciais na sauacutede puacuteblica exigem agilidade e pronta resposta com cursos para a qualificaccedilatildeo de profissionais

H1N1

Apoplexia

gripe suiacutena gripe A

influenza H1N1

hellip

21042010

28

Navegaccedilatildeo hiperboacutelica no DeCSCatalogaccedilatildeo de Objetos de Aprendizagem (OAs) usando Vocabulaacuterios Controlados

bull Seleccedilatildeo de termos do DeCS CID-10 SNOMED

ndash via fornecimento de palavras-chave que satildeo pesquisadas na base de conhecimento

ndash via navegaccedilatildeo em uma visatildeo do conhecimento em forma de aacutervore

Seleccedilatildeo via contexto ontoloacutegicoProtoacutetipo (catalogaccedilatildeo com entrada

de palavra-chave)

DSpaceCatalogaccedilatildeo de OAswf

Protoacutetipo (catalogaccedilatildeo com navegaccedilatildeo

na base de conhecimento)

DSpaceRecuperaccedilatildeo de OAswf

21042010

29

Recuperaccedilatildeo de Objetos de Aprendizagem (OAs) Baseada em Conhecimento

bull Vocabulaacuterios e relaccedilotildees semacircnticas

ndash Oriundos do DeCS

ndash Definidos pelos catalogadores de OAs

ndash Gerados pelo cruzamento de informaccedilotildees com o CID-10 (Classificaccedilatildeo Internacional de Doenccedilas)

ndash Ex sinocircnimos eacute um(a) parte de causa efeito sintoma etc

DeCs

Anatomia

Sistema Nervoso

Sistema Nervoso Central

Enceacutefalo

Prosenceacutefalo

Telencaacutefalo

Ceacuterebro

Doenccedilas

Doenccedilas do Sistema Nervoso

Doenccedilas Cardiovasculares

Doenccedilas do Sistema Nervoso Central

Encefalopatias

Transtornos Cerebrovasculares

Doenccedilas Vasculares

Transtornos Cerebrovasculares

Acidente Vascular Cerebral

Acidente Vascular Cerebral

OA 1

OA 2

AVC

IctusCerebral

Derrame Cerebral

Hemisfeacuterios Cerebrais

ApoplexiaAcidente

Cerebrovascular

IctoCerebral

Apoplexia Cerebrovascular

Apoplexia Cerebral

Acidente Vascular

Encefaacutelico

Acidente Vascular

do Ceacuterebro

Acidente Vascular Cerebral

padratildeo (sinocircnimo)

anota

especiacutefica de domiacutenio

anocircnimas (DeCs)

172

DeCs

Anatomia

Sistema Nervoso

Sistema Nervoso Central

Enceacutefalo

Prosenceacutefalo

Telencaacutefalo

Ceacuterebro (2)

Doenccedilas

Doenccedilas do Sistema Nervoso

Doenccedilas Cardiovasculares

Doenccedilas do Sistema Nervoso Central

Encefalopatias

Transtornos Cerebrovasculares

Doenccedilas Vasculares

Transtornos Cerebrovasculares

Acidente Cerebral Vascular (1)

Acidente Cerebral Vascular(1)

OA 1

OA 2

AVC

IctusCerebral

Derrame Cerebral

Hemisfeacuterios Cerebrais

ApoplexiaAcidente

Cerebrovascular

IctoCerebral

Apoplexia Cerebrovascular

Apoplexia Cerebral

Acidente Vascular

Encefaacutelico

Acidente Vascular

do Ceacuterebro

Acidente Vascular Cerebral

Busca de OAs na aacuterea de sauacutede usando conhecimento de domiacutenio

Semantic Learning Objects (VIAN J SILVEIRA R A FILETO R WCCE 2009)

21042010

30

Conclusotildees

A Web semacircntica tem potencial de contribuir naobtenccedilatildeo de melhores resultados para buscas

Suporte automatizado eacute fundamental para a construccedilatildeo evoluccedilatildeo e integraccedilatildeo de ontologias anotaccedilotildees semacircnticas e contextos de usuaacuterios

Nossos primeiros resultados focam na captura e utilizaccedilatildeo de contextos de usuaacuterios mapeados a ontologias de domiacutenios especiacuteficos paradesambiguar e estender as buscas

Trabalhos futuros

Processos parcialmente automatizados para geraccedilatildeo e atualizaccedilatildeo de ontologias e anotaccedilotildees semacircnticas

Experimentos para comprovar a eficaacutecia das teacutecnicas e ferramentas utilizadas

Validaccedilatildeo de soluccedilotildees de problemas de busca semacircntica em diversos domiacutenios de aplicaccedilatildeo

Determinaccedilatildeo de niacuteveis adequados de acoplamento entre contextos e ontologias e dessas com os recursos a serem recuperados

Notiacutecias e anaacutelises

httpnewscnetcomnew-search-engine-cuil-takes-aim-at-google

httpwwwreadwritewebcomarchivesis_google_a_semantic_search_enginephp

httpwwwreadwritewebcomarchivessemantic_search_the_myt

h_and_realityphp

httpwwwpandiacomsew1262-top-5-semantic-search-

engineshtml

httpmindsetresearchyahoocom

httpnewscnetcom8301-13953_3-9982015-80html

httpwwwsearchenginejournalcomaskcom-focuses-on-semantic-search8252

httpnewsbbccouk2hiprogrammesclick_onlinedefaultstm

httpnewsbbccouk2hiprogrammesclick_online8144765stm

Web semacircntica e buscassemacircnticas

httpwwww3org2001sw

httpsemanticweborg

httpenwikipediaorgwikiSemantic_Web

httpenwikipediaorgwikiSemantic_search

Ferramentas de desenvolvimento

httpprotegestanfordedu

httpjenasourceforgenet

httpwwww3org2001Annotea

httpwwwontotextcomkim

httpesww3orgtopicSemanticWebTools

httpwwwdamlorg200305swmu-tools-

tutorialOverviewhtml

Referecircncias em Web semacircntica

T Berners-Lee J Hendler e O Lassila The Semantic Web Scientific American May 2001

Thomas B Passing Explores Guide to the Semantic Web Manning Publications Greenwich CT 2005

Davies J Studer R Warren P (Eds) Semantic Web Technologies trends and research in ontology-based

Systems John Wiley amp Sons 2006

Breitman KK Casanova MA Truszkowski W Semantic Web

Concepts Technologies and Applications Series NASA Monographs in Systems and Software Engineering Springer 2007

Grigoris Antoniou and Frank van Harmelen A Semantic Web Primer 2nd edition The MIT Press Cambridge MA USA 2008

Kashyap V Bussler C Moran M The Semantic Web -Semantics for Data and Services on the Web Series Data-

Centric Systems and Applications Springer 2008

Hitzler P Krotzsch M Rudolph S Foundations of SemanticWeb Technologies Chapman amp HallCRC 2009

21042010

31

Referecircncias em buscas semacircnticas

Guha R McCool R and Miller E 2003 Semantic search In Proc of the 12th international Conference on World Wide Web

(WWW) Budapest Hungary ACM New York NY 2003 700-709

Reeve L and Han H 2005 Survey of semantic annotation

platforms In Proceedings of the ACM Symposium on Applied Computing Santa Fe New Mexico ACM New York NY 2005

1634-1638

Eetu Makela Survey of Semantic Search Research

Mangold C A Survey and classification of semantic search approaches Journal of Metadata Semantics and Ontology 2(1)

2007

Stephan Bloehdorn Philipp Cimiano Alistair Duke Peter Haase Joumlrg Heizmann Ian Thurlow Johanna Voumllker Ontology-BasedQuestion Answering for Digital Libraries ECDL 2007 14-25

Hai Dong Hussain FK Chang E A survey in semantic search technologies In 2nd IEEE International Conference on

Digital Ecosystems and Technologies 2008 403-408

Algumas referecircncias grupo UFSC

DAgostini C S Fileto R Capturing Users Preferences and Intentions in a Semantic Search System In 21st International

Conference on Software Engineering amp Knowledge Engineering (SEKE) Boston 2009 p 587-591

DAgostini C S Fileto R Dantas M A R Gauthier F A O

Contextual Semantic Search - Capturing using the UsersContext to Direct Semantic Search In 10th InternationalConference on Enterprise Information Systems (ICEIS) Barcelona

Spain 2008 v SAIC p 154-159

DAgostini C S Fileto R Capturing and managing usercontext for improving information retrieval In Workshop de

Teses e Dissertaccedilotildees do Simpoacutesio Brasileiro de Bancos de Dados (WTDBDSBBD) Campinas Unicamp Brazil 2008

Vian J Silveira R A Fileto R Proposal of a Multi-agent System for Indexing and Recovery applied to Learning

Objects In 9th IFIP World Conference on Computers in Education (WCCE) Bento Goncalves Brazil 2009

Alguns projetos na UFSC

httpwwwlisaufscbrprojetos

httpwwwunasusufscbr

httpwwwliteraturabrasileiraufscbr

Perguntas

Page 12: Buscas Semânticasfileto/Talks/BuscasSemanticas6sp.pdf · 21/04/2010 1 1 Buscas semânticas: panorama e tendências atuais minicurso ERBD 2010 RenatoFileto fileto@inf.ufsc.br AlunosColaboradores:

21042010

12

Anotaccedilatildeo Semacircntica de Documentos

Atribui agraves entidades que aparecem no documento ligaccedilotildees com suas descriccedilotildees semacircnticas na ontologia

Aplicaacutevel a qualquer tipo de texto (documentos HTML documentos de texto comuns campos de banco de dados entre outros)

Representaccedilatildeo das anotaccedilotildees

Intrusiva

Natildeo intrusiva

Confecccedilatildeo das anotaccedilotildees

bull Semi-Automaacutetica Associa palavras do texto a classes

instacircncias e propriedades da ontologia utilizando-se do

julgamento humano Esta associaccedilatildeo geralmente eacute efetuada

atraveacutes de interfaces ldquoarraste-e-solterdquo (eg OntoMat)rlm

bull Automaacutetica Aplica teacutecnicas de processamento de

linguagem natural aprendizado de maacutequina e extraccedilatildeo de

informaccedilatildeo entre outras para associar palavras agrave ontologia

Essas ferramentas podem utilizar ontologias padratildeo (eg

IEEE Standard Upper Ontology) ou ontologias de domiacutenios

especiacuteficos (eg Unified Medical Language System)

bull Hiacutebrida Combinaccedilatildeo das teacutecnicas acima

Geraccedilatildeo de anotaccedilotildees semacircnticas (Reeve e Han 2005)rlm

Ferramentas para anotaccedilatildeo

Annozilla Funciona sobre o Mozzila Firefox

Annotea projeto da W3C - servidor de anotaccedilotildees em RDF

Armadillo

Muse

Pankol

Semantic Word anotaccedilatildeo interativa de porccedilotildees de documentos

Word

OntoMat Annotizer anotaccedilatildeo interativa de paacuteginas Web com

ontologias em OWL

Smore marcaccedilotildees sobre HTML com ontologias em OWL

Melita ferramenta de anotaccedilatildeo semi-automaacutetica que usa algoritmo

de IE para ajudar o usuaacuterio no processo de anotaccedilatildeo

MnM anotaccedilatildeo semacircntica de paacuteginas Web com metadados

descritos em RDFOCMLDAML+OIL

KIM permite criar metadados armazenar e buscar informaccedilotildees e

pode ser usada para anotaccedilatildeo e procura de documentos

21042010

13

O processo automatizado de anotaccedilatildeo semacircntica de documentos

Tokenizaccedilatildeo e Eliminaccedilatildeo de StopWords

Etiquetagem

Stemmer

Corpus Anotado

Identificaccedilatildeo EN

Associaccedilatildeo atermos da ontologia

RepositoacuterioSemacircntico

Tokensrelevantes

Palavras +Classificaccedilatildeo Gramatical

Radicais das Palavras +Classificaccedilatildeo Gramatical

Entidades Nomeadas

Anotaccedilatildeo Semacircntica

Dados Metadados Documento

s

Ontologia do Domiacutenio

Valida

Valida

Especialista

RepositoacuterioInformaccedilatildeo

Annotation example(Davies et al 2006)

Consider the phrase

There are deliverables

The tokens are

[There] [are] [deliverables] []

The tagger finds out what kind of a word each of the tokens

is (whether it is a noun an adjective a verb etc)rlm

[There] existential quantifier

[are] verbmdash3rd person singular present

[deliverables] nounmdashplural

Annotation example (cont)rlm

The morphological analyser gives the roots of all the words

[There] rootmdashthere

[are] rootmdashbe

[deliverables] rootmdashdeliverable

There are mdash mdashmdash

triggers the creation of one or more new classes in the

ontology

There are projects

There are workpackages tasks and deliverables

SEKT is a project

MUSINGrlmbdquoKnowledgerlmWeb‟rlmandrlmbdquoPrestorlmSpace‟rlmarerlmprojects

Projects have workpackages

Workpackages can have tasks

WP1 WP2 WP3 WP4 WP5 and WP6 are workpackages

SEKT has WP1

MUSING has WP2 WP3 and WP4

bdquoKnowledgerlmWeb‟rlmhasrlmWP5 and WP6

Annotation example (cont)rlm

Ontologia resultante Quadro Comparativo(Nunes e Fileto 2007)rlm

21042010

14

Dependecircncias entre plataformas(Rui Tramontin Junior 2007)rlm

Comparaccedilatildeo de desempenho(Reeve e Han 2005)rlm

Prataforma Categoria Precisatildeo Cobertura Medida F

Armadillo Descoberta de padrotildees

910 740 870

KIM Regras 860 820 840

MnM Induccedilatildeo 950 900 nd

MUSE Regras 935 923 929

PANKOW Descoberta de padrotildees

650 282 249

SemTag Regras 820 nd nd

Evoluccedilatildeo de ontologias(Bloehdorn et al 2006)rlm

Exemplo Uso natildeo uniforme de conceitos

Alternativas para remoccedilatildeo do conceito C que tem sub-conceitos

Processo de evoluccedilatildeo de ontologias

CapturaCaptura

da

Mudanccedila

Representaccedilatildeo Semacircntica Propagaccedilatildeo Implementaccedilatildeo Validaccedilatildeo

Fases Elementares

21042010

15

Mapeamentos entre ontologias(Ontology Matching)

Fusatildeo de ontologias

Processo semi-automatico de alinhamento(Huang at al 2006)rlm

Referecircncia

Jerome Euzenat INRIA Rhone-Alpes France

Pavel Shvaiko University of Trento Italy

Ontology Matching

URL httpbookontologymatchingorg

Springer-Verlag Heidelberg (DE) 2007

343 p 67 illus Hardcover

ISBN 978-3-540-49611-3

E as buscas semacircnticas

Recuperaccedilatildeo da informaccedilatildeo de documentosrlm

Medidas da eficaacutecia das soluccedilotildees

precisatildeo = nro de docs relevantes recuperadosnro de docs recuperados

cobertura = nro de docs relevantes recuperadosnro de docs relevantes

21042010

16

Classificaccedilatildeo de abordagens para buscas semacircnticas (Mangold 2007)

Arquitetura

Acoplamento entre ontologias e documentos

Transparecircncia

Contexto do usuaacuterio

Modificaccedilatildeo de consultas

Estrutura das ontologias

Tecnologia para representar as ontologias

Desempenho escalabilidade e distribuiccedilatildeo

Adaptabilidade

Ranking

Arquiteturas para buscas semacircnticas

Maacutequina de busca stand_alone armazenametadados sobre os documentos em iacutendicescom os quais avalia as consultas

Meta-maacutequina de busca distribui asconsultas para outras maacutequinas de busca ecombina os resultados

Acoplamento ontologias-documentos

Acoplamento forte os metadados dosdocumentos referem-se explicitamente aosconceitos de uma ontologia e vice-versa(requer anotaccedilatildeo semacircntica)rlm

Acoplamento fraco os documentos satildeoindependentes de quaisquer ontologiasdisponiacuteveis (pode restringir a capacidade debusca)rlm

Contexto do usuaacuterio

Learning extraiacutedo na interaccedilotildees do usuaacuteriocom o sistema (histoacuterico das consultas erefinamentos de consultas)rlm

Hard-coded as consultas satildeo organizadas emcategorias que definem a informaccedilatildeo solicitada(eg ldquolocation ofrdquo ldquoresources forrdquo rlm(

Modificaccedilatildeo de consultas

Manual o sistema retorna um trechoapropriado da ontologia junto com a respostapermitindo ao usuaacuterio navegar na ontologia ereformular a consulta pela adiccedilatildeo e remoccedilatildeo determos

Re-escrita automaacutetica a consulta eacuteotimizada automaticamente pelo sistema

Baseada em grafo considera conceitos edocumentos como nodos de um grafoefetuando propagaccedilatildeo da consulta a partir dosnodos correspondentes a termos de busca

Modificaccedilatildeo de consultas

Modificaccedilatildeo de consulta

Manual

Re-escrita de consulta

Baseada em grafo

Inserccedilatildeo de termoRemoccedilatildeo de termo

Substituiccedilatildeo de termo

Conjuntiva

Disjuntiva

Conjuntiva Disjuntiva

21042010

17

Estrutura da ontologia

Propriedades anocircnimas as relaccedilotildees entreconceitos natildeo satildeo nomeadas indicando apenasque eles compartilham o mesmo contexto

Propriedades padronizadas sinocircniacutemiahiperniacutemia meroniacutemia negaccedilatildeo etc

Propriedades especiacuteficas de domiacutenio aleacutemdas propriedades padratildeo considerapropriedades especiacuteficas de um domiacutenio (egldquotipo de cacircmerardquo em sistema para a aacuterea defotografia)rlm

Tecnologia da ontologia

F-Logic

RDF

DAML+OIL

Frames

OWL

Comparaccedilatildeo de abordagens Comparaccedilatildeo de abordagens (cont)

Buscas semacircnticas na Web hoje

httpwwwaliprcom (imagens)rlm

httpwwwcognitioncom

httpwwwdeepdyvecom

httpwwwbingcom

httpwwwcuilcom

httpwwwfreebasecom

httpwwwgooglecom

httpwwwkosmixcom

httpwwwhakiacom

httpwwwpowersetcom

httpwwwsensebotnet

httpdeveloperyahoocomsearchmonkey

httpswoogleumbcedu (ontologias)rlm

21042010

18

21042010

19

SAO PAULO-SP

University of Sao Paulo

Sao Paulo Fashion

Sao Paulo Fashion Week

Sao Paulo State

Sao Paulo Hotel

Sao Paulo Hotels

Sao Paulo Brasilien

Sao Paulo Congonhas

21042010

20

21042010

21

Sao Paulo Airport

Sao Paulo Plane Crash

Sao Paulo Zoo

hellip

21042010

22

21042010

23

Algumas questotildees em aberto

Representaccedilatildeo de contextos de usuaacuterios emapeamento desses a ontologias

Anaacutelise dos efeitos de modificaccedilotildees de consultas

Meta-buscas semacircnticas

Anaacutelise da aceitaccedilatildeo dos usuaacuterios

Adaptabilidade a diferentes ontologias

Ranking dos resultados

Integraccedilatildeo com sistemas de gerenciamento dedocumentosconteuacutedo

Tratamento de dados multimiacuteda

Interfaces homem-maacutequina

Desempenho e escalabilidade

Contextual Semantic Search (CSS)(DAgostine Fileto ndash SBBD2007)rlm

21042010

24

General Architecture for CSSThe Weighted Topic Graph(DAgostine Fileto Dantas Gauthier - ICEIS 2008)rlm

A weighted topic graph is a graph TM(T A)rlm

T is a set of topics (vertices)rlm

A is a set of associations (edges)rlm

Let be an ontology O

Each topic t in T corresponds to a ontology term o in O

Each topic t has a weight [01] The sum from the weights from all topics with same name equals 1

Each association a has a weight [01] The sum

from all the weights from all association departing

a single topics equals 1

Topic weights used to disambiguate

Eg interest in Satildeo Paulo city instead of Satildeo Paulo

state

Association weights used to semantically

expand searches

Eg Actual interest in Guarulhos and airport while

searching for Satildeo Paulo city

The Weights in the Topic Graph Capturing the Users Context

Generated Topic Graph with the Ontological Users Context

The Contextual Semantic Search Process

21042010

25

Desambiguaccedilatildeo

Fundamento dos algoritmos de busca sobre contexto ontoloacutegico

Heuriacutesticas de estigmergia (Ant Colony Optimization - ACO)

Traccedilos de ferormocircnio

Algoritmo de busca semacircntica baseada em ACO

Entrada palavras-chave[ ]

Dados G(TA) Onto repositoacuterio

limite_de_profundidade

limite_miacutenimo_de_peso

λ fator de atenuaccedilatildeo de peso

iniacutecio Algoritmo Busca Contextual 1 Estigmeacuterica

resultados = busca_G_ou_Onto(palavras-chave[])

atenuaG (iacutendice ) λrlmisin [0 1]

manutenccedilatildeo(coleta_feedback(resultados))

fim

21042010

26

Demo Praestro ndash Karina Fasolin

Alguns trabalhos relacionados

Name Article Comments

Graupmann

et al 2005

The SphereSearch

engine for unifiedranked retrieval of

heterogeneous XML

and web documents

Searches through XML documents The context is a region in radius

around given element A data inside two regions is considered relevant

to both contexts

Made tests with large collections like DBLP INEX Wikipedia put for

stress testing regarding the size of the collection

ldquoLet us first comment on the difficulties of defining a meaningfulbenchmark for this kind of novel systemrdquo

Park e

Cheyer 2006

Just For Me Topic

Maps and Ontologies

Manages knowledge in three layers Topics Knowledge Structures and

Documents

Not implemented (at least at the time of publication)

Michlmayr

et al 2007Adaptive User Profiles

for Enterprise

Information Access

Represents context as an individual graph The graph is constructed

based on tags used to semantically annotate the content which the user

considers to be relevant

However the tags are only that only labels They are not tied-down to

a formal definition

Alguns trabalhos relacionados (cont)

Name Article Comments

Aleman-

Meza et a

2003

Context-Aware

Semantic Association

Ranking

Also defines context as regions But the regions are static defined in

the ontology which is used by the system So the contexts are defined

the same for every single user

Mani and

Sundaram

2007

Modeling user context

with applications to

media retrieval

Creates a graph representing the users context Each node

corresponds to an instance in the ontology The edges represent

relations between the instances Built to search trough multimedia

documents

However it does not associates the vocabulary the user uses with the

instances

Challam et

al 2007

Contextual Search

Using Ontology-Based

User Profiles

Monitors the users activity capturing content from open Internet

Explorer MS-Office and MSN The captured information is stored and

usedrlmtorlmbuildrlmarlmuser‟srlmcontextualrlmprofilerlmbasesrlmonrlmanrlmontology

The context is tightly coupled with the ontology

NO IMAGES WERE

PROVIDED

Vallet et al

2006

Personalized

Information Retrieval in

Context

Stores context as a graph constructed based on the ontology used by

the system Similar to Mani and Sundaram including its limitations

(mapping the vocabulary) however if built for text documents

Sieg et al

2007

Ontological User

Profiles for

Personalized Web

Search

Similar to Challam et al but it gets the context information from the

ontology terms used to annotate the retrieved relevant context

Also limited by the structure of the ontology

Alguns trabalhos relacionados(cont)

Name Deals with

objective

knowledge

(ontology)

Deals with

subjective

knowledge

(users

context)

The knowledge

management is

transparent

Idea Implemented

Graupmann et

al 2005

X IMPL

Park e Cheyer

2006

X X X IDEA

Michlmayr et al2007

X X IMPL

Aleman-Meza et

a 2003

X X IMPL

Mani eSundaram 2007

X X X IMPL

Challam et al

2007

X X X IMPL

Vallet et al 2006 X X X IMPL

Sieg et al 2007 X X X IMPL

(incomplete)

Praestro X X X IMPL

(prototype)

UnA-SUS ndash Universidade Aberta do SUS

Programa do Ministeacuterio da Sauacutede para atender necessidades de e

permanente dos

Accedilotildees focadas em

formulaccedilatildeo de conteuacutedo

bibliotecas digitais

cursos a distacircncia

21042010

27

Metas da UnA-SUS

Desenvolver um

plataforma para de

composiccedilatildeo e de

Montar e oferecer cursos para formaccedilatildeo continuada de profissionais da sauacutede

157

Metadados

O processo de produccedilatildeo catalogaccedilatildeo e reuso de OAs

Repositoacuterio

Conteuacutedo

OAs

requisiccedilotildees

Design revisatildeo e publicaccedilatildeo

OA

SGA outros reps

Busca e reuso

OAsMetadados

OAs

Concepccedilatildeo e validaccedilatildeo de OAs

O processo de produccedilatildeo catalogaccedilatildeo e reuso de OAs

OA1

Curso A

Curso B

OA2

OA3

Viacutedeo

Imagens

RepositoacuteriosConteuacutedoMultimiacutedia

SGA RepositoacuteriosOAs

Reuso eacute essencial

bull OAs satildeo caros para produzir

bull Demandas emergenciais na sauacutede puacuteblica exigem agilidade e pronta resposta com cursos para a qualificaccedilatildeo de profissionais

H1N1

Apoplexia

gripe suiacutena gripe A

influenza H1N1

hellip

21042010

28

Navegaccedilatildeo hiperboacutelica no DeCSCatalogaccedilatildeo de Objetos de Aprendizagem (OAs) usando Vocabulaacuterios Controlados

bull Seleccedilatildeo de termos do DeCS CID-10 SNOMED

ndash via fornecimento de palavras-chave que satildeo pesquisadas na base de conhecimento

ndash via navegaccedilatildeo em uma visatildeo do conhecimento em forma de aacutervore

Seleccedilatildeo via contexto ontoloacutegicoProtoacutetipo (catalogaccedilatildeo com entrada

de palavra-chave)

DSpaceCatalogaccedilatildeo de OAswf

Protoacutetipo (catalogaccedilatildeo com navegaccedilatildeo

na base de conhecimento)

DSpaceRecuperaccedilatildeo de OAswf

21042010

29

Recuperaccedilatildeo de Objetos de Aprendizagem (OAs) Baseada em Conhecimento

bull Vocabulaacuterios e relaccedilotildees semacircnticas

ndash Oriundos do DeCS

ndash Definidos pelos catalogadores de OAs

ndash Gerados pelo cruzamento de informaccedilotildees com o CID-10 (Classificaccedilatildeo Internacional de Doenccedilas)

ndash Ex sinocircnimos eacute um(a) parte de causa efeito sintoma etc

DeCs

Anatomia

Sistema Nervoso

Sistema Nervoso Central

Enceacutefalo

Prosenceacutefalo

Telencaacutefalo

Ceacuterebro

Doenccedilas

Doenccedilas do Sistema Nervoso

Doenccedilas Cardiovasculares

Doenccedilas do Sistema Nervoso Central

Encefalopatias

Transtornos Cerebrovasculares

Doenccedilas Vasculares

Transtornos Cerebrovasculares

Acidente Vascular Cerebral

Acidente Vascular Cerebral

OA 1

OA 2

AVC

IctusCerebral

Derrame Cerebral

Hemisfeacuterios Cerebrais

ApoplexiaAcidente

Cerebrovascular

IctoCerebral

Apoplexia Cerebrovascular

Apoplexia Cerebral

Acidente Vascular

Encefaacutelico

Acidente Vascular

do Ceacuterebro

Acidente Vascular Cerebral

padratildeo (sinocircnimo)

anota

especiacutefica de domiacutenio

anocircnimas (DeCs)

172

DeCs

Anatomia

Sistema Nervoso

Sistema Nervoso Central

Enceacutefalo

Prosenceacutefalo

Telencaacutefalo

Ceacuterebro (2)

Doenccedilas

Doenccedilas do Sistema Nervoso

Doenccedilas Cardiovasculares

Doenccedilas do Sistema Nervoso Central

Encefalopatias

Transtornos Cerebrovasculares

Doenccedilas Vasculares

Transtornos Cerebrovasculares

Acidente Cerebral Vascular (1)

Acidente Cerebral Vascular(1)

OA 1

OA 2

AVC

IctusCerebral

Derrame Cerebral

Hemisfeacuterios Cerebrais

ApoplexiaAcidente

Cerebrovascular

IctoCerebral

Apoplexia Cerebrovascular

Apoplexia Cerebral

Acidente Vascular

Encefaacutelico

Acidente Vascular

do Ceacuterebro

Acidente Vascular Cerebral

Busca de OAs na aacuterea de sauacutede usando conhecimento de domiacutenio

Semantic Learning Objects (VIAN J SILVEIRA R A FILETO R WCCE 2009)

21042010

30

Conclusotildees

A Web semacircntica tem potencial de contribuir naobtenccedilatildeo de melhores resultados para buscas

Suporte automatizado eacute fundamental para a construccedilatildeo evoluccedilatildeo e integraccedilatildeo de ontologias anotaccedilotildees semacircnticas e contextos de usuaacuterios

Nossos primeiros resultados focam na captura e utilizaccedilatildeo de contextos de usuaacuterios mapeados a ontologias de domiacutenios especiacuteficos paradesambiguar e estender as buscas

Trabalhos futuros

Processos parcialmente automatizados para geraccedilatildeo e atualizaccedilatildeo de ontologias e anotaccedilotildees semacircnticas

Experimentos para comprovar a eficaacutecia das teacutecnicas e ferramentas utilizadas

Validaccedilatildeo de soluccedilotildees de problemas de busca semacircntica em diversos domiacutenios de aplicaccedilatildeo

Determinaccedilatildeo de niacuteveis adequados de acoplamento entre contextos e ontologias e dessas com os recursos a serem recuperados

Notiacutecias e anaacutelises

httpnewscnetcomnew-search-engine-cuil-takes-aim-at-google

httpwwwreadwritewebcomarchivesis_google_a_semantic_search_enginephp

httpwwwreadwritewebcomarchivessemantic_search_the_myt

h_and_realityphp

httpwwwpandiacomsew1262-top-5-semantic-search-

engineshtml

httpmindsetresearchyahoocom

httpnewscnetcom8301-13953_3-9982015-80html

httpwwwsearchenginejournalcomaskcom-focuses-on-semantic-search8252

httpnewsbbccouk2hiprogrammesclick_onlinedefaultstm

httpnewsbbccouk2hiprogrammesclick_online8144765stm

Web semacircntica e buscassemacircnticas

httpwwww3org2001sw

httpsemanticweborg

httpenwikipediaorgwikiSemantic_Web

httpenwikipediaorgwikiSemantic_search

Ferramentas de desenvolvimento

httpprotegestanfordedu

httpjenasourceforgenet

httpwwww3org2001Annotea

httpwwwontotextcomkim

httpesww3orgtopicSemanticWebTools

httpwwwdamlorg200305swmu-tools-

tutorialOverviewhtml

Referecircncias em Web semacircntica

T Berners-Lee J Hendler e O Lassila The Semantic Web Scientific American May 2001

Thomas B Passing Explores Guide to the Semantic Web Manning Publications Greenwich CT 2005

Davies J Studer R Warren P (Eds) Semantic Web Technologies trends and research in ontology-based

Systems John Wiley amp Sons 2006

Breitman KK Casanova MA Truszkowski W Semantic Web

Concepts Technologies and Applications Series NASA Monographs in Systems and Software Engineering Springer 2007

Grigoris Antoniou and Frank van Harmelen A Semantic Web Primer 2nd edition The MIT Press Cambridge MA USA 2008

Kashyap V Bussler C Moran M The Semantic Web -Semantics for Data and Services on the Web Series Data-

Centric Systems and Applications Springer 2008

Hitzler P Krotzsch M Rudolph S Foundations of SemanticWeb Technologies Chapman amp HallCRC 2009

21042010

31

Referecircncias em buscas semacircnticas

Guha R McCool R and Miller E 2003 Semantic search In Proc of the 12th international Conference on World Wide Web

(WWW) Budapest Hungary ACM New York NY 2003 700-709

Reeve L and Han H 2005 Survey of semantic annotation

platforms In Proceedings of the ACM Symposium on Applied Computing Santa Fe New Mexico ACM New York NY 2005

1634-1638

Eetu Makela Survey of Semantic Search Research

Mangold C A Survey and classification of semantic search approaches Journal of Metadata Semantics and Ontology 2(1)

2007

Stephan Bloehdorn Philipp Cimiano Alistair Duke Peter Haase Joumlrg Heizmann Ian Thurlow Johanna Voumllker Ontology-BasedQuestion Answering for Digital Libraries ECDL 2007 14-25

Hai Dong Hussain FK Chang E A survey in semantic search technologies In 2nd IEEE International Conference on

Digital Ecosystems and Technologies 2008 403-408

Algumas referecircncias grupo UFSC

DAgostini C S Fileto R Capturing Users Preferences and Intentions in a Semantic Search System In 21st International

Conference on Software Engineering amp Knowledge Engineering (SEKE) Boston 2009 p 587-591

DAgostini C S Fileto R Dantas M A R Gauthier F A O

Contextual Semantic Search - Capturing using the UsersContext to Direct Semantic Search In 10th InternationalConference on Enterprise Information Systems (ICEIS) Barcelona

Spain 2008 v SAIC p 154-159

DAgostini C S Fileto R Capturing and managing usercontext for improving information retrieval In Workshop de

Teses e Dissertaccedilotildees do Simpoacutesio Brasileiro de Bancos de Dados (WTDBDSBBD) Campinas Unicamp Brazil 2008

Vian J Silveira R A Fileto R Proposal of a Multi-agent System for Indexing and Recovery applied to Learning

Objects In 9th IFIP World Conference on Computers in Education (WCCE) Bento Goncalves Brazil 2009

Alguns projetos na UFSC

httpwwwlisaufscbrprojetos

httpwwwunasusufscbr

httpwwwliteraturabrasileiraufscbr

Perguntas

Page 13: Buscas Semânticasfileto/Talks/BuscasSemanticas6sp.pdf · 21/04/2010 1 1 Buscas semânticas: panorama e tendências atuais minicurso ERBD 2010 RenatoFileto fileto@inf.ufsc.br AlunosColaboradores:

21042010

13

O processo automatizado de anotaccedilatildeo semacircntica de documentos

Tokenizaccedilatildeo e Eliminaccedilatildeo de StopWords

Etiquetagem

Stemmer

Corpus Anotado

Identificaccedilatildeo EN

Associaccedilatildeo atermos da ontologia

RepositoacuterioSemacircntico

Tokensrelevantes

Palavras +Classificaccedilatildeo Gramatical

Radicais das Palavras +Classificaccedilatildeo Gramatical

Entidades Nomeadas

Anotaccedilatildeo Semacircntica

Dados Metadados Documento

s

Ontologia do Domiacutenio

Valida

Valida

Especialista

RepositoacuterioInformaccedilatildeo

Annotation example(Davies et al 2006)

Consider the phrase

There are deliverables

The tokens are

[There] [are] [deliverables] []

The tagger finds out what kind of a word each of the tokens

is (whether it is a noun an adjective a verb etc)rlm

[There] existential quantifier

[are] verbmdash3rd person singular present

[deliverables] nounmdashplural

Annotation example (cont)rlm

The morphological analyser gives the roots of all the words

[There] rootmdashthere

[are] rootmdashbe

[deliverables] rootmdashdeliverable

There are mdash mdashmdash

triggers the creation of one or more new classes in the

ontology

There are projects

There are workpackages tasks and deliverables

SEKT is a project

MUSINGrlmbdquoKnowledgerlmWeb‟rlmandrlmbdquoPrestorlmSpace‟rlmarerlmprojects

Projects have workpackages

Workpackages can have tasks

WP1 WP2 WP3 WP4 WP5 and WP6 are workpackages

SEKT has WP1

MUSING has WP2 WP3 and WP4

bdquoKnowledgerlmWeb‟rlmhasrlmWP5 and WP6

Annotation example (cont)rlm

Ontologia resultante Quadro Comparativo(Nunes e Fileto 2007)rlm

21042010

14

Dependecircncias entre plataformas(Rui Tramontin Junior 2007)rlm

Comparaccedilatildeo de desempenho(Reeve e Han 2005)rlm

Prataforma Categoria Precisatildeo Cobertura Medida F

Armadillo Descoberta de padrotildees

910 740 870

KIM Regras 860 820 840

MnM Induccedilatildeo 950 900 nd

MUSE Regras 935 923 929

PANKOW Descoberta de padrotildees

650 282 249

SemTag Regras 820 nd nd

Evoluccedilatildeo de ontologias(Bloehdorn et al 2006)rlm

Exemplo Uso natildeo uniforme de conceitos

Alternativas para remoccedilatildeo do conceito C que tem sub-conceitos

Processo de evoluccedilatildeo de ontologias

CapturaCaptura

da

Mudanccedila

Representaccedilatildeo Semacircntica Propagaccedilatildeo Implementaccedilatildeo Validaccedilatildeo

Fases Elementares

21042010

15

Mapeamentos entre ontologias(Ontology Matching)

Fusatildeo de ontologias

Processo semi-automatico de alinhamento(Huang at al 2006)rlm

Referecircncia

Jerome Euzenat INRIA Rhone-Alpes France

Pavel Shvaiko University of Trento Italy

Ontology Matching

URL httpbookontologymatchingorg

Springer-Verlag Heidelberg (DE) 2007

343 p 67 illus Hardcover

ISBN 978-3-540-49611-3

E as buscas semacircnticas

Recuperaccedilatildeo da informaccedilatildeo de documentosrlm

Medidas da eficaacutecia das soluccedilotildees

precisatildeo = nro de docs relevantes recuperadosnro de docs recuperados

cobertura = nro de docs relevantes recuperadosnro de docs relevantes

21042010

16

Classificaccedilatildeo de abordagens para buscas semacircnticas (Mangold 2007)

Arquitetura

Acoplamento entre ontologias e documentos

Transparecircncia

Contexto do usuaacuterio

Modificaccedilatildeo de consultas

Estrutura das ontologias

Tecnologia para representar as ontologias

Desempenho escalabilidade e distribuiccedilatildeo

Adaptabilidade

Ranking

Arquiteturas para buscas semacircnticas

Maacutequina de busca stand_alone armazenametadados sobre os documentos em iacutendicescom os quais avalia as consultas

Meta-maacutequina de busca distribui asconsultas para outras maacutequinas de busca ecombina os resultados

Acoplamento ontologias-documentos

Acoplamento forte os metadados dosdocumentos referem-se explicitamente aosconceitos de uma ontologia e vice-versa(requer anotaccedilatildeo semacircntica)rlm

Acoplamento fraco os documentos satildeoindependentes de quaisquer ontologiasdisponiacuteveis (pode restringir a capacidade debusca)rlm

Contexto do usuaacuterio

Learning extraiacutedo na interaccedilotildees do usuaacuteriocom o sistema (histoacuterico das consultas erefinamentos de consultas)rlm

Hard-coded as consultas satildeo organizadas emcategorias que definem a informaccedilatildeo solicitada(eg ldquolocation ofrdquo ldquoresources forrdquo rlm(

Modificaccedilatildeo de consultas

Manual o sistema retorna um trechoapropriado da ontologia junto com a respostapermitindo ao usuaacuterio navegar na ontologia ereformular a consulta pela adiccedilatildeo e remoccedilatildeo determos

Re-escrita automaacutetica a consulta eacuteotimizada automaticamente pelo sistema

Baseada em grafo considera conceitos edocumentos como nodos de um grafoefetuando propagaccedilatildeo da consulta a partir dosnodos correspondentes a termos de busca

Modificaccedilatildeo de consultas

Modificaccedilatildeo de consulta

Manual

Re-escrita de consulta

Baseada em grafo

Inserccedilatildeo de termoRemoccedilatildeo de termo

Substituiccedilatildeo de termo

Conjuntiva

Disjuntiva

Conjuntiva Disjuntiva

21042010

17

Estrutura da ontologia

Propriedades anocircnimas as relaccedilotildees entreconceitos natildeo satildeo nomeadas indicando apenasque eles compartilham o mesmo contexto

Propriedades padronizadas sinocircniacutemiahiperniacutemia meroniacutemia negaccedilatildeo etc

Propriedades especiacuteficas de domiacutenio aleacutemdas propriedades padratildeo considerapropriedades especiacuteficas de um domiacutenio (egldquotipo de cacircmerardquo em sistema para a aacuterea defotografia)rlm

Tecnologia da ontologia

F-Logic

RDF

DAML+OIL

Frames

OWL

Comparaccedilatildeo de abordagens Comparaccedilatildeo de abordagens (cont)

Buscas semacircnticas na Web hoje

httpwwwaliprcom (imagens)rlm

httpwwwcognitioncom

httpwwwdeepdyvecom

httpwwwbingcom

httpwwwcuilcom

httpwwwfreebasecom

httpwwwgooglecom

httpwwwkosmixcom

httpwwwhakiacom

httpwwwpowersetcom

httpwwwsensebotnet

httpdeveloperyahoocomsearchmonkey

httpswoogleumbcedu (ontologias)rlm

21042010

18

21042010

19

SAO PAULO-SP

University of Sao Paulo

Sao Paulo Fashion

Sao Paulo Fashion Week

Sao Paulo State

Sao Paulo Hotel

Sao Paulo Hotels

Sao Paulo Brasilien

Sao Paulo Congonhas

21042010

20

21042010

21

Sao Paulo Airport

Sao Paulo Plane Crash

Sao Paulo Zoo

hellip

21042010

22

21042010

23

Algumas questotildees em aberto

Representaccedilatildeo de contextos de usuaacuterios emapeamento desses a ontologias

Anaacutelise dos efeitos de modificaccedilotildees de consultas

Meta-buscas semacircnticas

Anaacutelise da aceitaccedilatildeo dos usuaacuterios

Adaptabilidade a diferentes ontologias

Ranking dos resultados

Integraccedilatildeo com sistemas de gerenciamento dedocumentosconteuacutedo

Tratamento de dados multimiacuteda

Interfaces homem-maacutequina

Desempenho e escalabilidade

Contextual Semantic Search (CSS)(DAgostine Fileto ndash SBBD2007)rlm

21042010

24

General Architecture for CSSThe Weighted Topic Graph(DAgostine Fileto Dantas Gauthier - ICEIS 2008)rlm

A weighted topic graph is a graph TM(T A)rlm

T is a set of topics (vertices)rlm

A is a set of associations (edges)rlm

Let be an ontology O

Each topic t in T corresponds to a ontology term o in O

Each topic t has a weight [01] The sum from the weights from all topics with same name equals 1

Each association a has a weight [01] The sum

from all the weights from all association departing

a single topics equals 1

Topic weights used to disambiguate

Eg interest in Satildeo Paulo city instead of Satildeo Paulo

state

Association weights used to semantically

expand searches

Eg Actual interest in Guarulhos and airport while

searching for Satildeo Paulo city

The Weights in the Topic Graph Capturing the Users Context

Generated Topic Graph with the Ontological Users Context

The Contextual Semantic Search Process

21042010

25

Desambiguaccedilatildeo

Fundamento dos algoritmos de busca sobre contexto ontoloacutegico

Heuriacutesticas de estigmergia (Ant Colony Optimization - ACO)

Traccedilos de ferormocircnio

Algoritmo de busca semacircntica baseada em ACO

Entrada palavras-chave[ ]

Dados G(TA) Onto repositoacuterio

limite_de_profundidade

limite_miacutenimo_de_peso

λ fator de atenuaccedilatildeo de peso

iniacutecio Algoritmo Busca Contextual 1 Estigmeacuterica

resultados = busca_G_ou_Onto(palavras-chave[])

atenuaG (iacutendice ) λrlmisin [0 1]

manutenccedilatildeo(coleta_feedback(resultados))

fim

21042010

26

Demo Praestro ndash Karina Fasolin

Alguns trabalhos relacionados

Name Article Comments

Graupmann

et al 2005

The SphereSearch

engine for unifiedranked retrieval of

heterogeneous XML

and web documents

Searches through XML documents The context is a region in radius

around given element A data inside two regions is considered relevant

to both contexts

Made tests with large collections like DBLP INEX Wikipedia put for

stress testing regarding the size of the collection

ldquoLet us first comment on the difficulties of defining a meaningfulbenchmark for this kind of novel systemrdquo

Park e

Cheyer 2006

Just For Me Topic

Maps and Ontologies

Manages knowledge in three layers Topics Knowledge Structures and

Documents

Not implemented (at least at the time of publication)

Michlmayr

et al 2007Adaptive User Profiles

for Enterprise

Information Access

Represents context as an individual graph The graph is constructed

based on tags used to semantically annotate the content which the user

considers to be relevant

However the tags are only that only labels They are not tied-down to

a formal definition

Alguns trabalhos relacionados (cont)

Name Article Comments

Aleman-

Meza et a

2003

Context-Aware

Semantic Association

Ranking

Also defines context as regions But the regions are static defined in

the ontology which is used by the system So the contexts are defined

the same for every single user

Mani and

Sundaram

2007

Modeling user context

with applications to

media retrieval

Creates a graph representing the users context Each node

corresponds to an instance in the ontology The edges represent

relations between the instances Built to search trough multimedia

documents

However it does not associates the vocabulary the user uses with the

instances

Challam et

al 2007

Contextual Search

Using Ontology-Based

User Profiles

Monitors the users activity capturing content from open Internet

Explorer MS-Office and MSN The captured information is stored and

usedrlmtorlmbuildrlmarlmuser‟srlmcontextualrlmprofilerlmbasesrlmonrlmanrlmontology

The context is tightly coupled with the ontology

NO IMAGES WERE

PROVIDED

Vallet et al

2006

Personalized

Information Retrieval in

Context

Stores context as a graph constructed based on the ontology used by

the system Similar to Mani and Sundaram including its limitations

(mapping the vocabulary) however if built for text documents

Sieg et al

2007

Ontological User

Profiles for

Personalized Web

Search

Similar to Challam et al but it gets the context information from the

ontology terms used to annotate the retrieved relevant context

Also limited by the structure of the ontology

Alguns trabalhos relacionados(cont)

Name Deals with

objective

knowledge

(ontology)

Deals with

subjective

knowledge

(users

context)

The knowledge

management is

transparent

Idea Implemented

Graupmann et

al 2005

X IMPL

Park e Cheyer

2006

X X X IDEA

Michlmayr et al2007

X X IMPL

Aleman-Meza et

a 2003

X X IMPL

Mani eSundaram 2007

X X X IMPL

Challam et al

2007

X X X IMPL

Vallet et al 2006 X X X IMPL

Sieg et al 2007 X X X IMPL

(incomplete)

Praestro X X X IMPL

(prototype)

UnA-SUS ndash Universidade Aberta do SUS

Programa do Ministeacuterio da Sauacutede para atender necessidades de e

permanente dos

Accedilotildees focadas em

formulaccedilatildeo de conteuacutedo

bibliotecas digitais

cursos a distacircncia

21042010

27

Metas da UnA-SUS

Desenvolver um

plataforma para de

composiccedilatildeo e de

Montar e oferecer cursos para formaccedilatildeo continuada de profissionais da sauacutede

157

Metadados

O processo de produccedilatildeo catalogaccedilatildeo e reuso de OAs

Repositoacuterio

Conteuacutedo

OAs

requisiccedilotildees

Design revisatildeo e publicaccedilatildeo

OA

SGA outros reps

Busca e reuso

OAsMetadados

OAs

Concepccedilatildeo e validaccedilatildeo de OAs

O processo de produccedilatildeo catalogaccedilatildeo e reuso de OAs

OA1

Curso A

Curso B

OA2

OA3

Viacutedeo

Imagens

RepositoacuteriosConteuacutedoMultimiacutedia

SGA RepositoacuteriosOAs

Reuso eacute essencial

bull OAs satildeo caros para produzir

bull Demandas emergenciais na sauacutede puacuteblica exigem agilidade e pronta resposta com cursos para a qualificaccedilatildeo de profissionais

H1N1

Apoplexia

gripe suiacutena gripe A

influenza H1N1

hellip

21042010

28

Navegaccedilatildeo hiperboacutelica no DeCSCatalogaccedilatildeo de Objetos de Aprendizagem (OAs) usando Vocabulaacuterios Controlados

bull Seleccedilatildeo de termos do DeCS CID-10 SNOMED

ndash via fornecimento de palavras-chave que satildeo pesquisadas na base de conhecimento

ndash via navegaccedilatildeo em uma visatildeo do conhecimento em forma de aacutervore

Seleccedilatildeo via contexto ontoloacutegicoProtoacutetipo (catalogaccedilatildeo com entrada

de palavra-chave)

DSpaceCatalogaccedilatildeo de OAswf

Protoacutetipo (catalogaccedilatildeo com navegaccedilatildeo

na base de conhecimento)

DSpaceRecuperaccedilatildeo de OAswf

21042010

29

Recuperaccedilatildeo de Objetos de Aprendizagem (OAs) Baseada em Conhecimento

bull Vocabulaacuterios e relaccedilotildees semacircnticas

ndash Oriundos do DeCS

ndash Definidos pelos catalogadores de OAs

ndash Gerados pelo cruzamento de informaccedilotildees com o CID-10 (Classificaccedilatildeo Internacional de Doenccedilas)

ndash Ex sinocircnimos eacute um(a) parte de causa efeito sintoma etc

DeCs

Anatomia

Sistema Nervoso

Sistema Nervoso Central

Enceacutefalo

Prosenceacutefalo

Telencaacutefalo

Ceacuterebro

Doenccedilas

Doenccedilas do Sistema Nervoso

Doenccedilas Cardiovasculares

Doenccedilas do Sistema Nervoso Central

Encefalopatias

Transtornos Cerebrovasculares

Doenccedilas Vasculares

Transtornos Cerebrovasculares

Acidente Vascular Cerebral

Acidente Vascular Cerebral

OA 1

OA 2

AVC

IctusCerebral

Derrame Cerebral

Hemisfeacuterios Cerebrais

ApoplexiaAcidente

Cerebrovascular

IctoCerebral

Apoplexia Cerebrovascular

Apoplexia Cerebral

Acidente Vascular

Encefaacutelico

Acidente Vascular

do Ceacuterebro

Acidente Vascular Cerebral

padratildeo (sinocircnimo)

anota

especiacutefica de domiacutenio

anocircnimas (DeCs)

172

DeCs

Anatomia

Sistema Nervoso

Sistema Nervoso Central

Enceacutefalo

Prosenceacutefalo

Telencaacutefalo

Ceacuterebro (2)

Doenccedilas

Doenccedilas do Sistema Nervoso

Doenccedilas Cardiovasculares

Doenccedilas do Sistema Nervoso Central

Encefalopatias

Transtornos Cerebrovasculares

Doenccedilas Vasculares

Transtornos Cerebrovasculares

Acidente Cerebral Vascular (1)

Acidente Cerebral Vascular(1)

OA 1

OA 2

AVC

IctusCerebral

Derrame Cerebral

Hemisfeacuterios Cerebrais

ApoplexiaAcidente

Cerebrovascular

IctoCerebral

Apoplexia Cerebrovascular

Apoplexia Cerebral

Acidente Vascular

Encefaacutelico

Acidente Vascular

do Ceacuterebro

Acidente Vascular Cerebral

Busca de OAs na aacuterea de sauacutede usando conhecimento de domiacutenio

Semantic Learning Objects (VIAN J SILVEIRA R A FILETO R WCCE 2009)

21042010

30

Conclusotildees

A Web semacircntica tem potencial de contribuir naobtenccedilatildeo de melhores resultados para buscas

Suporte automatizado eacute fundamental para a construccedilatildeo evoluccedilatildeo e integraccedilatildeo de ontologias anotaccedilotildees semacircnticas e contextos de usuaacuterios

Nossos primeiros resultados focam na captura e utilizaccedilatildeo de contextos de usuaacuterios mapeados a ontologias de domiacutenios especiacuteficos paradesambiguar e estender as buscas

Trabalhos futuros

Processos parcialmente automatizados para geraccedilatildeo e atualizaccedilatildeo de ontologias e anotaccedilotildees semacircnticas

Experimentos para comprovar a eficaacutecia das teacutecnicas e ferramentas utilizadas

Validaccedilatildeo de soluccedilotildees de problemas de busca semacircntica em diversos domiacutenios de aplicaccedilatildeo

Determinaccedilatildeo de niacuteveis adequados de acoplamento entre contextos e ontologias e dessas com os recursos a serem recuperados

Notiacutecias e anaacutelises

httpnewscnetcomnew-search-engine-cuil-takes-aim-at-google

httpwwwreadwritewebcomarchivesis_google_a_semantic_search_enginephp

httpwwwreadwritewebcomarchivessemantic_search_the_myt

h_and_realityphp

httpwwwpandiacomsew1262-top-5-semantic-search-

engineshtml

httpmindsetresearchyahoocom

httpnewscnetcom8301-13953_3-9982015-80html

httpwwwsearchenginejournalcomaskcom-focuses-on-semantic-search8252

httpnewsbbccouk2hiprogrammesclick_onlinedefaultstm

httpnewsbbccouk2hiprogrammesclick_online8144765stm

Web semacircntica e buscassemacircnticas

httpwwww3org2001sw

httpsemanticweborg

httpenwikipediaorgwikiSemantic_Web

httpenwikipediaorgwikiSemantic_search

Ferramentas de desenvolvimento

httpprotegestanfordedu

httpjenasourceforgenet

httpwwww3org2001Annotea

httpwwwontotextcomkim

httpesww3orgtopicSemanticWebTools

httpwwwdamlorg200305swmu-tools-

tutorialOverviewhtml

Referecircncias em Web semacircntica

T Berners-Lee J Hendler e O Lassila The Semantic Web Scientific American May 2001

Thomas B Passing Explores Guide to the Semantic Web Manning Publications Greenwich CT 2005

Davies J Studer R Warren P (Eds) Semantic Web Technologies trends and research in ontology-based

Systems John Wiley amp Sons 2006

Breitman KK Casanova MA Truszkowski W Semantic Web

Concepts Technologies and Applications Series NASA Monographs in Systems and Software Engineering Springer 2007

Grigoris Antoniou and Frank van Harmelen A Semantic Web Primer 2nd edition The MIT Press Cambridge MA USA 2008

Kashyap V Bussler C Moran M The Semantic Web -Semantics for Data and Services on the Web Series Data-

Centric Systems and Applications Springer 2008

Hitzler P Krotzsch M Rudolph S Foundations of SemanticWeb Technologies Chapman amp HallCRC 2009

21042010

31

Referecircncias em buscas semacircnticas

Guha R McCool R and Miller E 2003 Semantic search In Proc of the 12th international Conference on World Wide Web

(WWW) Budapest Hungary ACM New York NY 2003 700-709

Reeve L and Han H 2005 Survey of semantic annotation

platforms In Proceedings of the ACM Symposium on Applied Computing Santa Fe New Mexico ACM New York NY 2005

1634-1638

Eetu Makela Survey of Semantic Search Research

Mangold C A Survey and classification of semantic search approaches Journal of Metadata Semantics and Ontology 2(1)

2007

Stephan Bloehdorn Philipp Cimiano Alistair Duke Peter Haase Joumlrg Heizmann Ian Thurlow Johanna Voumllker Ontology-BasedQuestion Answering for Digital Libraries ECDL 2007 14-25

Hai Dong Hussain FK Chang E A survey in semantic search technologies In 2nd IEEE International Conference on

Digital Ecosystems and Technologies 2008 403-408

Algumas referecircncias grupo UFSC

DAgostini C S Fileto R Capturing Users Preferences and Intentions in a Semantic Search System In 21st International

Conference on Software Engineering amp Knowledge Engineering (SEKE) Boston 2009 p 587-591

DAgostini C S Fileto R Dantas M A R Gauthier F A O

Contextual Semantic Search - Capturing using the UsersContext to Direct Semantic Search In 10th InternationalConference on Enterprise Information Systems (ICEIS) Barcelona

Spain 2008 v SAIC p 154-159

DAgostini C S Fileto R Capturing and managing usercontext for improving information retrieval In Workshop de

Teses e Dissertaccedilotildees do Simpoacutesio Brasileiro de Bancos de Dados (WTDBDSBBD) Campinas Unicamp Brazil 2008

Vian J Silveira R A Fileto R Proposal of a Multi-agent System for Indexing and Recovery applied to Learning

Objects In 9th IFIP World Conference on Computers in Education (WCCE) Bento Goncalves Brazil 2009

Alguns projetos na UFSC

httpwwwlisaufscbrprojetos

httpwwwunasusufscbr

httpwwwliteraturabrasileiraufscbr

Perguntas

Page 14: Buscas Semânticasfileto/Talks/BuscasSemanticas6sp.pdf · 21/04/2010 1 1 Buscas semânticas: panorama e tendências atuais minicurso ERBD 2010 RenatoFileto fileto@inf.ufsc.br AlunosColaboradores:

21042010

14

Dependecircncias entre plataformas(Rui Tramontin Junior 2007)rlm

Comparaccedilatildeo de desempenho(Reeve e Han 2005)rlm

Prataforma Categoria Precisatildeo Cobertura Medida F

Armadillo Descoberta de padrotildees

910 740 870

KIM Regras 860 820 840

MnM Induccedilatildeo 950 900 nd

MUSE Regras 935 923 929

PANKOW Descoberta de padrotildees

650 282 249

SemTag Regras 820 nd nd

Evoluccedilatildeo de ontologias(Bloehdorn et al 2006)rlm

Exemplo Uso natildeo uniforme de conceitos

Alternativas para remoccedilatildeo do conceito C que tem sub-conceitos

Processo de evoluccedilatildeo de ontologias

CapturaCaptura

da

Mudanccedila

Representaccedilatildeo Semacircntica Propagaccedilatildeo Implementaccedilatildeo Validaccedilatildeo

Fases Elementares

21042010

15

Mapeamentos entre ontologias(Ontology Matching)

Fusatildeo de ontologias

Processo semi-automatico de alinhamento(Huang at al 2006)rlm

Referecircncia

Jerome Euzenat INRIA Rhone-Alpes France

Pavel Shvaiko University of Trento Italy

Ontology Matching

URL httpbookontologymatchingorg

Springer-Verlag Heidelberg (DE) 2007

343 p 67 illus Hardcover

ISBN 978-3-540-49611-3

E as buscas semacircnticas

Recuperaccedilatildeo da informaccedilatildeo de documentosrlm

Medidas da eficaacutecia das soluccedilotildees

precisatildeo = nro de docs relevantes recuperadosnro de docs recuperados

cobertura = nro de docs relevantes recuperadosnro de docs relevantes

21042010

16

Classificaccedilatildeo de abordagens para buscas semacircnticas (Mangold 2007)

Arquitetura

Acoplamento entre ontologias e documentos

Transparecircncia

Contexto do usuaacuterio

Modificaccedilatildeo de consultas

Estrutura das ontologias

Tecnologia para representar as ontologias

Desempenho escalabilidade e distribuiccedilatildeo

Adaptabilidade

Ranking

Arquiteturas para buscas semacircnticas

Maacutequina de busca stand_alone armazenametadados sobre os documentos em iacutendicescom os quais avalia as consultas

Meta-maacutequina de busca distribui asconsultas para outras maacutequinas de busca ecombina os resultados

Acoplamento ontologias-documentos

Acoplamento forte os metadados dosdocumentos referem-se explicitamente aosconceitos de uma ontologia e vice-versa(requer anotaccedilatildeo semacircntica)rlm

Acoplamento fraco os documentos satildeoindependentes de quaisquer ontologiasdisponiacuteveis (pode restringir a capacidade debusca)rlm

Contexto do usuaacuterio

Learning extraiacutedo na interaccedilotildees do usuaacuteriocom o sistema (histoacuterico das consultas erefinamentos de consultas)rlm

Hard-coded as consultas satildeo organizadas emcategorias que definem a informaccedilatildeo solicitada(eg ldquolocation ofrdquo ldquoresources forrdquo rlm(

Modificaccedilatildeo de consultas

Manual o sistema retorna um trechoapropriado da ontologia junto com a respostapermitindo ao usuaacuterio navegar na ontologia ereformular a consulta pela adiccedilatildeo e remoccedilatildeo determos

Re-escrita automaacutetica a consulta eacuteotimizada automaticamente pelo sistema

Baseada em grafo considera conceitos edocumentos como nodos de um grafoefetuando propagaccedilatildeo da consulta a partir dosnodos correspondentes a termos de busca

Modificaccedilatildeo de consultas

Modificaccedilatildeo de consulta

Manual

Re-escrita de consulta

Baseada em grafo

Inserccedilatildeo de termoRemoccedilatildeo de termo

Substituiccedilatildeo de termo

Conjuntiva

Disjuntiva

Conjuntiva Disjuntiva

21042010

17

Estrutura da ontologia

Propriedades anocircnimas as relaccedilotildees entreconceitos natildeo satildeo nomeadas indicando apenasque eles compartilham o mesmo contexto

Propriedades padronizadas sinocircniacutemiahiperniacutemia meroniacutemia negaccedilatildeo etc

Propriedades especiacuteficas de domiacutenio aleacutemdas propriedades padratildeo considerapropriedades especiacuteficas de um domiacutenio (egldquotipo de cacircmerardquo em sistema para a aacuterea defotografia)rlm

Tecnologia da ontologia

F-Logic

RDF

DAML+OIL

Frames

OWL

Comparaccedilatildeo de abordagens Comparaccedilatildeo de abordagens (cont)

Buscas semacircnticas na Web hoje

httpwwwaliprcom (imagens)rlm

httpwwwcognitioncom

httpwwwdeepdyvecom

httpwwwbingcom

httpwwwcuilcom

httpwwwfreebasecom

httpwwwgooglecom

httpwwwkosmixcom

httpwwwhakiacom

httpwwwpowersetcom

httpwwwsensebotnet

httpdeveloperyahoocomsearchmonkey

httpswoogleumbcedu (ontologias)rlm

21042010

18

21042010

19

SAO PAULO-SP

University of Sao Paulo

Sao Paulo Fashion

Sao Paulo Fashion Week

Sao Paulo State

Sao Paulo Hotel

Sao Paulo Hotels

Sao Paulo Brasilien

Sao Paulo Congonhas

21042010

20

21042010

21

Sao Paulo Airport

Sao Paulo Plane Crash

Sao Paulo Zoo

hellip

21042010

22

21042010

23

Algumas questotildees em aberto

Representaccedilatildeo de contextos de usuaacuterios emapeamento desses a ontologias

Anaacutelise dos efeitos de modificaccedilotildees de consultas

Meta-buscas semacircnticas

Anaacutelise da aceitaccedilatildeo dos usuaacuterios

Adaptabilidade a diferentes ontologias

Ranking dos resultados

Integraccedilatildeo com sistemas de gerenciamento dedocumentosconteuacutedo

Tratamento de dados multimiacuteda

Interfaces homem-maacutequina

Desempenho e escalabilidade

Contextual Semantic Search (CSS)(DAgostine Fileto ndash SBBD2007)rlm

21042010

24

General Architecture for CSSThe Weighted Topic Graph(DAgostine Fileto Dantas Gauthier - ICEIS 2008)rlm

A weighted topic graph is a graph TM(T A)rlm

T is a set of topics (vertices)rlm

A is a set of associations (edges)rlm

Let be an ontology O

Each topic t in T corresponds to a ontology term o in O

Each topic t has a weight [01] The sum from the weights from all topics with same name equals 1

Each association a has a weight [01] The sum

from all the weights from all association departing

a single topics equals 1

Topic weights used to disambiguate

Eg interest in Satildeo Paulo city instead of Satildeo Paulo

state

Association weights used to semantically

expand searches

Eg Actual interest in Guarulhos and airport while

searching for Satildeo Paulo city

The Weights in the Topic Graph Capturing the Users Context

Generated Topic Graph with the Ontological Users Context

The Contextual Semantic Search Process

21042010

25

Desambiguaccedilatildeo

Fundamento dos algoritmos de busca sobre contexto ontoloacutegico

Heuriacutesticas de estigmergia (Ant Colony Optimization - ACO)

Traccedilos de ferormocircnio

Algoritmo de busca semacircntica baseada em ACO

Entrada palavras-chave[ ]

Dados G(TA) Onto repositoacuterio

limite_de_profundidade

limite_miacutenimo_de_peso

λ fator de atenuaccedilatildeo de peso

iniacutecio Algoritmo Busca Contextual 1 Estigmeacuterica

resultados = busca_G_ou_Onto(palavras-chave[])

atenuaG (iacutendice ) λrlmisin [0 1]

manutenccedilatildeo(coleta_feedback(resultados))

fim

21042010

26

Demo Praestro ndash Karina Fasolin

Alguns trabalhos relacionados

Name Article Comments

Graupmann

et al 2005

The SphereSearch

engine for unifiedranked retrieval of

heterogeneous XML

and web documents

Searches through XML documents The context is a region in radius

around given element A data inside two regions is considered relevant

to both contexts

Made tests with large collections like DBLP INEX Wikipedia put for

stress testing regarding the size of the collection

ldquoLet us first comment on the difficulties of defining a meaningfulbenchmark for this kind of novel systemrdquo

Park e

Cheyer 2006

Just For Me Topic

Maps and Ontologies

Manages knowledge in three layers Topics Knowledge Structures and

Documents

Not implemented (at least at the time of publication)

Michlmayr

et al 2007Adaptive User Profiles

for Enterprise

Information Access

Represents context as an individual graph The graph is constructed

based on tags used to semantically annotate the content which the user

considers to be relevant

However the tags are only that only labels They are not tied-down to

a formal definition

Alguns trabalhos relacionados (cont)

Name Article Comments

Aleman-

Meza et a

2003

Context-Aware

Semantic Association

Ranking

Also defines context as regions But the regions are static defined in

the ontology which is used by the system So the contexts are defined

the same for every single user

Mani and

Sundaram

2007

Modeling user context

with applications to

media retrieval

Creates a graph representing the users context Each node

corresponds to an instance in the ontology The edges represent

relations between the instances Built to search trough multimedia

documents

However it does not associates the vocabulary the user uses with the

instances

Challam et

al 2007

Contextual Search

Using Ontology-Based

User Profiles

Monitors the users activity capturing content from open Internet

Explorer MS-Office and MSN The captured information is stored and

usedrlmtorlmbuildrlmarlmuser‟srlmcontextualrlmprofilerlmbasesrlmonrlmanrlmontology

The context is tightly coupled with the ontology

NO IMAGES WERE

PROVIDED

Vallet et al

2006

Personalized

Information Retrieval in

Context

Stores context as a graph constructed based on the ontology used by

the system Similar to Mani and Sundaram including its limitations

(mapping the vocabulary) however if built for text documents

Sieg et al

2007

Ontological User

Profiles for

Personalized Web

Search

Similar to Challam et al but it gets the context information from the

ontology terms used to annotate the retrieved relevant context

Also limited by the structure of the ontology

Alguns trabalhos relacionados(cont)

Name Deals with

objective

knowledge

(ontology)

Deals with

subjective

knowledge

(users

context)

The knowledge

management is

transparent

Idea Implemented

Graupmann et

al 2005

X IMPL

Park e Cheyer

2006

X X X IDEA

Michlmayr et al2007

X X IMPL

Aleman-Meza et

a 2003

X X IMPL

Mani eSundaram 2007

X X X IMPL

Challam et al

2007

X X X IMPL

Vallet et al 2006 X X X IMPL

Sieg et al 2007 X X X IMPL

(incomplete)

Praestro X X X IMPL

(prototype)

UnA-SUS ndash Universidade Aberta do SUS

Programa do Ministeacuterio da Sauacutede para atender necessidades de e

permanente dos

Accedilotildees focadas em

formulaccedilatildeo de conteuacutedo

bibliotecas digitais

cursos a distacircncia

21042010

27

Metas da UnA-SUS

Desenvolver um

plataforma para de

composiccedilatildeo e de

Montar e oferecer cursos para formaccedilatildeo continuada de profissionais da sauacutede

157

Metadados

O processo de produccedilatildeo catalogaccedilatildeo e reuso de OAs

Repositoacuterio

Conteuacutedo

OAs

requisiccedilotildees

Design revisatildeo e publicaccedilatildeo

OA

SGA outros reps

Busca e reuso

OAsMetadados

OAs

Concepccedilatildeo e validaccedilatildeo de OAs

O processo de produccedilatildeo catalogaccedilatildeo e reuso de OAs

OA1

Curso A

Curso B

OA2

OA3

Viacutedeo

Imagens

RepositoacuteriosConteuacutedoMultimiacutedia

SGA RepositoacuteriosOAs

Reuso eacute essencial

bull OAs satildeo caros para produzir

bull Demandas emergenciais na sauacutede puacuteblica exigem agilidade e pronta resposta com cursos para a qualificaccedilatildeo de profissionais

H1N1

Apoplexia

gripe suiacutena gripe A

influenza H1N1

hellip

21042010

28

Navegaccedilatildeo hiperboacutelica no DeCSCatalogaccedilatildeo de Objetos de Aprendizagem (OAs) usando Vocabulaacuterios Controlados

bull Seleccedilatildeo de termos do DeCS CID-10 SNOMED

ndash via fornecimento de palavras-chave que satildeo pesquisadas na base de conhecimento

ndash via navegaccedilatildeo em uma visatildeo do conhecimento em forma de aacutervore

Seleccedilatildeo via contexto ontoloacutegicoProtoacutetipo (catalogaccedilatildeo com entrada

de palavra-chave)

DSpaceCatalogaccedilatildeo de OAswf

Protoacutetipo (catalogaccedilatildeo com navegaccedilatildeo

na base de conhecimento)

DSpaceRecuperaccedilatildeo de OAswf

21042010

29

Recuperaccedilatildeo de Objetos de Aprendizagem (OAs) Baseada em Conhecimento

bull Vocabulaacuterios e relaccedilotildees semacircnticas

ndash Oriundos do DeCS

ndash Definidos pelos catalogadores de OAs

ndash Gerados pelo cruzamento de informaccedilotildees com o CID-10 (Classificaccedilatildeo Internacional de Doenccedilas)

ndash Ex sinocircnimos eacute um(a) parte de causa efeito sintoma etc

DeCs

Anatomia

Sistema Nervoso

Sistema Nervoso Central

Enceacutefalo

Prosenceacutefalo

Telencaacutefalo

Ceacuterebro

Doenccedilas

Doenccedilas do Sistema Nervoso

Doenccedilas Cardiovasculares

Doenccedilas do Sistema Nervoso Central

Encefalopatias

Transtornos Cerebrovasculares

Doenccedilas Vasculares

Transtornos Cerebrovasculares

Acidente Vascular Cerebral

Acidente Vascular Cerebral

OA 1

OA 2

AVC

IctusCerebral

Derrame Cerebral

Hemisfeacuterios Cerebrais

ApoplexiaAcidente

Cerebrovascular

IctoCerebral

Apoplexia Cerebrovascular

Apoplexia Cerebral

Acidente Vascular

Encefaacutelico

Acidente Vascular

do Ceacuterebro

Acidente Vascular Cerebral

padratildeo (sinocircnimo)

anota

especiacutefica de domiacutenio

anocircnimas (DeCs)

172

DeCs

Anatomia

Sistema Nervoso

Sistema Nervoso Central

Enceacutefalo

Prosenceacutefalo

Telencaacutefalo

Ceacuterebro (2)

Doenccedilas

Doenccedilas do Sistema Nervoso

Doenccedilas Cardiovasculares

Doenccedilas do Sistema Nervoso Central

Encefalopatias

Transtornos Cerebrovasculares

Doenccedilas Vasculares

Transtornos Cerebrovasculares

Acidente Cerebral Vascular (1)

Acidente Cerebral Vascular(1)

OA 1

OA 2

AVC

IctusCerebral

Derrame Cerebral

Hemisfeacuterios Cerebrais

ApoplexiaAcidente

Cerebrovascular

IctoCerebral

Apoplexia Cerebrovascular

Apoplexia Cerebral

Acidente Vascular

Encefaacutelico

Acidente Vascular

do Ceacuterebro

Acidente Vascular Cerebral

Busca de OAs na aacuterea de sauacutede usando conhecimento de domiacutenio

Semantic Learning Objects (VIAN J SILVEIRA R A FILETO R WCCE 2009)

21042010

30

Conclusotildees

A Web semacircntica tem potencial de contribuir naobtenccedilatildeo de melhores resultados para buscas

Suporte automatizado eacute fundamental para a construccedilatildeo evoluccedilatildeo e integraccedilatildeo de ontologias anotaccedilotildees semacircnticas e contextos de usuaacuterios

Nossos primeiros resultados focam na captura e utilizaccedilatildeo de contextos de usuaacuterios mapeados a ontologias de domiacutenios especiacuteficos paradesambiguar e estender as buscas

Trabalhos futuros

Processos parcialmente automatizados para geraccedilatildeo e atualizaccedilatildeo de ontologias e anotaccedilotildees semacircnticas

Experimentos para comprovar a eficaacutecia das teacutecnicas e ferramentas utilizadas

Validaccedilatildeo de soluccedilotildees de problemas de busca semacircntica em diversos domiacutenios de aplicaccedilatildeo

Determinaccedilatildeo de niacuteveis adequados de acoplamento entre contextos e ontologias e dessas com os recursos a serem recuperados

Notiacutecias e anaacutelises

httpnewscnetcomnew-search-engine-cuil-takes-aim-at-google

httpwwwreadwritewebcomarchivesis_google_a_semantic_search_enginephp

httpwwwreadwritewebcomarchivessemantic_search_the_myt

h_and_realityphp

httpwwwpandiacomsew1262-top-5-semantic-search-

engineshtml

httpmindsetresearchyahoocom

httpnewscnetcom8301-13953_3-9982015-80html

httpwwwsearchenginejournalcomaskcom-focuses-on-semantic-search8252

httpnewsbbccouk2hiprogrammesclick_onlinedefaultstm

httpnewsbbccouk2hiprogrammesclick_online8144765stm

Web semacircntica e buscassemacircnticas

httpwwww3org2001sw

httpsemanticweborg

httpenwikipediaorgwikiSemantic_Web

httpenwikipediaorgwikiSemantic_search

Ferramentas de desenvolvimento

httpprotegestanfordedu

httpjenasourceforgenet

httpwwww3org2001Annotea

httpwwwontotextcomkim

httpesww3orgtopicSemanticWebTools

httpwwwdamlorg200305swmu-tools-

tutorialOverviewhtml

Referecircncias em Web semacircntica

T Berners-Lee J Hendler e O Lassila The Semantic Web Scientific American May 2001

Thomas B Passing Explores Guide to the Semantic Web Manning Publications Greenwich CT 2005

Davies J Studer R Warren P (Eds) Semantic Web Technologies trends and research in ontology-based

Systems John Wiley amp Sons 2006

Breitman KK Casanova MA Truszkowski W Semantic Web

Concepts Technologies and Applications Series NASA Monographs in Systems and Software Engineering Springer 2007

Grigoris Antoniou and Frank van Harmelen A Semantic Web Primer 2nd edition The MIT Press Cambridge MA USA 2008

Kashyap V Bussler C Moran M The Semantic Web -Semantics for Data and Services on the Web Series Data-

Centric Systems and Applications Springer 2008

Hitzler P Krotzsch M Rudolph S Foundations of SemanticWeb Technologies Chapman amp HallCRC 2009

21042010

31

Referecircncias em buscas semacircnticas

Guha R McCool R and Miller E 2003 Semantic search In Proc of the 12th international Conference on World Wide Web

(WWW) Budapest Hungary ACM New York NY 2003 700-709

Reeve L and Han H 2005 Survey of semantic annotation

platforms In Proceedings of the ACM Symposium on Applied Computing Santa Fe New Mexico ACM New York NY 2005

1634-1638

Eetu Makela Survey of Semantic Search Research

Mangold C A Survey and classification of semantic search approaches Journal of Metadata Semantics and Ontology 2(1)

2007

Stephan Bloehdorn Philipp Cimiano Alistair Duke Peter Haase Joumlrg Heizmann Ian Thurlow Johanna Voumllker Ontology-BasedQuestion Answering for Digital Libraries ECDL 2007 14-25

Hai Dong Hussain FK Chang E A survey in semantic search technologies In 2nd IEEE International Conference on

Digital Ecosystems and Technologies 2008 403-408

Algumas referecircncias grupo UFSC

DAgostini C S Fileto R Capturing Users Preferences and Intentions in a Semantic Search System In 21st International

Conference on Software Engineering amp Knowledge Engineering (SEKE) Boston 2009 p 587-591

DAgostini C S Fileto R Dantas M A R Gauthier F A O

Contextual Semantic Search - Capturing using the UsersContext to Direct Semantic Search In 10th InternationalConference on Enterprise Information Systems (ICEIS) Barcelona

Spain 2008 v SAIC p 154-159

DAgostini C S Fileto R Capturing and managing usercontext for improving information retrieval In Workshop de

Teses e Dissertaccedilotildees do Simpoacutesio Brasileiro de Bancos de Dados (WTDBDSBBD) Campinas Unicamp Brazil 2008

Vian J Silveira R A Fileto R Proposal of a Multi-agent System for Indexing and Recovery applied to Learning

Objects In 9th IFIP World Conference on Computers in Education (WCCE) Bento Goncalves Brazil 2009

Alguns projetos na UFSC

httpwwwlisaufscbrprojetos

httpwwwunasusufscbr

httpwwwliteraturabrasileiraufscbr

Perguntas

Page 15: Buscas Semânticasfileto/Talks/BuscasSemanticas6sp.pdf · 21/04/2010 1 1 Buscas semânticas: panorama e tendências atuais minicurso ERBD 2010 RenatoFileto fileto@inf.ufsc.br AlunosColaboradores:

21042010

15

Mapeamentos entre ontologias(Ontology Matching)

Fusatildeo de ontologias

Processo semi-automatico de alinhamento(Huang at al 2006)rlm

Referecircncia

Jerome Euzenat INRIA Rhone-Alpes France

Pavel Shvaiko University of Trento Italy

Ontology Matching

URL httpbookontologymatchingorg

Springer-Verlag Heidelberg (DE) 2007

343 p 67 illus Hardcover

ISBN 978-3-540-49611-3

E as buscas semacircnticas

Recuperaccedilatildeo da informaccedilatildeo de documentosrlm

Medidas da eficaacutecia das soluccedilotildees

precisatildeo = nro de docs relevantes recuperadosnro de docs recuperados

cobertura = nro de docs relevantes recuperadosnro de docs relevantes

21042010

16

Classificaccedilatildeo de abordagens para buscas semacircnticas (Mangold 2007)

Arquitetura

Acoplamento entre ontologias e documentos

Transparecircncia

Contexto do usuaacuterio

Modificaccedilatildeo de consultas

Estrutura das ontologias

Tecnologia para representar as ontologias

Desempenho escalabilidade e distribuiccedilatildeo

Adaptabilidade

Ranking

Arquiteturas para buscas semacircnticas

Maacutequina de busca stand_alone armazenametadados sobre os documentos em iacutendicescom os quais avalia as consultas

Meta-maacutequina de busca distribui asconsultas para outras maacutequinas de busca ecombina os resultados

Acoplamento ontologias-documentos

Acoplamento forte os metadados dosdocumentos referem-se explicitamente aosconceitos de uma ontologia e vice-versa(requer anotaccedilatildeo semacircntica)rlm

Acoplamento fraco os documentos satildeoindependentes de quaisquer ontologiasdisponiacuteveis (pode restringir a capacidade debusca)rlm

Contexto do usuaacuterio

Learning extraiacutedo na interaccedilotildees do usuaacuteriocom o sistema (histoacuterico das consultas erefinamentos de consultas)rlm

Hard-coded as consultas satildeo organizadas emcategorias que definem a informaccedilatildeo solicitada(eg ldquolocation ofrdquo ldquoresources forrdquo rlm(

Modificaccedilatildeo de consultas

Manual o sistema retorna um trechoapropriado da ontologia junto com a respostapermitindo ao usuaacuterio navegar na ontologia ereformular a consulta pela adiccedilatildeo e remoccedilatildeo determos

Re-escrita automaacutetica a consulta eacuteotimizada automaticamente pelo sistema

Baseada em grafo considera conceitos edocumentos como nodos de um grafoefetuando propagaccedilatildeo da consulta a partir dosnodos correspondentes a termos de busca

Modificaccedilatildeo de consultas

Modificaccedilatildeo de consulta

Manual

Re-escrita de consulta

Baseada em grafo

Inserccedilatildeo de termoRemoccedilatildeo de termo

Substituiccedilatildeo de termo

Conjuntiva

Disjuntiva

Conjuntiva Disjuntiva

21042010

17

Estrutura da ontologia

Propriedades anocircnimas as relaccedilotildees entreconceitos natildeo satildeo nomeadas indicando apenasque eles compartilham o mesmo contexto

Propriedades padronizadas sinocircniacutemiahiperniacutemia meroniacutemia negaccedilatildeo etc

Propriedades especiacuteficas de domiacutenio aleacutemdas propriedades padratildeo considerapropriedades especiacuteficas de um domiacutenio (egldquotipo de cacircmerardquo em sistema para a aacuterea defotografia)rlm

Tecnologia da ontologia

F-Logic

RDF

DAML+OIL

Frames

OWL

Comparaccedilatildeo de abordagens Comparaccedilatildeo de abordagens (cont)

Buscas semacircnticas na Web hoje

httpwwwaliprcom (imagens)rlm

httpwwwcognitioncom

httpwwwdeepdyvecom

httpwwwbingcom

httpwwwcuilcom

httpwwwfreebasecom

httpwwwgooglecom

httpwwwkosmixcom

httpwwwhakiacom

httpwwwpowersetcom

httpwwwsensebotnet

httpdeveloperyahoocomsearchmonkey

httpswoogleumbcedu (ontologias)rlm

21042010

18

21042010

19

SAO PAULO-SP

University of Sao Paulo

Sao Paulo Fashion

Sao Paulo Fashion Week

Sao Paulo State

Sao Paulo Hotel

Sao Paulo Hotels

Sao Paulo Brasilien

Sao Paulo Congonhas

21042010

20

21042010

21

Sao Paulo Airport

Sao Paulo Plane Crash

Sao Paulo Zoo

hellip

21042010

22

21042010

23

Algumas questotildees em aberto

Representaccedilatildeo de contextos de usuaacuterios emapeamento desses a ontologias

Anaacutelise dos efeitos de modificaccedilotildees de consultas

Meta-buscas semacircnticas

Anaacutelise da aceitaccedilatildeo dos usuaacuterios

Adaptabilidade a diferentes ontologias

Ranking dos resultados

Integraccedilatildeo com sistemas de gerenciamento dedocumentosconteuacutedo

Tratamento de dados multimiacuteda

Interfaces homem-maacutequina

Desempenho e escalabilidade

Contextual Semantic Search (CSS)(DAgostine Fileto ndash SBBD2007)rlm

21042010

24

General Architecture for CSSThe Weighted Topic Graph(DAgostine Fileto Dantas Gauthier - ICEIS 2008)rlm

A weighted topic graph is a graph TM(T A)rlm

T is a set of topics (vertices)rlm

A is a set of associations (edges)rlm

Let be an ontology O

Each topic t in T corresponds to a ontology term o in O

Each topic t has a weight [01] The sum from the weights from all topics with same name equals 1

Each association a has a weight [01] The sum

from all the weights from all association departing

a single topics equals 1

Topic weights used to disambiguate

Eg interest in Satildeo Paulo city instead of Satildeo Paulo

state

Association weights used to semantically

expand searches

Eg Actual interest in Guarulhos and airport while

searching for Satildeo Paulo city

The Weights in the Topic Graph Capturing the Users Context

Generated Topic Graph with the Ontological Users Context

The Contextual Semantic Search Process

21042010

25

Desambiguaccedilatildeo

Fundamento dos algoritmos de busca sobre contexto ontoloacutegico

Heuriacutesticas de estigmergia (Ant Colony Optimization - ACO)

Traccedilos de ferormocircnio

Algoritmo de busca semacircntica baseada em ACO

Entrada palavras-chave[ ]

Dados G(TA) Onto repositoacuterio

limite_de_profundidade

limite_miacutenimo_de_peso

λ fator de atenuaccedilatildeo de peso

iniacutecio Algoritmo Busca Contextual 1 Estigmeacuterica

resultados = busca_G_ou_Onto(palavras-chave[])

atenuaG (iacutendice ) λrlmisin [0 1]

manutenccedilatildeo(coleta_feedback(resultados))

fim

21042010

26

Demo Praestro ndash Karina Fasolin

Alguns trabalhos relacionados

Name Article Comments

Graupmann

et al 2005

The SphereSearch

engine for unifiedranked retrieval of

heterogeneous XML

and web documents

Searches through XML documents The context is a region in radius

around given element A data inside two regions is considered relevant

to both contexts

Made tests with large collections like DBLP INEX Wikipedia put for

stress testing regarding the size of the collection

ldquoLet us first comment on the difficulties of defining a meaningfulbenchmark for this kind of novel systemrdquo

Park e

Cheyer 2006

Just For Me Topic

Maps and Ontologies

Manages knowledge in three layers Topics Knowledge Structures and

Documents

Not implemented (at least at the time of publication)

Michlmayr

et al 2007Adaptive User Profiles

for Enterprise

Information Access

Represents context as an individual graph The graph is constructed

based on tags used to semantically annotate the content which the user

considers to be relevant

However the tags are only that only labels They are not tied-down to

a formal definition

Alguns trabalhos relacionados (cont)

Name Article Comments

Aleman-

Meza et a

2003

Context-Aware

Semantic Association

Ranking

Also defines context as regions But the regions are static defined in

the ontology which is used by the system So the contexts are defined

the same for every single user

Mani and

Sundaram

2007

Modeling user context

with applications to

media retrieval

Creates a graph representing the users context Each node

corresponds to an instance in the ontology The edges represent

relations between the instances Built to search trough multimedia

documents

However it does not associates the vocabulary the user uses with the

instances

Challam et

al 2007

Contextual Search

Using Ontology-Based

User Profiles

Monitors the users activity capturing content from open Internet

Explorer MS-Office and MSN The captured information is stored and

usedrlmtorlmbuildrlmarlmuser‟srlmcontextualrlmprofilerlmbasesrlmonrlmanrlmontology

The context is tightly coupled with the ontology

NO IMAGES WERE

PROVIDED

Vallet et al

2006

Personalized

Information Retrieval in

Context

Stores context as a graph constructed based on the ontology used by

the system Similar to Mani and Sundaram including its limitations

(mapping the vocabulary) however if built for text documents

Sieg et al

2007

Ontological User

Profiles for

Personalized Web

Search

Similar to Challam et al but it gets the context information from the

ontology terms used to annotate the retrieved relevant context

Also limited by the structure of the ontology

Alguns trabalhos relacionados(cont)

Name Deals with

objective

knowledge

(ontology)

Deals with

subjective

knowledge

(users

context)

The knowledge

management is

transparent

Idea Implemented

Graupmann et

al 2005

X IMPL

Park e Cheyer

2006

X X X IDEA

Michlmayr et al2007

X X IMPL

Aleman-Meza et

a 2003

X X IMPL

Mani eSundaram 2007

X X X IMPL

Challam et al

2007

X X X IMPL

Vallet et al 2006 X X X IMPL

Sieg et al 2007 X X X IMPL

(incomplete)

Praestro X X X IMPL

(prototype)

UnA-SUS ndash Universidade Aberta do SUS

Programa do Ministeacuterio da Sauacutede para atender necessidades de e

permanente dos

Accedilotildees focadas em

formulaccedilatildeo de conteuacutedo

bibliotecas digitais

cursos a distacircncia

21042010

27

Metas da UnA-SUS

Desenvolver um

plataforma para de

composiccedilatildeo e de

Montar e oferecer cursos para formaccedilatildeo continuada de profissionais da sauacutede

157

Metadados

O processo de produccedilatildeo catalogaccedilatildeo e reuso de OAs

Repositoacuterio

Conteuacutedo

OAs

requisiccedilotildees

Design revisatildeo e publicaccedilatildeo

OA

SGA outros reps

Busca e reuso

OAsMetadados

OAs

Concepccedilatildeo e validaccedilatildeo de OAs

O processo de produccedilatildeo catalogaccedilatildeo e reuso de OAs

OA1

Curso A

Curso B

OA2

OA3

Viacutedeo

Imagens

RepositoacuteriosConteuacutedoMultimiacutedia

SGA RepositoacuteriosOAs

Reuso eacute essencial

bull OAs satildeo caros para produzir

bull Demandas emergenciais na sauacutede puacuteblica exigem agilidade e pronta resposta com cursos para a qualificaccedilatildeo de profissionais

H1N1

Apoplexia

gripe suiacutena gripe A

influenza H1N1

hellip

21042010

28

Navegaccedilatildeo hiperboacutelica no DeCSCatalogaccedilatildeo de Objetos de Aprendizagem (OAs) usando Vocabulaacuterios Controlados

bull Seleccedilatildeo de termos do DeCS CID-10 SNOMED

ndash via fornecimento de palavras-chave que satildeo pesquisadas na base de conhecimento

ndash via navegaccedilatildeo em uma visatildeo do conhecimento em forma de aacutervore

Seleccedilatildeo via contexto ontoloacutegicoProtoacutetipo (catalogaccedilatildeo com entrada

de palavra-chave)

DSpaceCatalogaccedilatildeo de OAswf

Protoacutetipo (catalogaccedilatildeo com navegaccedilatildeo

na base de conhecimento)

DSpaceRecuperaccedilatildeo de OAswf

21042010

29

Recuperaccedilatildeo de Objetos de Aprendizagem (OAs) Baseada em Conhecimento

bull Vocabulaacuterios e relaccedilotildees semacircnticas

ndash Oriundos do DeCS

ndash Definidos pelos catalogadores de OAs

ndash Gerados pelo cruzamento de informaccedilotildees com o CID-10 (Classificaccedilatildeo Internacional de Doenccedilas)

ndash Ex sinocircnimos eacute um(a) parte de causa efeito sintoma etc

DeCs

Anatomia

Sistema Nervoso

Sistema Nervoso Central

Enceacutefalo

Prosenceacutefalo

Telencaacutefalo

Ceacuterebro

Doenccedilas

Doenccedilas do Sistema Nervoso

Doenccedilas Cardiovasculares

Doenccedilas do Sistema Nervoso Central

Encefalopatias

Transtornos Cerebrovasculares

Doenccedilas Vasculares

Transtornos Cerebrovasculares

Acidente Vascular Cerebral

Acidente Vascular Cerebral

OA 1

OA 2

AVC

IctusCerebral

Derrame Cerebral

Hemisfeacuterios Cerebrais

ApoplexiaAcidente

Cerebrovascular

IctoCerebral

Apoplexia Cerebrovascular

Apoplexia Cerebral

Acidente Vascular

Encefaacutelico

Acidente Vascular

do Ceacuterebro

Acidente Vascular Cerebral

padratildeo (sinocircnimo)

anota

especiacutefica de domiacutenio

anocircnimas (DeCs)

172

DeCs

Anatomia

Sistema Nervoso

Sistema Nervoso Central

Enceacutefalo

Prosenceacutefalo

Telencaacutefalo

Ceacuterebro (2)

Doenccedilas

Doenccedilas do Sistema Nervoso

Doenccedilas Cardiovasculares

Doenccedilas do Sistema Nervoso Central

Encefalopatias

Transtornos Cerebrovasculares

Doenccedilas Vasculares

Transtornos Cerebrovasculares

Acidente Cerebral Vascular (1)

Acidente Cerebral Vascular(1)

OA 1

OA 2

AVC

IctusCerebral

Derrame Cerebral

Hemisfeacuterios Cerebrais

ApoplexiaAcidente

Cerebrovascular

IctoCerebral

Apoplexia Cerebrovascular

Apoplexia Cerebral

Acidente Vascular

Encefaacutelico

Acidente Vascular

do Ceacuterebro

Acidente Vascular Cerebral

Busca de OAs na aacuterea de sauacutede usando conhecimento de domiacutenio

Semantic Learning Objects (VIAN J SILVEIRA R A FILETO R WCCE 2009)

21042010

30

Conclusotildees

A Web semacircntica tem potencial de contribuir naobtenccedilatildeo de melhores resultados para buscas

Suporte automatizado eacute fundamental para a construccedilatildeo evoluccedilatildeo e integraccedilatildeo de ontologias anotaccedilotildees semacircnticas e contextos de usuaacuterios

Nossos primeiros resultados focam na captura e utilizaccedilatildeo de contextos de usuaacuterios mapeados a ontologias de domiacutenios especiacuteficos paradesambiguar e estender as buscas

Trabalhos futuros

Processos parcialmente automatizados para geraccedilatildeo e atualizaccedilatildeo de ontologias e anotaccedilotildees semacircnticas

Experimentos para comprovar a eficaacutecia das teacutecnicas e ferramentas utilizadas

Validaccedilatildeo de soluccedilotildees de problemas de busca semacircntica em diversos domiacutenios de aplicaccedilatildeo

Determinaccedilatildeo de niacuteveis adequados de acoplamento entre contextos e ontologias e dessas com os recursos a serem recuperados

Notiacutecias e anaacutelises

httpnewscnetcomnew-search-engine-cuil-takes-aim-at-google

httpwwwreadwritewebcomarchivesis_google_a_semantic_search_enginephp

httpwwwreadwritewebcomarchivessemantic_search_the_myt

h_and_realityphp

httpwwwpandiacomsew1262-top-5-semantic-search-

engineshtml

httpmindsetresearchyahoocom

httpnewscnetcom8301-13953_3-9982015-80html

httpwwwsearchenginejournalcomaskcom-focuses-on-semantic-search8252

httpnewsbbccouk2hiprogrammesclick_onlinedefaultstm

httpnewsbbccouk2hiprogrammesclick_online8144765stm

Web semacircntica e buscassemacircnticas

httpwwww3org2001sw

httpsemanticweborg

httpenwikipediaorgwikiSemantic_Web

httpenwikipediaorgwikiSemantic_search

Ferramentas de desenvolvimento

httpprotegestanfordedu

httpjenasourceforgenet

httpwwww3org2001Annotea

httpwwwontotextcomkim

httpesww3orgtopicSemanticWebTools

httpwwwdamlorg200305swmu-tools-

tutorialOverviewhtml

Referecircncias em Web semacircntica

T Berners-Lee J Hendler e O Lassila The Semantic Web Scientific American May 2001

Thomas B Passing Explores Guide to the Semantic Web Manning Publications Greenwich CT 2005

Davies J Studer R Warren P (Eds) Semantic Web Technologies trends and research in ontology-based

Systems John Wiley amp Sons 2006

Breitman KK Casanova MA Truszkowski W Semantic Web

Concepts Technologies and Applications Series NASA Monographs in Systems and Software Engineering Springer 2007

Grigoris Antoniou and Frank van Harmelen A Semantic Web Primer 2nd edition The MIT Press Cambridge MA USA 2008

Kashyap V Bussler C Moran M The Semantic Web -Semantics for Data and Services on the Web Series Data-

Centric Systems and Applications Springer 2008

Hitzler P Krotzsch M Rudolph S Foundations of SemanticWeb Technologies Chapman amp HallCRC 2009

21042010

31

Referecircncias em buscas semacircnticas

Guha R McCool R and Miller E 2003 Semantic search In Proc of the 12th international Conference on World Wide Web

(WWW) Budapest Hungary ACM New York NY 2003 700-709

Reeve L and Han H 2005 Survey of semantic annotation

platforms In Proceedings of the ACM Symposium on Applied Computing Santa Fe New Mexico ACM New York NY 2005

1634-1638

Eetu Makela Survey of Semantic Search Research

Mangold C A Survey and classification of semantic search approaches Journal of Metadata Semantics and Ontology 2(1)

2007

Stephan Bloehdorn Philipp Cimiano Alistair Duke Peter Haase Joumlrg Heizmann Ian Thurlow Johanna Voumllker Ontology-BasedQuestion Answering for Digital Libraries ECDL 2007 14-25

Hai Dong Hussain FK Chang E A survey in semantic search technologies In 2nd IEEE International Conference on

Digital Ecosystems and Technologies 2008 403-408

Algumas referecircncias grupo UFSC

DAgostini C S Fileto R Capturing Users Preferences and Intentions in a Semantic Search System In 21st International

Conference on Software Engineering amp Knowledge Engineering (SEKE) Boston 2009 p 587-591

DAgostini C S Fileto R Dantas M A R Gauthier F A O

Contextual Semantic Search - Capturing using the UsersContext to Direct Semantic Search In 10th InternationalConference on Enterprise Information Systems (ICEIS) Barcelona

Spain 2008 v SAIC p 154-159

DAgostini C S Fileto R Capturing and managing usercontext for improving information retrieval In Workshop de

Teses e Dissertaccedilotildees do Simpoacutesio Brasileiro de Bancos de Dados (WTDBDSBBD) Campinas Unicamp Brazil 2008

Vian J Silveira R A Fileto R Proposal of a Multi-agent System for Indexing and Recovery applied to Learning

Objects In 9th IFIP World Conference on Computers in Education (WCCE) Bento Goncalves Brazil 2009

Alguns projetos na UFSC

httpwwwlisaufscbrprojetos

httpwwwunasusufscbr

httpwwwliteraturabrasileiraufscbr

Perguntas

Page 16: Buscas Semânticasfileto/Talks/BuscasSemanticas6sp.pdf · 21/04/2010 1 1 Buscas semânticas: panorama e tendências atuais minicurso ERBD 2010 RenatoFileto fileto@inf.ufsc.br AlunosColaboradores:

21042010

16

Classificaccedilatildeo de abordagens para buscas semacircnticas (Mangold 2007)

Arquitetura

Acoplamento entre ontologias e documentos

Transparecircncia

Contexto do usuaacuterio

Modificaccedilatildeo de consultas

Estrutura das ontologias

Tecnologia para representar as ontologias

Desempenho escalabilidade e distribuiccedilatildeo

Adaptabilidade

Ranking

Arquiteturas para buscas semacircnticas

Maacutequina de busca stand_alone armazenametadados sobre os documentos em iacutendicescom os quais avalia as consultas

Meta-maacutequina de busca distribui asconsultas para outras maacutequinas de busca ecombina os resultados

Acoplamento ontologias-documentos

Acoplamento forte os metadados dosdocumentos referem-se explicitamente aosconceitos de uma ontologia e vice-versa(requer anotaccedilatildeo semacircntica)rlm

Acoplamento fraco os documentos satildeoindependentes de quaisquer ontologiasdisponiacuteveis (pode restringir a capacidade debusca)rlm

Contexto do usuaacuterio

Learning extraiacutedo na interaccedilotildees do usuaacuteriocom o sistema (histoacuterico das consultas erefinamentos de consultas)rlm

Hard-coded as consultas satildeo organizadas emcategorias que definem a informaccedilatildeo solicitada(eg ldquolocation ofrdquo ldquoresources forrdquo rlm(

Modificaccedilatildeo de consultas

Manual o sistema retorna um trechoapropriado da ontologia junto com a respostapermitindo ao usuaacuterio navegar na ontologia ereformular a consulta pela adiccedilatildeo e remoccedilatildeo determos

Re-escrita automaacutetica a consulta eacuteotimizada automaticamente pelo sistema

Baseada em grafo considera conceitos edocumentos como nodos de um grafoefetuando propagaccedilatildeo da consulta a partir dosnodos correspondentes a termos de busca

Modificaccedilatildeo de consultas

Modificaccedilatildeo de consulta

Manual

Re-escrita de consulta

Baseada em grafo

Inserccedilatildeo de termoRemoccedilatildeo de termo

Substituiccedilatildeo de termo

Conjuntiva

Disjuntiva

Conjuntiva Disjuntiva

21042010

17

Estrutura da ontologia

Propriedades anocircnimas as relaccedilotildees entreconceitos natildeo satildeo nomeadas indicando apenasque eles compartilham o mesmo contexto

Propriedades padronizadas sinocircniacutemiahiperniacutemia meroniacutemia negaccedilatildeo etc

Propriedades especiacuteficas de domiacutenio aleacutemdas propriedades padratildeo considerapropriedades especiacuteficas de um domiacutenio (egldquotipo de cacircmerardquo em sistema para a aacuterea defotografia)rlm

Tecnologia da ontologia

F-Logic

RDF

DAML+OIL

Frames

OWL

Comparaccedilatildeo de abordagens Comparaccedilatildeo de abordagens (cont)

Buscas semacircnticas na Web hoje

httpwwwaliprcom (imagens)rlm

httpwwwcognitioncom

httpwwwdeepdyvecom

httpwwwbingcom

httpwwwcuilcom

httpwwwfreebasecom

httpwwwgooglecom

httpwwwkosmixcom

httpwwwhakiacom

httpwwwpowersetcom

httpwwwsensebotnet

httpdeveloperyahoocomsearchmonkey

httpswoogleumbcedu (ontologias)rlm

21042010

18

21042010

19

SAO PAULO-SP

University of Sao Paulo

Sao Paulo Fashion

Sao Paulo Fashion Week

Sao Paulo State

Sao Paulo Hotel

Sao Paulo Hotels

Sao Paulo Brasilien

Sao Paulo Congonhas

21042010

20

21042010

21

Sao Paulo Airport

Sao Paulo Plane Crash

Sao Paulo Zoo

hellip

21042010

22

21042010

23

Algumas questotildees em aberto

Representaccedilatildeo de contextos de usuaacuterios emapeamento desses a ontologias

Anaacutelise dos efeitos de modificaccedilotildees de consultas

Meta-buscas semacircnticas

Anaacutelise da aceitaccedilatildeo dos usuaacuterios

Adaptabilidade a diferentes ontologias

Ranking dos resultados

Integraccedilatildeo com sistemas de gerenciamento dedocumentosconteuacutedo

Tratamento de dados multimiacuteda

Interfaces homem-maacutequina

Desempenho e escalabilidade

Contextual Semantic Search (CSS)(DAgostine Fileto ndash SBBD2007)rlm

21042010

24

General Architecture for CSSThe Weighted Topic Graph(DAgostine Fileto Dantas Gauthier - ICEIS 2008)rlm

A weighted topic graph is a graph TM(T A)rlm

T is a set of topics (vertices)rlm

A is a set of associations (edges)rlm

Let be an ontology O

Each topic t in T corresponds to a ontology term o in O

Each topic t has a weight [01] The sum from the weights from all topics with same name equals 1

Each association a has a weight [01] The sum

from all the weights from all association departing

a single topics equals 1

Topic weights used to disambiguate

Eg interest in Satildeo Paulo city instead of Satildeo Paulo

state

Association weights used to semantically

expand searches

Eg Actual interest in Guarulhos and airport while

searching for Satildeo Paulo city

The Weights in the Topic Graph Capturing the Users Context

Generated Topic Graph with the Ontological Users Context

The Contextual Semantic Search Process

21042010

25

Desambiguaccedilatildeo

Fundamento dos algoritmos de busca sobre contexto ontoloacutegico

Heuriacutesticas de estigmergia (Ant Colony Optimization - ACO)

Traccedilos de ferormocircnio

Algoritmo de busca semacircntica baseada em ACO

Entrada palavras-chave[ ]

Dados G(TA) Onto repositoacuterio

limite_de_profundidade

limite_miacutenimo_de_peso

λ fator de atenuaccedilatildeo de peso

iniacutecio Algoritmo Busca Contextual 1 Estigmeacuterica

resultados = busca_G_ou_Onto(palavras-chave[])

atenuaG (iacutendice ) λrlmisin [0 1]

manutenccedilatildeo(coleta_feedback(resultados))

fim

21042010

26

Demo Praestro ndash Karina Fasolin

Alguns trabalhos relacionados

Name Article Comments

Graupmann

et al 2005

The SphereSearch

engine for unifiedranked retrieval of

heterogeneous XML

and web documents

Searches through XML documents The context is a region in radius

around given element A data inside two regions is considered relevant

to both contexts

Made tests with large collections like DBLP INEX Wikipedia put for

stress testing regarding the size of the collection

ldquoLet us first comment on the difficulties of defining a meaningfulbenchmark for this kind of novel systemrdquo

Park e

Cheyer 2006

Just For Me Topic

Maps and Ontologies

Manages knowledge in three layers Topics Knowledge Structures and

Documents

Not implemented (at least at the time of publication)

Michlmayr

et al 2007Adaptive User Profiles

for Enterprise

Information Access

Represents context as an individual graph The graph is constructed

based on tags used to semantically annotate the content which the user

considers to be relevant

However the tags are only that only labels They are not tied-down to

a formal definition

Alguns trabalhos relacionados (cont)

Name Article Comments

Aleman-

Meza et a

2003

Context-Aware

Semantic Association

Ranking

Also defines context as regions But the regions are static defined in

the ontology which is used by the system So the contexts are defined

the same for every single user

Mani and

Sundaram

2007

Modeling user context

with applications to

media retrieval

Creates a graph representing the users context Each node

corresponds to an instance in the ontology The edges represent

relations between the instances Built to search trough multimedia

documents

However it does not associates the vocabulary the user uses with the

instances

Challam et

al 2007

Contextual Search

Using Ontology-Based

User Profiles

Monitors the users activity capturing content from open Internet

Explorer MS-Office and MSN The captured information is stored and

usedrlmtorlmbuildrlmarlmuser‟srlmcontextualrlmprofilerlmbasesrlmonrlmanrlmontology

The context is tightly coupled with the ontology

NO IMAGES WERE

PROVIDED

Vallet et al

2006

Personalized

Information Retrieval in

Context

Stores context as a graph constructed based on the ontology used by

the system Similar to Mani and Sundaram including its limitations

(mapping the vocabulary) however if built for text documents

Sieg et al

2007

Ontological User

Profiles for

Personalized Web

Search

Similar to Challam et al but it gets the context information from the

ontology terms used to annotate the retrieved relevant context

Also limited by the structure of the ontology

Alguns trabalhos relacionados(cont)

Name Deals with

objective

knowledge

(ontology)

Deals with

subjective

knowledge

(users

context)

The knowledge

management is

transparent

Idea Implemented

Graupmann et

al 2005

X IMPL

Park e Cheyer

2006

X X X IDEA

Michlmayr et al2007

X X IMPL

Aleman-Meza et

a 2003

X X IMPL

Mani eSundaram 2007

X X X IMPL

Challam et al

2007

X X X IMPL

Vallet et al 2006 X X X IMPL

Sieg et al 2007 X X X IMPL

(incomplete)

Praestro X X X IMPL

(prototype)

UnA-SUS ndash Universidade Aberta do SUS

Programa do Ministeacuterio da Sauacutede para atender necessidades de e

permanente dos

Accedilotildees focadas em

formulaccedilatildeo de conteuacutedo

bibliotecas digitais

cursos a distacircncia

21042010

27

Metas da UnA-SUS

Desenvolver um

plataforma para de

composiccedilatildeo e de

Montar e oferecer cursos para formaccedilatildeo continuada de profissionais da sauacutede

157

Metadados

O processo de produccedilatildeo catalogaccedilatildeo e reuso de OAs

Repositoacuterio

Conteuacutedo

OAs

requisiccedilotildees

Design revisatildeo e publicaccedilatildeo

OA

SGA outros reps

Busca e reuso

OAsMetadados

OAs

Concepccedilatildeo e validaccedilatildeo de OAs

O processo de produccedilatildeo catalogaccedilatildeo e reuso de OAs

OA1

Curso A

Curso B

OA2

OA3

Viacutedeo

Imagens

RepositoacuteriosConteuacutedoMultimiacutedia

SGA RepositoacuteriosOAs

Reuso eacute essencial

bull OAs satildeo caros para produzir

bull Demandas emergenciais na sauacutede puacuteblica exigem agilidade e pronta resposta com cursos para a qualificaccedilatildeo de profissionais

H1N1

Apoplexia

gripe suiacutena gripe A

influenza H1N1

hellip

21042010

28

Navegaccedilatildeo hiperboacutelica no DeCSCatalogaccedilatildeo de Objetos de Aprendizagem (OAs) usando Vocabulaacuterios Controlados

bull Seleccedilatildeo de termos do DeCS CID-10 SNOMED

ndash via fornecimento de palavras-chave que satildeo pesquisadas na base de conhecimento

ndash via navegaccedilatildeo em uma visatildeo do conhecimento em forma de aacutervore

Seleccedilatildeo via contexto ontoloacutegicoProtoacutetipo (catalogaccedilatildeo com entrada

de palavra-chave)

DSpaceCatalogaccedilatildeo de OAswf

Protoacutetipo (catalogaccedilatildeo com navegaccedilatildeo

na base de conhecimento)

DSpaceRecuperaccedilatildeo de OAswf

21042010

29

Recuperaccedilatildeo de Objetos de Aprendizagem (OAs) Baseada em Conhecimento

bull Vocabulaacuterios e relaccedilotildees semacircnticas

ndash Oriundos do DeCS

ndash Definidos pelos catalogadores de OAs

ndash Gerados pelo cruzamento de informaccedilotildees com o CID-10 (Classificaccedilatildeo Internacional de Doenccedilas)

ndash Ex sinocircnimos eacute um(a) parte de causa efeito sintoma etc

DeCs

Anatomia

Sistema Nervoso

Sistema Nervoso Central

Enceacutefalo

Prosenceacutefalo

Telencaacutefalo

Ceacuterebro

Doenccedilas

Doenccedilas do Sistema Nervoso

Doenccedilas Cardiovasculares

Doenccedilas do Sistema Nervoso Central

Encefalopatias

Transtornos Cerebrovasculares

Doenccedilas Vasculares

Transtornos Cerebrovasculares

Acidente Vascular Cerebral

Acidente Vascular Cerebral

OA 1

OA 2

AVC

IctusCerebral

Derrame Cerebral

Hemisfeacuterios Cerebrais

ApoplexiaAcidente

Cerebrovascular

IctoCerebral

Apoplexia Cerebrovascular

Apoplexia Cerebral

Acidente Vascular

Encefaacutelico

Acidente Vascular

do Ceacuterebro

Acidente Vascular Cerebral

padratildeo (sinocircnimo)

anota

especiacutefica de domiacutenio

anocircnimas (DeCs)

172

DeCs

Anatomia

Sistema Nervoso

Sistema Nervoso Central

Enceacutefalo

Prosenceacutefalo

Telencaacutefalo

Ceacuterebro (2)

Doenccedilas

Doenccedilas do Sistema Nervoso

Doenccedilas Cardiovasculares

Doenccedilas do Sistema Nervoso Central

Encefalopatias

Transtornos Cerebrovasculares

Doenccedilas Vasculares

Transtornos Cerebrovasculares

Acidente Cerebral Vascular (1)

Acidente Cerebral Vascular(1)

OA 1

OA 2

AVC

IctusCerebral

Derrame Cerebral

Hemisfeacuterios Cerebrais

ApoplexiaAcidente

Cerebrovascular

IctoCerebral

Apoplexia Cerebrovascular

Apoplexia Cerebral

Acidente Vascular

Encefaacutelico

Acidente Vascular

do Ceacuterebro

Acidente Vascular Cerebral

Busca de OAs na aacuterea de sauacutede usando conhecimento de domiacutenio

Semantic Learning Objects (VIAN J SILVEIRA R A FILETO R WCCE 2009)

21042010

30

Conclusotildees

A Web semacircntica tem potencial de contribuir naobtenccedilatildeo de melhores resultados para buscas

Suporte automatizado eacute fundamental para a construccedilatildeo evoluccedilatildeo e integraccedilatildeo de ontologias anotaccedilotildees semacircnticas e contextos de usuaacuterios

Nossos primeiros resultados focam na captura e utilizaccedilatildeo de contextos de usuaacuterios mapeados a ontologias de domiacutenios especiacuteficos paradesambiguar e estender as buscas

Trabalhos futuros

Processos parcialmente automatizados para geraccedilatildeo e atualizaccedilatildeo de ontologias e anotaccedilotildees semacircnticas

Experimentos para comprovar a eficaacutecia das teacutecnicas e ferramentas utilizadas

Validaccedilatildeo de soluccedilotildees de problemas de busca semacircntica em diversos domiacutenios de aplicaccedilatildeo

Determinaccedilatildeo de niacuteveis adequados de acoplamento entre contextos e ontologias e dessas com os recursos a serem recuperados

Notiacutecias e anaacutelises

httpnewscnetcomnew-search-engine-cuil-takes-aim-at-google

httpwwwreadwritewebcomarchivesis_google_a_semantic_search_enginephp

httpwwwreadwritewebcomarchivessemantic_search_the_myt

h_and_realityphp

httpwwwpandiacomsew1262-top-5-semantic-search-

engineshtml

httpmindsetresearchyahoocom

httpnewscnetcom8301-13953_3-9982015-80html

httpwwwsearchenginejournalcomaskcom-focuses-on-semantic-search8252

httpnewsbbccouk2hiprogrammesclick_onlinedefaultstm

httpnewsbbccouk2hiprogrammesclick_online8144765stm

Web semacircntica e buscassemacircnticas

httpwwww3org2001sw

httpsemanticweborg

httpenwikipediaorgwikiSemantic_Web

httpenwikipediaorgwikiSemantic_search

Ferramentas de desenvolvimento

httpprotegestanfordedu

httpjenasourceforgenet

httpwwww3org2001Annotea

httpwwwontotextcomkim

httpesww3orgtopicSemanticWebTools

httpwwwdamlorg200305swmu-tools-

tutorialOverviewhtml

Referecircncias em Web semacircntica

T Berners-Lee J Hendler e O Lassila The Semantic Web Scientific American May 2001

Thomas B Passing Explores Guide to the Semantic Web Manning Publications Greenwich CT 2005

Davies J Studer R Warren P (Eds) Semantic Web Technologies trends and research in ontology-based

Systems John Wiley amp Sons 2006

Breitman KK Casanova MA Truszkowski W Semantic Web

Concepts Technologies and Applications Series NASA Monographs in Systems and Software Engineering Springer 2007

Grigoris Antoniou and Frank van Harmelen A Semantic Web Primer 2nd edition The MIT Press Cambridge MA USA 2008

Kashyap V Bussler C Moran M The Semantic Web -Semantics for Data and Services on the Web Series Data-

Centric Systems and Applications Springer 2008

Hitzler P Krotzsch M Rudolph S Foundations of SemanticWeb Technologies Chapman amp HallCRC 2009

21042010

31

Referecircncias em buscas semacircnticas

Guha R McCool R and Miller E 2003 Semantic search In Proc of the 12th international Conference on World Wide Web

(WWW) Budapest Hungary ACM New York NY 2003 700-709

Reeve L and Han H 2005 Survey of semantic annotation

platforms In Proceedings of the ACM Symposium on Applied Computing Santa Fe New Mexico ACM New York NY 2005

1634-1638

Eetu Makela Survey of Semantic Search Research

Mangold C A Survey and classification of semantic search approaches Journal of Metadata Semantics and Ontology 2(1)

2007

Stephan Bloehdorn Philipp Cimiano Alistair Duke Peter Haase Joumlrg Heizmann Ian Thurlow Johanna Voumllker Ontology-BasedQuestion Answering for Digital Libraries ECDL 2007 14-25

Hai Dong Hussain FK Chang E A survey in semantic search technologies In 2nd IEEE International Conference on

Digital Ecosystems and Technologies 2008 403-408

Algumas referecircncias grupo UFSC

DAgostini C S Fileto R Capturing Users Preferences and Intentions in a Semantic Search System In 21st International

Conference on Software Engineering amp Knowledge Engineering (SEKE) Boston 2009 p 587-591

DAgostini C S Fileto R Dantas M A R Gauthier F A O

Contextual Semantic Search - Capturing using the UsersContext to Direct Semantic Search In 10th InternationalConference on Enterprise Information Systems (ICEIS) Barcelona

Spain 2008 v SAIC p 154-159

DAgostini C S Fileto R Capturing and managing usercontext for improving information retrieval In Workshop de

Teses e Dissertaccedilotildees do Simpoacutesio Brasileiro de Bancos de Dados (WTDBDSBBD) Campinas Unicamp Brazil 2008

Vian J Silveira R A Fileto R Proposal of a Multi-agent System for Indexing and Recovery applied to Learning

Objects In 9th IFIP World Conference on Computers in Education (WCCE) Bento Goncalves Brazil 2009

Alguns projetos na UFSC

httpwwwlisaufscbrprojetos

httpwwwunasusufscbr

httpwwwliteraturabrasileiraufscbr

Perguntas

Page 17: Buscas Semânticasfileto/Talks/BuscasSemanticas6sp.pdf · 21/04/2010 1 1 Buscas semânticas: panorama e tendências atuais minicurso ERBD 2010 RenatoFileto fileto@inf.ufsc.br AlunosColaboradores:

21042010

17

Estrutura da ontologia

Propriedades anocircnimas as relaccedilotildees entreconceitos natildeo satildeo nomeadas indicando apenasque eles compartilham o mesmo contexto

Propriedades padronizadas sinocircniacutemiahiperniacutemia meroniacutemia negaccedilatildeo etc

Propriedades especiacuteficas de domiacutenio aleacutemdas propriedades padratildeo considerapropriedades especiacuteficas de um domiacutenio (egldquotipo de cacircmerardquo em sistema para a aacuterea defotografia)rlm

Tecnologia da ontologia

F-Logic

RDF

DAML+OIL

Frames

OWL

Comparaccedilatildeo de abordagens Comparaccedilatildeo de abordagens (cont)

Buscas semacircnticas na Web hoje

httpwwwaliprcom (imagens)rlm

httpwwwcognitioncom

httpwwwdeepdyvecom

httpwwwbingcom

httpwwwcuilcom

httpwwwfreebasecom

httpwwwgooglecom

httpwwwkosmixcom

httpwwwhakiacom

httpwwwpowersetcom

httpwwwsensebotnet

httpdeveloperyahoocomsearchmonkey

httpswoogleumbcedu (ontologias)rlm

21042010

18

21042010

19

SAO PAULO-SP

University of Sao Paulo

Sao Paulo Fashion

Sao Paulo Fashion Week

Sao Paulo State

Sao Paulo Hotel

Sao Paulo Hotels

Sao Paulo Brasilien

Sao Paulo Congonhas

21042010

20

21042010

21

Sao Paulo Airport

Sao Paulo Plane Crash

Sao Paulo Zoo

hellip

21042010

22

21042010

23

Algumas questotildees em aberto

Representaccedilatildeo de contextos de usuaacuterios emapeamento desses a ontologias

Anaacutelise dos efeitos de modificaccedilotildees de consultas

Meta-buscas semacircnticas

Anaacutelise da aceitaccedilatildeo dos usuaacuterios

Adaptabilidade a diferentes ontologias

Ranking dos resultados

Integraccedilatildeo com sistemas de gerenciamento dedocumentosconteuacutedo

Tratamento de dados multimiacuteda

Interfaces homem-maacutequina

Desempenho e escalabilidade

Contextual Semantic Search (CSS)(DAgostine Fileto ndash SBBD2007)rlm

21042010

24

General Architecture for CSSThe Weighted Topic Graph(DAgostine Fileto Dantas Gauthier - ICEIS 2008)rlm

A weighted topic graph is a graph TM(T A)rlm

T is a set of topics (vertices)rlm

A is a set of associations (edges)rlm

Let be an ontology O

Each topic t in T corresponds to a ontology term o in O

Each topic t has a weight [01] The sum from the weights from all topics with same name equals 1

Each association a has a weight [01] The sum

from all the weights from all association departing

a single topics equals 1

Topic weights used to disambiguate

Eg interest in Satildeo Paulo city instead of Satildeo Paulo

state

Association weights used to semantically

expand searches

Eg Actual interest in Guarulhos and airport while

searching for Satildeo Paulo city

The Weights in the Topic Graph Capturing the Users Context

Generated Topic Graph with the Ontological Users Context

The Contextual Semantic Search Process

21042010

25

Desambiguaccedilatildeo

Fundamento dos algoritmos de busca sobre contexto ontoloacutegico

Heuriacutesticas de estigmergia (Ant Colony Optimization - ACO)

Traccedilos de ferormocircnio

Algoritmo de busca semacircntica baseada em ACO

Entrada palavras-chave[ ]

Dados G(TA) Onto repositoacuterio

limite_de_profundidade

limite_miacutenimo_de_peso

λ fator de atenuaccedilatildeo de peso

iniacutecio Algoritmo Busca Contextual 1 Estigmeacuterica

resultados = busca_G_ou_Onto(palavras-chave[])

atenuaG (iacutendice ) λrlmisin [0 1]

manutenccedilatildeo(coleta_feedback(resultados))

fim

21042010

26

Demo Praestro ndash Karina Fasolin

Alguns trabalhos relacionados

Name Article Comments

Graupmann

et al 2005

The SphereSearch

engine for unifiedranked retrieval of

heterogeneous XML

and web documents

Searches through XML documents The context is a region in radius

around given element A data inside two regions is considered relevant

to both contexts

Made tests with large collections like DBLP INEX Wikipedia put for

stress testing regarding the size of the collection

ldquoLet us first comment on the difficulties of defining a meaningfulbenchmark for this kind of novel systemrdquo

Park e

Cheyer 2006

Just For Me Topic

Maps and Ontologies

Manages knowledge in three layers Topics Knowledge Structures and

Documents

Not implemented (at least at the time of publication)

Michlmayr

et al 2007Adaptive User Profiles

for Enterprise

Information Access

Represents context as an individual graph The graph is constructed

based on tags used to semantically annotate the content which the user

considers to be relevant

However the tags are only that only labels They are not tied-down to

a formal definition

Alguns trabalhos relacionados (cont)

Name Article Comments

Aleman-

Meza et a

2003

Context-Aware

Semantic Association

Ranking

Also defines context as regions But the regions are static defined in

the ontology which is used by the system So the contexts are defined

the same for every single user

Mani and

Sundaram

2007

Modeling user context

with applications to

media retrieval

Creates a graph representing the users context Each node

corresponds to an instance in the ontology The edges represent

relations between the instances Built to search trough multimedia

documents

However it does not associates the vocabulary the user uses with the

instances

Challam et

al 2007

Contextual Search

Using Ontology-Based

User Profiles

Monitors the users activity capturing content from open Internet

Explorer MS-Office and MSN The captured information is stored and

usedrlmtorlmbuildrlmarlmuser‟srlmcontextualrlmprofilerlmbasesrlmonrlmanrlmontology

The context is tightly coupled with the ontology

NO IMAGES WERE

PROVIDED

Vallet et al

2006

Personalized

Information Retrieval in

Context

Stores context as a graph constructed based on the ontology used by

the system Similar to Mani and Sundaram including its limitations

(mapping the vocabulary) however if built for text documents

Sieg et al

2007

Ontological User

Profiles for

Personalized Web

Search

Similar to Challam et al but it gets the context information from the

ontology terms used to annotate the retrieved relevant context

Also limited by the structure of the ontology

Alguns trabalhos relacionados(cont)

Name Deals with

objective

knowledge

(ontology)

Deals with

subjective

knowledge

(users

context)

The knowledge

management is

transparent

Idea Implemented

Graupmann et

al 2005

X IMPL

Park e Cheyer

2006

X X X IDEA

Michlmayr et al2007

X X IMPL

Aleman-Meza et

a 2003

X X IMPL

Mani eSundaram 2007

X X X IMPL

Challam et al

2007

X X X IMPL

Vallet et al 2006 X X X IMPL

Sieg et al 2007 X X X IMPL

(incomplete)

Praestro X X X IMPL

(prototype)

UnA-SUS ndash Universidade Aberta do SUS

Programa do Ministeacuterio da Sauacutede para atender necessidades de e

permanente dos

Accedilotildees focadas em

formulaccedilatildeo de conteuacutedo

bibliotecas digitais

cursos a distacircncia

21042010

27

Metas da UnA-SUS

Desenvolver um

plataforma para de

composiccedilatildeo e de

Montar e oferecer cursos para formaccedilatildeo continuada de profissionais da sauacutede

157

Metadados

O processo de produccedilatildeo catalogaccedilatildeo e reuso de OAs

Repositoacuterio

Conteuacutedo

OAs

requisiccedilotildees

Design revisatildeo e publicaccedilatildeo

OA

SGA outros reps

Busca e reuso

OAsMetadados

OAs

Concepccedilatildeo e validaccedilatildeo de OAs

O processo de produccedilatildeo catalogaccedilatildeo e reuso de OAs

OA1

Curso A

Curso B

OA2

OA3

Viacutedeo

Imagens

RepositoacuteriosConteuacutedoMultimiacutedia

SGA RepositoacuteriosOAs

Reuso eacute essencial

bull OAs satildeo caros para produzir

bull Demandas emergenciais na sauacutede puacuteblica exigem agilidade e pronta resposta com cursos para a qualificaccedilatildeo de profissionais

H1N1

Apoplexia

gripe suiacutena gripe A

influenza H1N1

hellip

21042010

28

Navegaccedilatildeo hiperboacutelica no DeCSCatalogaccedilatildeo de Objetos de Aprendizagem (OAs) usando Vocabulaacuterios Controlados

bull Seleccedilatildeo de termos do DeCS CID-10 SNOMED

ndash via fornecimento de palavras-chave que satildeo pesquisadas na base de conhecimento

ndash via navegaccedilatildeo em uma visatildeo do conhecimento em forma de aacutervore

Seleccedilatildeo via contexto ontoloacutegicoProtoacutetipo (catalogaccedilatildeo com entrada

de palavra-chave)

DSpaceCatalogaccedilatildeo de OAswf

Protoacutetipo (catalogaccedilatildeo com navegaccedilatildeo

na base de conhecimento)

DSpaceRecuperaccedilatildeo de OAswf

21042010

29

Recuperaccedilatildeo de Objetos de Aprendizagem (OAs) Baseada em Conhecimento

bull Vocabulaacuterios e relaccedilotildees semacircnticas

ndash Oriundos do DeCS

ndash Definidos pelos catalogadores de OAs

ndash Gerados pelo cruzamento de informaccedilotildees com o CID-10 (Classificaccedilatildeo Internacional de Doenccedilas)

ndash Ex sinocircnimos eacute um(a) parte de causa efeito sintoma etc

DeCs

Anatomia

Sistema Nervoso

Sistema Nervoso Central

Enceacutefalo

Prosenceacutefalo

Telencaacutefalo

Ceacuterebro

Doenccedilas

Doenccedilas do Sistema Nervoso

Doenccedilas Cardiovasculares

Doenccedilas do Sistema Nervoso Central

Encefalopatias

Transtornos Cerebrovasculares

Doenccedilas Vasculares

Transtornos Cerebrovasculares

Acidente Vascular Cerebral

Acidente Vascular Cerebral

OA 1

OA 2

AVC

IctusCerebral

Derrame Cerebral

Hemisfeacuterios Cerebrais

ApoplexiaAcidente

Cerebrovascular

IctoCerebral

Apoplexia Cerebrovascular

Apoplexia Cerebral

Acidente Vascular

Encefaacutelico

Acidente Vascular

do Ceacuterebro

Acidente Vascular Cerebral

padratildeo (sinocircnimo)

anota

especiacutefica de domiacutenio

anocircnimas (DeCs)

172

DeCs

Anatomia

Sistema Nervoso

Sistema Nervoso Central

Enceacutefalo

Prosenceacutefalo

Telencaacutefalo

Ceacuterebro (2)

Doenccedilas

Doenccedilas do Sistema Nervoso

Doenccedilas Cardiovasculares

Doenccedilas do Sistema Nervoso Central

Encefalopatias

Transtornos Cerebrovasculares

Doenccedilas Vasculares

Transtornos Cerebrovasculares

Acidente Cerebral Vascular (1)

Acidente Cerebral Vascular(1)

OA 1

OA 2

AVC

IctusCerebral

Derrame Cerebral

Hemisfeacuterios Cerebrais

ApoplexiaAcidente

Cerebrovascular

IctoCerebral

Apoplexia Cerebrovascular

Apoplexia Cerebral

Acidente Vascular

Encefaacutelico

Acidente Vascular

do Ceacuterebro

Acidente Vascular Cerebral

Busca de OAs na aacuterea de sauacutede usando conhecimento de domiacutenio

Semantic Learning Objects (VIAN J SILVEIRA R A FILETO R WCCE 2009)

21042010

30

Conclusotildees

A Web semacircntica tem potencial de contribuir naobtenccedilatildeo de melhores resultados para buscas

Suporte automatizado eacute fundamental para a construccedilatildeo evoluccedilatildeo e integraccedilatildeo de ontologias anotaccedilotildees semacircnticas e contextos de usuaacuterios

Nossos primeiros resultados focam na captura e utilizaccedilatildeo de contextos de usuaacuterios mapeados a ontologias de domiacutenios especiacuteficos paradesambiguar e estender as buscas

Trabalhos futuros

Processos parcialmente automatizados para geraccedilatildeo e atualizaccedilatildeo de ontologias e anotaccedilotildees semacircnticas

Experimentos para comprovar a eficaacutecia das teacutecnicas e ferramentas utilizadas

Validaccedilatildeo de soluccedilotildees de problemas de busca semacircntica em diversos domiacutenios de aplicaccedilatildeo

Determinaccedilatildeo de niacuteveis adequados de acoplamento entre contextos e ontologias e dessas com os recursos a serem recuperados

Notiacutecias e anaacutelises

httpnewscnetcomnew-search-engine-cuil-takes-aim-at-google

httpwwwreadwritewebcomarchivesis_google_a_semantic_search_enginephp

httpwwwreadwritewebcomarchivessemantic_search_the_myt

h_and_realityphp

httpwwwpandiacomsew1262-top-5-semantic-search-

engineshtml

httpmindsetresearchyahoocom

httpnewscnetcom8301-13953_3-9982015-80html

httpwwwsearchenginejournalcomaskcom-focuses-on-semantic-search8252

httpnewsbbccouk2hiprogrammesclick_onlinedefaultstm

httpnewsbbccouk2hiprogrammesclick_online8144765stm

Web semacircntica e buscassemacircnticas

httpwwww3org2001sw

httpsemanticweborg

httpenwikipediaorgwikiSemantic_Web

httpenwikipediaorgwikiSemantic_search

Ferramentas de desenvolvimento

httpprotegestanfordedu

httpjenasourceforgenet

httpwwww3org2001Annotea

httpwwwontotextcomkim

httpesww3orgtopicSemanticWebTools

httpwwwdamlorg200305swmu-tools-

tutorialOverviewhtml

Referecircncias em Web semacircntica

T Berners-Lee J Hendler e O Lassila The Semantic Web Scientific American May 2001

Thomas B Passing Explores Guide to the Semantic Web Manning Publications Greenwich CT 2005

Davies J Studer R Warren P (Eds) Semantic Web Technologies trends and research in ontology-based

Systems John Wiley amp Sons 2006

Breitman KK Casanova MA Truszkowski W Semantic Web

Concepts Technologies and Applications Series NASA Monographs in Systems and Software Engineering Springer 2007

Grigoris Antoniou and Frank van Harmelen A Semantic Web Primer 2nd edition The MIT Press Cambridge MA USA 2008

Kashyap V Bussler C Moran M The Semantic Web -Semantics for Data and Services on the Web Series Data-

Centric Systems and Applications Springer 2008

Hitzler P Krotzsch M Rudolph S Foundations of SemanticWeb Technologies Chapman amp HallCRC 2009

21042010

31

Referecircncias em buscas semacircnticas

Guha R McCool R and Miller E 2003 Semantic search In Proc of the 12th international Conference on World Wide Web

(WWW) Budapest Hungary ACM New York NY 2003 700-709

Reeve L and Han H 2005 Survey of semantic annotation

platforms In Proceedings of the ACM Symposium on Applied Computing Santa Fe New Mexico ACM New York NY 2005

1634-1638

Eetu Makela Survey of Semantic Search Research

Mangold C A Survey and classification of semantic search approaches Journal of Metadata Semantics and Ontology 2(1)

2007

Stephan Bloehdorn Philipp Cimiano Alistair Duke Peter Haase Joumlrg Heizmann Ian Thurlow Johanna Voumllker Ontology-BasedQuestion Answering for Digital Libraries ECDL 2007 14-25

Hai Dong Hussain FK Chang E A survey in semantic search technologies In 2nd IEEE International Conference on

Digital Ecosystems and Technologies 2008 403-408

Algumas referecircncias grupo UFSC

DAgostini C S Fileto R Capturing Users Preferences and Intentions in a Semantic Search System In 21st International

Conference on Software Engineering amp Knowledge Engineering (SEKE) Boston 2009 p 587-591

DAgostini C S Fileto R Dantas M A R Gauthier F A O

Contextual Semantic Search - Capturing using the UsersContext to Direct Semantic Search In 10th InternationalConference on Enterprise Information Systems (ICEIS) Barcelona

Spain 2008 v SAIC p 154-159

DAgostini C S Fileto R Capturing and managing usercontext for improving information retrieval In Workshop de

Teses e Dissertaccedilotildees do Simpoacutesio Brasileiro de Bancos de Dados (WTDBDSBBD) Campinas Unicamp Brazil 2008

Vian J Silveira R A Fileto R Proposal of a Multi-agent System for Indexing and Recovery applied to Learning

Objects In 9th IFIP World Conference on Computers in Education (WCCE) Bento Goncalves Brazil 2009

Alguns projetos na UFSC

httpwwwlisaufscbrprojetos

httpwwwunasusufscbr

httpwwwliteraturabrasileiraufscbr

Perguntas

Page 18: Buscas Semânticasfileto/Talks/BuscasSemanticas6sp.pdf · 21/04/2010 1 1 Buscas semânticas: panorama e tendências atuais minicurso ERBD 2010 RenatoFileto fileto@inf.ufsc.br AlunosColaboradores:

21042010

18

21042010

19

SAO PAULO-SP

University of Sao Paulo

Sao Paulo Fashion

Sao Paulo Fashion Week

Sao Paulo State

Sao Paulo Hotel

Sao Paulo Hotels

Sao Paulo Brasilien

Sao Paulo Congonhas

21042010

20

21042010

21

Sao Paulo Airport

Sao Paulo Plane Crash

Sao Paulo Zoo

hellip

21042010

22

21042010

23

Algumas questotildees em aberto

Representaccedilatildeo de contextos de usuaacuterios emapeamento desses a ontologias

Anaacutelise dos efeitos de modificaccedilotildees de consultas

Meta-buscas semacircnticas

Anaacutelise da aceitaccedilatildeo dos usuaacuterios

Adaptabilidade a diferentes ontologias

Ranking dos resultados

Integraccedilatildeo com sistemas de gerenciamento dedocumentosconteuacutedo

Tratamento de dados multimiacuteda

Interfaces homem-maacutequina

Desempenho e escalabilidade

Contextual Semantic Search (CSS)(DAgostine Fileto ndash SBBD2007)rlm

21042010

24

General Architecture for CSSThe Weighted Topic Graph(DAgostine Fileto Dantas Gauthier - ICEIS 2008)rlm

A weighted topic graph is a graph TM(T A)rlm

T is a set of topics (vertices)rlm

A is a set of associations (edges)rlm

Let be an ontology O

Each topic t in T corresponds to a ontology term o in O

Each topic t has a weight [01] The sum from the weights from all topics with same name equals 1

Each association a has a weight [01] The sum

from all the weights from all association departing

a single topics equals 1

Topic weights used to disambiguate

Eg interest in Satildeo Paulo city instead of Satildeo Paulo

state

Association weights used to semantically

expand searches

Eg Actual interest in Guarulhos and airport while

searching for Satildeo Paulo city

The Weights in the Topic Graph Capturing the Users Context

Generated Topic Graph with the Ontological Users Context

The Contextual Semantic Search Process

21042010

25

Desambiguaccedilatildeo

Fundamento dos algoritmos de busca sobre contexto ontoloacutegico

Heuriacutesticas de estigmergia (Ant Colony Optimization - ACO)

Traccedilos de ferormocircnio

Algoritmo de busca semacircntica baseada em ACO

Entrada palavras-chave[ ]

Dados G(TA) Onto repositoacuterio

limite_de_profundidade

limite_miacutenimo_de_peso

λ fator de atenuaccedilatildeo de peso

iniacutecio Algoritmo Busca Contextual 1 Estigmeacuterica

resultados = busca_G_ou_Onto(palavras-chave[])

atenuaG (iacutendice ) λrlmisin [0 1]

manutenccedilatildeo(coleta_feedback(resultados))

fim

21042010

26

Demo Praestro ndash Karina Fasolin

Alguns trabalhos relacionados

Name Article Comments

Graupmann

et al 2005

The SphereSearch

engine for unifiedranked retrieval of

heterogeneous XML

and web documents

Searches through XML documents The context is a region in radius

around given element A data inside two regions is considered relevant

to both contexts

Made tests with large collections like DBLP INEX Wikipedia put for

stress testing regarding the size of the collection

ldquoLet us first comment on the difficulties of defining a meaningfulbenchmark for this kind of novel systemrdquo

Park e

Cheyer 2006

Just For Me Topic

Maps and Ontologies

Manages knowledge in three layers Topics Knowledge Structures and

Documents

Not implemented (at least at the time of publication)

Michlmayr

et al 2007Adaptive User Profiles

for Enterprise

Information Access

Represents context as an individual graph The graph is constructed

based on tags used to semantically annotate the content which the user

considers to be relevant

However the tags are only that only labels They are not tied-down to

a formal definition

Alguns trabalhos relacionados (cont)

Name Article Comments

Aleman-

Meza et a

2003

Context-Aware

Semantic Association

Ranking

Also defines context as regions But the regions are static defined in

the ontology which is used by the system So the contexts are defined

the same for every single user

Mani and

Sundaram

2007

Modeling user context

with applications to

media retrieval

Creates a graph representing the users context Each node

corresponds to an instance in the ontology The edges represent

relations between the instances Built to search trough multimedia

documents

However it does not associates the vocabulary the user uses with the

instances

Challam et

al 2007

Contextual Search

Using Ontology-Based

User Profiles

Monitors the users activity capturing content from open Internet

Explorer MS-Office and MSN The captured information is stored and

usedrlmtorlmbuildrlmarlmuser‟srlmcontextualrlmprofilerlmbasesrlmonrlmanrlmontology

The context is tightly coupled with the ontology

NO IMAGES WERE

PROVIDED

Vallet et al

2006

Personalized

Information Retrieval in

Context

Stores context as a graph constructed based on the ontology used by

the system Similar to Mani and Sundaram including its limitations

(mapping the vocabulary) however if built for text documents

Sieg et al

2007

Ontological User

Profiles for

Personalized Web

Search

Similar to Challam et al but it gets the context information from the

ontology terms used to annotate the retrieved relevant context

Also limited by the structure of the ontology

Alguns trabalhos relacionados(cont)

Name Deals with

objective

knowledge

(ontology)

Deals with

subjective

knowledge

(users

context)

The knowledge

management is

transparent

Idea Implemented

Graupmann et

al 2005

X IMPL

Park e Cheyer

2006

X X X IDEA

Michlmayr et al2007

X X IMPL

Aleman-Meza et

a 2003

X X IMPL

Mani eSundaram 2007

X X X IMPL

Challam et al

2007

X X X IMPL

Vallet et al 2006 X X X IMPL

Sieg et al 2007 X X X IMPL

(incomplete)

Praestro X X X IMPL

(prototype)

UnA-SUS ndash Universidade Aberta do SUS

Programa do Ministeacuterio da Sauacutede para atender necessidades de e

permanente dos

Accedilotildees focadas em

formulaccedilatildeo de conteuacutedo

bibliotecas digitais

cursos a distacircncia

21042010

27

Metas da UnA-SUS

Desenvolver um

plataforma para de

composiccedilatildeo e de

Montar e oferecer cursos para formaccedilatildeo continuada de profissionais da sauacutede

157

Metadados

O processo de produccedilatildeo catalogaccedilatildeo e reuso de OAs

Repositoacuterio

Conteuacutedo

OAs

requisiccedilotildees

Design revisatildeo e publicaccedilatildeo

OA

SGA outros reps

Busca e reuso

OAsMetadados

OAs

Concepccedilatildeo e validaccedilatildeo de OAs

O processo de produccedilatildeo catalogaccedilatildeo e reuso de OAs

OA1

Curso A

Curso B

OA2

OA3

Viacutedeo

Imagens

RepositoacuteriosConteuacutedoMultimiacutedia

SGA RepositoacuteriosOAs

Reuso eacute essencial

bull OAs satildeo caros para produzir

bull Demandas emergenciais na sauacutede puacuteblica exigem agilidade e pronta resposta com cursos para a qualificaccedilatildeo de profissionais

H1N1

Apoplexia

gripe suiacutena gripe A

influenza H1N1

hellip

21042010

28

Navegaccedilatildeo hiperboacutelica no DeCSCatalogaccedilatildeo de Objetos de Aprendizagem (OAs) usando Vocabulaacuterios Controlados

bull Seleccedilatildeo de termos do DeCS CID-10 SNOMED

ndash via fornecimento de palavras-chave que satildeo pesquisadas na base de conhecimento

ndash via navegaccedilatildeo em uma visatildeo do conhecimento em forma de aacutervore

Seleccedilatildeo via contexto ontoloacutegicoProtoacutetipo (catalogaccedilatildeo com entrada

de palavra-chave)

DSpaceCatalogaccedilatildeo de OAswf

Protoacutetipo (catalogaccedilatildeo com navegaccedilatildeo

na base de conhecimento)

DSpaceRecuperaccedilatildeo de OAswf

21042010

29

Recuperaccedilatildeo de Objetos de Aprendizagem (OAs) Baseada em Conhecimento

bull Vocabulaacuterios e relaccedilotildees semacircnticas

ndash Oriundos do DeCS

ndash Definidos pelos catalogadores de OAs

ndash Gerados pelo cruzamento de informaccedilotildees com o CID-10 (Classificaccedilatildeo Internacional de Doenccedilas)

ndash Ex sinocircnimos eacute um(a) parte de causa efeito sintoma etc

DeCs

Anatomia

Sistema Nervoso

Sistema Nervoso Central

Enceacutefalo

Prosenceacutefalo

Telencaacutefalo

Ceacuterebro

Doenccedilas

Doenccedilas do Sistema Nervoso

Doenccedilas Cardiovasculares

Doenccedilas do Sistema Nervoso Central

Encefalopatias

Transtornos Cerebrovasculares

Doenccedilas Vasculares

Transtornos Cerebrovasculares

Acidente Vascular Cerebral

Acidente Vascular Cerebral

OA 1

OA 2

AVC

IctusCerebral

Derrame Cerebral

Hemisfeacuterios Cerebrais

ApoplexiaAcidente

Cerebrovascular

IctoCerebral

Apoplexia Cerebrovascular

Apoplexia Cerebral

Acidente Vascular

Encefaacutelico

Acidente Vascular

do Ceacuterebro

Acidente Vascular Cerebral

padratildeo (sinocircnimo)

anota

especiacutefica de domiacutenio

anocircnimas (DeCs)

172

DeCs

Anatomia

Sistema Nervoso

Sistema Nervoso Central

Enceacutefalo

Prosenceacutefalo

Telencaacutefalo

Ceacuterebro (2)

Doenccedilas

Doenccedilas do Sistema Nervoso

Doenccedilas Cardiovasculares

Doenccedilas do Sistema Nervoso Central

Encefalopatias

Transtornos Cerebrovasculares

Doenccedilas Vasculares

Transtornos Cerebrovasculares

Acidente Cerebral Vascular (1)

Acidente Cerebral Vascular(1)

OA 1

OA 2

AVC

IctusCerebral

Derrame Cerebral

Hemisfeacuterios Cerebrais

ApoplexiaAcidente

Cerebrovascular

IctoCerebral

Apoplexia Cerebrovascular

Apoplexia Cerebral

Acidente Vascular

Encefaacutelico

Acidente Vascular

do Ceacuterebro

Acidente Vascular Cerebral

Busca de OAs na aacuterea de sauacutede usando conhecimento de domiacutenio

Semantic Learning Objects (VIAN J SILVEIRA R A FILETO R WCCE 2009)

21042010

30

Conclusotildees

A Web semacircntica tem potencial de contribuir naobtenccedilatildeo de melhores resultados para buscas

Suporte automatizado eacute fundamental para a construccedilatildeo evoluccedilatildeo e integraccedilatildeo de ontologias anotaccedilotildees semacircnticas e contextos de usuaacuterios

Nossos primeiros resultados focam na captura e utilizaccedilatildeo de contextos de usuaacuterios mapeados a ontologias de domiacutenios especiacuteficos paradesambiguar e estender as buscas

Trabalhos futuros

Processos parcialmente automatizados para geraccedilatildeo e atualizaccedilatildeo de ontologias e anotaccedilotildees semacircnticas

Experimentos para comprovar a eficaacutecia das teacutecnicas e ferramentas utilizadas

Validaccedilatildeo de soluccedilotildees de problemas de busca semacircntica em diversos domiacutenios de aplicaccedilatildeo

Determinaccedilatildeo de niacuteveis adequados de acoplamento entre contextos e ontologias e dessas com os recursos a serem recuperados

Notiacutecias e anaacutelises

httpnewscnetcomnew-search-engine-cuil-takes-aim-at-google

httpwwwreadwritewebcomarchivesis_google_a_semantic_search_enginephp

httpwwwreadwritewebcomarchivessemantic_search_the_myt

h_and_realityphp

httpwwwpandiacomsew1262-top-5-semantic-search-

engineshtml

httpmindsetresearchyahoocom

httpnewscnetcom8301-13953_3-9982015-80html

httpwwwsearchenginejournalcomaskcom-focuses-on-semantic-search8252

httpnewsbbccouk2hiprogrammesclick_onlinedefaultstm

httpnewsbbccouk2hiprogrammesclick_online8144765stm

Web semacircntica e buscassemacircnticas

httpwwww3org2001sw

httpsemanticweborg

httpenwikipediaorgwikiSemantic_Web

httpenwikipediaorgwikiSemantic_search

Ferramentas de desenvolvimento

httpprotegestanfordedu

httpjenasourceforgenet

httpwwww3org2001Annotea

httpwwwontotextcomkim

httpesww3orgtopicSemanticWebTools

httpwwwdamlorg200305swmu-tools-

tutorialOverviewhtml

Referecircncias em Web semacircntica

T Berners-Lee J Hendler e O Lassila The Semantic Web Scientific American May 2001

Thomas B Passing Explores Guide to the Semantic Web Manning Publications Greenwich CT 2005

Davies J Studer R Warren P (Eds) Semantic Web Technologies trends and research in ontology-based

Systems John Wiley amp Sons 2006

Breitman KK Casanova MA Truszkowski W Semantic Web

Concepts Technologies and Applications Series NASA Monographs in Systems and Software Engineering Springer 2007

Grigoris Antoniou and Frank van Harmelen A Semantic Web Primer 2nd edition The MIT Press Cambridge MA USA 2008

Kashyap V Bussler C Moran M The Semantic Web -Semantics for Data and Services on the Web Series Data-

Centric Systems and Applications Springer 2008

Hitzler P Krotzsch M Rudolph S Foundations of SemanticWeb Technologies Chapman amp HallCRC 2009

21042010

31

Referecircncias em buscas semacircnticas

Guha R McCool R and Miller E 2003 Semantic search In Proc of the 12th international Conference on World Wide Web

(WWW) Budapest Hungary ACM New York NY 2003 700-709

Reeve L and Han H 2005 Survey of semantic annotation

platforms In Proceedings of the ACM Symposium on Applied Computing Santa Fe New Mexico ACM New York NY 2005

1634-1638

Eetu Makela Survey of Semantic Search Research

Mangold C A Survey and classification of semantic search approaches Journal of Metadata Semantics and Ontology 2(1)

2007

Stephan Bloehdorn Philipp Cimiano Alistair Duke Peter Haase Joumlrg Heizmann Ian Thurlow Johanna Voumllker Ontology-BasedQuestion Answering for Digital Libraries ECDL 2007 14-25

Hai Dong Hussain FK Chang E A survey in semantic search technologies In 2nd IEEE International Conference on

Digital Ecosystems and Technologies 2008 403-408

Algumas referecircncias grupo UFSC

DAgostini C S Fileto R Capturing Users Preferences and Intentions in a Semantic Search System In 21st International

Conference on Software Engineering amp Knowledge Engineering (SEKE) Boston 2009 p 587-591

DAgostini C S Fileto R Dantas M A R Gauthier F A O

Contextual Semantic Search - Capturing using the UsersContext to Direct Semantic Search In 10th InternationalConference on Enterprise Information Systems (ICEIS) Barcelona

Spain 2008 v SAIC p 154-159

DAgostini C S Fileto R Capturing and managing usercontext for improving information retrieval In Workshop de

Teses e Dissertaccedilotildees do Simpoacutesio Brasileiro de Bancos de Dados (WTDBDSBBD) Campinas Unicamp Brazil 2008

Vian J Silveira R A Fileto R Proposal of a Multi-agent System for Indexing and Recovery applied to Learning

Objects In 9th IFIP World Conference on Computers in Education (WCCE) Bento Goncalves Brazil 2009

Alguns projetos na UFSC

httpwwwlisaufscbrprojetos

httpwwwunasusufscbr

httpwwwliteraturabrasileiraufscbr

Perguntas

Page 19: Buscas Semânticasfileto/Talks/BuscasSemanticas6sp.pdf · 21/04/2010 1 1 Buscas semânticas: panorama e tendências atuais minicurso ERBD 2010 RenatoFileto fileto@inf.ufsc.br AlunosColaboradores:

21042010

19

SAO PAULO-SP

University of Sao Paulo

Sao Paulo Fashion

Sao Paulo Fashion Week

Sao Paulo State

Sao Paulo Hotel

Sao Paulo Hotels

Sao Paulo Brasilien

Sao Paulo Congonhas

21042010

20

21042010

21

Sao Paulo Airport

Sao Paulo Plane Crash

Sao Paulo Zoo

hellip

21042010

22

21042010

23

Algumas questotildees em aberto

Representaccedilatildeo de contextos de usuaacuterios emapeamento desses a ontologias

Anaacutelise dos efeitos de modificaccedilotildees de consultas

Meta-buscas semacircnticas

Anaacutelise da aceitaccedilatildeo dos usuaacuterios

Adaptabilidade a diferentes ontologias

Ranking dos resultados

Integraccedilatildeo com sistemas de gerenciamento dedocumentosconteuacutedo

Tratamento de dados multimiacuteda

Interfaces homem-maacutequina

Desempenho e escalabilidade

Contextual Semantic Search (CSS)(DAgostine Fileto ndash SBBD2007)rlm

21042010

24

General Architecture for CSSThe Weighted Topic Graph(DAgostine Fileto Dantas Gauthier - ICEIS 2008)rlm

A weighted topic graph is a graph TM(T A)rlm

T is a set of topics (vertices)rlm

A is a set of associations (edges)rlm

Let be an ontology O

Each topic t in T corresponds to a ontology term o in O

Each topic t has a weight [01] The sum from the weights from all topics with same name equals 1

Each association a has a weight [01] The sum

from all the weights from all association departing

a single topics equals 1

Topic weights used to disambiguate

Eg interest in Satildeo Paulo city instead of Satildeo Paulo

state

Association weights used to semantically

expand searches

Eg Actual interest in Guarulhos and airport while

searching for Satildeo Paulo city

The Weights in the Topic Graph Capturing the Users Context

Generated Topic Graph with the Ontological Users Context

The Contextual Semantic Search Process

21042010

25

Desambiguaccedilatildeo

Fundamento dos algoritmos de busca sobre contexto ontoloacutegico

Heuriacutesticas de estigmergia (Ant Colony Optimization - ACO)

Traccedilos de ferormocircnio

Algoritmo de busca semacircntica baseada em ACO

Entrada palavras-chave[ ]

Dados G(TA) Onto repositoacuterio

limite_de_profundidade

limite_miacutenimo_de_peso

λ fator de atenuaccedilatildeo de peso

iniacutecio Algoritmo Busca Contextual 1 Estigmeacuterica

resultados = busca_G_ou_Onto(palavras-chave[])

atenuaG (iacutendice ) λrlmisin [0 1]

manutenccedilatildeo(coleta_feedback(resultados))

fim

21042010

26

Demo Praestro ndash Karina Fasolin

Alguns trabalhos relacionados

Name Article Comments

Graupmann

et al 2005

The SphereSearch

engine for unifiedranked retrieval of

heterogeneous XML

and web documents

Searches through XML documents The context is a region in radius

around given element A data inside two regions is considered relevant

to both contexts

Made tests with large collections like DBLP INEX Wikipedia put for

stress testing regarding the size of the collection

ldquoLet us first comment on the difficulties of defining a meaningfulbenchmark for this kind of novel systemrdquo

Park e

Cheyer 2006

Just For Me Topic

Maps and Ontologies

Manages knowledge in three layers Topics Knowledge Structures and

Documents

Not implemented (at least at the time of publication)

Michlmayr

et al 2007Adaptive User Profiles

for Enterprise

Information Access

Represents context as an individual graph The graph is constructed

based on tags used to semantically annotate the content which the user

considers to be relevant

However the tags are only that only labels They are not tied-down to

a formal definition

Alguns trabalhos relacionados (cont)

Name Article Comments

Aleman-

Meza et a

2003

Context-Aware

Semantic Association

Ranking

Also defines context as regions But the regions are static defined in

the ontology which is used by the system So the contexts are defined

the same for every single user

Mani and

Sundaram

2007

Modeling user context

with applications to

media retrieval

Creates a graph representing the users context Each node

corresponds to an instance in the ontology The edges represent

relations between the instances Built to search trough multimedia

documents

However it does not associates the vocabulary the user uses with the

instances

Challam et

al 2007

Contextual Search

Using Ontology-Based

User Profiles

Monitors the users activity capturing content from open Internet

Explorer MS-Office and MSN The captured information is stored and

usedrlmtorlmbuildrlmarlmuser‟srlmcontextualrlmprofilerlmbasesrlmonrlmanrlmontology

The context is tightly coupled with the ontology

NO IMAGES WERE

PROVIDED

Vallet et al

2006

Personalized

Information Retrieval in

Context

Stores context as a graph constructed based on the ontology used by

the system Similar to Mani and Sundaram including its limitations

(mapping the vocabulary) however if built for text documents

Sieg et al

2007

Ontological User

Profiles for

Personalized Web

Search

Similar to Challam et al but it gets the context information from the

ontology terms used to annotate the retrieved relevant context

Also limited by the structure of the ontology

Alguns trabalhos relacionados(cont)

Name Deals with

objective

knowledge

(ontology)

Deals with

subjective

knowledge

(users

context)

The knowledge

management is

transparent

Idea Implemented

Graupmann et

al 2005

X IMPL

Park e Cheyer

2006

X X X IDEA

Michlmayr et al2007

X X IMPL

Aleman-Meza et

a 2003

X X IMPL

Mani eSundaram 2007

X X X IMPL

Challam et al

2007

X X X IMPL

Vallet et al 2006 X X X IMPL

Sieg et al 2007 X X X IMPL

(incomplete)

Praestro X X X IMPL

(prototype)

UnA-SUS ndash Universidade Aberta do SUS

Programa do Ministeacuterio da Sauacutede para atender necessidades de e

permanente dos

Accedilotildees focadas em

formulaccedilatildeo de conteuacutedo

bibliotecas digitais

cursos a distacircncia

21042010

27

Metas da UnA-SUS

Desenvolver um

plataforma para de

composiccedilatildeo e de

Montar e oferecer cursos para formaccedilatildeo continuada de profissionais da sauacutede

157

Metadados

O processo de produccedilatildeo catalogaccedilatildeo e reuso de OAs

Repositoacuterio

Conteuacutedo

OAs

requisiccedilotildees

Design revisatildeo e publicaccedilatildeo

OA

SGA outros reps

Busca e reuso

OAsMetadados

OAs

Concepccedilatildeo e validaccedilatildeo de OAs

O processo de produccedilatildeo catalogaccedilatildeo e reuso de OAs

OA1

Curso A

Curso B

OA2

OA3

Viacutedeo

Imagens

RepositoacuteriosConteuacutedoMultimiacutedia

SGA RepositoacuteriosOAs

Reuso eacute essencial

bull OAs satildeo caros para produzir

bull Demandas emergenciais na sauacutede puacuteblica exigem agilidade e pronta resposta com cursos para a qualificaccedilatildeo de profissionais

H1N1

Apoplexia

gripe suiacutena gripe A

influenza H1N1

hellip

21042010

28

Navegaccedilatildeo hiperboacutelica no DeCSCatalogaccedilatildeo de Objetos de Aprendizagem (OAs) usando Vocabulaacuterios Controlados

bull Seleccedilatildeo de termos do DeCS CID-10 SNOMED

ndash via fornecimento de palavras-chave que satildeo pesquisadas na base de conhecimento

ndash via navegaccedilatildeo em uma visatildeo do conhecimento em forma de aacutervore

Seleccedilatildeo via contexto ontoloacutegicoProtoacutetipo (catalogaccedilatildeo com entrada

de palavra-chave)

DSpaceCatalogaccedilatildeo de OAswf

Protoacutetipo (catalogaccedilatildeo com navegaccedilatildeo

na base de conhecimento)

DSpaceRecuperaccedilatildeo de OAswf

21042010

29

Recuperaccedilatildeo de Objetos de Aprendizagem (OAs) Baseada em Conhecimento

bull Vocabulaacuterios e relaccedilotildees semacircnticas

ndash Oriundos do DeCS

ndash Definidos pelos catalogadores de OAs

ndash Gerados pelo cruzamento de informaccedilotildees com o CID-10 (Classificaccedilatildeo Internacional de Doenccedilas)

ndash Ex sinocircnimos eacute um(a) parte de causa efeito sintoma etc

DeCs

Anatomia

Sistema Nervoso

Sistema Nervoso Central

Enceacutefalo

Prosenceacutefalo

Telencaacutefalo

Ceacuterebro

Doenccedilas

Doenccedilas do Sistema Nervoso

Doenccedilas Cardiovasculares

Doenccedilas do Sistema Nervoso Central

Encefalopatias

Transtornos Cerebrovasculares

Doenccedilas Vasculares

Transtornos Cerebrovasculares

Acidente Vascular Cerebral

Acidente Vascular Cerebral

OA 1

OA 2

AVC

IctusCerebral

Derrame Cerebral

Hemisfeacuterios Cerebrais

ApoplexiaAcidente

Cerebrovascular

IctoCerebral

Apoplexia Cerebrovascular

Apoplexia Cerebral

Acidente Vascular

Encefaacutelico

Acidente Vascular

do Ceacuterebro

Acidente Vascular Cerebral

padratildeo (sinocircnimo)

anota

especiacutefica de domiacutenio

anocircnimas (DeCs)

172

DeCs

Anatomia

Sistema Nervoso

Sistema Nervoso Central

Enceacutefalo

Prosenceacutefalo

Telencaacutefalo

Ceacuterebro (2)

Doenccedilas

Doenccedilas do Sistema Nervoso

Doenccedilas Cardiovasculares

Doenccedilas do Sistema Nervoso Central

Encefalopatias

Transtornos Cerebrovasculares

Doenccedilas Vasculares

Transtornos Cerebrovasculares

Acidente Cerebral Vascular (1)

Acidente Cerebral Vascular(1)

OA 1

OA 2

AVC

IctusCerebral

Derrame Cerebral

Hemisfeacuterios Cerebrais

ApoplexiaAcidente

Cerebrovascular

IctoCerebral

Apoplexia Cerebrovascular

Apoplexia Cerebral

Acidente Vascular

Encefaacutelico

Acidente Vascular

do Ceacuterebro

Acidente Vascular Cerebral

Busca de OAs na aacuterea de sauacutede usando conhecimento de domiacutenio

Semantic Learning Objects (VIAN J SILVEIRA R A FILETO R WCCE 2009)

21042010

30

Conclusotildees

A Web semacircntica tem potencial de contribuir naobtenccedilatildeo de melhores resultados para buscas

Suporte automatizado eacute fundamental para a construccedilatildeo evoluccedilatildeo e integraccedilatildeo de ontologias anotaccedilotildees semacircnticas e contextos de usuaacuterios

Nossos primeiros resultados focam na captura e utilizaccedilatildeo de contextos de usuaacuterios mapeados a ontologias de domiacutenios especiacuteficos paradesambiguar e estender as buscas

Trabalhos futuros

Processos parcialmente automatizados para geraccedilatildeo e atualizaccedilatildeo de ontologias e anotaccedilotildees semacircnticas

Experimentos para comprovar a eficaacutecia das teacutecnicas e ferramentas utilizadas

Validaccedilatildeo de soluccedilotildees de problemas de busca semacircntica em diversos domiacutenios de aplicaccedilatildeo

Determinaccedilatildeo de niacuteveis adequados de acoplamento entre contextos e ontologias e dessas com os recursos a serem recuperados

Notiacutecias e anaacutelises

httpnewscnetcomnew-search-engine-cuil-takes-aim-at-google

httpwwwreadwritewebcomarchivesis_google_a_semantic_search_enginephp

httpwwwreadwritewebcomarchivessemantic_search_the_myt

h_and_realityphp

httpwwwpandiacomsew1262-top-5-semantic-search-

engineshtml

httpmindsetresearchyahoocom

httpnewscnetcom8301-13953_3-9982015-80html

httpwwwsearchenginejournalcomaskcom-focuses-on-semantic-search8252

httpnewsbbccouk2hiprogrammesclick_onlinedefaultstm

httpnewsbbccouk2hiprogrammesclick_online8144765stm

Web semacircntica e buscassemacircnticas

httpwwww3org2001sw

httpsemanticweborg

httpenwikipediaorgwikiSemantic_Web

httpenwikipediaorgwikiSemantic_search

Ferramentas de desenvolvimento

httpprotegestanfordedu

httpjenasourceforgenet

httpwwww3org2001Annotea

httpwwwontotextcomkim

httpesww3orgtopicSemanticWebTools

httpwwwdamlorg200305swmu-tools-

tutorialOverviewhtml

Referecircncias em Web semacircntica

T Berners-Lee J Hendler e O Lassila The Semantic Web Scientific American May 2001

Thomas B Passing Explores Guide to the Semantic Web Manning Publications Greenwich CT 2005

Davies J Studer R Warren P (Eds) Semantic Web Technologies trends and research in ontology-based

Systems John Wiley amp Sons 2006

Breitman KK Casanova MA Truszkowski W Semantic Web

Concepts Technologies and Applications Series NASA Monographs in Systems and Software Engineering Springer 2007

Grigoris Antoniou and Frank van Harmelen A Semantic Web Primer 2nd edition The MIT Press Cambridge MA USA 2008

Kashyap V Bussler C Moran M The Semantic Web -Semantics for Data and Services on the Web Series Data-

Centric Systems and Applications Springer 2008

Hitzler P Krotzsch M Rudolph S Foundations of SemanticWeb Technologies Chapman amp HallCRC 2009

21042010

31

Referecircncias em buscas semacircnticas

Guha R McCool R and Miller E 2003 Semantic search In Proc of the 12th international Conference on World Wide Web

(WWW) Budapest Hungary ACM New York NY 2003 700-709

Reeve L and Han H 2005 Survey of semantic annotation

platforms In Proceedings of the ACM Symposium on Applied Computing Santa Fe New Mexico ACM New York NY 2005

1634-1638

Eetu Makela Survey of Semantic Search Research

Mangold C A Survey and classification of semantic search approaches Journal of Metadata Semantics and Ontology 2(1)

2007

Stephan Bloehdorn Philipp Cimiano Alistair Duke Peter Haase Joumlrg Heizmann Ian Thurlow Johanna Voumllker Ontology-BasedQuestion Answering for Digital Libraries ECDL 2007 14-25

Hai Dong Hussain FK Chang E A survey in semantic search technologies In 2nd IEEE International Conference on

Digital Ecosystems and Technologies 2008 403-408

Algumas referecircncias grupo UFSC

DAgostini C S Fileto R Capturing Users Preferences and Intentions in a Semantic Search System In 21st International

Conference on Software Engineering amp Knowledge Engineering (SEKE) Boston 2009 p 587-591

DAgostini C S Fileto R Dantas M A R Gauthier F A O

Contextual Semantic Search - Capturing using the UsersContext to Direct Semantic Search In 10th InternationalConference on Enterprise Information Systems (ICEIS) Barcelona

Spain 2008 v SAIC p 154-159

DAgostini C S Fileto R Capturing and managing usercontext for improving information retrieval In Workshop de

Teses e Dissertaccedilotildees do Simpoacutesio Brasileiro de Bancos de Dados (WTDBDSBBD) Campinas Unicamp Brazil 2008

Vian J Silveira R A Fileto R Proposal of a Multi-agent System for Indexing and Recovery applied to Learning

Objects In 9th IFIP World Conference on Computers in Education (WCCE) Bento Goncalves Brazil 2009

Alguns projetos na UFSC

httpwwwlisaufscbrprojetos

httpwwwunasusufscbr

httpwwwliteraturabrasileiraufscbr

Perguntas

Page 20: Buscas Semânticasfileto/Talks/BuscasSemanticas6sp.pdf · 21/04/2010 1 1 Buscas semânticas: panorama e tendências atuais minicurso ERBD 2010 RenatoFileto fileto@inf.ufsc.br AlunosColaboradores:

21042010

20

21042010

21

Sao Paulo Airport

Sao Paulo Plane Crash

Sao Paulo Zoo

hellip

21042010

22

21042010

23

Algumas questotildees em aberto

Representaccedilatildeo de contextos de usuaacuterios emapeamento desses a ontologias

Anaacutelise dos efeitos de modificaccedilotildees de consultas

Meta-buscas semacircnticas

Anaacutelise da aceitaccedilatildeo dos usuaacuterios

Adaptabilidade a diferentes ontologias

Ranking dos resultados

Integraccedilatildeo com sistemas de gerenciamento dedocumentosconteuacutedo

Tratamento de dados multimiacuteda

Interfaces homem-maacutequina

Desempenho e escalabilidade

Contextual Semantic Search (CSS)(DAgostine Fileto ndash SBBD2007)rlm

21042010

24

General Architecture for CSSThe Weighted Topic Graph(DAgostine Fileto Dantas Gauthier - ICEIS 2008)rlm

A weighted topic graph is a graph TM(T A)rlm

T is a set of topics (vertices)rlm

A is a set of associations (edges)rlm

Let be an ontology O

Each topic t in T corresponds to a ontology term o in O

Each topic t has a weight [01] The sum from the weights from all topics with same name equals 1

Each association a has a weight [01] The sum

from all the weights from all association departing

a single topics equals 1

Topic weights used to disambiguate

Eg interest in Satildeo Paulo city instead of Satildeo Paulo

state

Association weights used to semantically

expand searches

Eg Actual interest in Guarulhos and airport while

searching for Satildeo Paulo city

The Weights in the Topic Graph Capturing the Users Context

Generated Topic Graph with the Ontological Users Context

The Contextual Semantic Search Process

21042010

25

Desambiguaccedilatildeo

Fundamento dos algoritmos de busca sobre contexto ontoloacutegico

Heuriacutesticas de estigmergia (Ant Colony Optimization - ACO)

Traccedilos de ferormocircnio

Algoritmo de busca semacircntica baseada em ACO

Entrada palavras-chave[ ]

Dados G(TA) Onto repositoacuterio

limite_de_profundidade

limite_miacutenimo_de_peso

λ fator de atenuaccedilatildeo de peso

iniacutecio Algoritmo Busca Contextual 1 Estigmeacuterica

resultados = busca_G_ou_Onto(palavras-chave[])

atenuaG (iacutendice ) λrlmisin [0 1]

manutenccedilatildeo(coleta_feedback(resultados))

fim

21042010

26

Demo Praestro ndash Karina Fasolin

Alguns trabalhos relacionados

Name Article Comments

Graupmann

et al 2005

The SphereSearch

engine for unifiedranked retrieval of

heterogeneous XML

and web documents

Searches through XML documents The context is a region in radius

around given element A data inside two regions is considered relevant

to both contexts

Made tests with large collections like DBLP INEX Wikipedia put for

stress testing regarding the size of the collection

ldquoLet us first comment on the difficulties of defining a meaningfulbenchmark for this kind of novel systemrdquo

Park e

Cheyer 2006

Just For Me Topic

Maps and Ontologies

Manages knowledge in three layers Topics Knowledge Structures and

Documents

Not implemented (at least at the time of publication)

Michlmayr

et al 2007Adaptive User Profiles

for Enterprise

Information Access

Represents context as an individual graph The graph is constructed

based on tags used to semantically annotate the content which the user

considers to be relevant

However the tags are only that only labels They are not tied-down to

a formal definition

Alguns trabalhos relacionados (cont)

Name Article Comments

Aleman-

Meza et a

2003

Context-Aware

Semantic Association

Ranking

Also defines context as regions But the regions are static defined in

the ontology which is used by the system So the contexts are defined

the same for every single user

Mani and

Sundaram

2007

Modeling user context

with applications to

media retrieval

Creates a graph representing the users context Each node

corresponds to an instance in the ontology The edges represent

relations between the instances Built to search trough multimedia

documents

However it does not associates the vocabulary the user uses with the

instances

Challam et

al 2007

Contextual Search

Using Ontology-Based

User Profiles

Monitors the users activity capturing content from open Internet

Explorer MS-Office and MSN The captured information is stored and

usedrlmtorlmbuildrlmarlmuser‟srlmcontextualrlmprofilerlmbasesrlmonrlmanrlmontology

The context is tightly coupled with the ontology

NO IMAGES WERE

PROVIDED

Vallet et al

2006

Personalized

Information Retrieval in

Context

Stores context as a graph constructed based on the ontology used by

the system Similar to Mani and Sundaram including its limitations

(mapping the vocabulary) however if built for text documents

Sieg et al

2007

Ontological User

Profiles for

Personalized Web

Search

Similar to Challam et al but it gets the context information from the

ontology terms used to annotate the retrieved relevant context

Also limited by the structure of the ontology

Alguns trabalhos relacionados(cont)

Name Deals with

objective

knowledge

(ontology)

Deals with

subjective

knowledge

(users

context)

The knowledge

management is

transparent

Idea Implemented

Graupmann et

al 2005

X IMPL

Park e Cheyer

2006

X X X IDEA

Michlmayr et al2007

X X IMPL

Aleman-Meza et

a 2003

X X IMPL

Mani eSundaram 2007

X X X IMPL

Challam et al

2007

X X X IMPL

Vallet et al 2006 X X X IMPL

Sieg et al 2007 X X X IMPL

(incomplete)

Praestro X X X IMPL

(prototype)

UnA-SUS ndash Universidade Aberta do SUS

Programa do Ministeacuterio da Sauacutede para atender necessidades de e

permanente dos

Accedilotildees focadas em

formulaccedilatildeo de conteuacutedo

bibliotecas digitais

cursos a distacircncia

21042010

27

Metas da UnA-SUS

Desenvolver um

plataforma para de

composiccedilatildeo e de

Montar e oferecer cursos para formaccedilatildeo continuada de profissionais da sauacutede

157

Metadados

O processo de produccedilatildeo catalogaccedilatildeo e reuso de OAs

Repositoacuterio

Conteuacutedo

OAs

requisiccedilotildees

Design revisatildeo e publicaccedilatildeo

OA

SGA outros reps

Busca e reuso

OAsMetadados

OAs

Concepccedilatildeo e validaccedilatildeo de OAs

O processo de produccedilatildeo catalogaccedilatildeo e reuso de OAs

OA1

Curso A

Curso B

OA2

OA3

Viacutedeo

Imagens

RepositoacuteriosConteuacutedoMultimiacutedia

SGA RepositoacuteriosOAs

Reuso eacute essencial

bull OAs satildeo caros para produzir

bull Demandas emergenciais na sauacutede puacuteblica exigem agilidade e pronta resposta com cursos para a qualificaccedilatildeo de profissionais

H1N1

Apoplexia

gripe suiacutena gripe A

influenza H1N1

hellip

21042010

28

Navegaccedilatildeo hiperboacutelica no DeCSCatalogaccedilatildeo de Objetos de Aprendizagem (OAs) usando Vocabulaacuterios Controlados

bull Seleccedilatildeo de termos do DeCS CID-10 SNOMED

ndash via fornecimento de palavras-chave que satildeo pesquisadas na base de conhecimento

ndash via navegaccedilatildeo em uma visatildeo do conhecimento em forma de aacutervore

Seleccedilatildeo via contexto ontoloacutegicoProtoacutetipo (catalogaccedilatildeo com entrada

de palavra-chave)

DSpaceCatalogaccedilatildeo de OAswf

Protoacutetipo (catalogaccedilatildeo com navegaccedilatildeo

na base de conhecimento)

DSpaceRecuperaccedilatildeo de OAswf

21042010

29

Recuperaccedilatildeo de Objetos de Aprendizagem (OAs) Baseada em Conhecimento

bull Vocabulaacuterios e relaccedilotildees semacircnticas

ndash Oriundos do DeCS

ndash Definidos pelos catalogadores de OAs

ndash Gerados pelo cruzamento de informaccedilotildees com o CID-10 (Classificaccedilatildeo Internacional de Doenccedilas)

ndash Ex sinocircnimos eacute um(a) parte de causa efeito sintoma etc

DeCs

Anatomia

Sistema Nervoso

Sistema Nervoso Central

Enceacutefalo

Prosenceacutefalo

Telencaacutefalo

Ceacuterebro

Doenccedilas

Doenccedilas do Sistema Nervoso

Doenccedilas Cardiovasculares

Doenccedilas do Sistema Nervoso Central

Encefalopatias

Transtornos Cerebrovasculares

Doenccedilas Vasculares

Transtornos Cerebrovasculares

Acidente Vascular Cerebral

Acidente Vascular Cerebral

OA 1

OA 2

AVC

IctusCerebral

Derrame Cerebral

Hemisfeacuterios Cerebrais

ApoplexiaAcidente

Cerebrovascular

IctoCerebral

Apoplexia Cerebrovascular

Apoplexia Cerebral

Acidente Vascular

Encefaacutelico

Acidente Vascular

do Ceacuterebro

Acidente Vascular Cerebral

padratildeo (sinocircnimo)

anota

especiacutefica de domiacutenio

anocircnimas (DeCs)

172

DeCs

Anatomia

Sistema Nervoso

Sistema Nervoso Central

Enceacutefalo

Prosenceacutefalo

Telencaacutefalo

Ceacuterebro (2)

Doenccedilas

Doenccedilas do Sistema Nervoso

Doenccedilas Cardiovasculares

Doenccedilas do Sistema Nervoso Central

Encefalopatias

Transtornos Cerebrovasculares

Doenccedilas Vasculares

Transtornos Cerebrovasculares

Acidente Cerebral Vascular (1)

Acidente Cerebral Vascular(1)

OA 1

OA 2

AVC

IctusCerebral

Derrame Cerebral

Hemisfeacuterios Cerebrais

ApoplexiaAcidente

Cerebrovascular

IctoCerebral

Apoplexia Cerebrovascular

Apoplexia Cerebral

Acidente Vascular

Encefaacutelico

Acidente Vascular

do Ceacuterebro

Acidente Vascular Cerebral

Busca de OAs na aacuterea de sauacutede usando conhecimento de domiacutenio

Semantic Learning Objects (VIAN J SILVEIRA R A FILETO R WCCE 2009)

21042010

30

Conclusotildees

A Web semacircntica tem potencial de contribuir naobtenccedilatildeo de melhores resultados para buscas

Suporte automatizado eacute fundamental para a construccedilatildeo evoluccedilatildeo e integraccedilatildeo de ontologias anotaccedilotildees semacircnticas e contextos de usuaacuterios

Nossos primeiros resultados focam na captura e utilizaccedilatildeo de contextos de usuaacuterios mapeados a ontologias de domiacutenios especiacuteficos paradesambiguar e estender as buscas

Trabalhos futuros

Processos parcialmente automatizados para geraccedilatildeo e atualizaccedilatildeo de ontologias e anotaccedilotildees semacircnticas

Experimentos para comprovar a eficaacutecia das teacutecnicas e ferramentas utilizadas

Validaccedilatildeo de soluccedilotildees de problemas de busca semacircntica em diversos domiacutenios de aplicaccedilatildeo

Determinaccedilatildeo de niacuteveis adequados de acoplamento entre contextos e ontologias e dessas com os recursos a serem recuperados

Notiacutecias e anaacutelises

httpnewscnetcomnew-search-engine-cuil-takes-aim-at-google

httpwwwreadwritewebcomarchivesis_google_a_semantic_search_enginephp

httpwwwreadwritewebcomarchivessemantic_search_the_myt

h_and_realityphp

httpwwwpandiacomsew1262-top-5-semantic-search-

engineshtml

httpmindsetresearchyahoocom

httpnewscnetcom8301-13953_3-9982015-80html

httpwwwsearchenginejournalcomaskcom-focuses-on-semantic-search8252

httpnewsbbccouk2hiprogrammesclick_onlinedefaultstm

httpnewsbbccouk2hiprogrammesclick_online8144765stm

Web semacircntica e buscassemacircnticas

httpwwww3org2001sw

httpsemanticweborg

httpenwikipediaorgwikiSemantic_Web

httpenwikipediaorgwikiSemantic_search

Ferramentas de desenvolvimento

httpprotegestanfordedu

httpjenasourceforgenet

httpwwww3org2001Annotea

httpwwwontotextcomkim

httpesww3orgtopicSemanticWebTools

httpwwwdamlorg200305swmu-tools-

tutorialOverviewhtml

Referecircncias em Web semacircntica

T Berners-Lee J Hendler e O Lassila The Semantic Web Scientific American May 2001

Thomas B Passing Explores Guide to the Semantic Web Manning Publications Greenwich CT 2005

Davies J Studer R Warren P (Eds) Semantic Web Technologies trends and research in ontology-based

Systems John Wiley amp Sons 2006

Breitman KK Casanova MA Truszkowski W Semantic Web

Concepts Technologies and Applications Series NASA Monographs in Systems and Software Engineering Springer 2007

Grigoris Antoniou and Frank van Harmelen A Semantic Web Primer 2nd edition The MIT Press Cambridge MA USA 2008

Kashyap V Bussler C Moran M The Semantic Web -Semantics for Data and Services on the Web Series Data-

Centric Systems and Applications Springer 2008

Hitzler P Krotzsch M Rudolph S Foundations of SemanticWeb Technologies Chapman amp HallCRC 2009

21042010

31

Referecircncias em buscas semacircnticas

Guha R McCool R and Miller E 2003 Semantic search In Proc of the 12th international Conference on World Wide Web

(WWW) Budapest Hungary ACM New York NY 2003 700-709

Reeve L and Han H 2005 Survey of semantic annotation

platforms In Proceedings of the ACM Symposium on Applied Computing Santa Fe New Mexico ACM New York NY 2005

1634-1638

Eetu Makela Survey of Semantic Search Research

Mangold C A Survey and classification of semantic search approaches Journal of Metadata Semantics and Ontology 2(1)

2007

Stephan Bloehdorn Philipp Cimiano Alistair Duke Peter Haase Joumlrg Heizmann Ian Thurlow Johanna Voumllker Ontology-BasedQuestion Answering for Digital Libraries ECDL 2007 14-25

Hai Dong Hussain FK Chang E A survey in semantic search technologies In 2nd IEEE International Conference on

Digital Ecosystems and Technologies 2008 403-408

Algumas referecircncias grupo UFSC

DAgostini C S Fileto R Capturing Users Preferences and Intentions in a Semantic Search System In 21st International

Conference on Software Engineering amp Knowledge Engineering (SEKE) Boston 2009 p 587-591

DAgostini C S Fileto R Dantas M A R Gauthier F A O

Contextual Semantic Search - Capturing using the UsersContext to Direct Semantic Search In 10th InternationalConference on Enterprise Information Systems (ICEIS) Barcelona

Spain 2008 v SAIC p 154-159

DAgostini C S Fileto R Capturing and managing usercontext for improving information retrieval In Workshop de

Teses e Dissertaccedilotildees do Simpoacutesio Brasileiro de Bancos de Dados (WTDBDSBBD) Campinas Unicamp Brazil 2008

Vian J Silveira R A Fileto R Proposal of a Multi-agent System for Indexing and Recovery applied to Learning

Objects In 9th IFIP World Conference on Computers in Education (WCCE) Bento Goncalves Brazil 2009

Alguns projetos na UFSC

httpwwwlisaufscbrprojetos

httpwwwunasusufscbr

httpwwwliteraturabrasileiraufscbr

Perguntas

Page 21: Buscas Semânticasfileto/Talks/BuscasSemanticas6sp.pdf · 21/04/2010 1 1 Buscas semânticas: panorama e tendências atuais minicurso ERBD 2010 RenatoFileto fileto@inf.ufsc.br AlunosColaboradores:

21042010

21

Sao Paulo Airport

Sao Paulo Plane Crash

Sao Paulo Zoo

hellip

21042010

22

21042010

23

Algumas questotildees em aberto

Representaccedilatildeo de contextos de usuaacuterios emapeamento desses a ontologias

Anaacutelise dos efeitos de modificaccedilotildees de consultas

Meta-buscas semacircnticas

Anaacutelise da aceitaccedilatildeo dos usuaacuterios

Adaptabilidade a diferentes ontologias

Ranking dos resultados

Integraccedilatildeo com sistemas de gerenciamento dedocumentosconteuacutedo

Tratamento de dados multimiacuteda

Interfaces homem-maacutequina

Desempenho e escalabilidade

Contextual Semantic Search (CSS)(DAgostine Fileto ndash SBBD2007)rlm

21042010

24

General Architecture for CSSThe Weighted Topic Graph(DAgostine Fileto Dantas Gauthier - ICEIS 2008)rlm

A weighted topic graph is a graph TM(T A)rlm

T is a set of topics (vertices)rlm

A is a set of associations (edges)rlm

Let be an ontology O

Each topic t in T corresponds to a ontology term o in O

Each topic t has a weight [01] The sum from the weights from all topics with same name equals 1

Each association a has a weight [01] The sum

from all the weights from all association departing

a single topics equals 1

Topic weights used to disambiguate

Eg interest in Satildeo Paulo city instead of Satildeo Paulo

state

Association weights used to semantically

expand searches

Eg Actual interest in Guarulhos and airport while

searching for Satildeo Paulo city

The Weights in the Topic Graph Capturing the Users Context

Generated Topic Graph with the Ontological Users Context

The Contextual Semantic Search Process

21042010

25

Desambiguaccedilatildeo

Fundamento dos algoritmos de busca sobre contexto ontoloacutegico

Heuriacutesticas de estigmergia (Ant Colony Optimization - ACO)

Traccedilos de ferormocircnio

Algoritmo de busca semacircntica baseada em ACO

Entrada palavras-chave[ ]

Dados G(TA) Onto repositoacuterio

limite_de_profundidade

limite_miacutenimo_de_peso

λ fator de atenuaccedilatildeo de peso

iniacutecio Algoritmo Busca Contextual 1 Estigmeacuterica

resultados = busca_G_ou_Onto(palavras-chave[])

atenuaG (iacutendice ) λrlmisin [0 1]

manutenccedilatildeo(coleta_feedback(resultados))

fim

21042010

26

Demo Praestro ndash Karina Fasolin

Alguns trabalhos relacionados

Name Article Comments

Graupmann

et al 2005

The SphereSearch

engine for unifiedranked retrieval of

heterogeneous XML

and web documents

Searches through XML documents The context is a region in radius

around given element A data inside two regions is considered relevant

to both contexts

Made tests with large collections like DBLP INEX Wikipedia put for

stress testing regarding the size of the collection

ldquoLet us first comment on the difficulties of defining a meaningfulbenchmark for this kind of novel systemrdquo

Park e

Cheyer 2006

Just For Me Topic

Maps and Ontologies

Manages knowledge in three layers Topics Knowledge Structures and

Documents

Not implemented (at least at the time of publication)

Michlmayr

et al 2007Adaptive User Profiles

for Enterprise

Information Access

Represents context as an individual graph The graph is constructed

based on tags used to semantically annotate the content which the user

considers to be relevant

However the tags are only that only labels They are not tied-down to

a formal definition

Alguns trabalhos relacionados (cont)

Name Article Comments

Aleman-

Meza et a

2003

Context-Aware

Semantic Association

Ranking

Also defines context as regions But the regions are static defined in

the ontology which is used by the system So the contexts are defined

the same for every single user

Mani and

Sundaram

2007

Modeling user context

with applications to

media retrieval

Creates a graph representing the users context Each node

corresponds to an instance in the ontology The edges represent

relations between the instances Built to search trough multimedia

documents

However it does not associates the vocabulary the user uses with the

instances

Challam et

al 2007

Contextual Search

Using Ontology-Based

User Profiles

Monitors the users activity capturing content from open Internet

Explorer MS-Office and MSN The captured information is stored and

usedrlmtorlmbuildrlmarlmuser‟srlmcontextualrlmprofilerlmbasesrlmonrlmanrlmontology

The context is tightly coupled with the ontology

NO IMAGES WERE

PROVIDED

Vallet et al

2006

Personalized

Information Retrieval in

Context

Stores context as a graph constructed based on the ontology used by

the system Similar to Mani and Sundaram including its limitations

(mapping the vocabulary) however if built for text documents

Sieg et al

2007

Ontological User

Profiles for

Personalized Web

Search

Similar to Challam et al but it gets the context information from the

ontology terms used to annotate the retrieved relevant context

Also limited by the structure of the ontology

Alguns trabalhos relacionados(cont)

Name Deals with

objective

knowledge

(ontology)

Deals with

subjective

knowledge

(users

context)

The knowledge

management is

transparent

Idea Implemented

Graupmann et

al 2005

X IMPL

Park e Cheyer

2006

X X X IDEA

Michlmayr et al2007

X X IMPL

Aleman-Meza et

a 2003

X X IMPL

Mani eSundaram 2007

X X X IMPL

Challam et al

2007

X X X IMPL

Vallet et al 2006 X X X IMPL

Sieg et al 2007 X X X IMPL

(incomplete)

Praestro X X X IMPL

(prototype)

UnA-SUS ndash Universidade Aberta do SUS

Programa do Ministeacuterio da Sauacutede para atender necessidades de e

permanente dos

Accedilotildees focadas em

formulaccedilatildeo de conteuacutedo

bibliotecas digitais

cursos a distacircncia

21042010

27

Metas da UnA-SUS

Desenvolver um

plataforma para de

composiccedilatildeo e de

Montar e oferecer cursos para formaccedilatildeo continuada de profissionais da sauacutede

157

Metadados

O processo de produccedilatildeo catalogaccedilatildeo e reuso de OAs

Repositoacuterio

Conteuacutedo

OAs

requisiccedilotildees

Design revisatildeo e publicaccedilatildeo

OA

SGA outros reps

Busca e reuso

OAsMetadados

OAs

Concepccedilatildeo e validaccedilatildeo de OAs

O processo de produccedilatildeo catalogaccedilatildeo e reuso de OAs

OA1

Curso A

Curso B

OA2

OA3

Viacutedeo

Imagens

RepositoacuteriosConteuacutedoMultimiacutedia

SGA RepositoacuteriosOAs

Reuso eacute essencial

bull OAs satildeo caros para produzir

bull Demandas emergenciais na sauacutede puacuteblica exigem agilidade e pronta resposta com cursos para a qualificaccedilatildeo de profissionais

H1N1

Apoplexia

gripe suiacutena gripe A

influenza H1N1

hellip

21042010

28

Navegaccedilatildeo hiperboacutelica no DeCSCatalogaccedilatildeo de Objetos de Aprendizagem (OAs) usando Vocabulaacuterios Controlados

bull Seleccedilatildeo de termos do DeCS CID-10 SNOMED

ndash via fornecimento de palavras-chave que satildeo pesquisadas na base de conhecimento

ndash via navegaccedilatildeo em uma visatildeo do conhecimento em forma de aacutervore

Seleccedilatildeo via contexto ontoloacutegicoProtoacutetipo (catalogaccedilatildeo com entrada

de palavra-chave)

DSpaceCatalogaccedilatildeo de OAswf

Protoacutetipo (catalogaccedilatildeo com navegaccedilatildeo

na base de conhecimento)

DSpaceRecuperaccedilatildeo de OAswf

21042010

29

Recuperaccedilatildeo de Objetos de Aprendizagem (OAs) Baseada em Conhecimento

bull Vocabulaacuterios e relaccedilotildees semacircnticas

ndash Oriundos do DeCS

ndash Definidos pelos catalogadores de OAs

ndash Gerados pelo cruzamento de informaccedilotildees com o CID-10 (Classificaccedilatildeo Internacional de Doenccedilas)

ndash Ex sinocircnimos eacute um(a) parte de causa efeito sintoma etc

DeCs

Anatomia

Sistema Nervoso

Sistema Nervoso Central

Enceacutefalo

Prosenceacutefalo

Telencaacutefalo

Ceacuterebro

Doenccedilas

Doenccedilas do Sistema Nervoso

Doenccedilas Cardiovasculares

Doenccedilas do Sistema Nervoso Central

Encefalopatias

Transtornos Cerebrovasculares

Doenccedilas Vasculares

Transtornos Cerebrovasculares

Acidente Vascular Cerebral

Acidente Vascular Cerebral

OA 1

OA 2

AVC

IctusCerebral

Derrame Cerebral

Hemisfeacuterios Cerebrais

ApoplexiaAcidente

Cerebrovascular

IctoCerebral

Apoplexia Cerebrovascular

Apoplexia Cerebral

Acidente Vascular

Encefaacutelico

Acidente Vascular

do Ceacuterebro

Acidente Vascular Cerebral

padratildeo (sinocircnimo)

anota

especiacutefica de domiacutenio

anocircnimas (DeCs)

172

DeCs

Anatomia

Sistema Nervoso

Sistema Nervoso Central

Enceacutefalo

Prosenceacutefalo

Telencaacutefalo

Ceacuterebro (2)

Doenccedilas

Doenccedilas do Sistema Nervoso

Doenccedilas Cardiovasculares

Doenccedilas do Sistema Nervoso Central

Encefalopatias

Transtornos Cerebrovasculares

Doenccedilas Vasculares

Transtornos Cerebrovasculares

Acidente Cerebral Vascular (1)

Acidente Cerebral Vascular(1)

OA 1

OA 2

AVC

IctusCerebral

Derrame Cerebral

Hemisfeacuterios Cerebrais

ApoplexiaAcidente

Cerebrovascular

IctoCerebral

Apoplexia Cerebrovascular

Apoplexia Cerebral

Acidente Vascular

Encefaacutelico

Acidente Vascular

do Ceacuterebro

Acidente Vascular Cerebral

Busca de OAs na aacuterea de sauacutede usando conhecimento de domiacutenio

Semantic Learning Objects (VIAN J SILVEIRA R A FILETO R WCCE 2009)

21042010

30

Conclusotildees

A Web semacircntica tem potencial de contribuir naobtenccedilatildeo de melhores resultados para buscas

Suporte automatizado eacute fundamental para a construccedilatildeo evoluccedilatildeo e integraccedilatildeo de ontologias anotaccedilotildees semacircnticas e contextos de usuaacuterios

Nossos primeiros resultados focam na captura e utilizaccedilatildeo de contextos de usuaacuterios mapeados a ontologias de domiacutenios especiacuteficos paradesambiguar e estender as buscas

Trabalhos futuros

Processos parcialmente automatizados para geraccedilatildeo e atualizaccedilatildeo de ontologias e anotaccedilotildees semacircnticas

Experimentos para comprovar a eficaacutecia das teacutecnicas e ferramentas utilizadas

Validaccedilatildeo de soluccedilotildees de problemas de busca semacircntica em diversos domiacutenios de aplicaccedilatildeo

Determinaccedilatildeo de niacuteveis adequados de acoplamento entre contextos e ontologias e dessas com os recursos a serem recuperados

Notiacutecias e anaacutelises

httpnewscnetcomnew-search-engine-cuil-takes-aim-at-google

httpwwwreadwritewebcomarchivesis_google_a_semantic_search_enginephp

httpwwwreadwritewebcomarchivessemantic_search_the_myt

h_and_realityphp

httpwwwpandiacomsew1262-top-5-semantic-search-

engineshtml

httpmindsetresearchyahoocom

httpnewscnetcom8301-13953_3-9982015-80html

httpwwwsearchenginejournalcomaskcom-focuses-on-semantic-search8252

httpnewsbbccouk2hiprogrammesclick_onlinedefaultstm

httpnewsbbccouk2hiprogrammesclick_online8144765stm

Web semacircntica e buscassemacircnticas

httpwwww3org2001sw

httpsemanticweborg

httpenwikipediaorgwikiSemantic_Web

httpenwikipediaorgwikiSemantic_search

Ferramentas de desenvolvimento

httpprotegestanfordedu

httpjenasourceforgenet

httpwwww3org2001Annotea

httpwwwontotextcomkim

httpesww3orgtopicSemanticWebTools

httpwwwdamlorg200305swmu-tools-

tutorialOverviewhtml

Referecircncias em Web semacircntica

T Berners-Lee J Hendler e O Lassila The Semantic Web Scientific American May 2001

Thomas B Passing Explores Guide to the Semantic Web Manning Publications Greenwich CT 2005

Davies J Studer R Warren P (Eds) Semantic Web Technologies trends and research in ontology-based

Systems John Wiley amp Sons 2006

Breitman KK Casanova MA Truszkowski W Semantic Web

Concepts Technologies and Applications Series NASA Monographs in Systems and Software Engineering Springer 2007

Grigoris Antoniou and Frank van Harmelen A Semantic Web Primer 2nd edition The MIT Press Cambridge MA USA 2008

Kashyap V Bussler C Moran M The Semantic Web -Semantics for Data and Services on the Web Series Data-

Centric Systems and Applications Springer 2008

Hitzler P Krotzsch M Rudolph S Foundations of SemanticWeb Technologies Chapman amp HallCRC 2009

21042010

31

Referecircncias em buscas semacircnticas

Guha R McCool R and Miller E 2003 Semantic search In Proc of the 12th international Conference on World Wide Web

(WWW) Budapest Hungary ACM New York NY 2003 700-709

Reeve L and Han H 2005 Survey of semantic annotation

platforms In Proceedings of the ACM Symposium on Applied Computing Santa Fe New Mexico ACM New York NY 2005

1634-1638

Eetu Makela Survey of Semantic Search Research

Mangold C A Survey and classification of semantic search approaches Journal of Metadata Semantics and Ontology 2(1)

2007

Stephan Bloehdorn Philipp Cimiano Alistair Duke Peter Haase Joumlrg Heizmann Ian Thurlow Johanna Voumllker Ontology-BasedQuestion Answering for Digital Libraries ECDL 2007 14-25

Hai Dong Hussain FK Chang E A survey in semantic search technologies In 2nd IEEE International Conference on

Digital Ecosystems and Technologies 2008 403-408

Algumas referecircncias grupo UFSC

DAgostini C S Fileto R Capturing Users Preferences and Intentions in a Semantic Search System In 21st International

Conference on Software Engineering amp Knowledge Engineering (SEKE) Boston 2009 p 587-591

DAgostini C S Fileto R Dantas M A R Gauthier F A O

Contextual Semantic Search - Capturing using the UsersContext to Direct Semantic Search In 10th InternationalConference on Enterprise Information Systems (ICEIS) Barcelona

Spain 2008 v SAIC p 154-159

DAgostini C S Fileto R Capturing and managing usercontext for improving information retrieval In Workshop de

Teses e Dissertaccedilotildees do Simpoacutesio Brasileiro de Bancos de Dados (WTDBDSBBD) Campinas Unicamp Brazil 2008

Vian J Silveira R A Fileto R Proposal of a Multi-agent System for Indexing and Recovery applied to Learning

Objects In 9th IFIP World Conference on Computers in Education (WCCE) Bento Goncalves Brazil 2009

Alguns projetos na UFSC

httpwwwlisaufscbrprojetos

httpwwwunasusufscbr

httpwwwliteraturabrasileiraufscbr

Perguntas

Page 22: Buscas Semânticasfileto/Talks/BuscasSemanticas6sp.pdf · 21/04/2010 1 1 Buscas semânticas: panorama e tendências atuais minicurso ERBD 2010 RenatoFileto fileto@inf.ufsc.br AlunosColaboradores:

21042010

22

21042010

23

Algumas questotildees em aberto

Representaccedilatildeo de contextos de usuaacuterios emapeamento desses a ontologias

Anaacutelise dos efeitos de modificaccedilotildees de consultas

Meta-buscas semacircnticas

Anaacutelise da aceitaccedilatildeo dos usuaacuterios

Adaptabilidade a diferentes ontologias

Ranking dos resultados

Integraccedilatildeo com sistemas de gerenciamento dedocumentosconteuacutedo

Tratamento de dados multimiacuteda

Interfaces homem-maacutequina

Desempenho e escalabilidade

Contextual Semantic Search (CSS)(DAgostine Fileto ndash SBBD2007)rlm

21042010

24

General Architecture for CSSThe Weighted Topic Graph(DAgostine Fileto Dantas Gauthier - ICEIS 2008)rlm

A weighted topic graph is a graph TM(T A)rlm

T is a set of topics (vertices)rlm

A is a set of associations (edges)rlm

Let be an ontology O

Each topic t in T corresponds to a ontology term o in O

Each topic t has a weight [01] The sum from the weights from all topics with same name equals 1

Each association a has a weight [01] The sum

from all the weights from all association departing

a single topics equals 1

Topic weights used to disambiguate

Eg interest in Satildeo Paulo city instead of Satildeo Paulo

state

Association weights used to semantically

expand searches

Eg Actual interest in Guarulhos and airport while

searching for Satildeo Paulo city

The Weights in the Topic Graph Capturing the Users Context

Generated Topic Graph with the Ontological Users Context

The Contextual Semantic Search Process

21042010

25

Desambiguaccedilatildeo

Fundamento dos algoritmos de busca sobre contexto ontoloacutegico

Heuriacutesticas de estigmergia (Ant Colony Optimization - ACO)

Traccedilos de ferormocircnio

Algoritmo de busca semacircntica baseada em ACO

Entrada palavras-chave[ ]

Dados G(TA) Onto repositoacuterio

limite_de_profundidade

limite_miacutenimo_de_peso

λ fator de atenuaccedilatildeo de peso

iniacutecio Algoritmo Busca Contextual 1 Estigmeacuterica

resultados = busca_G_ou_Onto(palavras-chave[])

atenuaG (iacutendice ) λrlmisin [0 1]

manutenccedilatildeo(coleta_feedback(resultados))

fim

21042010

26

Demo Praestro ndash Karina Fasolin

Alguns trabalhos relacionados

Name Article Comments

Graupmann

et al 2005

The SphereSearch

engine for unifiedranked retrieval of

heterogeneous XML

and web documents

Searches through XML documents The context is a region in radius

around given element A data inside two regions is considered relevant

to both contexts

Made tests with large collections like DBLP INEX Wikipedia put for

stress testing regarding the size of the collection

ldquoLet us first comment on the difficulties of defining a meaningfulbenchmark for this kind of novel systemrdquo

Park e

Cheyer 2006

Just For Me Topic

Maps and Ontologies

Manages knowledge in three layers Topics Knowledge Structures and

Documents

Not implemented (at least at the time of publication)

Michlmayr

et al 2007Adaptive User Profiles

for Enterprise

Information Access

Represents context as an individual graph The graph is constructed

based on tags used to semantically annotate the content which the user

considers to be relevant

However the tags are only that only labels They are not tied-down to

a formal definition

Alguns trabalhos relacionados (cont)

Name Article Comments

Aleman-

Meza et a

2003

Context-Aware

Semantic Association

Ranking

Also defines context as regions But the regions are static defined in

the ontology which is used by the system So the contexts are defined

the same for every single user

Mani and

Sundaram

2007

Modeling user context

with applications to

media retrieval

Creates a graph representing the users context Each node

corresponds to an instance in the ontology The edges represent

relations between the instances Built to search trough multimedia

documents

However it does not associates the vocabulary the user uses with the

instances

Challam et

al 2007

Contextual Search

Using Ontology-Based

User Profiles

Monitors the users activity capturing content from open Internet

Explorer MS-Office and MSN The captured information is stored and

usedrlmtorlmbuildrlmarlmuser‟srlmcontextualrlmprofilerlmbasesrlmonrlmanrlmontology

The context is tightly coupled with the ontology

NO IMAGES WERE

PROVIDED

Vallet et al

2006

Personalized

Information Retrieval in

Context

Stores context as a graph constructed based on the ontology used by

the system Similar to Mani and Sundaram including its limitations

(mapping the vocabulary) however if built for text documents

Sieg et al

2007

Ontological User

Profiles for

Personalized Web

Search

Similar to Challam et al but it gets the context information from the

ontology terms used to annotate the retrieved relevant context

Also limited by the structure of the ontology

Alguns trabalhos relacionados(cont)

Name Deals with

objective

knowledge

(ontology)

Deals with

subjective

knowledge

(users

context)

The knowledge

management is

transparent

Idea Implemented

Graupmann et

al 2005

X IMPL

Park e Cheyer

2006

X X X IDEA

Michlmayr et al2007

X X IMPL

Aleman-Meza et

a 2003

X X IMPL

Mani eSundaram 2007

X X X IMPL

Challam et al

2007

X X X IMPL

Vallet et al 2006 X X X IMPL

Sieg et al 2007 X X X IMPL

(incomplete)

Praestro X X X IMPL

(prototype)

UnA-SUS ndash Universidade Aberta do SUS

Programa do Ministeacuterio da Sauacutede para atender necessidades de e

permanente dos

Accedilotildees focadas em

formulaccedilatildeo de conteuacutedo

bibliotecas digitais

cursos a distacircncia

21042010

27

Metas da UnA-SUS

Desenvolver um

plataforma para de

composiccedilatildeo e de

Montar e oferecer cursos para formaccedilatildeo continuada de profissionais da sauacutede

157

Metadados

O processo de produccedilatildeo catalogaccedilatildeo e reuso de OAs

Repositoacuterio

Conteuacutedo

OAs

requisiccedilotildees

Design revisatildeo e publicaccedilatildeo

OA

SGA outros reps

Busca e reuso

OAsMetadados

OAs

Concepccedilatildeo e validaccedilatildeo de OAs

O processo de produccedilatildeo catalogaccedilatildeo e reuso de OAs

OA1

Curso A

Curso B

OA2

OA3

Viacutedeo

Imagens

RepositoacuteriosConteuacutedoMultimiacutedia

SGA RepositoacuteriosOAs

Reuso eacute essencial

bull OAs satildeo caros para produzir

bull Demandas emergenciais na sauacutede puacuteblica exigem agilidade e pronta resposta com cursos para a qualificaccedilatildeo de profissionais

H1N1

Apoplexia

gripe suiacutena gripe A

influenza H1N1

hellip

21042010

28

Navegaccedilatildeo hiperboacutelica no DeCSCatalogaccedilatildeo de Objetos de Aprendizagem (OAs) usando Vocabulaacuterios Controlados

bull Seleccedilatildeo de termos do DeCS CID-10 SNOMED

ndash via fornecimento de palavras-chave que satildeo pesquisadas na base de conhecimento

ndash via navegaccedilatildeo em uma visatildeo do conhecimento em forma de aacutervore

Seleccedilatildeo via contexto ontoloacutegicoProtoacutetipo (catalogaccedilatildeo com entrada

de palavra-chave)

DSpaceCatalogaccedilatildeo de OAswf

Protoacutetipo (catalogaccedilatildeo com navegaccedilatildeo

na base de conhecimento)

DSpaceRecuperaccedilatildeo de OAswf

21042010

29

Recuperaccedilatildeo de Objetos de Aprendizagem (OAs) Baseada em Conhecimento

bull Vocabulaacuterios e relaccedilotildees semacircnticas

ndash Oriundos do DeCS

ndash Definidos pelos catalogadores de OAs

ndash Gerados pelo cruzamento de informaccedilotildees com o CID-10 (Classificaccedilatildeo Internacional de Doenccedilas)

ndash Ex sinocircnimos eacute um(a) parte de causa efeito sintoma etc

DeCs

Anatomia

Sistema Nervoso

Sistema Nervoso Central

Enceacutefalo

Prosenceacutefalo

Telencaacutefalo

Ceacuterebro

Doenccedilas

Doenccedilas do Sistema Nervoso

Doenccedilas Cardiovasculares

Doenccedilas do Sistema Nervoso Central

Encefalopatias

Transtornos Cerebrovasculares

Doenccedilas Vasculares

Transtornos Cerebrovasculares

Acidente Vascular Cerebral

Acidente Vascular Cerebral

OA 1

OA 2

AVC

IctusCerebral

Derrame Cerebral

Hemisfeacuterios Cerebrais

ApoplexiaAcidente

Cerebrovascular

IctoCerebral

Apoplexia Cerebrovascular

Apoplexia Cerebral

Acidente Vascular

Encefaacutelico

Acidente Vascular

do Ceacuterebro

Acidente Vascular Cerebral

padratildeo (sinocircnimo)

anota

especiacutefica de domiacutenio

anocircnimas (DeCs)

172

DeCs

Anatomia

Sistema Nervoso

Sistema Nervoso Central

Enceacutefalo

Prosenceacutefalo

Telencaacutefalo

Ceacuterebro (2)

Doenccedilas

Doenccedilas do Sistema Nervoso

Doenccedilas Cardiovasculares

Doenccedilas do Sistema Nervoso Central

Encefalopatias

Transtornos Cerebrovasculares

Doenccedilas Vasculares

Transtornos Cerebrovasculares

Acidente Cerebral Vascular (1)

Acidente Cerebral Vascular(1)

OA 1

OA 2

AVC

IctusCerebral

Derrame Cerebral

Hemisfeacuterios Cerebrais

ApoplexiaAcidente

Cerebrovascular

IctoCerebral

Apoplexia Cerebrovascular

Apoplexia Cerebral

Acidente Vascular

Encefaacutelico

Acidente Vascular

do Ceacuterebro

Acidente Vascular Cerebral

Busca de OAs na aacuterea de sauacutede usando conhecimento de domiacutenio

Semantic Learning Objects (VIAN J SILVEIRA R A FILETO R WCCE 2009)

21042010

30

Conclusotildees

A Web semacircntica tem potencial de contribuir naobtenccedilatildeo de melhores resultados para buscas

Suporte automatizado eacute fundamental para a construccedilatildeo evoluccedilatildeo e integraccedilatildeo de ontologias anotaccedilotildees semacircnticas e contextos de usuaacuterios

Nossos primeiros resultados focam na captura e utilizaccedilatildeo de contextos de usuaacuterios mapeados a ontologias de domiacutenios especiacuteficos paradesambiguar e estender as buscas

Trabalhos futuros

Processos parcialmente automatizados para geraccedilatildeo e atualizaccedilatildeo de ontologias e anotaccedilotildees semacircnticas

Experimentos para comprovar a eficaacutecia das teacutecnicas e ferramentas utilizadas

Validaccedilatildeo de soluccedilotildees de problemas de busca semacircntica em diversos domiacutenios de aplicaccedilatildeo

Determinaccedilatildeo de niacuteveis adequados de acoplamento entre contextos e ontologias e dessas com os recursos a serem recuperados

Notiacutecias e anaacutelises

httpnewscnetcomnew-search-engine-cuil-takes-aim-at-google

httpwwwreadwritewebcomarchivesis_google_a_semantic_search_enginephp

httpwwwreadwritewebcomarchivessemantic_search_the_myt

h_and_realityphp

httpwwwpandiacomsew1262-top-5-semantic-search-

engineshtml

httpmindsetresearchyahoocom

httpnewscnetcom8301-13953_3-9982015-80html

httpwwwsearchenginejournalcomaskcom-focuses-on-semantic-search8252

httpnewsbbccouk2hiprogrammesclick_onlinedefaultstm

httpnewsbbccouk2hiprogrammesclick_online8144765stm

Web semacircntica e buscassemacircnticas

httpwwww3org2001sw

httpsemanticweborg

httpenwikipediaorgwikiSemantic_Web

httpenwikipediaorgwikiSemantic_search

Ferramentas de desenvolvimento

httpprotegestanfordedu

httpjenasourceforgenet

httpwwww3org2001Annotea

httpwwwontotextcomkim

httpesww3orgtopicSemanticWebTools

httpwwwdamlorg200305swmu-tools-

tutorialOverviewhtml

Referecircncias em Web semacircntica

T Berners-Lee J Hendler e O Lassila The Semantic Web Scientific American May 2001

Thomas B Passing Explores Guide to the Semantic Web Manning Publications Greenwich CT 2005

Davies J Studer R Warren P (Eds) Semantic Web Technologies trends and research in ontology-based

Systems John Wiley amp Sons 2006

Breitman KK Casanova MA Truszkowski W Semantic Web

Concepts Technologies and Applications Series NASA Monographs in Systems and Software Engineering Springer 2007

Grigoris Antoniou and Frank van Harmelen A Semantic Web Primer 2nd edition The MIT Press Cambridge MA USA 2008

Kashyap V Bussler C Moran M The Semantic Web -Semantics for Data and Services on the Web Series Data-

Centric Systems and Applications Springer 2008

Hitzler P Krotzsch M Rudolph S Foundations of SemanticWeb Technologies Chapman amp HallCRC 2009

21042010

31

Referecircncias em buscas semacircnticas

Guha R McCool R and Miller E 2003 Semantic search In Proc of the 12th international Conference on World Wide Web

(WWW) Budapest Hungary ACM New York NY 2003 700-709

Reeve L and Han H 2005 Survey of semantic annotation

platforms In Proceedings of the ACM Symposium on Applied Computing Santa Fe New Mexico ACM New York NY 2005

1634-1638

Eetu Makela Survey of Semantic Search Research

Mangold C A Survey and classification of semantic search approaches Journal of Metadata Semantics and Ontology 2(1)

2007

Stephan Bloehdorn Philipp Cimiano Alistair Duke Peter Haase Joumlrg Heizmann Ian Thurlow Johanna Voumllker Ontology-BasedQuestion Answering for Digital Libraries ECDL 2007 14-25

Hai Dong Hussain FK Chang E A survey in semantic search technologies In 2nd IEEE International Conference on

Digital Ecosystems and Technologies 2008 403-408

Algumas referecircncias grupo UFSC

DAgostini C S Fileto R Capturing Users Preferences and Intentions in a Semantic Search System In 21st International

Conference on Software Engineering amp Knowledge Engineering (SEKE) Boston 2009 p 587-591

DAgostini C S Fileto R Dantas M A R Gauthier F A O

Contextual Semantic Search - Capturing using the UsersContext to Direct Semantic Search In 10th InternationalConference on Enterprise Information Systems (ICEIS) Barcelona

Spain 2008 v SAIC p 154-159

DAgostini C S Fileto R Capturing and managing usercontext for improving information retrieval In Workshop de

Teses e Dissertaccedilotildees do Simpoacutesio Brasileiro de Bancos de Dados (WTDBDSBBD) Campinas Unicamp Brazil 2008

Vian J Silveira R A Fileto R Proposal of a Multi-agent System for Indexing and Recovery applied to Learning

Objects In 9th IFIP World Conference on Computers in Education (WCCE) Bento Goncalves Brazil 2009

Alguns projetos na UFSC

httpwwwlisaufscbrprojetos

httpwwwunasusufscbr

httpwwwliteraturabrasileiraufscbr

Perguntas

Page 23: Buscas Semânticasfileto/Talks/BuscasSemanticas6sp.pdf · 21/04/2010 1 1 Buscas semânticas: panorama e tendências atuais minicurso ERBD 2010 RenatoFileto fileto@inf.ufsc.br AlunosColaboradores:

21042010

23

Algumas questotildees em aberto

Representaccedilatildeo de contextos de usuaacuterios emapeamento desses a ontologias

Anaacutelise dos efeitos de modificaccedilotildees de consultas

Meta-buscas semacircnticas

Anaacutelise da aceitaccedilatildeo dos usuaacuterios

Adaptabilidade a diferentes ontologias

Ranking dos resultados

Integraccedilatildeo com sistemas de gerenciamento dedocumentosconteuacutedo

Tratamento de dados multimiacuteda

Interfaces homem-maacutequina

Desempenho e escalabilidade

Contextual Semantic Search (CSS)(DAgostine Fileto ndash SBBD2007)rlm

21042010

24

General Architecture for CSSThe Weighted Topic Graph(DAgostine Fileto Dantas Gauthier - ICEIS 2008)rlm

A weighted topic graph is a graph TM(T A)rlm

T is a set of topics (vertices)rlm

A is a set of associations (edges)rlm

Let be an ontology O

Each topic t in T corresponds to a ontology term o in O

Each topic t has a weight [01] The sum from the weights from all topics with same name equals 1

Each association a has a weight [01] The sum

from all the weights from all association departing

a single topics equals 1

Topic weights used to disambiguate

Eg interest in Satildeo Paulo city instead of Satildeo Paulo

state

Association weights used to semantically

expand searches

Eg Actual interest in Guarulhos and airport while

searching for Satildeo Paulo city

The Weights in the Topic Graph Capturing the Users Context

Generated Topic Graph with the Ontological Users Context

The Contextual Semantic Search Process

21042010

25

Desambiguaccedilatildeo

Fundamento dos algoritmos de busca sobre contexto ontoloacutegico

Heuriacutesticas de estigmergia (Ant Colony Optimization - ACO)

Traccedilos de ferormocircnio

Algoritmo de busca semacircntica baseada em ACO

Entrada palavras-chave[ ]

Dados G(TA) Onto repositoacuterio

limite_de_profundidade

limite_miacutenimo_de_peso

λ fator de atenuaccedilatildeo de peso

iniacutecio Algoritmo Busca Contextual 1 Estigmeacuterica

resultados = busca_G_ou_Onto(palavras-chave[])

atenuaG (iacutendice ) λrlmisin [0 1]

manutenccedilatildeo(coleta_feedback(resultados))

fim

21042010

26

Demo Praestro ndash Karina Fasolin

Alguns trabalhos relacionados

Name Article Comments

Graupmann

et al 2005

The SphereSearch

engine for unifiedranked retrieval of

heterogeneous XML

and web documents

Searches through XML documents The context is a region in radius

around given element A data inside two regions is considered relevant

to both contexts

Made tests with large collections like DBLP INEX Wikipedia put for

stress testing regarding the size of the collection

ldquoLet us first comment on the difficulties of defining a meaningfulbenchmark for this kind of novel systemrdquo

Park e

Cheyer 2006

Just For Me Topic

Maps and Ontologies

Manages knowledge in three layers Topics Knowledge Structures and

Documents

Not implemented (at least at the time of publication)

Michlmayr

et al 2007Adaptive User Profiles

for Enterprise

Information Access

Represents context as an individual graph The graph is constructed

based on tags used to semantically annotate the content which the user

considers to be relevant

However the tags are only that only labels They are not tied-down to

a formal definition

Alguns trabalhos relacionados (cont)

Name Article Comments

Aleman-

Meza et a

2003

Context-Aware

Semantic Association

Ranking

Also defines context as regions But the regions are static defined in

the ontology which is used by the system So the contexts are defined

the same for every single user

Mani and

Sundaram

2007

Modeling user context

with applications to

media retrieval

Creates a graph representing the users context Each node

corresponds to an instance in the ontology The edges represent

relations between the instances Built to search trough multimedia

documents

However it does not associates the vocabulary the user uses with the

instances

Challam et

al 2007

Contextual Search

Using Ontology-Based

User Profiles

Monitors the users activity capturing content from open Internet

Explorer MS-Office and MSN The captured information is stored and

usedrlmtorlmbuildrlmarlmuser‟srlmcontextualrlmprofilerlmbasesrlmonrlmanrlmontology

The context is tightly coupled with the ontology

NO IMAGES WERE

PROVIDED

Vallet et al

2006

Personalized

Information Retrieval in

Context

Stores context as a graph constructed based on the ontology used by

the system Similar to Mani and Sundaram including its limitations

(mapping the vocabulary) however if built for text documents

Sieg et al

2007

Ontological User

Profiles for

Personalized Web

Search

Similar to Challam et al but it gets the context information from the

ontology terms used to annotate the retrieved relevant context

Also limited by the structure of the ontology

Alguns trabalhos relacionados(cont)

Name Deals with

objective

knowledge

(ontology)

Deals with

subjective

knowledge

(users

context)

The knowledge

management is

transparent

Idea Implemented

Graupmann et

al 2005

X IMPL

Park e Cheyer

2006

X X X IDEA

Michlmayr et al2007

X X IMPL

Aleman-Meza et

a 2003

X X IMPL

Mani eSundaram 2007

X X X IMPL

Challam et al

2007

X X X IMPL

Vallet et al 2006 X X X IMPL

Sieg et al 2007 X X X IMPL

(incomplete)

Praestro X X X IMPL

(prototype)

UnA-SUS ndash Universidade Aberta do SUS

Programa do Ministeacuterio da Sauacutede para atender necessidades de e

permanente dos

Accedilotildees focadas em

formulaccedilatildeo de conteuacutedo

bibliotecas digitais

cursos a distacircncia

21042010

27

Metas da UnA-SUS

Desenvolver um

plataforma para de

composiccedilatildeo e de

Montar e oferecer cursos para formaccedilatildeo continuada de profissionais da sauacutede

157

Metadados

O processo de produccedilatildeo catalogaccedilatildeo e reuso de OAs

Repositoacuterio

Conteuacutedo

OAs

requisiccedilotildees

Design revisatildeo e publicaccedilatildeo

OA

SGA outros reps

Busca e reuso

OAsMetadados

OAs

Concepccedilatildeo e validaccedilatildeo de OAs

O processo de produccedilatildeo catalogaccedilatildeo e reuso de OAs

OA1

Curso A

Curso B

OA2

OA3

Viacutedeo

Imagens

RepositoacuteriosConteuacutedoMultimiacutedia

SGA RepositoacuteriosOAs

Reuso eacute essencial

bull OAs satildeo caros para produzir

bull Demandas emergenciais na sauacutede puacuteblica exigem agilidade e pronta resposta com cursos para a qualificaccedilatildeo de profissionais

H1N1

Apoplexia

gripe suiacutena gripe A

influenza H1N1

hellip

21042010

28

Navegaccedilatildeo hiperboacutelica no DeCSCatalogaccedilatildeo de Objetos de Aprendizagem (OAs) usando Vocabulaacuterios Controlados

bull Seleccedilatildeo de termos do DeCS CID-10 SNOMED

ndash via fornecimento de palavras-chave que satildeo pesquisadas na base de conhecimento

ndash via navegaccedilatildeo em uma visatildeo do conhecimento em forma de aacutervore

Seleccedilatildeo via contexto ontoloacutegicoProtoacutetipo (catalogaccedilatildeo com entrada

de palavra-chave)

DSpaceCatalogaccedilatildeo de OAswf

Protoacutetipo (catalogaccedilatildeo com navegaccedilatildeo

na base de conhecimento)

DSpaceRecuperaccedilatildeo de OAswf

21042010

29

Recuperaccedilatildeo de Objetos de Aprendizagem (OAs) Baseada em Conhecimento

bull Vocabulaacuterios e relaccedilotildees semacircnticas

ndash Oriundos do DeCS

ndash Definidos pelos catalogadores de OAs

ndash Gerados pelo cruzamento de informaccedilotildees com o CID-10 (Classificaccedilatildeo Internacional de Doenccedilas)

ndash Ex sinocircnimos eacute um(a) parte de causa efeito sintoma etc

DeCs

Anatomia

Sistema Nervoso

Sistema Nervoso Central

Enceacutefalo

Prosenceacutefalo

Telencaacutefalo

Ceacuterebro

Doenccedilas

Doenccedilas do Sistema Nervoso

Doenccedilas Cardiovasculares

Doenccedilas do Sistema Nervoso Central

Encefalopatias

Transtornos Cerebrovasculares

Doenccedilas Vasculares

Transtornos Cerebrovasculares

Acidente Vascular Cerebral

Acidente Vascular Cerebral

OA 1

OA 2

AVC

IctusCerebral

Derrame Cerebral

Hemisfeacuterios Cerebrais

ApoplexiaAcidente

Cerebrovascular

IctoCerebral

Apoplexia Cerebrovascular

Apoplexia Cerebral

Acidente Vascular

Encefaacutelico

Acidente Vascular

do Ceacuterebro

Acidente Vascular Cerebral

padratildeo (sinocircnimo)

anota

especiacutefica de domiacutenio

anocircnimas (DeCs)

172

DeCs

Anatomia

Sistema Nervoso

Sistema Nervoso Central

Enceacutefalo

Prosenceacutefalo

Telencaacutefalo

Ceacuterebro (2)

Doenccedilas

Doenccedilas do Sistema Nervoso

Doenccedilas Cardiovasculares

Doenccedilas do Sistema Nervoso Central

Encefalopatias

Transtornos Cerebrovasculares

Doenccedilas Vasculares

Transtornos Cerebrovasculares

Acidente Cerebral Vascular (1)

Acidente Cerebral Vascular(1)

OA 1

OA 2

AVC

IctusCerebral

Derrame Cerebral

Hemisfeacuterios Cerebrais

ApoplexiaAcidente

Cerebrovascular

IctoCerebral

Apoplexia Cerebrovascular

Apoplexia Cerebral

Acidente Vascular

Encefaacutelico

Acidente Vascular

do Ceacuterebro

Acidente Vascular Cerebral

Busca de OAs na aacuterea de sauacutede usando conhecimento de domiacutenio

Semantic Learning Objects (VIAN J SILVEIRA R A FILETO R WCCE 2009)

21042010

30

Conclusotildees

A Web semacircntica tem potencial de contribuir naobtenccedilatildeo de melhores resultados para buscas

Suporte automatizado eacute fundamental para a construccedilatildeo evoluccedilatildeo e integraccedilatildeo de ontologias anotaccedilotildees semacircnticas e contextos de usuaacuterios

Nossos primeiros resultados focam na captura e utilizaccedilatildeo de contextos de usuaacuterios mapeados a ontologias de domiacutenios especiacuteficos paradesambiguar e estender as buscas

Trabalhos futuros

Processos parcialmente automatizados para geraccedilatildeo e atualizaccedilatildeo de ontologias e anotaccedilotildees semacircnticas

Experimentos para comprovar a eficaacutecia das teacutecnicas e ferramentas utilizadas

Validaccedilatildeo de soluccedilotildees de problemas de busca semacircntica em diversos domiacutenios de aplicaccedilatildeo

Determinaccedilatildeo de niacuteveis adequados de acoplamento entre contextos e ontologias e dessas com os recursos a serem recuperados

Notiacutecias e anaacutelises

httpnewscnetcomnew-search-engine-cuil-takes-aim-at-google

httpwwwreadwritewebcomarchivesis_google_a_semantic_search_enginephp

httpwwwreadwritewebcomarchivessemantic_search_the_myt

h_and_realityphp

httpwwwpandiacomsew1262-top-5-semantic-search-

engineshtml

httpmindsetresearchyahoocom

httpnewscnetcom8301-13953_3-9982015-80html

httpwwwsearchenginejournalcomaskcom-focuses-on-semantic-search8252

httpnewsbbccouk2hiprogrammesclick_onlinedefaultstm

httpnewsbbccouk2hiprogrammesclick_online8144765stm

Web semacircntica e buscassemacircnticas

httpwwww3org2001sw

httpsemanticweborg

httpenwikipediaorgwikiSemantic_Web

httpenwikipediaorgwikiSemantic_search

Ferramentas de desenvolvimento

httpprotegestanfordedu

httpjenasourceforgenet

httpwwww3org2001Annotea

httpwwwontotextcomkim

httpesww3orgtopicSemanticWebTools

httpwwwdamlorg200305swmu-tools-

tutorialOverviewhtml

Referecircncias em Web semacircntica

T Berners-Lee J Hendler e O Lassila The Semantic Web Scientific American May 2001

Thomas B Passing Explores Guide to the Semantic Web Manning Publications Greenwich CT 2005

Davies J Studer R Warren P (Eds) Semantic Web Technologies trends and research in ontology-based

Systems John Wiley amp Sons 2006

Breitman KK Casanova MA Truszkowski W Semantic Web

Concepts Technologies and Applications Series NASA Monographs in Systems and Software Engineering Springer 2007

Grigoris Antoniou and Frank van Harmelen A Semantic Web Primer 2nd edition The MIT Press Cambridge MA USA 2008

Kashyap V Bussler C Moran M The Semantic Web -Semantics for Data and Services on the Web Series Data-

Centric Systems and Applications Springer 2008

Hitzler P Krotzsch M Rudolph S Foundations of SemanticWeb Technologies Chapman amp HallCRC 2009

21042010

31

Referecircncias em buscas semacircnticas

Guha R McCool R and Miller E 2003 Semantic search In Proc of the 12th international Conference on World Wide Web

(WWW) Budapest Hungary ACM New York NY 2003 700-709

Reeve L and Han H 2005 Survey of semantic annotation

platforms In Proceedings of the ACM Symposium on Applied Computing Santa Fe New Mexico ACM New York NY 2005

1634-1638

Eetu Makela Survey of Semantic Search Research

Mangold C A Survey and classification of semantic search approaches Journal of Metadata Semantics and Ontology 2(1)

2007

Stephan Bloehdorn Philipp Cimiano Alistair Duke Peter Haase Joumlrg Heizmann Ian Thurlow Johanna Voumllker Ontology-BasedQuestion Answering for Digital Libraries ECDL 2007 14-25

Hai Dong Hussain FK Chang E A survey in semantic search technologies In 2nd IEEE International Conference on

Digital Ecosystems and Technologies 2008 403-408

Algumas referecircncias grupo UFSC

DAgostini C S Fileto R Capturing Users Preferences and Intentions in a Semantic Search System In 21st International

Conference on Software Engineering amp Knowledge Engineering (SEKE) Boston 2009 p 587-591

DAgostini C S Fileto R Dantas M A R Gauthier F A O

Contextual Semantic Search - Capturing using the UsersContext to Direct Semantic Search In 10th InternationalConference on Enterprise Information Systems (ICEIS) Barcelona

Spain 2008 v SAIC p 154-159

DAgostini C S Fileto R Capturing and managing usercontext for improving information retrieval In Workshop de

Teses e Dissertaccedilotildees do Simpoacutesio Brasileiro de Bancos de Dados (WTDBDSBBD) Campinas Unicamp Brazil 2008

Vian J Silveira R A Fileto R Proposal of a Multi-agent System for Indexing and Recovery applied to Learning

Objects In 9th IFIP World Conference on Computers in Education (WCCE) Bento Goncalves Brazil 2009

Alguns projetos na UFSC

httpwwwlisaufscbrprojetos

httpwwwunasusufscbr

httpwwwliteraturabrasileiraufscbr

Perguntas

Page 24: Buscas Semânticasfileto/Talks/BuscasSemanticas6sp.pdf · 21/04/2010 1 1 Buscas semânticas: panorama e tendências atuais minicurso ERBD 2010 RenatoFileto fileto@inf.ufsc.br AlunosColaboradores:

21042010

24

General Architecture for CSSThe Weighted Topic Graph(DAgostine Fileto Dantas Gauthier - ICEIS 2008)rlm

A weighted topic graph is a graph TM(T A)rlm

T is a set of topics (vertices)rlm

A is a set of associations (edges)rlm

Let be an ontology O

Each topic t in T corresponds to a ontology term o in O

Each topic t has a weight [01] The sum from the weights from all topics with same name equals 1

Each association a has a weight [01] The sum

from all the weights from all association departing

a single topics equals 1

Topic weights used to disambiguate

Eg interest in Satildeo Paulo city instead of Satildeo Paulo

state

Association weights used to semantically

expand searches

Eg Actual interest in Guarulhos and airport while

searching for Satildeo Paulo city

The Weights in the Topic Graph Capturing the Users Context

Generated Topic Graph with the Ontological Users Context

The Contextual Semantic Search Process

21042010

25

Desambiguaccedilatildeo

Fundamento dos algoritmos de busca sobre contexto ontoloacutegico

Heuriacutesticas de estigmergia (Ant Colony Optimization - ACO)

Traccedilos de ferormocircnio

Algoritmo de busca semacircntica baseada em ACO

Entrada palavras-chave[ ]

Dados G(TA) Onto repositoacuterio

limite_de_profundidade

limite_miacutenimo_de_peso

λ fator de atenuaccedilatildeo de peso

iniacutecio Algoritmo Busca Contextual 1 Estigmeacuterica

resultados = busca_G_ou_Onto(palavras-chave[])

atenuaG (iacutendice ) λrlmisin [0 1]

manutenccedilatildeo(coleta_feedback(resultados))

fim

21042010

26

Demo Praestro ndash Karina Fasolin

Alguns trabalhos relacionados

Name Article Comments

Graupmann

et al 2005

The SphereSearch

engine for unifiedranked retrieval of

heterogeneous XML

and web documents

Searches through XML documents The context is a region in radius

around given element A data inside two regions is considered relevant

to both contexts

Made tests with large collections like DBLP INEX Wikipedia put for

stress testing regarding the size of the collection

ldquoLet us first comment on the difficulties of defining a meaningfulbenchmark for this kind of novel systemrdquo

Park e

Cheyer 2006

Just For Me Topic

Maps and Ontologies

Manages knowledge in three layers Topics Knowledge Structures and

Documents

Not implemented (at least at the time of publication)

Michlmayr

et al 2007Adaptive User Profiles

for Enterprise

Information Access

Represents context as an individual graph The graph is constructed

based on tags used to semantically annotate the content which the user

considers to be relevant

However the tags are only that only labels They are not tied-down to

a formal definition

Alguns trabalhos relacionados (cont)

Name Article Comments

Aleman-

Meza et a

2003

Context-Aware

Semantic Association

Ranking

Also defines context as regions But the regions are static defined in

the ontology which is used by the system So the contexts are defined

the same for every single user

Mani and

Sundaram

2007

Modeling user context

with applications to

media retrieval

Creates a graph representing the users context Each node

corresponds to an instance in the ontology The edges represent

relations between the instances Built to search trough multimedia

documents

However it does not associates the vocabulary the user uses with the

instances

Challam et

al 2007

Contextual Search

Using Ontology-Based

User Profiles

Monitors the users activity capturing content from open Internet

Explorer MS-Office and MSN The captured information is stored and

usedrlmtorlmbuildrlmarlmuser‟srlmcontextualrlmprofilerlmbasesrlmonrlmanrlmontology

The context is tightly coupled with the ontology

NO IMAGES WERE

PROVIDED

Vallet et al

2006

Personalized

Information Retrieval in

Context

Stores context as a graph constructed based on the ontology used by

the system Similar to Mani and Sundaram including its limitations

(mapping the vocabulary) however if built for text documents

Sieg et al

2007

Ontological User

Profiles for

Personalized Web

Search

Similar to Challam et al but it gets the context information from the

ontology terms used to annotate the retrieved relevant context

Also limited by the structure of the ontology

Alguns trabalhos relacionados(cont)

Name Deals with

objective

knowledge

(ontology)

Deals with

subjective

knowledge

(users

context)

The knowledge

management is

transparent

Idea Implemented

Graupmann et

al 2005

X IMPL

Park e Cheyer

2006

X X X IDEA

Michlmayr et al2007

X X IMPL

Aleman-Meza et

a 2003

X X IMPL

Mani eSundaram 2007

X X X IMPL

Challam et al

2007

X X X IMPL

Vallet et al 2006 X X X IMPL

Sieg et al 2007 X X X IMPL

(incomplete)

Praestro X X X IMPL

(prototype)

UnA-SUS ndash Universidade Aberta do SUS

Programa do Ministeacuterio da Sauacutede para atender necessidades de e

permanente dos

Accedilotildees focadas em

formulaccedilatildeo de conteuacutedo

bibliotecas digitais

cursos a distacircncia

21042010

27

Metas da UnA-SUS

Desenvolver um

plataforma para de

composiccedilatildeo e de

Montar e oferecer cursos para formaccedilatildeo continuada de profissionais da sauacutede

157

Metadados

O processo de produccedilatildeo catalogaccedilatildeo e reuso de OAs

Repositoacuterio

Conteuacutedo

OAs

requisiccedilotildees

Design revisatildeo e publicaccedilatildeo

OA

SGA outros reps

Busca e reuso

OAsMetadados

OAs

Concepccedilatildeo e validaccedilatildeo de OAs

O processo de produccedilatildeo catalogaccedilatildeo e reuso de OAs

OA1

Curso A

Curso B

OA2

OA3

Viacutedeo

Imagens

RepositoacuteriosConteuacutedoMultimiacutedia

SGA RepositoacuteriosOAs

Reuso eacute essencial

bull OAs satildeo caros para produzir

bull Demandas emergenciais na sauacutede puacuteblica exigem agilidade e pronta resposta com cursos para a qualificaccedilatildeo de profissionais

H1N1

Apoplexia

gripe suiacutena gripe A

influenza H1N1

hellip

21042010

28

Navegaccedilatildeo hiperboacutelica no DeCSCatalogaccedilatildeo de Objetos de Aprendizagem (OAs) usando Vocabulaacuterios Controlados

bull Seleccedilatildeo de termos do DeCS CID-10 SNOMED

ndash via fornecimento de palavras-chave que satildeo pesquisadas na base de conhecimento

ndash via navegaccedilatildeo em uma visatildeo do conhecimento em forma de aacutervore

Seleccedilatildeo via contexto ontoloacutegicoProtoacutetipo (catalogaccedilatildeo com entrada

de palavra-chave)

DSpaceCatalogaccedilatildeo de OAswf

Protoacutetipo (catalogaccedilatildeo com navegaccedilatildeo

na base de conhecimento)

DSpaceRecuperaccedilatildeo de OAswf

21042010

29

Recuperaccedilatildeo de Objetos de Aprendizagem (OAs) Baseada em Conhecimento

bull Vocabulaacuterios e relaccedilotildees semacircnticas

ndash Oriundos do DeCS

ndash Definidos pelos catalogadores de OAs

ndash Gerados pelo cruzamento de informaccedilotildees com o CID-10 (Classificaccedilatildeo Internacional de Doenccedilas)

ndash Ex sinocircnimos eacute um(a) parte de causa efeito sintoma etc

DeCs

Anatomia

Sistema Nervoso

Sistema Nervoso Central

Enceacutefalo

Prosenceacutefalo

Telencaacutefalo

Ceacuterebro

Doenccedilas

Doenccedilas do Sistema Nervoso

Doenccedilas Cardiovasculares

Doenccedilas do Sistema Nervoso Central

Encefalopatias

Transtornos Cerebrovasculares

Doenccedilas Vasculares

Transtornos Cerebrovasculares

Acidente Vascular Cerebral

Acidente Vascular Cerebral

OA 1

OA 2

AVC

IctusCerebral

Derrame Cerebral

Hemisfeacuterios Cerebrais

ApoplexiaAcidente

Cerebrovascular

IctoCerebral

Apoplexia Cerebrovascular

Apoplexia Cerebral

Acidente Vascular

Encefaacutelico

Acidente Vascular

do Ceacuterebro

Acidente Vascular Cerebral

padratildeo (sinocircnimo)

anota

especiacutefica de domiacutenio

anocircnimas (DeCs)

172

DeCs

Anatomia

Sistema Nervoso

Sistema Nervoso Central

Enceacutefalo

Prosenceacutefalo

Telencaacutefalo

Ceacuterebro (2)

Doenccedilas

Doenccedilas do Sistema Nervoso

Doenccedilas Cardiovasculares

Doenccedilas do Sistema Nervoso Central

Encefalopatias

Transtornos Cerebrovasculares

Doenccedilas Vasculares

Transtornos Cerebrovasculares

Acidente Cerebral Vascular (1)

Acidente Cerebral Vascular(1)

OA 1

OA 2

AVC

IctusCerebral

Derrame Cerebral

Hemisfeacuterios Cerebrais

ApoplexiaAcidente

Cerebrovascular

IctoCerebral

Apoplexia Cerebrovascular

Apoplexia Cerebral

Acidente Vascular

Encefaacutelico

Acidente Vascular

do Ceacuterebro

Acidente Vascular Cerebral

Busca de OAs na aacuterea de sauacutede usando conhecimento de domiacutenio

Semantic Learning Objects (VIAN J SILVEIRA R A FILETO R WCCE 2009)

21042010

30

Conclusotildees

A Web semacircntica tem potencial de contribuir naobtenccedilatildeo de melhores resultados para buscas

Suporte automatizado eacute fundamental para a construccedilatildeo evoluccedilatildeo e integraccedilatildeo de ontologias anotaccedilotildees semacircnticas e contextos de usuaacuterios

Nossos primeiros resultados focam na captura e utilizaccedilatildeo de contextos de usuaacuterios mapeados a ontologias de domiacutenios especiacuteficos paradesambiguar e estender as buscas

Trabalhos futuros

Processos parcialmente automatizados para geraccedilatildeo e atualizaccedilatildeo de ontologias e anotaccedilotildees semacircnticas

Experimentos para comprovar a eficaacutecia das teacutecnicas e ferramentas utilizadas

Validaccedilatildeo de soluccedilotildees de problemas de busca semacircntica em diversos domiacutenios de aplicaccedilatildeo

Determinaccedilatildeo de niacuteveis adequados de acoplamento entre contextos e ontologias e dessas com os recursos a serem recuperados

Notiacutecias e anaacutelises

httpnewscnetcomnew-search-engine-cuil-takes-aim-at-google

httpwwwreadwritewebcomarchivesis_google_a_semantic_search_enginephp

httpwwwreadwritewebcomarchivessemantic_search_the_myt

h_and_realityphp

httpwwwpandiacomsew1262-top-5-semantic-search-

engineshtml

httpmindsetresearchyahoocom

httpnewscnetcom8301-13953_3-9982015-80html

httpwwwsearchenginejournalcomaskcom-focuses-on-semantic-search8252

httpnewsbbccouk2hiprogrammesclick_onlinedefaultstm

httpnewsbbccouk2hiprogrammesclick_online8144765stm

Web semacircntica e buscassemacircnticas

httpwwww3org2001sw

httpsemanticweborg

httpenwikipediaorgwikiSemantic_Web

httpenwikipediaorgwikiSemantic_search

Ferramentas de desenvolvimento

httpprotegestanfordedu

httpjenasourceforgenet

httpwwww3org2001Annotea

httpwwwontotextcomkim

httpesww3orgtopicSemanticWebTools

httpwwwdamlorg200305swmu-tools-

tutorialOverviewhtml

Referecircncias em Web semacircntica

T Berners-Lee J Hendler e O Lassila The Semantic Web Scientific American May 2001

Thomas B Passing Explores Guide to the Semantic Web Manning Publications Greenwich CT 2005

Davies J Studer R Warren P (Eds) Semantic Web Technologies trends and research in ontology-based

Systems John Wiley amp Sons 2006

Breitman KK Casanova MA Truszkowski W Semantic Web

Concepts Technologies and Applications Series NASA Monographs in Systems and Software Engineering Springer 2007

Grigoris Antoniou and Frank van Harmelen A Semantic Web Primer 2nd edition The MIT Press Cambridge MA USA 2008

Kashyap V Bussler C Moran M The Semantic Web -Semantics for Data and Services on the Web Series Data-

Centric Systems and Applications Springer 2008

Hitzler P Krotzsch M Rudolph S Foundations of SemanticWeb Technologies Chapman amp HallCRC 2009

21042010

31

Referecircncias em buscas semacircnticas

Guha R McCool R and Miller E 2003 Semantic search In Proc of the 12th international Conference on World Wide Web

(WWW) Budapest Hungary ACM New York NY 2003 700-709

Reeve L and Han H 2005 Survey of semantic annotation

platforms In Proceedings of the ACM Symposium on Applied Computing Santa Fe New Mexico ACM New York NY 2005

1634-1638

Eetu Makela Survey of Semantic Search Research

Mangold C A Survey and classification of semantic search approaches Journal of Metadata Semantics and Ontology 2(1)

2007

Stephan Bloehdorn Philipp Cimiano Alistair Duke Peter Haase Joumlrg Heizmann Ian Thurlow Johanna Voumllker Ontology-BasedQuestion Answering for Digital Libraries ECDL 2007 14-25

Hai Dong Hussain FK Chang E A survey in semantic search technologies In 2nd IEEE International Conference on

Digital Ecosystems and Technologies 2008 403-408

Algumas referecircncias grupo UFSC

DAgostini C S Fileto R Capturing Users Preferences and Intentions in a Semantic Search System In 21st International

Conference on Software Engineering amp Knowledge Engineering (SEKE) Boston 2009 p 587-591

DAgostini C S Fileto R Dantas M A R Gauthier F A O

Contextual Semantic Search - Capturing using the UsersContext to Direct Semantic Search In 10th InternationalConference on Enterprise Information Systems (ICEIS) Barcelona

Spain 2008 v SAIC p 154-159

DAgostini C S Fileto R Capturing and managing usercontext for improving information retrieval In Workshop de

Teses e Dissertaccedilotildees do Simpoacutesio Brasileiro de Bancos de Dados (WTDBDSBBD) Campinas Unicamp Brazil 2008

Vian J Silveira R A Fileto R Proposal of a Multi-agent System for Indexing and Recovery applied to Learning

Objects In 9th IFIP World Conference on Computers in Education (WCCE) Bento Goncalves Brazil 2009

Alguns projetos na UFSC

httpwwwlisaufscbrprojetos

httpwwwunasusufscbr

httpwwwliteraturabrasileiraufscbr

Perguntas

Page 25: Buscas Semânticasfileto/Talks/BuscasSemanticas6sp.pdf · 21/04/2010 1 1 Buscas semânticas: panorama e tendências atuais minicurso ERBD 2010 RenatoFileto fileto@inf.ufsc.br AlunosColaboradores:

21042010

25

Desambiguaccedilatildeo

Fundamento dos algoritmos de busca sobre contexto ontoloacutegico

Heuriacutesticas de estigmergia (Ant Colony Optimization - ACO)

Traccedilos de ferormocircnio

Algoritmo de busca semacircntica baseada em ACO

Entrada palavras-chave[ ]

Dados G(TA) Onto repositoacuterio

limite_de_profundidade

limite_miacutenimo_de_peso

λ fator de atenuaccedilatildeo de peso

iniacutecio Algoritmo Busca Contextual 1 Estigmeacuterica

resultados = busca_G_ou_Onto(palavras-chave[])

atenuaG (iacutendice ) λrlmisin [0 1]

manutenccedilatildeo(coleta_feedback(resultados))

fim

21042010

26

Demo Praestro ndash Karina Fasolin

Alguns trabalhos relacionados

Name Article Comments

Graupmann

et al 2005

The SphereSearch

engine for unifiedranked retrieval of

heterogeneous XML

and web documents

Searches through XML documents The context is a region in radius

around given element A data inside two regions is considered relevant

to both contexts

Made tests with large collections like DBLP INEX Wikipedia put for

stress testing regarding the size of the collection

ldquoLet us first comment on the difficulties of defining a meaningfulbenchmark for this kind of novel systemrdquo

Park e

Cheyer 2006

Just For Me Topic

Maps and Ontologies

Manages knowledge in three layers Topics Knowledge Structures and

Documents

Not implemented (at least at the time of publication)

Michlmayr

et al 2007Adaptive User Profiles

for Enterprise

Information Access

Represents context as an individual graph The graph is constructed

based on tags used to semantically annotate the content which the user

considers to be relevant

However the tags are only that only labels They are not tied-down to

a formal definition

Alguns trabalhos relacionados (cont)

Name Article Comments

Aleman-

Meza et a

2003

Context-Aware

Semantic Association

Ranking

Also defines context as regions But the regions are static defined in

the ontology which is used by the system So the contexts are defined

the same for every single user

Mani and

Sundaram

2007

Modeling user context

with applications to

media retrieval

Creates a graph representing the users context Each node

corresponds to an instance in the ontology The edges represent

relations between the instances Built to search trough multimedia

documents

However it does not associates the vocabulary the user uses with the

instances

Challam et

al 2007

Contextual Search

Using Ontology-Based

User Profiles

Monitors the users activity capturing content from open Internet

Explorer MS-Office and MSN The captured information is stored and

usedrlmtorlmbuildrlmarlmuser‟srlmcontextualrlmprofilerlmbasesrlmonrlmanrlmontology

The context is tightly coupled with the ontology

NO IMAGES WERE

PROVIDED

Vallet et al

2006

Personalized

Information Retrieval in

Context

Stores context as a graph constructed based on the ontology used by

the system Similar to Mani and Sundaram including its limitations

(mapping the vocabulary) however if built for text documents

Sieg et al

2007

Ontological User

Profiles for

Personalized Web

Search

Similar to Challam et al but it gets the context information from the

ontology terms used to annotate the retrieved relevant context

Also limited by the structure of the ontology

Alguns trabalhos relacionados(cont)

Name Deals with

objective

knowledge

(ontology)

Deals with

subjective

knowledge

(users

context)

The knowledge

management is

transparent

Idea Implemented

Graupmann et

al 2005

X IMPL

Park e Cheyer

2006

X X X IDEA

Michlmayr et al2007

X X IMPL

Aleman-Meza et

a 2003

X X IMPL

Mani eSundaram 2007

X X X IMPL

Challam et al

2007

X X X IMPL

Vallet et al 2006 X X X IMPL

Sieg et al 2007 X X X IMPL

(incomplete)

Praestro X X X IMPL

(prototype)

UnA-SUS ndash Universidade Aberta do SUS

Programa do Ministeacuterio da Sauacutede para atender necessidades de e

permanente dos

Accedilotildees focadas em

formulaccedilatildeo de conteuacutedo

bibliotecas digitais

cursos a distacircncia

21042010

27

Metas da UnA-SUS

Desenvolver um

plataforma para de

composiccedilatildeo e de

Montar e oferecer cursos para formaccedilatildeo continuada de profissionais da sauacutede

157

Metadados

O processo de produccedilatildeo catalogaccedilatildeo e reuso de OAs

Repositoacuterio

Conteuacutedo

OAs

requisiccedilotildees

Design revisatildeo e publicaccedilatildeo

OA

SGA outros reps

Busca e reuso

OAsMetadados

OAs

Concepccedilatildeo e validaccedilatildeo de OAs

O processo de produccedilatildeo catalogaccedilatildeo e reuso de OAs

OA1

Curso A

Curso B

OA2

OA3

Viacutedeo

Imagens

RepositoacuteriosConteuacutedoMultimiacutedia

SGA RepositoacuteriosOAs

Reuso eacute essencial

bull OAs satildeo caros para produzir

bull Demandas emergenciais na sauacutede puacuteblica exigem agilidade e pronta resposta com cursos para a qualificaccedilatildeo de profissionais

H1N1

Apoplexia

gripe suiacutena gripe A

influenza H1N1

hellip

21042010

28

Navegaccedilatildeo hiperboacutelica no DeCSCatalogaccedilatildeo de Objetos de Aprendizagem (OAs) usando Vocabulaacuterios Controlados

bull Seleccedilatildeo de termos do DeCS CID-10 SNOMED

ndash via fornecimento de palavras-chave que satildeo pesquisadas na base de conhecimento

ndash via navegaccedilatildeo em uma visatildeo do conhecimento em forma de aacutervore

Seleccedilatildeo via contexto ontoloacutegicoProtoacutetipo (catalogaccedilatildeo com entrada

de palavra-chave)

DSpaceCatalogaccedilatildeo de OAswf

Protoacutetipo (catalogaccedilatildeo com navegaccedilatildeo

na base de conhecimento)

DSpaceRecuperaccedilatildeo de OAswf

21042010

29

Recuperaccedilatildeo de Objetos de Aprendizagem (OAs) Baseada em Conhecimento

bull Vocabulaacuterios e relaccedilotildees semacircnticas

ndash Oriundos do DeCS

ndash Definidos pelos catalogadores de OAs

ndash Gerados pelo cruzamento de informaccedilotildees com o CID-10 (Classificaccedilatildeo Internacional de Doenccedilas)

ndash Ex sinocircnimos eacute um(a) parte de causa efeito sintoma etc

DeCs

Anatomia

Sistema Nervoso

Sistema Nervoso Central

Enceacutefalo

Prosenceacutefalo

Telencaacutefalo

Ceacuterebro

Doenccedilas

Doenccedilas do Sistema Nervoso

Doenccedilas Cardiovasculares

Doenccedilas do Sistema Nervoso Central

Encefalopatias

Transtornos Cerebrovasculares

Doenccedilas Vasculares

Transtornos Cerebrovasculares

Acidente Vascular Cerebral

Acidente Vascular Cerebral

OA 1

OA 2

AVC

IctusCerebral

Derrame Cerebral

Hemisfeacuterios Cerebrais

ApoplexiaAcidente

Cerebrovascular

IctoCerebral

Apoplexia Cerebrovascular

Apoplexia Cerebral

Acidente Vascular

Encefaacutelico

Acidente Vascular

do Ceacuterebro

Acidente Vascular Cerebral

padratildeo (sinocircnimo)

anota

especiacutefica de domiacutenio

anocircnimas (DeCs)

172

DeCs

Anatomia

Sistema Nervoso

Sistema Nervoso Central

Enceacutefalo

Prosenceacutefalo

Telencaacutefalo

Ceacuterebro (2)

Doenccedilas

Doenccedilas do Sistema Nervoso

Doenccedilas Cardiovasculares

Doenccedilas do Sistema Nervoso Central

Encefalopatias

Transtornos Cerebrovasculares

Doenccedilas Vasculares

Transtornos Cerebrovasculares

Acidente Cerebral Vascular (1)

Acidente Cerebral Vascular(1)

OA 1

OA 2

AVC

IctusCerebral

Derrame Cerebral

Hemisfeacuterios Cerebrais

ApoplexiaAcidente

Cerebrovascular

IctoCerebral

Apoplexia Cerebrovascular

Apoplexia Cerebral

Acidente Vascular

Encefaacutelico

Acidente Vascular

do Ceacuterebro

Acidente Vascular Cerebral

Busca de OAs na aacuterea de sauacutede usando conhecimento de domiacutenio

Semantic Learning Objects (VIAN J SILVEIRA R A FILETO R WCCE 2009)

21042010

30

Conclusotildees

A Web semacircntica tem potencial de contribuir naobtenccedilatildeo de melhores resultados para buscas

Suporte automatizado eacute fundamental para a construccedilatildeo evoluccedilatildeo e integraccedilatildeo de ontologias anotaccedilotildees semacircnticas e contextos de usuaacuterios

Nossos primeiros resultados focam na captura e utilizaccedilatildeo de contextos de usuaacuterios mapeados a ontologias de domiacutenios especiacuteficos paradesambiguar e estender as buscas

Trabalhos futuros

Processos parcialmente automatizados para geraccedilatildeo e atualizaccedilatildeo de ontologias e anotaccedilotildees semacircnticas

Experimentos para comprovar a eficaacutecia das teacutecnicas e ferramentas utilizadas

Validaccedilatildeo de soluccedilotildees de problemas de busca semacircntica em diversos domiacutenios de aplicaccedilatildeo

Determinaccedilatildeo de niacuteveis adequados de acoplamento entre contextos e ontologias e dessas com os recursos a serem recuperados

Notiacutecias e anaacutelises

httpnewscnetcomnew-search-engine-cuil-takes-aim-at-google

httpwwwreadwritewebcomarchivesis_google_a_semantic_search_enginephp

httpwwwreadwritewebcomarchivessemantic_search_the_myt

h_and_realityphp

httpwwwpandiacomsew1262-top-5-semantic-search-

engineshtml

httpmindsetresearchyahoocom

httpnewscnetcom8301-13953_3-9982015-80html

httpwwwsearchenginejournalcomaskcom-focuses-on-semantic-search8252

httpnewsbbccouk2hiprogrammesclick_onlinedefaultstm

httpnewsbbccouk2hiprogrammesclick_online8144765stm

Web semacircntica e buscassemacircnticas

httpwwww3org2001sw

httpsemanticweborg

httpenwikipediaorgwikiSemantic_Web

httpenwikipediaorgwikiSemantic_search

Ferramentas de desenvolvimento

httpprotegestanfordedu

httpjenasourceforgenet

httpwwww3org2001Annotea

httpwwwontotextcomkim

httpesww3orgtopicSemanticWebTools

httpwwwdamlorg200305swmu-tools-

tutorialOverviewhtml

Referecircncias em Web semacircntica

T Berners-Lee J Hendler e O Lassila The Semantic Web Scientific American May 2001

Thomas B Passing Explores Guide to the Semantic Web Manning Publications Greenwich CT 2005

Davies J Studer R Warren P (Eds) Semantic Web Technologies trends and research in ontology-based

Systems John Wiley amp Sons 2006

Breitman KK Casanova MA Truszkowski W Semantic Web

Concepts Technologies and Applications Series NASA Monographs in Systems and Software Engineering Springer 2007

Grigoris Antoniou and Frank van Harmelen A Semantic Web Primer 2nd edition The MIT Press Cambridge MA USA 2008

Kashyap V Bussler C Moran M The Semantic Web -Semantics for Data and Services on the Web Series Data-

Centric Systems and Applications Springer 2008

Hitzler P Krotzsch M Rudolph S Foundations of SemanticWeb Technologies Chapman amp HallCRC 2009

21042010

31

Referecircncias em buscas semacircnticas

Guha R McCool R and Miller E 2003 Semantic search In Proc of the 12th international Conference on World Wide Web

(WWW) Budapest Hungary ACM New York NY 2003 700-709

Reeve L and Han H 2005 Survey of semantic annotation

platforms In Proceedings of the ACM Symposium on Applied Computing Santa Fe New Mexico ACM New York NY 2005

1634-1638

Eetu Makela Survey of Semantic Search Research

Mangold C A Survey and classification of semantic search approaches Journal of Metadata Semantics and Ontology 2(1)

2007

Stephan Bloehdorn Philipp Cimiano Alistair Duke Peter Haase Joumlrg Heizmann Ian Thurlow Johanna Voumllker Ontology-BasedQuestion Answering for Digital Libraries ECDL 2007 14-25

Hai Dong Hussain FK Chang E A survey in semantic search technologies In 2nd IEEE International Conference on

Digital Ecosystems and Technologies 2008 403-408

Algumas referecircncias grupo UFSC

DAgostini C S Fileto R Capturing Users Preferences and Intentions in a Semantic Search System In 21st International

Conference on Software Engineering amp Knowledge Engineering (SEKE) Boston 2009 p 587-591

DAgostini C S Fileto R Dantas M A R Gauthier F A O

Contextual Semantic Search - Capturing using the UsersContext to Direct Semantic Search In 10th InternationalConference on Enterprise Information Systems (ICEIS) Barcelona

Spain 2008 v SAIC p 154-159

DAgostini C S Fileto R Capturing and managing usercontext for improving information retrieval In Workshop de

Teses e Dissertaccedilotildees do Simpoacutesio Brasileiro de Bancos de Dados (WTDBDSBBD) Campinas Unicamp Brazil 2008

Vian J Silveira R A Fileto R Proposal of a Multi-agent System for Indexing and Recovery applied to Learning

Objects In 9th IFIP World Conference on Computers in Education (WCCE) Bento Goncalves Brazil 2009

Alguns projetos na UFSC

httpwwwlisaufscbrprojetos

httpwwwunasusufscbr

httpwwwliteraturabrasileiraufscbr

Perguntas

Page 26: Buscas Semânticasfileto/Talks/BuscasSemanticas6sp.pdf · 21/04/2010 1 1 Buscas semânticas: panorama e tendências atuais minicurso ERBD 2010 RenatoFileto fileto@inf.ufsc.br AlunosColaboradores:

21042010

26

Demo Praestro ndash Karina Fasolin

Alguns trabalhos relacionados

Name Article Comments

Graupmann

et al 2005

The SphereSearch

engine for unifiedranked retrieval of

heterogeneous XML

and web documents

Searches through XML documents The context is a region in radius

around given element A data inside two regions is considered relevant

to both contexts

Made tests with large collections like DBLP INEX Wikipedia put for

stress testing regarding the size of the collection

ldquoLet us first comment on the difficulties of defining a meaningfulbenchmark for this kind of novel systemrdquo

Park e

Cheyer 2006

Just For Me Topic

Maps and Ontologies

Manages knowledge in three layers Topics Knowledge Structures and

Documents

Not implemented (at least at the time of publication)

Michlmayr

et al 2007Adaptive User Profiles

for Enterprise

Information Access

Represents context as an individual graph The graph is constructed

based on tags used to semantically annotate the content which the user

considers to be relevant

However the tags are only that only labels They are not tied-down to

a formal definition

Alguns trabalhos relacionados (cont)

Name Article Comments

Aleman-

Meza et a

2003

Context-Aware

Semantic Association

Ranking

Also defines context as regions But the regions are static defined in

the ontology which is used by the system So the contexts are defined

the same for every single user

Mani and

Sundaram

2007

Modeling user context

with applications to

media retrieval

Creates a graph representing the users context Each node

corresponds to an instance in the ontology The edges represent

relations between the instances Built to search trough multimedia

documents

However it does not associates the vocabulary the user uses with the

instances

Challam et

al 2007

Contextual Search

Using Ontology-Based

User Profiles

Monitors the users activity capturing content from open Internet

Explorer MS-Office and MSN The captured information is stored and

usedrlmtorlmbuildrlmarlmuser‟srlmcontextualrlmprofilerlmbasesrlmonrlmanrlmontology

The context is tightly coupled with the ontology

NO IMAGES WERE

PROVIDED

Vallet et al

2006

Personalized

Information Retrieval in

Context

Stores context as a graph constructed based on the ontology used by

the system Similar to Mani and Sundaram including its limitations

(mapping the vocabulary) however if built for text documents

Sieg et al

2007

Ontological User

Profiles for

Personalized Web

Search

Similar to Challam et al but it gets the context information from the

ontology terms used to annotate the retrieved relevant context

Also limited by the structure of the ontology

Alguns trabalhos relacionados(cont)

Name Deals with

objective

knowledge

(ontology)

Deals with

subjective

knowledge

(users

context)

The knowledge

management is

transparent

Idea Implemented

Graupmann et

al 2005

X IMPL

Park e Cheyer

2006

X X X IDEA

Michlmayr et al2007

X X IMPL

Aleman-Meza et

a 2003

X X IMPL

Mani eSundaram 2007

X X X IMPL

Challam et al

2007

X X X IMPL

Vallet et al 2006 X X X IMPL

Sieg et al 2007 X X X IMPL

(incomplete)

Praestro X X X IMPL

(prototype)

UnA-SUS ndash Universidade Aberta do SUS

Programa do Ministeacuterio da Sauacutede para atender necessidades de e

permanente dos

Accedilotildees focadas em

formulaccedilatildeo de conteuacutedo

bibliotecas digitais

cursos a distacircncia

21042010

27

Metas da UnA-SUS

Desenvolver um

plataforma para de

composiccedilatildeo e de

Montar e oferecer cursos para formaccedilatildeo continuada de profissionais da sauacutede

157

Metadados

O processo de produccedilatildeo catalogaccedilatildeo e reuso de OAs

Repositoacuterio

Conteuacutedo

OAs

requisiccedilotildees

Design revisatildeo e publicaccedilatildeo

OA

SGA outros reps

Busca e reuso

OAsMetadados

OAs

Concepccedilatildeo e validaccedilatildeo de OAs

O processo de produccedilatildeo catalogaccedilatildeo e reuso de OAs

OA1

Curso A

Curso B

OA2

OA3

Viacutedeo

Imagens

RepositoacuteriosConteuacutedoMultimiacutedia

SGA RepositoacuteriosOAs

Reuso eacute essencial

bull OAs satildeo caros para produzir

bull Demandas emergenciais na sauacutede puacuteblica exigem agilidade e pronta resposta com cursos para a qualificaccedilatildeo de profissionais

H1N1

Apoplexia

gripe suiacutena gripe A

influenza H1N1

hellip

21042010

28

Navegaccedilatildeo hiperboacutelica no DeCSCatalogaccedilatildeo de Objetos de Aprendizagem (OAs) usando Vocabulaacuterios Controlados

bull Seleccedilatildeo de termos do DeCS CID-10 SNOMED

ndash via fornecimento de palavras-chave que satildeo pesquisadas na base de conhecimento

ndash via navegaccedilatildeo em uma visatildeo do conhecimento em forma de aacutervore

Seleccedilatildeo via contexto ontoloacutegicoProtoacutetipo (catalogaccedilatildeo com entrada

de palavra-chave)

DSpaceCatalogaccedilatildeo de OAswf

Protoacutetipo (catalogaccedilatildeo com navegaccedilatildeo

na base de conhecimento)

DSpaceRecuperaccedilatildeo de OAswf

21042010

29

Recuperaccedilatildeo de Objetos de Aprendizagem (OAs) Baseada em Conhecimento

bull Vocabulaacuterios e relaccedilotildees semacircnticas

ndash Oriundos do DeCS

ndash Definidos pelos catalogadores de OAs

ndash Gerados pelo cruzamento de informaccedilotildees com o CID-10 (Classificaccedilatildeo Internacional de Doenccedilas)

ndash Ex sinocircnimos eacute um(a) parte de causa efeito sintoma etc

DeCs

Anatomia

Sistema Nervoso

Sistema Nervoso Central

Enceacutefalo

Prosenceacutefalo

Telencaacutefalo

Ceacuterebro

Doenccedilas

Doenccedilas do Sistema Nervoso

Doenccedilas Cardiovasculares

Doenccedilas do Sistema Nervoso Central

Encefalopatias

Transtornos Cerebrovasculares

Doenccedilas Vasculares

Transtornos Cerebrovasculares

Acidente Vascular Cerebral

Acidente Vascular Cerebral

OA 1

OA 2

AVC

IctusCerebral

Derrame Cerebral

Hemisfeacuterios Cerebrais

ApoplexiaAcidente

Cerebrovascular

IctoCerebral

Apoplexia Cerebrovascular

Apoplexia Cerebral

Acidente Vascular

Encefaacutelico

Acidente Vascular

do Ceacuterebro

Acidente Vascular Cerebral

padratildeo (sinocircnimo)

anota

especiacutefica de domiacutenio

anocircnimas (DeCs)

172

DeCs

Anatomia

Sistema Nervoso

Sistema Nervoso Central

Enceacutefalo

Prosenceacutefalo

Telencaacutefalo

Ceacuterebro (2)

Doenccedilas

Doenccedilas do Sistema Nervoso

Doenccedilas Cardiovasculares

Doenccedilas do Sistema Nervoso Central

Encefalopatias

Transtornos Cerebrovasculares

Doenccedilas Vasculares

Transtornos Cerebrovasculares

Acidente Cerebral Vascular (1)

Acidente Cerebral Vascular(1)

OA 1

OA 2

AVC

IctusCerebral

Derrame Cerebral

Hemisfeacuterios Cerebrais

ApoplexiaAcidente

Cerebrovascular

IctoCerebral

Apoplexia Cerebrovascular

Apoplexia Cerebral

Acidente Vascular

Encefaacutelico

Acidente Vascular

do Ceacuterebro

Acidente Vascular Cerebral

Busca de OAs na aacuterea de sauacutede usando conhecimento de domiacutenio

Semantic Learning Objects (VIAN J SILVEIRA R A FILETO R WCCE 2009)

21042010

30

Conclusotildees

A Web semacircntica tem potencial de contribuir naobtenccedilatildeo de melhores resultados para buscas

Suporte automatizado eacute fundamental para a construccedilatildeo evoluccedilatildeo e integraccedilatildeo de ontologias anotaccedilotildees semacircnticas e contextos de usuaacuterios

Nossos primeiros resultados focam na captura e utilizaccedilatildeo de contextos de usuaacuterios mapeados a ontologias de domiacutenios especiacuteficos paradesambiguar e estender as buscas

Trabalhos futuros

Processos parcialmente automatizados para geraccedilatildeo e atualizaccedilatildeo de ontologias e anotaccedilotildees semacircnticas

Experimentos para comprovar a eficaacutecia das teacutecnicas e ferramentas utilizadas

Validaccedilatildeo de soluccedilotildees de problemas de busca semacircntica em diversos domiacutenios de aplicaccedilatildeo

Determinaccedilatildeo de niacuteveis adequados de acoplamento entre contextos e ontologias e dessas com os recursos a serem recuperados

Notiacutecias e anaacutelises

httpnewscnetcomnew-search-engine-cuil-takes-aim-at-google

httpwwwreadwritewebcomarchivesis_google_a_semantic_search_enginephp

httpwwwreadwritewebcomarchivessemantic_search_the_myt

h_and_realityphp

httpwwwpandiacomsew1262-top-5-semantic-search-

engineshtml

httpmindsetresearchyahoocom

httpnewscnetcom8301-13953_3-9982015-80html

httpwwwsearchenginejournalcomaskcom-focuses-on-semantic-search8252

httpnewsbbccouk2hiprogrammesclick_onlinedefaultstm

httpnewsbbccouk2hiprogrammesclick_online8144765stm

Web semacircntica e buscassemacircnticas

httpwwww3org2001sw

httpsemanticweborg

httpenwikipediaorgwikiSemantic_Web

httpenwikipediaorgwikiSemantic_search

Ferramentas de desenvolvimento

httpprotegestanfordedu

httpjenasourceforgenet

httpwwww3org2001Annotea

httpwwwontotextcomkim

httpesww3orgtopicSemanticWebTools

httpwwwdamlorg200305swmu-tools-

tutorialOverviewhtml

Referecircncias em Web semacircntica

T Berners-Lee J Hendler e O Lassila The Semantic Web Scientific American May 2001

Thomas B Passing Explores Guide to the Semantic Web Manning Publications Greenwich CT 2005

Davies J Studer R Warren P (Eds) Semantic Web Technologies trends and research in ontology-based

Systems John Wiley amp Sons 2006

Breitman KK Casanova MA Truszkowski W Semantic Web

Concepts Technologies and Applications Series NASA Monographs in Systems and Software Engineering Springer 2007

Grigoris Antoniou and Frank van Harmelen A Semantic Web Primer 2nd edition The MIT Press Cambridge MA USA 2008

Kashyap V Bussler C Moran M The Semantic Web -Semantics for Data and Services on the Web Series Data-

Centric Systems and Applications Springer 2008

Hitzler P Krotzsch M Rudolph S Foundations of SemanticWeb Technologies Chapman amp HallCRC 2009

21042010

31

Referecircncias em buscas semacircnticas

Guha R McCool R and Miller E 2003 Semantic search In Proc of the 12th international Conference on World Wide Web

(WWW) Budapest Hungary ACM New York NY 2003 700-709

Reeve L and Han H 2005 Survey of semantic annotation

platforms In Proceedings of the ACM Symposium on Applied Computing Santa Fe New Mexico ACM New York NY 2005

1634-1638

Eetu Makela Survey of Semantic Search Research

Mangold C A Survey and classification of semantic search approaches Journal of Metadata Semantics and Ontology 2(1)

2007

Stephan Bloehdorn Philipp Cimiano Alistair Duke Peter Haase Joumlrg Heizmann Ian Thurlow Johanna Voumllker Ontology-BasedQuestion Answering for Digital Libraries ECDL 2007 14-25

Hai Dong Hussain FK Chang E A survey in semantic search technologies In 2nd IEEE International Conference on

Digital Ecosystems and Technologies 2008 403-408

Algumas referecircncias grupo UFSC

DAgostini C S Fileto R Capturing Users Preferences and Intentions in a Semantic Search System In 21st International

Conference on Software Engineering amp Knowledge Engineering (SEKE) Boston 2009 p 587-591

DAgostini C S Fileto R Dantas M A R Gauthier F A O

Contextual Semantic Search - Capturing using the UsersContext to Direct Semantic Search In 10th InternationalConference on Enterprise Information Systems (ICEIS) Barcelona

Spain 2008 v SAIC p 154-159

DAgostini C S Fileto R Capturing and managing usercontext for improving information retrieval In Workshop de

Teses e Dissertaccedilotildees do Simpoacutesio Brasileiro de Bancos de Dados (WTDBDSBBD) Campinas Unicamp Brazil 2008

Vian J Silveira R A Fileto R Proposal of a Multi-agent System for Indexing and Recovery applied to Learning

Objects In 9th IFIP World Conference on Computers in Education (WCCE) Bento Goncalves Brazil 2009

Alguns projetos na UFSC

httpwwwlisaufscbrprojetos

httpwwwunasusufscbr

httpwwwliteraturabrasileiraufscbr

Perguntas

Page 27: Buscas Semânticasfileto/Talks/BuscasSemanticas6sp.pdf · 21/04/2010 1 1 Buscas semânticas: panorama e tendências atuais minicurso ERBD 2010 RenatoFileto fileto@inf.ufsc.br AlunosColaboradores:

21042010

27

Metas da UnA-SUS

Desenvolver um

plataforma para de

composiccedilatildeo e de

Montar e oferecer cursos para formaccedilatildeo continuada de profissionais da sauacutede

157

Metadados

O processo de produccedilatildeo catalogaccedilatildeo e reuso de OAs

Repositoacuterio

Conteuacutedo

OAs

requisiccedilotildees

Design revisatildeo e publicaccedilatildeo

OA

SGA outros reps

Busca e reuso

OAsMetadados

OAs

Concepccedilatildeo e validaccedilatildeo de OAs

O processo de produccedilatildeo catalogaccedilatildeo e reuso de OAs

OA1

Curso A

Curso B

OA2

OA3

Viacutedeo

Imagens

RepositoacuteriosConteuacutedoMultimiacutedia

SGA RepositoacuteriosOAs

Reuso eacute essencial

bull OAs satildeo caros para produzir

bull Demandas emergenciais na sauacutede puacuteblica exigem agilidade e pronta resposta com cursos para a qualificaccedilatildeo de profissionais

H1N1

Apoplexia

gripe suiacutena gripe A

influenza H1N1

hellip

21042010

28

Navegaccedilatildeo hiperboacutelica no DeCSCatalogaccedilatildeo de Objetos de Aprendizagem (OAs) usando Vocabulaacuterios Controlados

bull Seleccedilatildeo de termos do DeCS CID-10 SNOMED

ndash via fornecimento de palavras-chave que satildeo pesquisadas na base de conhecimento

ndash via navegaccedilatildeo em uma visatildeo do conhecimento em forma de aacutervore

Seleccedilatildeo via contexto ontoloacutegicoProtoacutetipo (catalogaccedilatildeo com entrada

de palavra-chave)

DSpaceCatalogaccedilatildeo de OAswf

Protoacutetipo (catalogaccedilatildeo com navegaccedilatildeo

na base de conhecimento)

DSpaceRecuperaccedilatildeo de OAswf

21042010

29

Recuperaccedilatildeo de Objetos de Aprendizagem (OAs) Baseada em Conhecimento

bull Vocabulaacuterios e relaccedilotildees semacircnticas

ndash Oriundos do DeCS

ndash Definidos pelos catalogadores de OAs

ndash Gerados pelo cruzamento de informaccedilotildees com o CID-10 (Classificaccedilatildeo Internacional de Doenccedilas)

ndash Ex sinocircnimos eacute um(a) parte de causa efeito sintoma etc

DeCs

Anatomia

Sistema Nervoso

Sistema Nervoso Central

Enceacutefalo

Prosenceacutefalo

Telencaacutefalo

Ceacuterebro

Doenccedilas

Doenccedilas do Sistema Nervoso

Doenccedilas Cardiovasculares

Doenccedilas do Sistema Nervoso Central

Encefalopatias

Transtornos Cerebrovasculares

Doenccedilas Vasculares

Transtornos Cerebrovasculares

Acidente Vascular Cerebral

Acidente Vascular Cerebral

OA 1

OA 2

AVC

IctusCerebral

Derrame Cerebral

Hemisfeacuterios Cerebrais

ApoplexiaAcidente

Cerebrovascular

IctoCerebral

Apoplexia Cerebrovascular

Apoplexia Cerebral

Acidente Vascular

Encefaacutelico

Acidente Vascular

do Ceacuterebro

Acidente Vascular Cerebral

padratildeo (sinocircnimo)

anota

especiacutefica de domiacutenio

anocircnimas (DeCs)

172

DeCs

Anatomia

Sistema Nervoso

Sistema Nervoso Central

Enceacutefalo

Prosenceacutefalo

Telencaacutefalo

Ceacuterebro (2)

Doenccedilas

Doenccedilas do Sistema Nervoso

Doenccedilas Cardiovasculares

Doenccedilas do Sistema Nervoso Central

Encefalopatias

Transtornos Cerebrovasculares

Doenccedilas Vasculares

Transtornos Cerebrovasculares

Acidente Cerebral Vascular (1)

Acidente Cerebral Vascular(1)

OA 1

OA 2

AVC

IctusCerebral

Derrame Cerebral

Hemisfeacuterios Cerebrais

ApoplexiaAcidente

Cerebrovascular

IctoCerebral

Apoplexia Cerebrovascular

Apoplexia Cerebral

Acidente Vascular

Encefaacutelico

Acidente Vascular

do Ceacuterebro

Acidente Vascular Cerebral

Busca de OAs na aacuterea de sauacutede usando conhecimento de domiacutenio

Semantic Learning Objects (VIAN J SILVEIRA R A FILETO R WCCE 2009)

21042010

30

Conclusotildees

A Web semacircntica tem potencial de contribuir naobtenccedilatildeo de melhores resultados para buscas

Suporte automatizado eacute fundamental para a construccedilatildeo evoluccedilatildeo e integraccedilatildeo de ontologias anotaccedilotildees semacircnticas e contextos de usuaacuterios

Nossos primeiros resultados focam na captura e utilizaccedilatildeo de contextos de usuaacuterios mapeados a ontologias de domiacutenios especiacuteficos paradesambiguar e estender as buscas

Trabalhos futuros

Processos parcialmente automatizados para geraccedilatildeo e atualizaccedilatildeo de ontologias e anotaccedilotildees semacircnticas

Experimentos para comprovar a eficaacutecia das teacutecnicas e ferramentas utilizadas

Validaccedilatildeo de soluccedilotildees de problemas de busca semacircntica em diversos domiacutenios de aplicaccedilatildeo

Determinaccedilatildeo de niacuteveis adequados de acoplamento entre contextos e ontologias e dessas com os recursos a serem recuperados

Notiacutecias e anaacutelises

httpnewscnetcomnew-search-engine-cuil-takes-aim-at-google

httpwwwreadwritewebcomarchivesis_google_a_semantic_search_enginephp

httpwwwreadwritewebcomarchivessemantic_search_the_myt

h_and_realityphp

httpwwwpandiacomsew1262-top-5-semantic-search-

engineshtml

httpmindsetresearchyahoocom

httpnewscnetcom8301-13953_3-9982015-80html

httpwwwsearchenginejournalcomaskcom-focuses-on-semantic-search8252

httpnewsbbccouk2hiprogrammesclick_onlinedefaultstm

httpnewsbbccouk2hiprogrammesclick_online8144765stm

Web semacircntica e buscassemacircnticas

httpwwww3org2001sw

httpsemanticweborg

httpenwikipediaorgwikiSemantic_Web

httpenwikipediaorgwikiSemantic_search

Ferramentas de desenvolvimento

httpprotegestanfordedu

httpjenasourceforgenet

httpwwww3org2001Annotea

httpwwwontotextcomkim

httpesww3orgtopicSemanticWebTools

httpwwwdamlorg200305swmu-tools-

tutorialOverviewhtml

Referecircncias em Web semacircntica

T Berners-Lee J Hendler e O Lassila The Semantic Web Scientific American May 2001

Thomas B Passing Explores Guide to the Semantic Web Manning Publications Greenwich CT 2005

Davies J Studer R Warren P (Eds) Semantic Web Technologies trends and research in ontology-based

Systems John Wiley amp Sons 2006

Breitman KK Casanova MA Truszkowski W Semantic Web

Concepts Technologies and Applications Series NASA Monographs in Systems and Software Engineering Springer 2007

Grigoris Antoniou and Frank van Harmelen A Semantic Web Primer 2nd edition The MIT Press Cambridge MA USA 2008

Kashyap V Bussler C Moran M The Semantic Web -Semantics for Data and Services on the Web Series Data-

Centric Systems and Applications Springer 2008

Hitzler P Krotzsch M Rudolph S Foundations of SemanticWeb Technologies Chapman amp HallCRC 2009

21042010

31

Referecircncias em buscas semacircnticas

Guha R McCool R and Miller E 2003 Semantic search In Proc of the 12th international Conference on World Wide Web

(WWW) Budapest Hungary ACM New York NY 2003 700-709

Reeve L and Han H 2005 Survey of semantic annotation

platforms In Proceedings of the ACM Symposium on Applied Computing Santa Fe New Mexico ACM New York NY 2005

1634-1638

Eetu Makela Survey of Semantic Search Research

Mangold C A Survey and classification of semantic search approaches Journal of Metadata Semantics and Ontology 2(1)

2007

Stephan Bloehdorn Philipp Cimiano Alistair Duke Peter Haase Joumlrg Heizmann Ian Thurlow Johanna Voumllker Ontology-BasedQuestion Answering for Digital Libraries ECDL 2007 14-25

Hai Dong Hussain FK Chang E A survey in semantic search technologies In 2nd IEEE International Conference on

Digital Ecosystems and Technologies 2008 403-408

Algumas referecircncias grupo UFSC

DAgostini C S Fileto R Capturing Users Preferences and Intentions in a Semantic Search System In 21st International

Conference on Software Engineering amp Knowledge Engineering (SEKE) Boston 2009 p 587-591

DAgostini C S Fileto R Dantas M A R Gauthier F A O

Contextual Semantic Search - Capturing using the UsersContext to Direct Semantic Search In 10th InternationalConference on Enterprise Information Systems (ICEIS) Barcelona

Spain 2008 v SAIC p 154-159

DAgostini C S Fileto R Capturing and managing usercontext for improving information retrieval In Workshop de

Teses e Dissertaccedilotildees do Simpoacutesio Brasileiro de Bancos de Dados (WTDBDSBBD) Campinas Unicamp Brazil 2008

Vian J Silveira R A Fileto R Proposal of a Multi-agent System for Indexing and Recovery applied to Learning

Objects In 9th IFIP World Conference on Computers in Education (WCCE) Bento Goncalves Brazil 2009

Alguns projetos na UFSC

httpwwwlisaufscbrprojetos

httpwwwunasusufscbr

httpwwwliteraturabrasileiraufscbr

Perguntas

Page 28: Buscas Semânticasfileto/Talks/BuscasSemanticas6sp.pdf · 21/04/2010 1 1 Buscas semânticas: panorama e tendências atuais minicurso ERBD 2010 RenatoFileto fileto@inf.ufsc.br AlunosColaboradores:

21042010

28

Navegaccedilatildeo hiperboacutelica no DeCSCatalogaccedilatildeo de Objetos de Aprendizagem (OAs) usando Vocabulaacuterios Controlados

bull Seleccedilatildeo de termos do DeCS CID-10 SNOMED

ndash via fornecimento de palavras-chave que satildeo pesquisadas na base de conhecimento

ndash via navegaccedilatildeo em uma visatildeo do conhecimento em forma de aacutervore

Seleccedilatildeo via contexto ontoloacutegicoProtoacutetipo (catalogaccedilatildeo com entrada

de palavra-chave)

DSpaceCatalogaccedilatildeo de OAswf

Protoacutetipo (catalogaccedilatildeo com navegaccedilatildeo

na base de conhecimento)

DSpaceRecuperaccedilatildeo de OAswf

21042010

29

Recuperaccedilatildeo de Objetos de Aprendizagem (OAs) Baseada em Conhecimento

bull Vocabulaacuterios e relaccedilotildees semacircnticas

ndash Oriundos do DeCS

ndash Definidos pelos catalogadores de OAs

ndash Gerados pelo cruzamento de informaccedilotildees com o CID-10 (Classificaccedilatildeo Internacional de Doenccedilas)

ndash Ex sinocircnimos eacute um(a) parte de causa efeito sintoma etc

DeCs

Anatomia

Sistema Nervoso

Sistema Nervoso Central

Enceacutefalo

Prosenceacutefalo

Telencaacutefalo

Ceacuterebro

Doenccedilas

Doenccedilas do Sistema Nervoso

Doenccedilas Cardiovasculares

Doenccedilas do Sistema Nervoso Central

Encefalopatias

Transtornos Cerebrovasculares

Doenccedilas Vasculares

Transtornos Cerebrovasculares

Acidente Vascular Cerebral

Acidente Vascular Cerebral

OA 1

OA 2

AVC

IctusCerebral

Derrame Cerebral

Hemisfeacuterios Cerebrais

ApoplexiaAcidente

Cerebrovascular

IctoCerebral

Apoplexia Cerebrovascular

Apoplexia Cerebral

Acidente Vascular

Encefaacutelico

Acidente Vascular

do Ceacuterebro

Acidente Vascular Cerebral

padratildeo (sinocircnimo)

anota

especiacutefica de domiacutenio

anocircnimas (DeCs)

172

DeCs

Anatomia

Sistema Nervoso

Sistema Nervoso Central

Enceacutefalo

Prosenceacutefalo

Telencaacutefalo

Ceacuterebro (2)

Doenccedilas

Doenccedilas do Sistema Nervoso

Doenccedilas Cardiovasculares

Doenccedilas do Sistema Nervoso Central

Encefalopatias

Transtornos Cerebrovasculares

Doenccedilas Vasculares

Transtornos Cerebrovasculares

Acidente Cerebral Vascular (1)

Acidente Cerebral Vascular(1)

OA 1

OA 2

AVC

IctusCerebral

Derrame Cerebral

Hemisfeacuterios Cerebrais

ApoplexiaAcidente

Cerebrovascular

IctoCerebral

Apoplexia Cerebrovascular

Apoplexia Cerebral

Acidente Vascular

Encefaacutelico

Acidente Vascular

do Ceacuterebro

Acidente Vascular Cerebral

Busca de OAs na aacuterea de sauacutede usando conhecimento de domiacutenio

Semantic Learning Objects (VIAN J SILVEIRA R A FILETO R WCCE 2009)

21042010

30

Conclusotildees

A Web semacircntica tem potencial de contribuir naobtenccedilatildeo de melhores resultados para buscas

Suporte automatizado eacute fundamental para a construccedilatildeo evoluccedilatildeo e integraccedilatildeo de ontologias anotaccedilotildees semacircnticas e contextos de usuaacuterios

Nossos primeiros resultados focam na captura e utilizaccedilatildeo de contextos de usuaacuterios mapeados a ontologias de domiacutenios especiacuteficos paradesambiguar e estender as buscas

Trabalhos futuros

Processos parcialmente automatizados para geraccedilatildeo e atualizaccedilatildeo de ontologias e anotaccedilotildees semacircnticas

Experimentos para comprovar a eficaacutecia das teacutecnicas e ferramentas utilizadas

Validaccedilatildeo de soluccedilotildees de problemas de busca semacircntica em diversos domiacutenios de aplicaccedilatildeo

Determinaccedilatildeo de niacuteveis adequados de acoplamento entre contextos e ontologias e dessas com os recursos a serem recuperados

Notiacutecias e anaacutelises

httpnewscnetcomnew-search-engine-cuil-takes-aim-at-google

httpwwwreadwritewebcomarchivesis_google_a_semantic_search_enginephp

httpwwwreadwritewebcomarchivessemantic_search_the_myt

h_and_realityphp

httpwwwpandiacomsew1262-top-5-semantic-search-

engineshtml

httpmindsetresearchyahoocom

httpnewscnetcom8301-13953_3-9982015-80html

httpwwwsearchenginejournalcomaskcom-focuses-on-semantic-search8252

httpnewsbbccouk2hiprogrammesclick_onlinedefaultstm

httpnewsbbccouk2hiprogrammesclick_online8144765stm

Web semacircntica e buscassemacircnticas

httpwwww3org2001sw

httpsemanticweborg

httpenwikipediaorgwikiSemantic_Web

httpenwikipediaorgwikiSemantic_search

Ferramentas de desenvolvimento

httpprotegestanfordedu

httpjenasourceforgenet

httpwwww3org2001Annotea

httpwwwontotextcomkim

httpesww3orgtopicSemanticWebTools

httpwwwdamlorg200305swmu-tools-

tutorialOverviewhtml

Referecircncias em Web semacircntica

T Berners-Lee J Hendler e O Lassila The Semantic Web Scientific American May 2001

Thomas B Passing Explores Guide to the Semantic Web Manning Publications Greenwich CT 2005

Davies J Studer R Warren P (Eds) Semantic Web Technologies trends and research in ontology-based

Systems John Wiley amp Sons 2006

Breitman KK Casanova MA Truszkowski W Semantic Web

Concepts Technologies and Applications Series NASA Monographs in Systems and Software Engineering Springer 2007

Grigoris Antoniou and Frank van Harmelen A Semantic Web Primer 2nd edition The MIT Press Cambridge MA USA 2008

Kashyap V Bussler C Moran M The Semantic Web -Semantics for Data and Services on the Web Series Data-

Centric Systems and Applications Springer 2008

Hitzler P Krotzsch M Rudolph S Foundations of SemanticWeb Technologies Chapman amp HallCRC 2009

21042010

31

Referecircncias em buscas semacircnticas

Guha R McCool R and Miller E 2003 Semantic search In Proc of the 12th international Conference on World Wide Web

(WWW) Budapest Hungary ACM New York NY 2003 700-709

Reeve L and Han H 2005 Survey of semantic annotation

platforms In Proceedings of the ACM Symposium on Applied Computing Santa Fe New Mexico ACM New York NY 2005

1634-1638

Eetu Makela Survey of Semantic Search Research

Mangold C A Survey and classification of semantic search approaches Journal of Metadata Semantics and Ontology 2(1)

2007

Stephan Bloehdorn Philipp Cimiano Alistair Duke Peter Haase Joumlrg Heizmann Ian Thurlow Johanna Voumllker Ontology-BasedQuestion Answering for Digital Libraries ECDL 2007 14-25

Hai Dong Hussain FK Chang E A survey in semantic search technologies In 2nd IEEE International Conference on

Digital Ecosystems and Technologies 2008 403-408

Algumas referecircncias grupo UFSC

DAgostini C S Fileto R Capturing Users Preferences and Intentions in a Semantic Search System In 21st International

Conference on Software Engineering amp Knowledge Engineering (SEKE) Boston 2009 p 587-591

DAgostini C S Fileto R Dantas M A R Gauthier F A O

Contextual Semantic Search - Capturing using the UsersContext to Direct Semantic Search In 10th InternationalConference on Enterprise Information Systems (ICEIS) Barcelona

Spain 2008 v SAIC p 154-159

DAgostini C S Fileto R Capturing and managing usercontext for improving information retrieval In Workshop de

Teses e Dissertaccedilotildees do Simpoacutesio Brasileiro de Bancos de Dados (WTDBDSBBD) Campinas Unicamp Brazil 2008

Vian J Silveira R A Fileto R Proposal of a Multi-agent System for Indexing and Recovery applied to Learning

Objects In 9th IFIP World Conference on Computers in Education (WCCE) Bento Goncalves Brazil 2009

Alguns projetos na UFSC

httpwwwlisaufscbrprojetos

httpwwwunasusufscbr

httpwwwliteraturabrasileiraufscbr

Perguntas

Page 29: Buscas Semânticasfileto/Talks/BuscasSemanticas6sp.pdf · 21/04/2010 1 1 Buscas semânticas: panorama e tendências atuais minicurso ERBD 2010 RenatoFileto fileto@inf.ufsc.br AlunosColaboradores:

21042010

29

Recuperaccedilatildeo de Objetos de Aprendizagem (OAs) Baseada em Conhecimento

bull Vocabulaacuterios e relaccedilotildees semacircnticas

ndash Oriundos do DeCS

ndash Definidos pelos catalogadores de OAs

ndash Gerados pelo cruzamento de informaccedilotildees com o CID-10 (Classificaccedilatildeo Internacional de Doenccedilas)

ndash Ex sinocircnimos eacute um(a) parte de causa efeito sintoma etc

DeCs

Anatomia

Sistema Nervoso

Sistema Nervoso Central

Enceacutefalo

Prosenceacutefalo

Telencaacutefalo

Ceacuterebro

Doenccedilas

Doenccedilas do Sistema Nervoso

Doenccedilas Cardiovasculares

Doenccedilas do Sistema Nervoso Central

Encefalopatias

Transtornos Cerebrovasculares

Doenccedilas Vasculares

Transtornos Cerebrovasculares

Acidente Vascular Cerebral

Acidente Vascular Cerebral

OA 1

OA 2

AVC

IctusCerebral

Derrame Cerebral

Hemisfeacuterios Cerebrais

ApoplexiaAcidente

Cerebrovascular

IctoCerebral

Apoplexia Cerebrovascular

Apoplexia Cerebral

Acidente Vascular

Encefaacutelico

Acidente Vascular

do Ceacuterebro

Acidente Vascular Cerebral

padratildeo (sinocircnimo)

anota

especiacutefica de domiacutenio

anocircnimas (DeCs)

172

DeCs

Anatomia

Sistema Nervoso

Sistema Nervoso Central

Enceacutefalo

Prosenceacutefalo

Telencaacutefalo

Ceacuterebro (2)

Doenccedilas

Doenccedilas do Sistema Nervoso

Doenccedilas Cardiovasculares

Doenccedilas do Sistema Nervoso Central

Encefalopatias

Transtornos Cerebrovasculares

Doenccedilas Vasculares

Transtornos Cerebrovasculares

Acidente Cerebral Vascular (1)

Acidente Cerebral Vascular(1)

OA 1

OA 2

AVC

IctusCerebral

Derrame Cerebral

Hemisfeacuterios Cerebrais

ApoplexiaAcidente

Cerebrovascular

IctoCerebral

Apoplexia Cerebrovascular

Apoplexia Cerebral

Acidente Vascular

Encefaacutelico

Acidente Vascular

do Ceacuterebro

Acidente Vascular Cerebral

Busca de OAs na aacuterea de sauacutede usando conhecimento de domiacutenio

Semantic Learning Objects (VIAN J SILVEIRA R A FILETO R WCCE 2009)

21042010

30

Conclusotildees

A Web semacircntica tem potencial de contribuir naobtenccedilatildeo de melhores resultados para buscas

Suporte automatizado eacute fundamental para a construccedilatildeo evoluccedilatildeo e integraccedilatildeo de ontologias anotaccedilotildees semacircnticas e contextos de usuaacuterios

Nossos primeiros resultados focam na captura e utilizaccedilatildeo de contextos de usuaacuterios mapeados a ontologias de domiacutenios especiacuteficos paradesambiguar e estender as buscas

Trabalhos futuros

Processos parcialmente automatizados para geraccedilatildeo e atualizaccedilatildeo de ontologias e anotaccedilotildees semacircnticas

Experimentos para comprovar a eficaacutecia das teacutecnicas e ferramentas utilizadas

Validaccedilatildeo de soluccedilotildees de problemas de busca semacircntica em diversos domiacutenios de aplicaccedilatildeo

Determinaccedilatildeo de niacuteveis adequados de acoplamento entre contextos e ontologias e dessas com os recursos a serem recuperados

Notiacutecias e anaacutelises

httpnewscnetcomnew-search-engine-cuil-takes-aim-at-google

httpwwwreadwritewebcomarchivesis_google_a_semantic_search_enginephp

httpwwwreadwritewebcomarchivessemantic_search_the_myt

h_and_realityphp

httpwwwpandiacomsew1262-top-5-semantic-search-

engineshtml

httpmindsetresearchyahoocom

httpnewscnetcom8301-13953_3-9982015-80html

httpwwwsearchenginejournalcomaskcom-focuses-on-semantic-search8252

httpnewsbbccouk2hiprogrammesclick_onlinedefaultstm

httpnewsbbccouk2hiprogrammesclick_online8144765stm

Web semacircntica e buscassemacircnticas

httpwwww3org2001sw

httpsemanticweborg

httpenwikipediaorgwikiSemantic_Web

httpenwikipediaorgwikiSemantic_search

Ferramentas de desenvolvimento

httpprotegestanfordedu

httpjenasourceforgenet

httpwwww3org2001Annotea

httpwwwontotextcomkim

httpesww3orgtopicSemanticWebTools

httpwwwdamlorg200305swmu-tools-

tutorialOverviewhtml

Referecircncias em Web semacircntica

T Berners-Lee J Hendler e O Lassila The Semantic Web Scientific American May 2001

Thomas B Passing Explores Guide to the Semantic Web Manning Publications Greenwich CT 2005

Davies J Studer R Warren P (Eds) Semantic Web Technologies trends and research in ontology-based

Systems John Wiley amp Sons 2006

Breitman KK Casanova MA Truszkowski W Semantic Web

Concepts Technologies and Applications Series NASA Monographs in Systems and Software Engineering Springer 2007

Grigoris Antoniou and Frank van Harmelen A Semantic Web Primer 2nd edition The MIT Press Cambridge MA USA 2008

Kashyap V Bussler C Moran M The Semantic Web -Semantics for Data and Services on the Web Series Data-

Centric Systems and Applications Springer 2008

Hitzler P Krotzsch M Rudolph S Foundations of SemanticWeb Technologies Chapman amp HallCRC 2009

21042010

31

Referecircncias em buscas semacircnticas

Guha R McCool R and Miller E 2003 Semantic search In Proc of the 12th international Conference on World Wide Web

(WWW) Budapest Hungary ACM New York NY 2003 700-709

Reeve L and Han H 2005 Survey of semantic annotation

platforms In Proceedings of the ACM Symposium on Applied Computing Santa Fe New Mexico ACM New York NY 2005

1634-1638

Eetu Makela Survey of Semantic Search Research

Mangold C A Survey and classification of semantic search approaches Journal of Metadata Semantics and Ontology 2(1)

2007

Stephan Bloehdorn Philipp Cimiano Alistair Duke Peter Haase Joumlrg Heizmann Ian Thurlow Johanna Voumllker Ontology-BasedQuestion Answering for Digital Libraries ECDL 2007 14-25

Hai Dong Hussain FK Chang E A survey in semantic search technologies In 2nd IEEE International Conference on

Digital Ecosystems and Technologies 2008 403-408

Algumas referecircncias grupo UFSC

DAgostini C S Fileto R Capturing Users Preferences and Intentions in a Semantic Search System In 21st International

Conference on Software Engineering amp Knowledge Engineering (SEKE) Boston 2009 p 587-591

DAgostini C S Fileto R Dantas M A R Gauthier F A O

Contextual Semantic Search - Capturing using the UsersContext to Direct Semantic Search In 10th InternationalConference on Enterprise Information Systems (ICEIS) Barcelona

Spain 2008 v SAIC p 154-159

DAgostini C S Fileto R Capturing and managing usercontext for improving information retrieval In Workshop de

Teses e Dissertaccedilotildees do Simpoacutesio Brasileiro de Bancos de Dados (WTDBDSBBD) Campinas Unicamp Brazil 2008

Vian J Silveira R A Fileto R Proposal of a Multi-agent System for Indexing and Recovery applied to Learning

Objects In 9th IFIP World Conference on Computers in Education (WCCE) Bento Goncalves Brazil 2009

Alguns projetos na UFSC

httpwwwlisaufscbrprojetos

httpwwwunasusufscbr

httpwwwliteraturabrasileiraufscbr

Perguntas

Page 30: Buscas Semânticasfileto/Talks/BuscasSemanticas6sp.pdf · 21/04/2010 1 1 Buscas semânticas: panorama e tendências atuais minicurso ERBD 2010 RenatoFileto fileto@inf.ufsc.br AlunosColaboradores:

21042010

30

Conclusotildees

A Web semacircntica tem potencial de contribuir naobtenccedilatildeo de melhores resultados para buscas

Suporte automatizado eacute fundamental para a construccedilatildeo evoluccedilatildeo e integraccedilatildeo de ontologias anotaccedilotildees semacircnticas e contextos de usuaacuterios

Nossos primeiros resultados focam na captura e utilizaccedilatildeo de contextos de usuaacuterios mapeados a ontologias de domiacutenios especiacuteficos paradesambiguar e estender as buscas

Trabalhos futuros

Processos parcialmente automatizados para geraccedilatildeo e atualizaccedilatildeo de ontologias e anotaccedilotildees semacircnticas

Experimentos para comprovar a eficaacutecia das teacutecnicas e ferramentas utilizadas

Validaccedilatildeo de soluccedilotildees de problemas de busca semacircntica em diversos domiacutenios de aplicaccedilatildeo

Determinaccedilatildeo de niacuteveis adequados de acoplamento entre contextos e ontologias e dessas com os recursos a serem recuperados

Notiacutecias e anaacutelises

httpnewscnetcomnew-search-engine-cuil-takes-aim-at-google

httpwwwreadwritewebcomarchivesis_google_a_semantic_search_enginephp

httpwwwreadwritewebcomarchivessemantic_search_the_myt

h_and_realityphp

httpwwwpandiacomsew1262-top-5-semantic-search-

engineshtml

httpmindsetresearchyahoocom

httpnewscnetcom8301-13953_3-9982015-80html

httpwwwsearchenginejournalcomaskcom-focuses-on-semantic-search8252

httpnewsbbccouk2hiprogrammesclick_onlinedefaultstm

httpnewsbbccouk2hiprogrammesclick_online8144765stm

Web semacircntica e buscassemacircnticas

httpwwww3org2001sw

httpsemanticweborg

httpenwikipediaorgwikiSemantic_Web

httpenwikipediaorgwikiSemantic_search

Ferramentas de desenvolvimento

httpprotegestanfordedu

httpjenasourceforgenet

httpwwww3org2001Annotea

httpwwwontotextcomkim

httpesww3orgtopicSemanticWebTools

httpwwwdamlorg200305swmu-tools-

tutorialOverviewhtml

Referecircncias em Web semacircntica

T Berners-Lee J Hendler e O Lassila The Semantic Web Scientific American May 2001

Thomas B Passing Explores Guide to the Semantic Web Manning Publications Greenwich CT 2005

Davies J Studer R Warren P (Eds) Semantic Web Technologies trends and research in ontology-based

Systems John Wiley amp Sons 2006

Breitman KK Casanova MA Truszkowski W Semantic Web

Concepts Technologies and Applications Series NASA Monographs in Systems and Software Engineering Springer 2007

Grigoris Antoniou and Frank van Harmelen A Semantic Web Primer 2nd edition The MIT Press Cambridge MA USA 2008

Kashyap V Bussler C Moran M The Semantic Web -Semantics for Data and Services on the Web Series Data-

Centric Systems and Applications Springer 2008

Hitzler P Krotzsch M Rudolph S Foundations of SemanticWeb Technologies Chapman amp HallCRC 2009

21042010

31

Referecircncias em buscas semacircnticas

Guha R McCool R and Miller E 2003 Semantic search In Proc of the 12th international Conference on World Wide Web

(WWW) Budapest Hungary ACM New York NY 2003 700-709

Reeve L and Han H 2005 Survey of semantic annotation

platforms In Proceedings of the ACM Symposium on Applied Computing Santa Fe New Mexico ACM New York NY 2005

1634-1638

Eetu Makela Survey of Semantic Search Research

Mangold C A Survey and classification of semantic search approaches Journal of Metadata Semantics and Ontology 2(1)

2007

Stephan Bloehdorn Philipp Cimiano Alistair Duke Peter Haase Joumlrg Heizmann Ian Thurlow Johanna Voumllker Ontology-BasedQuestion Answering for Digital Libraries ECDL 2007 14-25

Hai Dong Hussain FK Chang E A survey in semantic search technologies In 2nd IEEE International Conference on

Digital Ecosystems and Technologies 2008 403-408

Algumas referecircncias grupo UFSC

DAgostini C S Fileto R Capturing Users Preferences and Intentions in a Semantic Search System In 21st International

Conference on Software Engineering amp Knowledge Engineering (SEKE) Boston 2009 p 587-591

DAgostini C S Fileto R Dantas M A R Gauthier F A O

Contextual Semantic Search - Capturing using the UsersContext to Direct Semantic Search In 10th InternationalConference on Enterprise Information Systems (ICEIS) Barcelona

Spain 2008 v SAIC p 154-159

DAgostini C S Fileto R Capturing and managing usercontext for improving information retrieval In Workshop de

Teses e Dissertaccedilotildees do Simpoacutesio Brasileiro de Bancos de Dados (WTDBDSBBD) Campinas Unicamp Brazil 2008

Vian J Silveira R A Fileto R Proposal of a Multi-agent System for Indexing and Recovery applied to Learning

Objects In 9th IFIP World Conference on Computers in Education (WCCE) Bento Goncalves Brazil 2009

Alguns projetos na UFSC

httpwwwlisaufscbrprojetos

httpwwwunasusufscbr

httpwwwliteraturabrasileiraufscbr

Perguntas

Page 31: Buscas Semânticasfileto/Talks/BuscasSemanticas6sp.pdf · 21/04/2010 1 1 Buscas semânticas: panorama e tendências atuais minicurso ERBD 2010 RenatoFileto fileto@inf.ufsc.br AlunosColaboradores:

21042010

31

Referecircncias em buscas semacircnticas

Guha R McCool R and Miller E 2003 Semantic search In Proc of the 12th international Conference on World Wide Web

(WWW) Budapest Hungary ACM New York NY 2003 700-709

Reeve L and Han H 2005 Survey of semantic annotation

platforms In Proceedings of the ACM Symposium on Applied Computing Santa Fe New Mexico ACM New York NY 2005

1634-1638

Eetu Makela Survey of Semantic Search Research

Mangold C A Survey and classification of semantic search approaches Journal of Metadata Semantics and Ontology 2(1)

2007

Stephan Bloehdorn Philipp Cimiano Alistair Duke Peter Haase Joumlrg Heizmann Ian Thurlow Johanna Voumllker Ontology-BasedQuestion Answering for Digital Libraries ECDL 2007 14-25

Hai Dong Hussain FK Chang E A survey in semantic search technologies In 2nd IEEE International Conference on

Digital Ecosystems and Technologies 2008 403-408

Algumas referecircncias grupo UFSC

DAgostini C S Fileto R Capturing Users Preferences and Intentions in a Semantic Search System In 21st International

Conference on Software Engineering amp Knowledge Engineering (SEKE) Boston 2009 p 587-591

DAgostini C S Fileto R Dantas M A R Gauthier F A O

Contextual Semantic Search - Capturing using the UsersContext to Direct Semantic Search In 10th InternationalConference on Enterprise Information Systems (ICEIS) Barcelona

Spain 2008 v SAIC p 154-159

DAgostini C S Fileto R Capturing and managing usercontext for improving information retrieval In Workshop de

Teses e Dissertaccedilotildees do Simpoacutesio Brasileiro de Bancos de Dados (WTDBDSBBD) Campinas Unicamp Brazil 2008

Vian J Silveira R A Fileto R Proposal of a Multi-agent System for Indexing and Recovery applied to Learning

Objects In 9th IFIP World Conference on Computers in Education (WCCE) Bento Goncalves Brazil 2009

Alguns projetos na UFSC

httpwwwlisaufscbrprojetos

httpwwwunasusufscbr

httpwwwliteraturabrasileiraufscbr

Perguntas