introducao a web semantica

Post on 06-Dec-2014

10.235 Views

Category:

Technology

3 Downloads

Preview:

Click to see full reader

DESCRIPTION

Introduçao à Web Semântica. Semana de Informática do CES (Juiz de Fora/MG/Br), setembro 2009

TRANSCRIPT

Ely Edison Matosely.matos@ufjf.edu.brAnalista de TI, UFJF

XIX Semana de Informática e Telecomunicações CES/JF - setembro2009

Web SemânticaWeb 3.0

Agenda

Web 1.0? Web 2.0?Qual o problema?

Quais as soluções?Quero saber mais!

Cada linguagem tem sua própria sintaxe e

semântica

Sintaxe estuda a gramática

Semântica estuda o significado

Sintaxe é como você diz

algo

Sintaxe é como você diz

algo

Semântica

é o que algo

significa

Semântica

é o que algo

significasintaxes diferentesmesma semântica

x += yx = x + y

sintaxes diferentesmesma semântica

x += yx = x + y

Sintaxe e semânticaestão relacionadas à

comunicação

Internet

web

documentos

páginas

hyperlinks

Esta é a

Web 1.0

Os autorescomeçaram a usar

Ajax

Então…

As pessoas começaram acompartilharfotos e vídeos

As pessoas começaram ainterargir

criandoredes sociais

As pessoas

começaram a

publicarconteúdo

emblogs

As pessoascomeçaramcontribuir

emwikis

tags e RSS

As pessoas começaram a usar

Esta é a

Web 2.0

Qual o

problema

?

Páginas Web são escritas em

HTML

HTML descreve

estrutura e apresentação

da informaçãoou seja

a sintaxenão a semântica

Uma página HTML

Que informação nós vemos?

Que informaçãoas máquinas vêem?

Se os computadores puderem entender o

significado da informação

...

Eles poderão aprender sobre o que

estamos interessados e nos

ajudar a encontrar o que

realmente queremos

Este é o campo da

WebSemântica

Esta é a

Web 3.0

A Web de hoje é uma Web de documentos

A Web Semântica é uma Web de coisas

ídolo

patrocínio

produto

competição

jogo

localização

Exemplo?

Quais as

soluções

?

Incrementa a World Wide Web Representa a informação da Web de

forma compreensível por máquinas Possibilita…

…buscar com objetivo …percorrer os dados … usar agentes automatizados

WWW Web Semânti

caPágina

sDados

2009: Onde estamos?

Aqui

2009: Onde estamos?As tecnologias da Web Semântica não são uma

ferramenta mágica para descobrir novos remédios (ou para salvar o mundo…)

Ainda há termos confusos e conflitantes no campo da Web Semântica, cada um sendo considerado

“correto”.

Não há grande disponibilidade de pessoas com as habilidades necessárias para projetar e construir

soluções em Web Semântica.

Ainda não existem padrões para temas como privacidade, confiança, probabilidade e outros

elementos da visão da Web Semântica.

A Web Semântica pode nos ajudar

a

Baseado no exemplo apresentado por Ivan Herman

1. Mapear os vários dados em uma representação abstrata de dados

Tornar os dados independentes de sua representação interna…

2. Combinar as representações resultantes3. Fazer consultas no conjunto total

• Consultas que não são possíveis nos data sets individuais

ID Author Title Publisher Year

ISBN0-00-651409-X

id_xyz The Glass Palace id_qpr 2000

ID Name Home page

id_xyz Ghosh, Amitav http://www.amitavghosh.com

ID Publisher Name

City

id_qpr Harper Collins London

Books

Authors

Publishers

A B D E

1 ID Titre Original

2

ISBN0 2020386682 A13 ISBN-0-00-651409-X

3

6 ID Auteur7 ISBN-0-00-651409-X A12

11

12

13

TraducteurLe Palais des miroirs

NomGhosh, AmitavBesse, Christianne

Mesma URI = Mesmo Recurso

Um usuário do data set “F” pode agora perguntar algo

como:

“Qual o título da versão original de Le Palais des mirroirs?”

Esta informação não está no data set “F”...

…mas pode ser recuperada depois da fusão com o data

set “A”!

Nós “sabemos” que a:author e f:auteur são a mesma coisa

Mas a fusão automática não sabe disto!

Vamos acrescentar alguma informação extra aos dados

fundidos:

a:author same as f:auteurAmbos identificam uma Person

Um usuário do data set “F” pode perguntar agora:

“Qual é a homepage do autor de Le Palais des mirroirs?”

A informação não está no data set “F” nem está no data set “A”…

…mas se tornou disponível através:

Da fusão dos data sets “A” e “F”Da adição de 3 declarações

simples de “junção”

Podemos integrar novas informações de outras

fontes em nosso data set

e.g. informação adicional sobre o autor Amitav

Ghosh

Talvez a maior fonte de conhecimento público seja

a Wikipedia

Pode ser, mas de fato, não deveria ser…

O que aconteceu por meios automáticos é feito

diariamente pelos usuários da Web!

A diferença?Um pouco de rigor extra,

para que as máquinas possam fazer isto também

Combinamos diferentes datasets que▪ ...podem ser internos ou estar em algum lugar da Web▪ ...são de formatos diferentes (RDBMS, Excel spreadsheet,

(X)HTML, etc)▪ ...têm diferentes nomes para as mesmas relações

Pudemos combinar os datasets porque algumas URIs são idênticas▪ i.e. o ISBNs no nosso exemplo

Pudemos adicionar algumas informações adicionais simples (a “cola”) para ajudar a fundir os datasets

O resultado? Respostas para perguntas que não poderiam ser feitas antes!

São astecnologias

daWeb

Semânticaque tornam

estaintegração

possível

RDF é

Resource DescriptionFramework

RDF é

O Modelo de Dadosda Web Semântica

RDF identifica as coisas usando URIs

(Uniform Resource Identifiers)

RDF usa declarações simples (Triplas) para descrever as relações

Coisa-Propriedade-Valor

Sujeito-Predicado-Objeto

RDF representação em grafo

“Ely Matos trabalha na UFJF”

“Ely Matos tem o email ely.matos@ufjf.edu.br”

“O campus da UFJF está localizado em Juiz de Fora”

Ely Matos UFJF

trabalhafor

Ely Matos

ely.matos@ufjf.edu.br

temEmail

UFJF

localizadoEmJuiz de Fora

RDF representação em grafoEly

Matos UFJFtrabalha

ely.matos@ufjf.edu.br

temEmaillocalizadoEm

Juiz de Fora

Minas Gerais

moraEm

cidadeDe

SPARQL é

SPARQLProtocol

AndRDF

QueryLanguage

SPARQL é

A linguagem de consulta

da Web Semântica

Por que SPARQL?Obter informação de dados estruturados e semi-estruturados

Explorar dados através da descoberta de relacionamentos desconhecidos

Consultar e pesquisar com uma visão integrada de diferentes fontes de dados

Reunir diferentes aplicações através da transformação de um vocabulário em outro

123

4

Quais automóveis fazem mais de 10Km por litro, têm custo dentro do orçamento do meu departamento e podem ser comprados em uma concessionária localizada até 15 Km de um dos meus empregados?

SELECT ?automobileWHERE { ?automobile a ex:Car ; epa:mpg ?mpg ; ex:dealer ?dealer . ?employee a ex:Employee ; geo:loc ?loc . ?dealer geo:loc ?dealerloc . FILTER(?mpg > 25 && geo:dist(?loc, ?dealerloc) <= 10) .}

Web dashboard SPARQL query

EmployeeDirectory

ERP / BudgetSystem

Web

Dealer 1Dealer 2

Dealer 3

EPA Fuel EfficiencySpreadsheet

SPARQL Query Engine

Exemplo de SPARQLEncontrar todos os países sem litoral com uma

população maior que 15 milhões de habitantes.

PREFIX type: <http://dbpedia.org/class/yago/>PREFIX prop: <http://dbpedia.org/property/> SELECT ?country_name ?population WHERE { ?country a type:LandlockedCountries ; rdfs:label ?country_name ; prop:populationEstimate ?population . FILTER ( ?population > 15000000 && langMatches(lang(?country_name), "EN") ) . }ORDER BY DESC(?population)

Consultando a Wikipedia...(http://dbpedia.org/sparql)

(Alguns) Datasets SPARQL’áveis

Mas...Nada do que vimos

até agora se aproxima da visão a longo prazo da Web Semântica

Do conhecimento explícito para o

inferido

RDFS OWL RIF

Ontologias Vocabulário de termos Novos termos formados a partir dos

existentes A Semântica é formalmente especificada Também registra os relacionamentos entre

termos

RDFS é

RDFSchema

RDF Schema

Vocabulário (definição de termos)e.g. define um relacionamento “dose prescrita”

Schema (definição de tipos)“dose prescrita” relaciona “tratamento” e “dosagem”

Taxonomia (definição de hierarquias)Qualquer “médico” é um “profissional médico”

OWL é

WebOntologyLanguage

OWLIdentidade igual/diferente

“author” e “auteur” são a mesma relaçãodois recursos com o mesmo “ISBN” são o mesmo “book”

Definições de tipo mais expressivasUm “cycle” é um “vehicle” com pelo menos uma

“wheel”Uma “bicycle” é um “cycle” com exatamente duas

“wheels”

Definições de relações mais expressivas“irmãoDe” é uma relação simétricaO valor de “diaDaSemana” deve ser um de “segunda”,

“terça”, “quarta”, “quinta”, “sexta”, “sábado”, “domingo”

O que podemos fazer com OWL?

ConsistênciaHá alguma contradição neste modelo?

ClassificaçãoQuais são os tipos inferidos deste recurso?

CorreçãoHá alguma classe nesta ontologia que não pode ter membros?

RIF é

RulesInterchange

Format

RIFRepresentação padrão para intercâmbio de conjuntos de regras lógicas e de negócio

Regras lógicasUm cliente se torna um cliente "Gold" assim

que suas compras acumuladas durante o ano corrente alcancem $5000

Regras de produçãoPara compras acima de $1000, clientes "Gold"

recebem um desconto de 10% do total da conta

Ontologias públicas reusáveis

Measurement Units Ontology

The Event Ontology

FOAF

Linked Data éUm conjunto de 4 regras simples para

publicação dedados RDF na Web

Desenvolvido por Tim Berners-Lee em 2006

The LOD “cloud”, Maio 2007

The LOD “cloud”, Março 2008

The LOD “cloud”, Setembro 2008

The LOD “cloud”, Março 2009

RDFa é

RDF in attributes

RDFa provê um conjunto de atributos

XHTML que expressam dados

RDF

Exemplo:Alice in Semantic Wonderland

Alice é uma blogger que publica artigos em http://example.com/alice

Ela quer declarar a licença do seu

trabalho

Ela quer especificar o título e o autor de um

artigo,mas estes atributos

não existem em XHTML

Ela pode usar o vocabulárioDublin Core

Ela quer registrar os créditos de Bob

quando ela posta as fotos tiradas por ele

Ela quer mostrar seu nome, email e

telefoneEla pode usar o

vocabulárioFriend-of-a-Friend (FOAF)

Quem está usando RDFa?

STW Thesaurus for Economics

“I have a dream for the Web in which computers become capable of analyzing all the data on the Web”

Tim Berners-Lee, 1999Inventor of the Web

A Web Semântica

EstáRealmente

Acontecendo

HOJE

Quer saber mais

?

www.w3c.org

semanticweb.org

linkeddata.org

rdfa.info

wikipedia.org

LivrosA Semantic Web PrimerGrigoris Antoniou e Frank van HarmelenSegunda Edição

Web SemânticaA Internet do Futuro

Karin BreitmanEditora LTC

Obrigado!

Ely Edison Matosely.matos@ufjf.edu.brAnalista de TI, UFJF

XIX Semana de Informática e Telecomunicações CES/JF - setembro2009

top related