introducao a web semantica
Post on 06-Dec-2014
10.235 Views
Preview:
DESCRIPTION
TRANSCRIPT
Ely Edison Matosely.matos@ufjf.edu.brAnalista de TI, UFJF
XIX Semana de Informática e Telecomunicações CES/JF - setembro2009
Web SemânticaWeb 3.0
Agenda
Web 1.0? Web 2.0?Qual o problema?
Quais as soluções?Quero saber mais!
Cada linguagem tem sua própria sintaxe e
semântica
Sintaxe estuda a gramática
Semântica estuda o significado
Sintaxe é como você diz
algo
Sintaxe é como você diz
algo
Semântica
é o que algo
significa
Semântica
é o que algo
significasintaxes diferentesmesma semântica
x += yx = x + y
sintaxes diferentesmesma semântica
x += yx = x + y
Sintaxe e semânticaestão relacionadas à
comunicação
Internet
web
documentos
páginas
hyperlinks
Esta é a
Web 1.0
Os autorescomeçaram a usar
Ajax
Então…
As pessoas começaram acompartilharfotos e vídeos
As pessoas começaram ainterargir
criandoredes sociais
As pessoas
começaram a
publicarconteúdo
emblogs
As pessoascomeçaramcontribuir
emwikis
tags e RSS
As pessoas começaram a usar
Esta é a
Web 2.0
Qual o
problema
?
Páginas Web são escritas em
HTML
HTML descreve
estrutura e apresentação
da informaçãoou seja
a sintaxenão a semântica
Uma página HTML
Que informação nós vemos?
Que informaçãoas máquinas vêem?
Se os computadores puderem entender o
significado da informação
...
Eles poderão aprender sobre o que
estamos interessados e nos
ajudar a encontrar o que
realmente queremos
Este é o campo da
WebSemântica
Esta é a
Web 3.0
A Web de hoje é uma Web de documentos
A Web Semântica é uma Web de coisas
ídolo
patrocínio
produto
competição
jogo
localização
Exemplo?
Quais as
soluções
?
Incrementa a World Wide Web Representa a informação da Web de
forma compreensível por máquinas Possibilita…
…buscar com objetivo …percorrer os dados … usar agentes automatizados
WWW Web Semânti
caPágina
sDados
2009: Onde estamos?
Aqui
2009: Onde estamos?As tecnologias da Web Semântica não são uma
ferramenta mágica para descobrir novos remédios (ou para salvar o mundo…)
Ainda há termos confusos e conflitantes no campo da Web Semântica, cada um sendo considerado
“correto”.
Não há grande disponibilidade de pessoas com as habilidades necessárias para projetar e construir
soluções em Web Semântica.
Ainda não existem padrões para temas como privacidade, confiança, probabilidade e outros
elementos da visão da Web Semântica.
A Web Semântica pode nos ajudar
a
Baseado no exemplo apresentado por Ivan Herman
1. Mapear os vários dados em uma representação abstrata de dados
Tornar os dados independentes de sua representação interna…
2. Combinar as representações resultantes3. Fazer consultas no conjunto total
• Consultas que não são possíveis nos data sets individuais
ID Author Title Publisher Year
ISBN0-00-651409-X
id_xyz The Glass Palace id_qpr 2000
ID Name Home page
id_xyz Ghosh, Amitav http://www.amitavghosh.com
ID Publisher Name
City
id_qpr Harper Collins London
Books
Authors
Publishers
A B D E
1 ID Titre Original
2
ISBN0 2020386682 A13 ISBN-0-00-651409-X
3
6 ID Auteur7 ISBN-0-00-651409-X A12
11
12
13
TraducteurLe Palais des miroirs
NomGhosh, AmitavBesse, Christianne
Mesma URI = Mesmo Recurso
Um usuário do data set “F” pode agora perguntar algo
como:
“Qual o título da versão original de Le Palais des mirroirs?”
Esta informação não está no data set “F”...
…mas pode ser recuperada depois da fusão com o data
set “A”!
Nós “sabemos” que a:author e f:auteur são a mesma coisa
Mas a fusão automática não sabe disto!
Vamos acrescentar alguma informação extra aos dados
fundidos:
a:author same as f:auteurAmbos identificam uma Person
Um usuário do data set “F” pode perguntar agora:
“Qual é a homepage do autor de Le Palais des mirroirs?”
A informação não está no data set “F” nem está no data set “A”…
…mas se tornou disponível através:
Da fusão dos data sets “A” e “F”Da adição de 3 declarações
simples de “junção”
Podemos integrar novas informações de outras
fontes em nosso data set
e.g. informação adicional sobre o autor Amitav
Ghosh
Talvez a maior fonte de conhecimento público seja
a Wikipedia
Pode ser, mas de fato, não deveria ser…
O que aconteceu por meios automáticos é feito
diariamente pelos usuários da Web!
A diferença?Um pouco de rigor extra,
para que as máquinas possam fazer isto também
Combinamos diferentes datasets que▪ ...podem ser internos ou estar em algum lugar da Web▪ ...são de formatos diferentes (RDBMS, Excel spreadsheet,
(X)HTML, etc)▪ ...têm diferentes nomes para as mesmas relações
Pudemos combinar os datasets porque algumas URIs são idênticas▪ i.e. o ISBNs no nosso exemplo
Pudemos adicionar algumas informações adicionais simples (a “cola”) para ajudar a fundir os datasets
O resultado? Respostas para perguntas que não poderiam ser feitas antes!
São astecnologias
daWeb
Semânticaque tornam
estaintegração
possível
RDF é
Resource DescriptionFramework
RDF é
O Modelo de Dadosda Web Semântica
RDF identifica as coisas usando URIs
(Uniform Resource Identifiers)
RDF usa declarações simples (Triplas) para descrever as relações
Coisa-Propriedade-Valor
Sujeito-Predicado-Objeto
RDF representação em grafo
“Ely Matos trabalha na UFJF”
“Ely Matos tem o email ely.matos@ufjf.edu.br”
“O campus da UFJF está localizado em Juiz de Fora”
Ely Matos UFJF
trabalhafor
Ely Matos
ely.matos@ufjf.edu.br
temEmail
UFJF
localizadoEmJuiz de Fora
RDF representação em grafoEly
Matos UFJFtrabalha
ely.matos@ufjf.edu.br
temEmaillocalizadoEm
Juiz de Fora
Minas Gerais
moraEm
cidadeDe
SPARQL é
SPARQLProtocol
AndRDF
QueryLanguage
SPARQL é
A linguagem de consulta
da Web Semântica
Por que SPARQL?Obter informação de dados estruturados e semi-estruturados
Explorar dados através da descoberta de relacionamentos desconhecidos
Consultar e pesquisar com uma visão integrada de diferentes fontes de dados
Reunir diferentes aplicações através da transformação de um vocabulário em outro
123
4
Quais automóveis fazem mais de 10Km por litro, têm custo dentro do orçamento do meu departamento e podem ser comprados em uma concessionária localizada até 15 Km de um dos meus empregados?
SELECT ?automobileWHERE { ?automobile a ex:Car ; epa:mpg ?mpg ; ex:dealer ?dealer . ?employee a ex:Employee ; geo:loc ?loc . ?dealer geo:loc ?dealerloc . FILTER(?mpg > 25 && geo:dist(?loc, ?dealerloc) <= 10) .}
Web dashboard SPARQL query
EmployeeDirectory
ERP / BudgetSystem
Web
Dealer 1Dealer 2
Dealer 3
EPA Fuel EfficiencySpreadsheet
SPARQL Query Engine
Exemplo de SPARQLEncontrar todos os países sem litoral com uma
população maior que 15 milhões de habitantes.
PREFIX type: <http://dbpedia.org/class/yago/>PREFIX prop: <http://dbpedia.org/property/> SELECT ?country_name ?population WHERE { ?country a type:LandlockedCountries ; rdfs:label ?country_name ; prop:populationEstimate ?population . FILTER ( ?population > 15000000 && langMatches(lang(?country_name), "EN") ) . }ORDER BY DESC(?population)
Consultando a Wikipedia...(http://dbpedia.org/sparql)
(Alguns) Datasets SPARQL’áveis
Mas...Nada do que vimos
até agora se aproxima da visão a longo prazo da Web Semântica
Do conhecimento explícito para o
inferido
RDFS OWL RIF
Ontologias Vocabulário de termos Novos termos formados a partir dos
existentes A Semântica é formalmente especificada Também registra os relacionamentos entre
termos
RDFS é
RDFSchema
RDF Schema
Vocabulário (definição de termos)e.g. define um relacionamento “dose prescrita”
Schema (definição de tipos)“dose prescrita” relaciona “tratamento” e “dosagem”
Taxonomia (definição de hierarquias)Qualquer “médico” é um “profissional médico”
OWL é
WebOntologyLanguage
OWLIdentidade igual/diferente
“author” e “auteur” são a mesma relaçãodois recursos com o mesmo “ISBN” são o mesmo “book”
Definições de tipo mais expressivasUm “cycle” é um “vehicle” com pelo menos uma
“wheel”Uma “bicycle” é um “cycle” com exatamente duas
“wheels”
Definições de relações mais expressivas“irmãoDe” é uma relação simétricaO valor de “diaDaSemana” deve ser um de “segunda”,
“terça”, “quarta”, “quinta”, “sexta”, “sábado”, “domingo”
O que podemos fazer com OWL?
ConsistênciaHá alguma contradição neste modelo?
ClassificaçãoQuais são os tipos inferidos deste recurso?
CorreçãoHá alguma classe nesta ontologia que não pode ter membros?
RIF é
RulesInterchange
Format
RIFRepresentação padrão para intercâmbio de conjuntos de regras lógicas e de negócio
Regras lógicasUm cliente se torna um cliente "Gold" assim
que suas compras acumuladas durante o ano corrente alcancem $5000
Regras de produçãoPara compras acima de $1000, clientes "Gold"
recebem um desconto de 10% do total da conta
Ontologias públicas reusáveis
Measurement Units Ontology
The Event Ontology
FOAF
Linked Data éUm conjunto de 4 regras simples para
publicação dedados RDF na Web
Desenvolvido por Tim Berners-Lee em 2006
The LOD “cloud”, Maio 2007
The LOD “cloud”, Março 2008
The LOD “cloud”, Setembro 2008
The LOD “cloud”, Março 2009
RDFa é
RDF in attributes
RDFa provê um conjunto de atributos
XHTML que expressam dados
RDF
Exemplo:Alice in Semantic Wonderland
Alice é uma blogger que publica artigos em http://example.com/alice
Ela quer declarar a licença do seu
trabalho
Ela quer especificar o título e o autor de um
artigo,mas estes atributos
não existem em XHTML
Ela pode usar o vocabulárioDublin Core
Ela quer registrar os créditos de Bob
quando ela posta as fotos tiradas por ele
Ela quer mostrar seu nome, email e
telefoneEla pode usar o
vocabulárioFriend-of-a-Friend (FOAF)
Quem está usando RDFa?
STW Thesaurus for Economics
“I have a dream for the Web in which computers become capable of analyzing all the data on the Web”
Tim Berners-Lee, 1999Inventor of the Web
A Web Semântica
EstáRealmente
Acontecendo
HOJE
Quer saber mais
?
www.w3c.org
semanticweb.org
linkeddata.org
rdfa.info
wikipedia.org
LivrosA Semantic Web PrimerGrigoris Antoniou e Frank van HarmelenSegunda Edição
Web SemânticaA Internet do Futuro
Karin BreitmanEditora LTC
Obrigado!
Ely Edison Matosely.matos@ufjf.edu.brAnalista de TI, UFJF
XIX Semana de Informática e Telecomunicações CES/JF - setembro2009
top related