microformats e web semântica, transformando seu site para web 3.0 - road show ti senac

Post on 18-Dec-2014

4.752 Views

Category:

Technology

5 Downloads

Preview:

Click to see full reader

DESCRIPTION

Palestra realizada no evento Road Show de TI SENAC nas unidades: - SENAC Ribeirão Preto - SENAC Taubaté - SENAC Rio Claro

TRANSCRIPT

Microformats e Web Semântica, transformando seu site para Web 3.0

Renato Bongiorno

Bem Vindos

Perguntas, idéias, links e o que quiserem - compartilhem:

#roadSemantico

• Web 1.0

• Web 2.0

• Web 3.0 ?

A primeira versão da Web mudou o mundo

Conectou pessoas de qualquer lugar

Abriu portas para novas possibilidades

Formada por documentos

estáticos (HTML)

Formada por documentos com atualizações dinâmicas

Interatividade entre as pessoas e a busca pela informação

ficou mais fácil

Compartilhamento de

idéias de forma dinâmica

Crowdsourcing

Web 1.0 – Revolução tecnológica

Acessibilidade de novos

protocolos

Formatos de documentos (HTML)

Tecnologia cliente/servidor

Web 2.0 - Revolução publicitária

Mecanismo de crescimento

Internautas

Interação e construção de comunidades web

Fenômeno social e

humanístico

Até Fevereiro de 2012 2.795.361 registros

cadastrados só com a categoria .BR

GRÁFICO DA EVOLUÇÃO DO NÚMERO DE DOMÍNIOS .br

Qual será a melhor forma de capturarmos informações relevantes e aproveitarmos melhor esse volume

imenso de informação?

Web Semântica é a forma de funcionamento da web que

visa facilitar a obtenção, classificação e organização das

informações na web, estruturando os documentos para

torná-los legíveis tanto para humanos quanto para

máquinas.

Como assim?!

Legível para máquinas e humanos?!

Tim Berners Lee e o Linking Open Data Community Project definem os objetivos da Web Semântica

como uma forma de compartilhar conteúdos,

ligá-los a outros e efetivamente construir uma

Web de Dados Ligados que abarcam o

globo terrestre.

Como fazer com que os mecanismos de busca localizem os conceitos dos

itens buscados e não somente as palavras chaves?

Metadados!

Metadados! A chave para o sucesso da

Web Semântica! E o que são metadados?

Segundo a International Federation of Library Associations (IFLA):

"Metadados são dados sobre dados. O termo se refere a qualquer informação utilizada para a

identificação, descrição e localização de recursos"

Para o W3C, metadados são definidos como:

"Informações para Web que podem ser compreendidas por máquinas"

Segundo o filósofo e consultor David Weinberger:

"Os dados são o que você procura e os metadados aquilo que você sabe..."

Como adicionar os metadados nas páginas e torná-las semânticas?

XML – O início de tudo....

Em 1989 Berners-Lee e Robert Caila no

CERN – criaram o sistema universal de interconexão de

informação, chamado então a partir de 1990 de

WWW (World Wide Web) – conseqüentemente junto ao HTML

O HTML apresentava duas grandes limitações:

√ Falta de estrutura para a demanda de informações

√ Impossibilidade de validação da informação exigida

Para dar conta dessas limitações, foi criada a linguagem de marcação XML – Extensible Markup Language, oferecendo às aplicações web:

√ Suporte para conexão entre outros documentos

√ Diferenciação entre conteúdo (dados)

e estrutura do documento

Como os dados podem se conectar via web através das linguagens

da Web Semântica?

Língua franca da web permitindo que máquinas possam interagir de

modo significativo.

Representação formal de um grupo de conceitos dentro de um domínio e as relações

entre estes conceitos. (Pollock , Jeffrey t.)

Especificações formais e explícitas de

conceitualizações compartilhadas. (Britman, Karin)

Uma base de conhecimento comum sobre um determinado domínio (assunto) que

permite ligar informações na web de forma categorizada e disponibilizá-la

universalmente. (Renato Bongiorno)

EDUCAÇÃO

› DOCENTE DO SENAC SP › MINISTRA CURSOS WEB

Unidades

Docentes

Cursos

Imagine que a minha página pessoal contendo metadados, se conecte com o vocabulário educacional e

que neste vocabulário tenha disponível as vinculação de: Unidades, Docentes e Cursos

EDUCAÇÃO

› DOCENTE DO SENAC SP › MINISTRA CURSOS WEB

Unidades Docentes Cursos

Docente SENAC Web SP

Veja como a informação

acrescida de semântica

será compreendida na web.

E como relacionar tudo isso?!

XML + Linguagens da

Web Semântica

XML

RDF

RDFa

Microformats

GRDDL

OWL

SPARQL

HTML5

Tenho um site em html/xhtml...como adicionar semântica de forma

prática e rápida?

Microformatos são coleções de formatos para embutir metadados de documentos no interior de suas páginas

Microformatos reutilizam atributos existentes em HTML (ex.: class e title)

Um exemplo de aplicação recorrente de microformatos é na inserção dos metadados em páginas de agenda de eventos e contatos pessoais.

Microformatos trabalham com vocabulários próprios, herdados de vocabulários já existentes e com grande utilização:

hCalendar (vCalendar)

hAtom (ATOM)

hCard (vCard)

Exemplo: Descrição do Evento Road Show TI – Taubaté <div class="vevent" id="hcalendar-Road-Show-TI-SENAC-2012">

<a class="url" href="http://www.sp.senac.br"> <span class="summary">Road Show TI SENAC 2012</span> no <span class="location“>Taubaté</span> <abbr class="dtstart" title="2012-04-26T19:30-03:0000"> Início - 26 de Abril as 19h30 </abbr> <abbr class="dtend" title="2012-04-03T21:00-03:00"> Término - 26 de Abril as 21h30 </abbr> </a> </div>

<div class="description"> Descrição do evento: Informar um comparativo das linguagens RDFa, GRDDL e Microformats para converter as tags em HTML em tags Semânticas. </div>

E como os mecanismos de busca e as demais páginas que contém relações em Microformatos sabem que estou utilizando o vocabulário de eventos

(hCalendar) em minha página?

É necessário fazer referências aos vocabulários:

<head profile="http://microformats.org/profile/hcalendar">

<link rel="profile" href="http://microformats.org/profile/hcalendar "> <a rel="profile" ref="http://microformats.org/profile/hcalendar"> hCalendar </a>

E o que utilizar com cada vocabulário? http://microformats.org/profile/hcalendar

Microformatos permitem a inserção de dados semânticos em páginas HTML de forma rápida e

fácil por reutilizar atributos e elementos próprios do HTML e que não irão causar danos para validações

de páginas nos DTDs utilizados junto ao W3C.

Antes de entendermos RDFa é essencial compreendermos RDF (sem a)....

Resource Description Framework - Plataforma de Descrições de Recursos

Projetado para fornecer interoperabilidade e semântica para metadados visando facilitar a busca na web

RDF é um padrão de metadados recomendado pelo W3C como linguagem para recursos interligados

RDF possui 03 princípios fundamentais:

Recursos

Propriedades

Frases

RDF pode descrever uma “coisa” fazendo declarações sobre suas propriedades.

A “coisa” é o recurso que você quer descrever

Os recursos podem ser qualquer coisa: pessoas, lugares, eventos, produtos, etc.

O conjunto de propriedades que esta coisa possui forma a descrição deste recurso – os seus atributos são sua definição

O evento ROAD SHOW TI é a “coisa” que estou descrevendo – o recurso

O evento ROAD SHOW TI possui uma propriedade, o realizador.

A propriedade realizador possui um valor, SENAC.

O evento ROAD SHOW TI é realizado pelo SENAC

Na frase...

Quem é o sujeito, o predicado e o objeto?

O evento ROAD SHOW TI é realizado pelo SENAC

O evento ROAD SHOW TI – Sujeito

Realizado – Predicado

SENAC – Objeto (complementa o significado do predicado)

O evento ROAD SHOW TI é realizado pelo SENAC

Tudo... RDF possui um modelo baseado em triplas

(que consta em 03 partes):

Sujeito

Predicado

Objeto

Em RDF o sujeito e as propriedades da rede semântica são identificados através de

endereços web (URI – Uniform Resource Indicator)

Isso permite uma maneira única e global de

nomear itens

<?xml version="1.0"?> <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:dc="http://purl.org/dc/elements/1.1/"> <rdf:Description rdf:about="http://www.sp.senac.br/"> <dc:creator> SENAC </dc:creator> </rdf:Description>

</rdf:RDF>

Exemplo da sentença:

O evento ROAD SHOW TI é realizado pelo SENAC em RDF:

Representação em Tripla:

SENAC Road Show TI Realizado

E o que tudo isso permite fazer?

Tornar a semântica dos recursos Web acessível por máquinas, possibilitando máquinas a

lidarem com os dados de forma mais inteligente, exemplos:

Descrever propriedades para itens de compra, como disponibilidade e preço

Descrever cronogramas para eventos

Descrever conteúdos para buscadores

Descrever informações sobre páginas como autor, data, título

Meus dados pessoais em RDF:

RDFa - Resource Description Framework in Attributes - Plataforma de Descrições de Recurso em Atributos

Quais atributos?

RDFa – Assim como Microformatos, permite a inserção de conteúdo semântico (metadados) em tags HTML, permitido entendimento não somente para humanos,

mas também para máquinas!

Atributos HTML!

Permite utilizar a estrutura de grafos RDF diretamente em tags HTML

E qual a vantagem do RDFa?

Permite uma flexibilidade maior na relação dos dados com os vocabulários.

Qualquer comunidade Web que desenvolva um

vocabulário para um determinado propósito pode ser automaticamente utilizado pelos desenvolvedores.

E qual a vantagem do RDFa?

Diferente dos Microformatos, que dependem que uma única comunidade forneça novos vocabulários.

Além da linguagem RDF ser uma recomendação W3C – objetivando os princípios da web semântica -

diferente dos Microformatos que foram “adaptados” para disponibilizar dados semânticos.

RDFa permite que se desenvolvam páginas em HTML referenciando diversos

vocabulários através das URIs.

Tenho meu site com marcações em microformatos e preciso integrar novas fontes de dados (ex.: XML) e extrair os dados semânticos

dessas informações em RDF, e agora?

Utilize XSLT + GRDDL!

Gleaning Resource Descriptions from Dialects Recomendação W3C que permite extrair RDF de

documentos HTML utilizando XSLT.

XSLT é uma linguagem de programação de estilos que quando codificados junto ao XML, permite descrever

transformações dos dados XML.

GRDDL (Gleaning Resource Descriptions from Dialects of Languages) - surgiu para suprir uma das maiores necessidades dos Microformatros – integrar diferentes

fontes de dados – extraindo o conteúdo semântico dos Microformatos e convertendo em RDF.

A transformação e a integração (Microformats RDF) dependem de dois fatores:

1 – Definir o vocabulário correspondente ao Microformato

2 – Criar o processo de transformação para extrair os dados do XHTML para produção das triplas RDF

conforme vocabulário referenciado

Complexo?!

Não, muito simples!

Basta acrescentar o atributo profile na tag head do XHTML informando que o arquivo deverá ser

processado via GRDDL, através da tag <link> e adicionar a URI de transformação.

<html>

<head profile="http://www.w3.org/2003/g/data-view"> <link rel=“transformation” href=“http://purl.org/dc/elements/1.1/” /> <div class="vevent" id="hcalendar-Road-Show-TI-SENAC-2012"> <a class="url" href="http://www.sp.senac.br"> <span class="summary">Road Show TI SENAC 2012</span> no <span class="location">São José do Rio Preto</span> <abbr class="dtstart" title="2012-03-08T19:30-03:0000"> Início - 08 de Março as 19h30 </abbr> <abbr class="dtend" title="2012-03-03T21:00-03:00"> Término - 08 de Março as 21h30 </abbr> </a> </div>

Exemplo de transformação/extração GRDDL - RDF

Ciclo de transformação

Esse ciclo de transformação que torna o GRDDL uma tecnologia com extremo poder para construir a ponte entre os dados XML/XHTML

com o mundo RDF

Uma das principais questões da Web Semântica é a disponibilidade dos dados

A WEB 2.0 virou uma das maiores fontes

de dados dinâmicos disponíveis hoje

Porém, a maioria dos sites não possui informações semânticas.

Por quê?

Complexidade técnica?

Na verdade não... Existe uma barreira “social”...

Faltam orientações para os web designers e provedores de conteúdo sobre a importância dos

metadados, vocabulários e linguagens da web semântica...

Microformatos e RDFa tem um papel importante para solucionar este problema, possibilitando a conexão

entre humanos e máquinas

E o mais importante...

Sem precisar criar arquivos e base de dados adicionais, basta “atualizar” seu HTML!

Há muito tempo a Web Semântica propôs a idéia de que com a semântica explícita nos dados os mecanismos de busca funcionariam melhor...

Com RDFa e Microformatos isso já começou!

Yahoo! SearchMonkey e BOSS

Permite aos usuários customizarem a apresentação dos resultados das buscas realizadas no Yahoo

Cada customização com SearchMonkey fornece acesso a

Microformatos e RDFa junto com cada personalização

Em 2009 o Yahoo disponibilizou o suporte a ferramenta BOSS – Build Your Own Search Service

Permite aos desenvolvedores a criação de um mecanismo de busca utilizando a API do Yahoo,

utilizando dados semânticos para resultar as páginas da busca

Yahoo! SearchMonkey e BOSS

Matéria Olhar Digital – Março de 2012

Google

Em Maio de 2009 o Google anunciou a utilização de Microformatos e RDFa para enriquecer os resultados

de busca

Em Maio de 2010 anunciou a utilização de Microformatos e RDFa no “Google Squared” provendo buscas semânticas

para imagens

Em Setembro de 2009 o Google anunciou a utilização dos dados em RDFa desenvolvido pelo

Yahoo!´s Search Monkey para sua indexação de vídeos

Google

Facebook – Open Graph Protocol

Em Maio de 2010 o Facebook anunciou o Open Graph Protocol

Permite as páginas acrescentarem informações ricas (semânticas) em seu gráfico social, permitindo relacionar e compartilhar conteúdos de uma página com seus amigos.

Depois que um usuário adiciona o aplicativo a sua aplicação, as ações de aplicativos específicos são compartilhados no

Facebook através do Open Graph

O Open Graph permite que aplicativos realizem atividades em um modelo baseado em ações e objetos.

Um aplicativo em execução pode definir a capacidade de "executar" (ação) um "route" (objeto) – Exemplo: Um aplicativo pode definir a capacidade de "ler"

(ação) um "livro" (objeto)

Tudo isso através de relações em RDFa

Facebook – Open Graph Protocol

Facebook – Open Graph Protocol

Facebook – Calendar

Além do RDFa, o Facebook também aderiu aos Microformatos (hCalendar e hCard)

Slideshare

Atribui metadados RDF nas páginas dos slides

Twitter

Atribui Microformats (hCard) para informações de contato.

Creative Commons

Definiu o RDFa para suas marcar seus trabalhos digitais e propriedades intelectuais (copyright license)

Obra publicada

(Rdfa)

Dados da obra publicada

(RDFa)

Dados do autor de publicação

(Rdfa)

Reuso da obra (Rdfa)

A nova publicação mantém os créditos

do autor original (Rdfa)

E no BRASIL?

Repositório de Vocabulários e Ontologias do Governo Eletrônico

É um conjunto de padrões, ferramentas e metodologias

para possibilitar: o intercâmbio de informações com

acordo semântico, de forma a viabilizar o pronto

cruzamento de dados de diversas fontes

Tem o objetivo principal promover a transparência

pública e estimular a participação da sociedade no acompanhamento da gestão

pública.

Tem por objetivos principais elaborar propostas para

políticas que considerem os dados abertos na promoção

da transparência pública

Assegurar que toda e qualquer publicação de dados públicos na web necessariamente

seja em formato aberto, visando a facilitar sua obtenção, análise e reaproveitamento pela

sociedade.

Tornar obrigatório que órgãos públicos criem grupos de trabalho ou departamentos

com competência sobre dados abertos

Criar incentivos financeiros do setor público, para que empresas da iniciativa privada,

especializadas em TI, desenvolvam soluções e aplicativos para dados abertos públicos.

A Web Directions – Uma empresa formada pela reunião dos melhores especialistas web com o objetivo

de educar e inspirar os desenvolvedores web.

Eles realizaram uma pesquisa com cerca de 1.300 desenvolvedores sobre a utilização de RDF e Microformatos – comparando os

resultados de 2008 – 2010.

Você utiliza marcações em Microformato em suas páginas?

Você utiliza marcações em RDFa em suas páginas?

O Linking Open Data visa tornar os dados livremente disponível para todos

O objetivo do SWEO W3C (Semantic Web Education and Outreach) é estender a Web com o uso comum de dados através da publicação de vários conjuntos de informações (como RDF) estabelecendo ligações entre estes itens em

diferentes fontes de dados.

As figuras a seguir mostram a evolução dos conjuntos de dados que foram publicados e

interligados pelo projeto até agora:

Com essa informação fica fácil identificar os vocabulários conforme sua

necessidade!

2007

2008

2009

2010

2011

Até Setembro de 2011 95 conjuntos de dados composto

por mais de 31 bilhões triplos RDF, que são interligadas por cerca de

504 milhões ligações RDF.

2011

2011

• Crawling:

Olha meu site aqui bongiornoweb.com.br

Vocabulários utilizados...

Um dia através das lentes...

Web para todos, em qualquer dispositivo, em qualquer lugar,

segura e confiável!

O Google já está preparado, agora só falta você!

Abram seus dados! “Open your data”

Lembra da busca inicial...

twitter.com/bongiornoweb

facebook.com/bongiornoweb

renatobonfanti@yahoo.com.br

Renato Bongiorno

top related