papel de los vocabularios semánticos en la economía en red - 12th contecsi

51
Papel de los vocabularios semánticos en la economía en red 12º CONTECSI-FEA-USP 1º Congresso Internacional em Tecnologia e Organização da Informação 22 de Maio de 2015 José A. Moreiro-González

Upload: tecsi-fea-usp

Post on 11-Aug-2015

74 views

Category:

Technology


0 download

TRANSCRIPT

Papel de los vocabularios semánticos en la economía en red

12º CONTECSI-FEA-USP 1º Congresso Internacional em Tecnologia e Organização da Informação 22 de Maio de 2015

José A. Moreiro-González

Vocabulários

Denominação genérica para as estruturas e os elementos estandardizados que representam e organizam a informação, sobre todo na Internet

Vocabulários

SOC (schemes que representam as matérias) +

Esquemas (schemas): formatos de metadados codificados numa linguagem de marcado, como XML, legíveis por computador

A nova Web obrigou a se adaptar às linguagens preexistentes

Palavras-chave da linguagem livre → Folksonomias

Palavras + equivalência → Anéis de sinônimos

Termos da linguagem controlada + hierarquia → Taxonomias

Termos + hierarquia + associação → Tesauros

Termos + associação manifesta + mapa → Redes semânticas (Topic

maps)

E tem impulsionado novos sistemas conceituais sobre

esquemas: → web semântica

Ontologias: Semântica formalizada para que os conceitos sejam

interpretáveis pelas máquinas (Conceitos + hierarquia y associações

manifestas + lógica)

Esquemas de metadados codificados e legíveis pelo computador

Vocabulários livres

Codificação mínima dos conteúdos dos documentos

Palavras sem normalizar (linguagem natural) selecionadas a partir do conteúdo dos documentos

A mais tradicional Lista lineal de palavras-chave

A mais recente Folksonomia (Web social)

Vocabulário preferido: linguagem livre

Expressado mediante folksonomias, palavras-chave em etiquetas (etiquetado /tagging)

Vocabulários controlados

Termos normalizados e unívocos

Com notações específicas

Protótipo de vocabulário controlado: Tesauro

Outros vocabulários controlados: listas de termos, anéis de sinônimos e taxonomias

Vantagens

Menor distorção

Servem tanto nos sistemas manuais como nos automáticos

Inconvenientes

Necessitam de pessoal especializado

Constante atualização

O usuário tem que conhecê-lo e investir tempo na estratégia

Economia colaborativa-Folksonomias

Na consolidação da economia colaborativa tem sido decisivos: O uso da tecnologia da informação.

As novas atividades para as quais produtos e serviços são

compartilhados. A nova consciência de consumo com base na utilização e não na posse. Algumas formas de intercâmbio têm surgido, particularmente em resposta

à crise económica e financeira. Também na organização do conhecimento. Os sistemas controlados não

atendiam às necessidades de recuperação na web social.

Folksonomias

Thomas Vander Wal propôs o neologismo

Folk + sonomy =

Gente + taxonomia, classificação cooperativa

Modo de indexação cooperativa que adota palavras-chave para representar a informação de maneira espontânea e livre

Arquitetura da informação social (Web 2.0) em que cada usuário escolhe o que mais se ajusta a seu entendimento

Folksonomias

• Com sua ênfase na usabilidade, a Web incentiva

mecanismos sociais para a participação e cooperação dos usuários na execução dos serviços , especialmente para descrever recursos comunitariamente e melhorar a disponibilidade de informações.

• Funciona a partir da ideia de que “O produto melhora com o uso e com o crescimento da comunidade que continua a fazer upload de conteúdos”.

Funcionamento das folksonomias

Para refinar as buscas, a inteligência organizativa comum tem ideado aplicações como: • A indexação por popularidade, • A valoração da opinião dos leitores, • A sindicação ou indexação mediante atribuição social

de etiquetas. As folksonomías não tem uma autoridade central que imponha sua visão; assim cada voz tem seu lugar.

Marcar com etiquetas de caráter social pode ser considerado "uma ponte de baixa inversão entre a indexação pessoal e a indexação compartilhada“

Vantagens das folksonomias

As folksonomías servem para extrair vocabulário (datamining) com o qual elaborar linguagens controladas depois de serem normalizado

Debilidades das folksonomias

Carecem de controle Não têm hierarquias nem associações, só é possível utilizar clusters que se podem formar com os recursos indexados pelos usuários com palavras-chave coincidentes A ambiguidade é muito alta: para um usuário um termo pode expressar uma realidade muito distinta da de outro usuário Não há guia nem limitações na hora de se etiquetar os conteúdos

Debilidades das folksonomias

Falta de consistência por ausência de controle de sinônimos: assim na hora de denominar um computador Macintosh, pode empregar-se as etiquetas “mac”, “apple”, “macintosh” Imprecisão ao se utilizar etiquetas só com unitermos Emprego indistinto de singulares e de plurais (assim é em Flickr) E, certamente, quanto se deriva da ausência de hierarquia Gene Smith. Folksonomy: social classification, http://atomiq.org/archives/2004/08/folksonomy_social_classification.html

Flickr

Site sobre fotografia Qualquer usuário pode compartilhar fotos deixando-as à disposição para consulta mediante o estabelecimento de palavras-chave em um ambiente colaborativo Cada usuário indexa as fotografias segundo o que seu conteúdo sugere

Si se realiza uma busca na:

https://www.flickr.com/

Empregando a palavra -chave “Festas juninas” encontramos na recuperação...

Muitos serviços de comunicação empresarial oferecem na web corporativa: Noticias de atualidade da empresa, Também bibliotecas de fotografias e vídeos com os

produtos e serviços que ao longo da historia tem fabricado ou distribuído,

Mas, pelo geral, a maior atenção é para o que está no mercado atualmente.

Desde una perspectiva biblioteconômica, as consequências de esta dupla finalidade são diferentes para as empresas e instituições: De uma parte, contribuem para a identidade visual

corporativa. De outra, servem para hospedar arquivos de imagem

em servidores alheios.

Flickr oferece uma boa possibilidade de uso corporativo. Ajuda a distribuir as tarefas de gerenciamento entre aqueles que trabalham em uma organização. Tem atualidade e agilidade. O acesso e a divulgação ficam acima da coleção e custódia. Muitos serviços de comunicação institucional gerem as suas bibliotecas de fotografias via Flickr.

No caso de grandes instituições é continuo o processo de entrada de fotos e álbuns que refletem a sua atividade. Mostram fotografias de cada uma das infraestruturas, edifícios e dos locais importantes de cada instituição. E as atividades diárias, profissionais e sociais mais variadas. Com forte presença dos eventos especiais que servem para comunicar diretamente as circunstâncias de sua presença humana e social.

A Universidade Carlos III de Madrid no Flickr: • 300 álbuns com fotografias posteriores a 2010.

• Classificadas segundo critérios institucionais.

• Fotografias de cada um dos campus. Da vida diária:

panorâmicas, edifícios, salas, equipamentos, laboratórios, bibliotecas, salas de aula, instalações esportivas,...

• Das diversas atividades acadêmicas: conferências, seminários, workshops, fóruns, reuniões científicas, apresentações de livros, homenagens, premiações, ...

• Comunicam-se direta e diariamente todas as circunstâncias da vida acadêmica, humana e social.

Outro exemplo, empresa brasileira de alimentos Perdigão no Flickr. Muitas fotos de suas fábricas, produtos, publicidade, promoções, logotipos ou caminhões de transporte que firme. Mesmo que a polissemia do termo Perdigão faz recuperar simultaneamente fotos: Rua Perdigão, no Porto, Fotos tiradas por alguém de nome Perdigão: de um intérprete ou um costureiro com esse nome. Ao lado de fotos do animal Perdigão (Rhynchotus rufescens) e da Quinta do Perdigão (vinhos).

O objetivo de ambos os exemplos é distribuir imagens de natureza corporativa e torná-las disponíveis para qualquer usuário ou seguidor interessado. Sem dúvida Flickr significou uma grande mudança quando se trata de compartilhar, armazenar e organizar fotos digitais. Facilitou a sua gestão, com a vantagem adicional de ser capaz de tê-las onde quer que se esteja.

As folksonomias são uma solução de baixo custo para a Web invisível e para

os recursos sem valor suficiente para serem descritos por serviços pagos

As melhorias na recuperação utilizando folksonomias acontecem por meio

de sua aproximação com a WS evitando problemas de sinonímia, polissemia

e melhorando a navegabilidade por meio de relações

Reflexão

Taxonomia

O termo taxonomia recobrou atualidade a partir dos pesquisadores em organizações informáticas de objetos

Sempre atendeu a estruturar conceitos e termos em sistemas classificados

Na ciência positivista as taxonomias representavam os princípios gerais da classificação científica

Etimologia: conjunção das palavras gregas taxis (ordenação) e nomos (método)

Ciência ou técnica de classificação: em Biologia, entende a descrição, identificação e classificação dos organismos, individualmente ou em grupo, de alcance global biotaxonomia, especializado em: fitotaxonomia e zootaxonomia

Taxonomia

As taxonomias estabelecem relações hierárquicas entre os objetos num espaço de informação integrada.

Eficácia como ferramentas para classificar: presencia nos esquemas de metadados, vocabulários controlados, sinônimos, modelos conceituais, Topic Maps e ontologias: permitem classificar os dados e informações pelo uso da derivação semântica.

Em muitas referências acadêmicas, taxonomia é usada como sinônimo de SOC.

Sempre tem sido utilizadas pelos profissionais da CI. Agora o uso e muito mais amplo.

Representação taxonômica arborescente

Reino: Animalia

Phylum: Cordata

Subphylum: Vertebrata

Classe: Mammalia

Subclasse: Theria

Ordem: Primata

Subordem: Arthropoidea

Família: Hominidae

Gênero: Homo

Espécie: Sapiens

Exemplo de zootaxonomia

Taxonomia linneana dos seres vivos – classificação dos humanos

Fonte: Breitman.- Web Semântica, p.34

Características das taxonomias

Estrutura classificatória hierárquica: (contexto conceitual) com determinados níveis de profundidade

Rótulos de entrada: lista de termos que dão nome aos conceitos. São os elementos da estrutura, agrupados em blocos temáticos

Admite facetas não hierárquicas: equivalências e até alguma associação, pois dão dinamismo e pluralidade de enfoques aos assuntos

Características das taxonomias

Em quanto vocabulário: a taxonomia é uma lista ordenada de termos controlados segundo um esquema hierárquico. A taxonomia reflete seu contexto de aplicação. É dinâmica na adaptação às mudanças que ocorrem continuamente. A presença, exclusão ou alteração de termos utilizados obriga a taxonomia a ter facilidade de modificação.

Características das taxonomias

Tesauros → os termos têm justificação documentária e disciplinar. Nas taxonomias o usuário os certifica

O conteúdo é representado mediante termos autorizados pelo uso entre os usuários

Taxonomias = meios de acesso, pois atuam como mapas

conceituais dos assuntos solicitados em um serviço de

recuperação: buscando categorizá-las, folheá-las e navegar

por elas

As taxonomias sempre tem organizado recursos de

informação.

Agora aplicam-se aos recursos digitais que empresas e

instituições custodiam nos seus servidores Web para

categorizá-los e navegá-los.

Ajudam aos usuários e clientes a encontrar produtos e

serviços. E para melhor representar as suas necessidades

de informação.

As empresas, organizações e serviços da administração

pública as usam, cada vez mais, para sistematizar a gestão

de conteúdos e os SOC.

Ex. de esquema de relacionamento

Classe Subclasse Espécie

Carros

Camionetes MPV

4x4

van

Carros esportivos grande turismo

roadster

superesportivo

Turismos familiar

sedan

Ex. de organizações de caráter taxonômico na vida diária

Guia de restaurantes de Madrid por tipo de cozinha

• Africano (4)

• Etíope

• Habesha

• Fedra

• Gonder • Senegalés

• Casamansa

• Alemán (1) • Kruger

• Andaluz (18) • Carmen

• La Quimera

• Surtopía

• …

• Arrocería (26) • L’Albufera

• …

Taxonomia da OIT/ILO

Exemplo relevante por facilitar a navegação visual, o controle terminológico e o uso prático. Estrutura: reflete o programa de trabalho da OIT.

Uso: Departamentos da OIT. Escritórios exteriores.

Fim: descrever o conteúdo de suas páginas web e realizar pesquisas na web da OIT.

Aplicação complementar: sistema de classificação por assunto para organizar coleções em pequenas bibliotecas ou centros de informação laboral.

Tamanho: 400 termos organizado em 25 macroclasses.

http://www.ilo.org/public/spanish/support/lib/tools/taxonomy.htm

Taxonomias Law

Com amplo reconhecimento no setor jurídico, a taxonomia de

blogs de Direito “Law X.0” (Acima de 600 blogs classificados

em oito grandes categorias, alguma das quais alcança até

treze subdivisões:

http://3lepiphany.typepad.com/3l_epiphany/2006/03/taxonomy

_overfl_79.html

Progressão taxonomica

Uso pelas entidades públicas e privadas de taxonomias terminológicas, mas agora expansivas e multinivel.

Benefícios

• Alta usabilidade pela simplicidade da estrutura hierárquica para organizar seus recursos terminológicos.

• Conforto de navegação na web.

• Bom ajuste para os requisitos de cada tipo de entidade.

• Fácil atualização.

Requisitos

• Integração no programa informático de cada entidade para que os dados sejam interativos.

• Que a segurança, interesse da aplicação e utilidade prática sejam garantidos através da padronização por agências internacionais.

Progressão taxonômica

Possibilitam a gestão estratégica da informação corporativa. Frente às taxonomias unicamente terminológicas: • Têm uma estrutura mais simples. • Menor número de etiquetas. • Muito mais interoperáveis. • Totalmente estandardizadas. • Estão ligadas aos objetos de informação. Claro, são corretas para a cooperação interagências na web semântica.

Representação da hierarquia numa taxonomia

Varias possibilidades de representar os níveis

hierárquicos:

Hierarquias multinível.

Estrutura arborescente.

Estrutura de macrotérminos.

Estrutura hierárquica bidirecional.

Categorias genéricas.

Facetada.

Redes semânticas.

Representação hierárquica multinivel

Vertebrados

Mamíferos

Térios

Metatérios }

Sibling terms Eutérios }

Primatas

Antropoides

Representação gráfica taxonomia ↔ mapa de

conhecimento

Exemplo de mapa conceptual estático

Enlaces en la web semántica

Aunar distintos recursos que existen en diferentes sistemas o servicios de información digital basados en Web (diccionarios, taxonomías, tesauros, ontologías, esquemas de clasificación, etc): NKOS (Network Knowledge Organization Systems/Services).

La web semántica necesita:

Lenguajes formales como: (DAML+OIL), RDF, OWL, etc.

Metadatos y esquemas de metadatos.

Ontologías: tanto específicas de un dominio, como ontologías de

alto nivel de tal forma que se proporcionen relaciones entre

ontologías para la recuperación, el intercambio y la integración

de la información interdisciplinar en la Web.

Enlaces en la web semántica

Significados legiveis por máquina (codificar a “semântica de mundo”).

XML (eXtended Markup Language):

Standard de representação, metalinguagem para ol intercambio de dados/informação na web.

Desde o ponto de vista estritamente informático: XML não aporta semântica.

Por isso precisa: metadados e ontologias (semântica).

Redes semânticas

Os nós de uma Rede Semântica estão unidos por elos, que indicam a relação que existe entre eles

Nó Nó

come (elo)

-----------------------→

Agente Objeto

João Pipoca

Mapas conceituais

No são SOC, mas anteciparam a representação do conhecimento em gráficas cognitivas → redes de conceitos

Baseamento: O conhecimento representa-se por frases

simples e estruturadas:

Sujeito - verbo – predicado; Como uma associação: conceito → relação → conceito Conceito: nós (pontos / vértices) Relação: união (elos / arcos / extremos / satélites)

RDF: modelo de grafo

Estrutura das sentencias em RDF: tripla de relação sujeito-predicado-objeto

Grafo: representação onde sujeitos e objetos > nodos

propriedades ou predicados > elo de relação

Expressão das triplas RDF: sujeito -> predicado -> objeto. O grafo é unidirecional

http://www.uc3m.es

Criador

Universidad Carlos III

Sujeito Objeto Sujeito

Predicado

Paralelismo = grafos de redes semânticas com a

criação de sentencias RDF

As partes da sentencia ou declaração chamam-se:

Sujeito: recurso ou cosa sobre o qual versa a declaração

Predicado: propriedade ou característica do sujeito que se

expressa mediante esta declaração (criador, idioma, data de

criação)

Objeto: valor da propriedade a qual refere-se o predicado

Taxonomias representativas

Existem muitas taxonomias relevantes para a prática financeira e contabilidade.

Em XBLR (eXtensible Business Reporting Language) intercâmbio, tratamento e armazenamento de documentos financeiros standard. É uma aplicação XML.

Este formato incorpora as International Accounting Standards (IASs), e as NIIF para PMS (Pequenas e medias empresas):

Taxonomias IAS-CI (desde 2003 com estandar IFRS), com versões.

Taxonomias IFRS.

Taxonomias nacionais.

CONTALOC

Codificação da taxonomia XBRL ao espanhol: http://www.ifrs.org/Use-around-the-world/IFRS-translations/Pages/IFRS-Taxonomy-in-Spanish.aspx

Taxonomias representativas

IFRS: número de etiquetas é limitado → empresas podem expandir as suas próprias etiquetas.

A taxonomia fixa as informações que devem mostrar os documentos financeiros.

Tecnologia inclusiva com um alto nível de desenvolvimento tecnológico e a concordância dos membros que as usam oficialmente.

Facilitam e simplificam a troca de informações dentro de uma empresa, com outras organizações, com os usuários e com os reguladores

Taxonomias representativas. Setor da saúde

OMS → dicionário e taxonomia estandardizados de erros médicos e insuficiências dos sistemas de cuidados de saúde.

Os conceitos sobre a segurança do paciente variam de um país para outro → imprescindível facilitar a colaboração e troca de informações entre os países.

Resultado: Classificação Internacional para a Segurança do Paciente feita a partir de Taxonomia da segurança do paciente (2004).

Importância do acordo linguístico e conceitual.

Agrupa os termos controlados em dez macroclasses e 48 macrodescritores.

Os termos preferidos formam um glossário com definições. Aparecem relacionados hierarquicamente dentro de uma ontologia de domínio explícita.

Exemplo:

http://www.who.int/patientsafety/implementation/icps/icps_full_report_es.pdf

Taxonomias representativas. Setor da saúde

Taxonomias padronizados para que todos os profissionais de enfermagem participem de uma linguagem comum e inequívoca.

Plano de cuidados segundo a taxonomia NANDA: os sete Diagnósticos de Enfermagem selecionados desde os critérios de desempenho, intervenções e atividades interdisciplinares.

As etiquetas diagnósticas de NANDA relacionasse com a taxonomia de Critérios de resultados NOC e com a taxonomia NIC para classificar as intervenções de enfermagem.

Taxonomias representativas. Setor da saúde

Exemplo do Listado de Diagnósticos Taxonomia NANDA

(http://enfermeriaactual.com/listado-de-diagnosticos-nanda/).

(00137) Aflicción crónica

La persona (familiar, cuidador o individuo con una enfermedad o discapacidad crónica)

presenta un patrón cíclico, recurrente y potencialmente progresivo de tristeza omnipresente

en respuesta a una pérdida continua en el curso de una enfermedad o discapacidad.

Factores relacionados:

- Muerte de un ser querido.

- La persona experimenta uno o más acontecimientos desencadenantes (crisis en el

manejo de la enfermedad, crisis relacionadas con edades de desarrollo y oportunidades

perdidas)….

(00071) Afrontamiento defensivo

(00074) Afrontamiento familiar comprometido…

Organização semântica de repositórios de objetos de aprendizagem

Ordenação de recursos em uma plataforma para associa-los com as disciplinas e usá-los.

Integram as taxonomias tradicionais de aprendizagem (Bloom, ...).

Suportam objetos de aprendizagem para permitir a reutilização, flexibilidade, acessibilidade e adaptabilidade (Taxonomia de tipos de objetos de aprendizagem).

Agrupados conter metadados que facilitam a classificação de materiais.

Atualizando a Taxonomia de Bloom, impulsionado por novas atividades, aprendizagem e casos de comportamento que estão aparecendo como digital é alargar a sua utilização (e Krathwohl ANDERSON, 2001).

Comentários finais

A utilização institucional das folksonomias causa a contradição de

transitar desde as palavras-chave para as classificações.

No caso das taxonomias tem evoluído desde o caráter solo terminológico

e desde a representação plana para a representação semântica, então

ontológica.

Mucha gracias por su atención