papel de los vocabularios semánticos en la economía en red - 12th contecsi
TRANSCRIPT
Papel de los vocabularios semánticos en la economía en red
12º CONTECSI-FEA-USP 1º Congresso Internacional em Tecnologia e Organização da Informação 22 de Maio de 2015
José A. Moreiro-González
Vocabulários
Denominação genérica para as estruturas e os elementos estandardizados que representam e organizam a informação, sobre todo na Internet
Vocabulários
SOC (schemes que representam as matérias) +
Esquemas (schemas): formatos de metadados codificados numa linguagem de marcado, como XML, legíveis por computador
A nova Web obrigou a se adaptar às linguagens preexistentes
Palavras-chave da linguagem livre → Folksonomias
Palavras + equivalência → Anéis de sinônimos
Termos da linguagem controlada + hierarquia → Taxonomias
Termos + hierarquia + associação → Tesauros
Termos + associação manifesta + mapa → Redes semânticas (Topic
maps)
E tem impulsionado novos sistemas conceituais sobre
esquemas: → web semântica
Ontologias: Semântica formalizada para que os conceitos sejam
interpretáveis pelas máquinas (Conceitos + hierarquia y associações
manifestas + lógica)
Esquemas de metadados codificados e legíveis pelo computador
Vocabulários livres
Codificação mínima dos conteúdos dos documentos
Palavras sem normalizar (linguagem natural) selecionadas a partir do conteúdo dos documentos
A mais tradicional Lista lineal de palavras-chave
A mais recente Folksonomia (Web social)
Vocabulário preferido: linguagem livre
Expressado mediante folksonomias, palavras-chave em etiquetas (etiquetado /tagging)
Vocabulários controlados
Termos normalizados e unívocos
Com notações específicas
Protótipo de vocabulário controlado: Tesauro
Outros vocabulários controlados: listas de termos, anéis de sinônimos e taxonomias
Vantagens
Menor distorção
Servem tanto nos sistemas manuais como nos automáticos
Inconvenientes
Necessitam de pessoal especializado
Constante atualização
O usuário tem que conhecê-lo e investir tempo na estratégia
Economia colaborativa-Folksonomias
Na consolidação da economia colaborativa tem sido decisivos: O uso da tecnologia da informação.
As novas atividades para as quais produtos e serviços são
compartilhados. A nova consciência de consumo com base na utilização e não na posse. Algumas formas de intercâmbio têm surgido, particularmente em resposta
à crise económica e financeira. Também na organização do conhecimento. Os sistemas controlados não
atendiam às necessidades de recuperação na web social.
Folksonomias
Thomas Vander Wal propôs o neologismo
Folk + sonomy =
Gente + taxonomia, classificação cooperativa
Modo de indexação cooperativa que adota palavras-chave para representar a informação de maneira espontânea e livre
Arquitetura da informação social (Web 2.0) em que cada usuário escolhe o que mais se ajusta a seu entendimento
Folksonomias
• Com sua ênfase na usabilidade, a Web incentiva
mecanismos sociais para a participação e cooperação dos usuários na execução dos serviços , especialmente para descrever recursos comunitariamente e melhorar a disponibilidade de informações.
• Funciona a partir da ideia de que “O produto melhora com o uso e com o crescimento da comunidade que continua a fazer upload de conteúdos”.
Funcionamento das folksonomias
Para refinar as buscas, a inteligência organizativa comum tem ideado aplicações como: • A indexação por popularidade, • A valoração da opinião dos leitores, • A sindicação ou indexação mediante atribuição social
de etiquetas. As folksonomías não tem uma autoridade central que imponha sua visão; assim cada voz tem seu lugar.
Marcar com etiquetas de caráter social pode ser considerado "uma ponte de baixa inversão entre a indexação pessoal e a indexação compartilhada“
Vantagens das folksonomias
As folksonomías servem para extrair vocabulário (datamining) com o qual elaborar linguagens controladas depois de serem normalizado
Debilidades das folksonomias
Carecem de controle Não têm hierarquias nem associações, só é possível utilizar clusters que se podem formar com os recursos indexados pelos usuários com palavras-chave coincidentes A ambiguidade é muito alta: para um usuário um termo pode expressar uma realidade muito distinta da de outro usuário Não há guia nem limitações na hora de se etiquetar os conteúdos
Debilidades das folksonomias
Falta de consistência por ausência de controle de sinônimos: assim na hora de denominar um computador Macintosh, pode empregar-se as etiquetas “mac”, “apple”, “macintosh” Imprecisão ao se utilizar etiquetas só com unitermos Emprego indistinto de singulares e de plurais (assim é em Flickr) E, certamente, quanto se deriva da ausência de hierarquia Gene Smith. Folksonomy: social classification, http://atomiq.org/archives/2004/08/folksonomy_social_classification.html
Flickr
Site sobre fotografia Qualquer usuário pode compartilhar fotos deixando-as à disposição para consulta mediante o estabelecimento de palavras-chave em um ambiente colaborativo Cada usuário indexa as fotografias segundo o que seu conteúdo sugere
Si se realiza uma busca na:
https://www.flickr.com/
Empregando a palavra -chave “Festas juninas” encontramos na recuperação...
Muitos serviços de comunicação empresarial oferecem na web corporativa: Noticias de atualidade da empresa, Também bibliotecas de fotografias e vídeos com os
produtos e serviços que ao longo da historia tem fabricado ou distribuído,
Mas, pelo geral, a maior atenção é para o que está no mercado atualmente.
Desde una perspectiva biblioteconômica, as consequências de esta dupla finalidade são diferentes para as empresas e instituições: De uma parte, contribuem para a identidade visual
corporativa. De outra, servem para hospedar arquivos de imagem
em servidores alheios.
Flickr oferece uma boa possibilidade de uso corporativo. Ajuda a distribuir as tarefas de gerenciamento entre aqueles que trabalham em uma organização. Tem atualidade e agilidade. O acesso e a divulgação ficam acima da coleção e custódia. Muitos serviços de comunicação institucional gerem as suas bibliotecas de fotografias via Flickr.
No caso de grandes instituições é continuo o processo de entrada de fotos e álbuns que refletem a sua atividade. Mostram fotografias de cada uma das infraestruturas, edifícios e dos locais importantes de cada instituição. E as atividades diárias, profissionais e sociais mais variadas. Com forte presença dos eventos especiais que servem para comunicar diretamente as circunstâncias de sua presença humana e social.
A Universidade Carlos III de Madrid no Flickr: • 300 álbuns com fotografias posteriores a 2010.
• Classificadas segundo critérios institucionais.
• Fotografias de cada um dos campus. Da vida diária:
panorâmicas, edifícios, salas, equipamentos, laboratórios, bibliotecas, salas de aula, instalações esportivas,...
• Das diversas atividades acadêmicas: conferências, seminários, workshops, fóruns, reuniões científicas, apresentações de livros, homenagens, premiações, ...
• Comunicam-se direta e diariamente todas as circunstâncias da vida acadêmica, humana e social.
Outro exemplo, empresa brasileira de alimentos Perdigão no Flickr. Muitas fotos de suas fábricas, produtos, publicidade, promoções, logotipos ou caminhões de transporte que firme. Mesmo que a polissemia do termo Perdigão faz recuperar simultaneamente fotos: Rua Perdigão, no Porto, Fotos tiradas por alguém de nome Perdigão: de um intérprete ou um costureiro com esse nome. Ao lado de fotos do animal Perdigão (Rhynchotus rufescens) e da Quinta do Perdigão (vinhos).
O objetivo de ambos os exemplos é distribuir imagens de natureza corporativa e torná-las disponíveis para qualquer usuário ou seguidor interessado. Sem dúvida Flickr significou uma grande mudança quando se trata de compartilhar, armazenar e organizar fotos digitais. Facilitou a sua gestão, com a vantagem adicional de ser capaz de tê-las onde quer que se esteja.
As folksonomias são uma solução de baixo custo para a Web invisível e para
os recursos sem valor suficiente para serem descritos por serviços pagos
As melhorias na recuperação utilizando folksonomias acontecem por meio
de sua aproximação com a WS evitando problemas de sinonímia, polissemia
e melhorando a navegabilidade por meio de relações
Reflexão
Taxonomia
O termo taxonomia recobrou atualidade a partir dos pesquisadores em organizações informáticas de objetos
Sempre atendeu a estruturar conceitos e termos em sistemas classificados
Na ciência positivista as taxonomias representavam os princípios gerais da classificação científica
Etimologia: conjunção das palavras gregas taxis (ordenação) e nomos (método)
Ciência ou técnica de classificação: em Biologia, entende a descrição, identificação e classificação dos organismos, individualmente ou em grupo, de alcance global biotaxonomia, especializado em: fitotaxonomia e zootaxonomia
Taxonomia
As taxonomias estabelecem relações hierárquicas entre os objetos num espaço de informação integrada.
Eficácia como ferramentas para classificar: presencia nos esquemas de metadados, vocabulários controlados, sinônimos, modelos conceituais, Topic Maps e ontologias: permitem classificar os dados e informações pelo uso da derivação semântica.
Em muitas referências acadêmicas, taxonomia é usada como sinônimo de SOC.
Sempre tem sido utilizadas pelos profissionais da CI. Agora o uso e muito mais amplo.
Reino: Animalia
Phylum: Cordata
Subphylum: Vertebrata
Classe: Mammalia
Subclasse: Theria
Ordem: Primata
Subordem: Arthropoidea
Família: Hominidae
Gênero: Homo
Espécie: Sapiens
Exemplo de zootaxonomia
Taxonomia linneana dos seres vivos – classificação dos humanos
Fonte: Breitman.- Web Semântica, p.34
Características das taxonomias
Estrutura classificatória hierárquica: (contexto conceitual) com determinados níveis de profundidade
Rótulos de entrada: lista de termos que dão nome aos conceitos. São os elementos da estrutura, agrupados em blocos temáticos
Admite facetas não hierárquicas: equivalências e até alguma associação, pois dão dinamismo e pluralidade de enfoques aos assuntos
Características das taxonomias
Em quanto vocabulário: a taxonomia é uma lista ordenada de termos controlados segundo um esquema hierárquico. A taxonomia reflete seu contexto de aplicação. É dinâmica na adaptação às mudanças que ocorrem continuamente. A presença, exclusão ou alteração de termos utilizados obriga a taxonomia a ter facilidade de modificação.
Características das taxonomias
Tesauros → os termos têm justificação documentária e disciplinar. Nas taxonomias o usuário os certifica
O conteúdo é representado mediante termos autorizados pelo uso entre os usuários
Taxonomias = meios de acesso, pois atuam como mapas
conceituais dos assuntos solicitados em um serviço de
recuperação: buscando categorizá-las, folheá-las e navegar
por elas
As taxonomias sempre tem organizado recursos de
informação.
Agora aplicam-se aos recursos digitais que empresas e
instituições custodiam nos seus servidores Web para
categorizá-los e navegá-los.
Ajudam aos usuários e clientes a encontrar produtos e
serviços. E para melhor representar as suas necessidades
de informação.
As empresas, organizações e serviços da administração
pública as usam, cada vez mais, para sistematizar a gestão
de conteúdos e os SOC.
Ex. de esquema de relacionamento
Classe Subclasse Espécie
Carros
Camionetes MPV
4x4
van
Carros esportivos grande turismo
roadster
superesportivo
Turismos familiar
sedan
Ex. de organizações de caráter taxonômico na vida diária
Guia de restaurantes de Madrid por tipo de cozinha
• Africano (4)
• Etíope
• Habesha
• Fedra
• Gonder • Senegalés
• Casamansa
• Alemán (1) • Kruger
• Andaluz (18) • Carmen
• La Quimera
• Surtopía
• …
• Arrocería (26) • L’Albufera
• …
Taxonomia da OIT/ILO
Exemplo relevante por facilitar a navegação visual, o controle terminológico e o uso prático. Estrutura: reflete o programa de trabalho da OIT.
Uso: Departamentos da OIT. Escritórios exteriores.
Fim: descrever o conteúdo de suas páginas web e realizar pesquisas na web da OIT.
Aplicação complementar: sistema de classificação por assunto para organizar coleções em pequenas bibliotecas ou centros de informação laboral.
Tamanho: 400 termos organizado em 25 macroclasses.
http://www.ilo.org/public/spanish/support/lib/tools/taxonomy.htm
Taxonomias Law
Com amplo reconhecimento no setor jurídico, a taxonomia de
blogs de Direito “Law X.0” (Acima de 600 blogs classificados
em oito grandes categorias, alguma das quais alcança até
treze subdivisões:
http://3lepiphany.typepad.com/3l_epiphany/2006/03/taxonomy
_overfl_79.html
Progressão taxonomica
Uso pelas entidades públicas e privadas de taxonomias terminológicas, mas agora expansivas e multinivel.
Benefícios
• Alta usabilidade pela simplicidade da estrutura hierárquica para organizar seus recursos terminológicos.
• Conforto de navegação na web.
• Bom ajuste para os requisitos de cada tipo de entidade.
• Fácil atualização.
Requisitos
• Integração no programa informático de cada entidade para que os dados sejam interativos.
• Que a segurança, interesse da aplicação e utilidade prática sejam garantidos através da padronização por agências internacionais.
Progressão taxonômica
Possibilitam a gestão estratégica da informação corporativa. Frente às taxonomias unicamente terminológicas: • Têm uma estrutura mais simples. • Menor número de etiquetas. • Muito mais interoperáveis. • Totalmente estandardizadas. • Estão ligadas aos objetos de informação. Claro, são corretas para a cooperação interagências na web semântica.
Representação da hierarquia numa taxonomia
Varias possibilidades de representar os níveis
hierárquicos:
Hierarquias multinível.
Estrutura arborescente.
Estrutura de macrotérminos.
Estrutura hierárquica bidirecional.
Categorias genéricas.
Facetada.
Redes semânticas.
Representação hierárquica multinivel
Vertebrados
Mamíferos
Térios
Metatérios }
Sibling terms Eutérios }
Primatas
Antropoides
Enlaces en la web semántica
Aunar distintos recursos que existen en diferentes sistemas o servicios de información digital basados en Web (diccionarios, taxonomías, tesauros, ontologías, esquemas de clasificación, etc): NKOS (Network Knowledge Organization Systems/Services).
La web semántica necesita:
Lenguajes formales como: (DAML+OIL), RDF, OWL, etc.
Metadatos y esquemas de metadatos.
Ontologías: tanto específicas de un dominio, como ontologías de
alto nivel de tal forma que se proporcionen relaciones entre
ontologías para la recuperación, el intercambio y la integración
de la información interdisciplinar en la Web.
Enlaces en la web semántica
Significados legiveis por máquina (codificar a “semântica de mundo”).
XML (eXtended Markup Language):
Standard de representação, metalinguagem para ol intercambio de dados/informação na web.
Desde o ponto de vista estritamente informático: XML não aporta semântica.
Por isso precisa: metadados e ontologias (semântica).
Redes semânticas
Os nós de uma Rede Semântica estão unidos por elos, que indicam a relação que existe entre eles
Nó Nó
come (elo)
-----------------------→
Agente Objeto
João Pipoca
Mapas conceituais
No são SOC, mas anteciparam a representação do conhecimento em gráficas cognitivas → redes de conceitos
Baseamento: O conhecimento representa-se por frases
simples e estruturadas:
Sujeito - verbo – predicado; Como uma associação: conceito → relação → conceito Conceito: nós (pontos / vértices) Relação: união (elos / arcos / extremos / satélites)
RDF: modelo de grafo
Estrutura das sentencias em RDF: tripla de relação sujeito-predicado-objeto
Grafo: representação onde sujeitos e objetos > nodos
propriedades ou predicados > elo de relação
Expressão das triplas RDF: sujeito -> predicado -> objeto. O grafo é unidirecional
http://www.uc3m.es
Criador
Universidad Carlos III
Sujeito Objeto Sujeito
Predicado
Paralelismo = grafos de redes semânticas com a
criação de sentencias RDF
As partes da sentencia ou declaração chamam-se:
Sujeito: recurso ou cosa sobre o qual versa a declaração
Predicado: propriedade ou característica do sujeito que se
expressa mediante esta declaração (criador, idioma, data de
criação)
Objeto: valor da propriedade a qual refere-se o predicado
Taxonomias representativas
Existem muitas taxonomias relevantes para a prática financeira e contabilidade.
Em XBLR (eXtensible Business Reporting Language) intercâmbio, tratamento e armazenamento de documentos financeiros standard. É uma aplicação XML.
Este formato incorpora as International Accounting Standards (IASs), e as NIIF para PMS (Pequenas e medias empresas):
Taxonomias IAS-CI (desde 2003 com estandar IFRS), com versões.
Taxonomias IFRS.
Taxonomias nacionais.
CONTALOC
Codificação da taxonomia XBRL ao espanhol: http://www.ifrs.org/Use-around-the-world/IFRS-translations/Pages/IFRS-Taxonomy-in-Spanish.aspx
Taxonomias representativas
IFRS: número de etiquetas é limitado → empresas podem expandir as suas próprias etiquetas.
A taxonomia fixa as informações que devem mostrar os documentos financeiros.
Tecnologia inclusiva com um alto nível de desenvolvimento tecnológico e a concordância dos membros que as usam oficialmente.
Facilitam e simplificam a troca de informações dentro de uma empresa, com outras organizações, com os usuários e com os reguladores
Taxonomias representativas. Setor da saúde
OMS → dicionário e taxonomia estandardizados de erros médicos e insuficiências dos sistemas de cuidados de saúde.
Os conceitos sobre a segurança do paciente variam de um país para outro → imprescindível facilitar a colaboração e troca de informações entre os países.
Resultado: Classificação Internacional para a Segurança do Paciente feita a partir de Taxonomia da segurança do paciente (2004).
Importância do acordo linguístico e conceitual.
Agrupa os termos controlados em dez macroclasses e 48 macrodescritores.
Os termos preferidos formam um glossário com definições. Aparecem relacionados hierarquicamente dentro de uma ontologia de domínio explícita.
Exemplo:
http://www.who.int/patientsafety/implementation/icps/icps_full_report_es.pdf
Taxonomias representativas. Setor da saúde
Taxonomias padronizados para que todos os profissionais de enfermagem participem de uma linguagem comum e inequívoca.
Plano de cuidados segundo a taxonomia NANDA: os sete Diagnósticos de Enfermagem selecionados desde os critérios de desempenho, intervenções e atividades interdisciplinares.
As etiquetas diagnósticas de NANDA relacionasse com a taxonomia de Critérios de resultados NOC e com a taxonomia NIC para classificar as intervenções de enfermagem.
Taxonomias representativas. Setor da saúde
Exemplo do Listado de Diagnósticos Taxonomia NANDA
(http://enfermeriaactual.com/listado-de-diagnosticos-nanda/).
(00137) Aflicción crónica
La persona (familiar, cuidador o individuo con una enfermedad o discapacidad crónica)
presenta un patrón cíclico, recurrente y potencialmente progresivo de tristeza omnipresente
en respuesta a una pérdida continua en el curso de una enfermedad o discapacidad.
Factores relacionados:
- Muerte de un ser querido.
- La persona experimenta uno o más acontecimientos desencadenantes (crisis en el
manejo de la enfermedad, crisis relacionadas con edades de desarrollo y oportunidades
perdidas)….
(00071) Afrontamiento defensivo
(00074) Afrontamiento familiar comprometido…
Organização semântica de repositórios de objetos de aprendizagem
Ordenação de recursos em uma plataforma para associa-los com as disciplinas e usá-los.
Integram as taxonomias tradicionais de aprendizagem (Bloom, ...).
Suportam objetos de aprendizagem para permitir a reutilização, flexibilidade, acessibilidade e adaptabilidade (Taxonomia de tipos de objetos de aprendizagem).
Agrupados conter metadados que facilitam a classificação de materiais.
Atualizando a Taxonomia de Bloom, impulsionado por novas atividades, aprendizagem e casos de comportamento que estão aparecendo como digital é alargar a sua utilização (e Krathwohl ANDERSON, 2001).
Comentários finais
A utilização institucional das folksonomias causa a contradição de
transitar desde as palavras-chave para as classificações.
No caso das taxonomias tem evoluído desde o caráter solo terminológico
e desde a representação plana para a representação semântica, então
ontológica.
Mucha gracias por su atención