bibliotecasdigitais

6
Escalabilidade e eficiência em bibliotecas digitais usando organização semântica de dados ICPD – Elisabete Cunha

Upload: gueste4f45e5

Post on 27-Jul-2015

115 views

Category:

Technology


0 download

TRANSCRIPT

Page 1: Bibliotecasdigitais

Escalabilidade e eficiência em bibliotecas digitais usando organização semântica de

dados

ICPD

– E

lisab

ete

Cunh

a

Page 2: Bibliotecasdigitais

modelação de um sistema de classificação e de

agrupamento automático de documentos, de

acordo com a sua proximidade semântica

+

Integração de uma classificação social

Page 3: Bibliotecasdigitais

Classificação Social

Pretende-se que os utilizadores possam:

• classificar

• comentar

• associar tags

Sob a hipótese de permitir uma melhor classificação e

organização dos documentos

Page 4: Bibliotecasdigitais

Objectivos

• Proposta de um algoritmo capaz de realizar a classificação semântica de documentos,

de forma escalável (para ordens de grandeza de centenas de milhar de documentos).

• Proposta de algoritmo para realizar o clustering semântico de documentos de forma

eficiente e escalável.

• Proposta de algoritmos para redução de dimensão espacial e para pré-tratamento de

dados.

• Estudo e modelação matemática da integração de uma classificação social com a

classificação automática.

• Modelação final do sistema incluindo todas as sub-partes.

Page 5: Bibliotecasdigitais

Como?

• Comparação de algoritmos e tecnologias

– Redução da dimensão espacial e do ruído nos dados

– Algoritmos de classificação e clustering

• Dicionário dinâmico

• Classificação social

• Modelação matemática, integral, do modelo

Page 6: Bibliotecasdigitais

1 -Classificação automática através da proximidade semântica

2 - Classificação Social

1 ?2 ?

1+2 ?