bibliotecasdigitais
TRANSCRIPT
Escalabilidade e eficiência em bibliotecas digitais usando organização semântica de
dados
ICPD
– E
lisab
ete
Cunh
a
modelação de um sistema de classificação e de
agrupamento automático de documentos, de
acordo com a sua proximidade semântica
+
Integração de uma classificação social
Classificação Social
Pretende-se que os utilizadores possam:
• classificar
• comentar
• associar tags
Sob a hipótese de permitir uma melhor classificação e
organização dos documentos
Objectivos
• Proposta de um algoritmo capaz de realizar a classificação semântica de documentos,
de forma escalável (para ordens de grandeza de centenas de milhar de documentos).
• Proposta de algoritmo para realizar o clustering semântico de documentos de forma
eficiente e escalável.
• Proposta de algoritmos para redução de dimensão espacial e para pré-tratamento de
dados.
• Estudo e modelação matemática da integração de uma classificação social com a
classificação automática.
• Modelação final do sistema incluindo todas as sub-partes.
Como?
• Comparação de algoritmos e tecnologias
– Redução da dimensão espacial e do ruído nos dados
– Algoritmos de classificação e clustering
• Dicionário dinâmico
• Classificação social
• Modelação matemática, integral, do modelo
1 -Classificação automática através da proximidade semântica
2 - Classificação Social
1 ?2 ?
1+2 ?