buscador semántico

23
UNIVERSIDAD TÉCNICA PARTICULAR DE LOJA Sistemas Basados en El Conocimiento Temas del Proyecto “Buscador Semántico de Libros” Elaborado por: Flor Cuenca Luis Sancho Docente: Ing. Priscila Valdivieso Ciclo: 10

Upload: flor-cuenca

Post on 18-Dec-2014

1.552 views

Category:

Education


2 download

DESCRIPTION

En este proyecto se usan varias herramientas para crear un buscador semántico.

TRANSCRIPT

Page 1: Buscador Semántico

UNIVERSIDAD TÉCNICA PARTICULAR DE LOJA

Sistemas Basados en El Conocimiento

Temas del Proyecto

“Buscador Semántico de Libros”

Elaborado por: Flor Cuenca Luis Sancho

Docente: Ing. Priscila Valdivieso

Ciclo: 10

Page 2: Buscador Semántico

Sistemas Basados en el Conocimiento

DOMINIO DEL PROYECTO

Contar con un buscador que facilite encontrar recursos de una manera mucho más precisa es un objetivo bastante ansiado por los internautas de hoy, sin embargo es de mucha utilidad contar con un buscador que nos faciliten las búsquedas de catálogo de recursos digitales dentro de una biblioteca, razón por la cual este proyecto va enfocado en aquello que es de mucha utilidad al momento de buscar información acerca de un tema en específico, generando al usuario la posibilidad de asignarle una valoración sobre su contenido para así mejorar los resultados presentados.

El eje principal de este proyecto va enfocado en la búsqueda de recursos educativos que traten sobre un tema en específico, brindándole al usuario los metadatos del recurso que le será de utilidad para lo que está buscando.

Cabe recalcar que el buscador que se pretende desarrollar se limitará únicamente a realizar búsquedas de recursos que pertenezcan al área técnica y que estén dentro de las categorías que posteriormente serán definidas.

Para concluir lo que se busca con este aplicativo es inferir el conocimiento almacenado en una ontología o en una base de datos e ir alimentado a la base del conocimiento con nueva información (rating) y con ello obtener un resultado muchos más acorde a lo que estamos buscando, siendo como agente activo el usuario con sus aportaciones para contribuir a la Base de Conocimientos.

ALCANCE

Nuestro proyecto tiene como objetivo permitir realizar las siguientes actividades dentro del buscador de catálogos para una determinada biblioteca.

1. Metadatos.- Ésta información se refiere a los datos que describirán un recurso y contendrá los siguientes campos:

* Titulo: Titulo del recurso.

* Autor: Autor o autores

* Año: Año de publicación del recurso

* Edición: Número o año de edición

* Descripción: Información que permitirá al buscador inferir a que categoría pertenece, será de mucha utilidad al momento de buscar resultados para el usuario.

* Editorial: Editorial que se encarga de la distribución de los ejemplares.

2. Buscador.- El buscador únicamente obtendrá información de la base de conocimiento que se encuentra almacenada en la ontología y en una base de datos que será alimentada con información

Buscador Semá[email protected]

[email protected]

Page 3: Buscador Semántico

Sistemas Basados en el Conocimiento

que el usuario ingrese acerca de un determinado libro, siendo el recurso priorizado en la siguiente búsqueda que realice un usuario.

3. Opciones de usuario.- El usuario podrá catalogar a un recurso dentro de una escala de valoración entre 1 y 10 de acuerdo a su utilidad, dicha información será almacenada en la BD para ser tomada en cuenta en las próximas búsquedas.

4. Recursos.- La información que se presentará al usuario es únicamente lo que se describe en los metadatos, no existirá la posibilidad de descargar el material en ningún formato, simplemente serán de solo lectura.

5. Opciones de búsqueda.- El buscador presentara resultados únicamente para aquellos recursos que se encuentren dentro del área técnica, por lo tanto si se utiliza terminología que no pertenece a dicha área no arrojará ningún resultado.

6.-Terminología a utilizar.- Para realizar una búsqueda se puede utilizar vocabulario que se encuentre únicamente dentro de los recursos que pertenecen al área técnica.

“Ejemplo: Si estamos buscando información que hable acerca de logaritmos, el buscador automáticamente sabrá que el usuario está buscando un recurso que pertenece al área técnica y por ende presentará en orden de prioridad todos aquellos recursos que pertenecen a dicha área.”

7. Prioridad de resultados.- En caso de que dos o más recursos tenga el mismo nivel de aceptación en base a lo que el usuario busca, se tomará en cuenta el rating (número de aceptaciones dadas por los usuarios) que contiene el recurso y se presentaran en forma descendente.

HERRAMIENTAS A USAR

Para el desarrollo del proyecto “Buscador Semántico” se usaron las siguientes herramientas:

CmapTools Coe: nos permitirá describir las relaciones que existen en cada una de las clases con los objetos.

SPARQL: lenguaje estandarizado para la consulta de grafos RDF, tecnología clave en el desarrollo de la Web Semántica.

Jena: es un framework Java para la creación de la Web Semántica aplicaciones. Proporciona un entorno de programación para RDF , RDFS y de OWL , SPARQL e incluye una base del motor de inferencia de la regla.

Richfaces: es una librería de componentes visuales para JSF, escrita en su origen por Exadel y adquirida por Jboss. Además, RichFaces posee un framework avanzado para la integración de funcionalidades Ajax en dichos componentes visuales, mediante el soporte de la librería Ajax4JSF.

Mysql: es un sistema de gestión de base de datos relacional, multi-hilo y multiusuario con más de seis millones de instalaciones.

Buscador Semá[email protected]

[email protected]

Page 4: Buscador Semántico

Sistemas Basados en el Conocimiento

Protege: es una de código abierto plataforma gratuita que proporciona una creciente comunidad de usuarios con un conjunto de herramientas para construir modelos de dominio y aplicaciones basadas en el conocimiento con ontologías.

Java: lenguaje de programación y la primera plataforma informática creada por Sun Microsystems en 1995.

CATEGORÍAS

Las principales categorías que se manejaran serán:

Matemáticas Proyectos Electrónica InteligenciaArtificial Redes Física Web Software

OBJETOS

1.- Recurso

- Titulo

- Autor

- Área a la que pertenece.

- Año de publicación

2.- Usuario

PROPIEDADES

- Username

- Nombre

- Apellido

- Dirección

- Nacionalidad

Buscador Semá[email protected]

[email protected]

Page 5: Buscador Semántico

Sistemas Basados en el Conocimiento

- Edad

TAREA 1: CONSTRUCCIÓN DEL GLOSARIO DE TÉRMINOS

Nombre Sinónimo Acrónimo Descripción TipoAccesibilidad --  Se   refiere   a   la   accesibilidad 

que   tendrá   un   determinado recurso.

Propiedad de clase

Agentes -- Término   más   usado   en   IA hacer referencia a robots que hacen el trabajo manual de los humanos   los   mismos   está programados.

Propiedad de clase

Año de edición Anio_edicion Hace   referencia   al     año   de edición   de   un   determinado libro.

Propiedad de clase

Antenas -- Dispositivo   de   formas   muy diversas que, en los emisores y   receptores   de   ondas electromagnéticas,   sirve   para emitirlas o recibirlas

Propiedad de clase

Aplicaciones -- Cada   uno   de   los   programas que,   una   vez   ejecutados, permiten   trabajar   con   el ordenador

Propiedad de clase

Are -- Dícese de que un objeto que es   parte   de   una   categoría   o clase.

Relación

Artificial --  Algo no natural. Propiedad de claseAutor --   Persona que realiza, causa u 

origina algo.Propiedad de clase

Cableado --   Conjunto   de   cables   que forman parte de un aparato o sistema eléctrico.

Propiedad de clase

can be -- Dícese de que un objeto que puede   ser   parte   de   una categoría o clase.

Relación

Capas --   Cada   una   de   las   partes superpuestas   que   forman   un todo   en   un   cableado   o estructura.

Propiedad de clase

Circuitos --   Conjunto   de   conductores que   recorre   una   corriente 

Propiedad de clase

Buscador Semá[email protected]

[email protected]

Page 6: Buscador Semántico

Sistemas Basados en el Conocimiento

eléctrica.Codigo --   Serie   de   líneas   y   números 

asociados   para   generar nuevas aplicaciones.

Propiedad de clase

Compuertas --  Se   refiere   a   las   compuertas dentro   de   los   circuitos electrónicos.

Propiedad de clase

Contenido --  Se refiere al contenido de un recurso.

Propiedad de clase

Contiene --   Dícese de que una clase que contiene un objeto.

relación

Control --  Una   de   las   etapas   de   la elaboración de un proyecto.

Propiedad de clase

Direccion --     Una   de   las   etapas   de   la elaboración de un proyecto.

Propiedad de clase

Disenio --  Estructura   de   un   proyecto, como se verá para el  usuario final.

Propiedad de clase

Ecuaciones --  Igualdad que contiene una o más funciones.

Propiedad de clase

Edicion --  Conjunto   de   ejemplares   de una obra de una sola.

Propiedad de clase

Editorial --  Empresa   que   se   dedica   a imprimir recursos.

Propiedad de clase

Electronica --   Rama de la física que estudia los   fenómenos basados en  la influencia   de   campos electromagnéticos   sobre   el movimiento de los electrones libres en el  vacío,  en gases o en semiconductores

Clase

Encriptacion --  Forma   de   seguridad   para acceso   a   un   sitio,   se   usan algoritmos.

Propiedad de clase

Energia --  Calor,   combustible, carburante,   electricidad, petróleo, gas

Propiedad de clase

Estandares -- Tipo, modelo, patrón Propiedad de claseFisica -- Ciencia,   mecánica,   acústica, 

termodinámica,   electricidad, radiactividad, óptica

Clase

--Formulas --  Enunciado,   expresión,   ley, 

término, formulaciónPropiedad de clase

Funciones --  Diferentes tareas que se han  Propiedad de claseBuscador Semántico

[email protected]@gmail.com

Page 7: Buscador Semántico

Sistemas Basados en el Conocimiento

especificado   y   que   se   deben llevar a cabo.

Gestion --  Dirección,   gobierno, administración

Propiedad de clase

Humana --  Hombre,   persona,   ser, individuo, ente, sujeto

Propiedad de clase

Informacion --  Aviso,   reportaje,   testimonio, comunicación,   aclaración, advertencia,   asesoría, averiguación, indagación

Propiedad de clase

Inteligencia --  Intelecto,   mente, pensamiento,   imaginación, comprensión,   conocimiento, entendimiento, razonamiento, juicio, razón

Propiedad de clase

Inteligencia Artificial -- Esta   expresión   se   usa   para referirse   a   la  disciplina  de   la informática

Clase

Leyes --  En la física se refiere a  peso, medida,   proporción, porcentaje.

Propiedad de clase

Libro --  Ejemplar,   tomo,   volumen, obra, texto, manual.

Clase

Logaritmos --  Dícese del  exponente, base. Propiedad de claseLogica --  Dícese   de   la   dialéctica, 

razonamiento, métodoPropiedad de clase

Logicas --    Dícese   de   la   dialéctica, razonamiento, método

Propiedad de clase

Maquetacion --   Distribución de elementos en el diseño gráfico.

Propiedad de clase

Masa --  En   física,   es   la   cantidad   de materia de un cuerpo.

Propiedad de clase

Matematicas --  Ciencia   que,   partiendo de axiomas y   siguiendo   el razonamiento   lógico,   estudia las   propiedades   y   relaciones cuantitativas   entre   los   entes abstractos.

Clase

Metodologias -- Hace referencia al conjunto de procedimientos   basados en principios   lógicos, utilizados   para   alcanzar   una gama  de  objetivos  que   rigen en   una investigación científica o   en   una exposición doctrinal.

Propiedad de clase

Buscador Semá[email protected]

[email protected]

Page 8: Buscador Semántico

Sistemas Basados en el Conocimiento

must be --  Dícese   de   que   un   objeto puede   ser   parte   de   una categoría o clase.

Relación

Nombre -- Es   la   designación   o denominación verbal.

Propiedad de clase

Numeros --  Es una entidad abstracta que representa   una   cantidad   (de una magnitud).

Propiedad de clase

Operadores --  Símbolo   matemático   que indica que debe ser llevada a cabo   una   operación especificada   sobre   un   cierto número de operandos

Propiedad de clase

Orden -- Propiedad de claseOwl --  Extensión de los archivos que 

se trabajan en Protégé.Propiedad de clase

Paginas --  Cantidad de hojas de un libro o revista.

Propiedad de clase

PaginaWeb --  Sitio en el cual se encuentran varios recursos.

Clase

Paper --  Recurso   digital   de   una investigación.

Clase

Peso --  Cantidad de medida. Propiedad de clasePlanificacion --  Una de  las tareas dentro del 

proceso   de   desarrollo   de   un proyecto.

Propiedad de clase

Primero -- Haciendo   referencia   a ecuaciones   de   primer   grado, es   aquella   que   después   de simplificada tiene la forma ax + b = c o sea una sola variable y con exponente 1

Propiedad de clase

Procesos --  Pasos   que   deben   ejecutarse para   la   elaboración   de   un proyecto.

Propiedad de clase

Programacion --  Acción y efecto de programar. Propiedad de claseProtocolos --  Las vías por donde cierto tipo 

de información va a circular.Propiedad de clase

Proyecto --  Tarea   la   cual   concierne diferentes factores.

Clase

Radiactividad --  Propiedad de los isótopos que son "inestables".

Propiedad de clase

Recurso -- La   palabra recurso se   emplea en   diversos   ámbitos,   pero siempre con el  significado de ser   medio   para   el   logro   de 

Clase

Buscador Semá[email protected]

[email protected]

Page 9: Buscador Semántico

Sistemas Basados en el Conocimiento

fines.Redes --  Hace referencia a un conjunto 

de   entidades   (objetos, personas,   etc.)   conectadas entre sí.

Clase

Resultados --  Efectos que se obtienen luego de aplicar alguna metodología de trabajo.

Propiedad de clase

Revista --  Recurso en el cual se publica temas de interés.

Clase

Robótica --  Rama de la Electrónica. Propiedad de claseSe clasifican en --  Se define así para determinar 

la   clasificación   de   varios objetos.

Relación

Segundo --  Hacer   referencia   a   la igualdad que se nos forma al sustituir la " y " de una función cuadrática   por   0,   en   una ecuación de segundo grado.

Propiedad de clase

Seguridad -- Conjunto de medidas tomadas para protegerse contra robos, ataques   tanto   físicos   como lógicos.

Propiedad de clase

Semantica -- Estudio  del   significado  de   los signos   lingüísticos;   esto   es, palabras,   expresiones   y oraciones.

Propiedad de clase

Software --  Conjunto   de   programas   que tiene un PC.

Clase

Son definidos como --  Se   lo   define   así   para   hacer referencia   a   un   conjunto   de objetos.

Relación

Telecomunicaciones --  Sistema   de   Conmutación, Interconexión   y   finalmente subsistema de Soporte

Propiedad de clase

Tiene -- RelaciónTitulo --  Dícese   del   nombre   de   un 

recurso, libro o revista.Propiedad de clase

Transporte --  En   redes   se  dice  de   la   capa que ayuda a transferir datos.

Propiedad de clase

Trigonometria --  Parte   de   la  matemática   que se  encarga  del  cálculo  de  los elementos de los triángulos.

Propiedad de clase

url --  Consiste en una secuencia de caracteres   que   identifica   de forma   única   a   algún   recurso 

Propiedad de clase

Buscador Semá[email protected]

[email protected]

Page 10: Buscador Semántico

Sistemas Basados en el Conocimiento

de   Internet   sea   una   imagen, una   página   o   cualquier   otro recurso

Usuarios --  Clientes   finales   que   se benefician  de  un   resultado  o proyecto.

Propiedad de clase

Vectores -- Es   todo   segmento   de   recta dirigido en el espacio.

Propiedad de clase

Vulnerabilidades --  Se dice de las desventajas de un programa o proyecto tanto a nivel físico o lógico.

Propiedad de clase

Web -- Sistema   de   distribución   de información   basado en hipertexto o   hipermedias enlazadas y accesibles a través de Internet.

Clase

TAREA 2: CONSTRUCCIÓN DE LA TAXONOMÍA

Para tener una mejor idea de las diversas relaciones entre las propiedades se creó una taxonomía en CmapTools Coe.

Buscador Semá[email protected]

[email protected]

Page 11: Buscador Semántico
Page 12: Buscador Semántico

TAREA 3: CONSTRUCCIÓN DE LAS RELACIONES BINARIAS

Page 13: Buscador Semántico

Sistemas Basados en el Conocimiento

IMPLEMENTACIÓN

Para la implementación de la funcionalidad del proyecto se realizaron las siguientes actividades:

Se seleccionó el framework Jena, el cual nos permite trabajar una ontología con una base de datos relacional utilizando para ello consultas sparql que son procesadas por dicho framework para posteriormente extraer los datos de la BD.

Se presenta un formulario donde se solicita al usuario que ingrese un tema en específico que quiere buscar.

En base al criterio ingresado por el usuario, se arma la consulta sparql que posteriormente será ejecutada por Jena para extraer los datos desde la BD.

Una vez que obtenemos los resultados de la consulta, estos son presentados al usuario dándole la posibilidad de seleccionar cualquiera de ellos y ver más detalle del libro.

EN NUESTRO PROYECTO SE PUEDE APRECIAR LAS SIGUIENTES

CLASES:

Buscador Semá[email protected]

[email protected]

Page 14: Buscador Semántico

Sistemas Basados en el Conocimiento

Área, Autor, Categoría, Editorial, Idioma, Libro, PaginaWeb, País.

A continuación tenemos los objetos que van a relacionar las clases:

Buscador Semá[email protected]

[email protected]

Page 15: Buscador Semántico

Sistemas Basados en el Conocimiento

Libro, país, idioma, area, paginaweb, autor, editorial, categoría, hasidioma, hascategoria, hasarea.

Buscador Semá[email protected]

[email protected]

Page 16: Buscador Semántico

Sistemas Basados en el Conocimiento

A continuación tenemos los atributos de las clases:

Y AHORA LAS PROPIEDADES EXTRÍNSECAS E INTRÍNSECAS

IDENTIFICADAS DE CADA CLASE.

Extrínsecas(heredadas) Intrínsecas(propias)ÁREA libroAUTOR Dirección , nombreCATEGORÍA LibroIDIOMA InstanciasLIBRO Año de publicación, apellido. Dirección, url, descripción,

volumen, nombre, titulo.PAGINAWEB InstanciasPAÍS país Idioma

Buscador Semá[email protected]

[email protected]

Page 17: Buscador Semántico

Sistemas Basados en el Conocimiento

CONCLUSIONES

Para el desarrollo de este proyecto se delimito acerca del entorno de trabajo en el que va a interactuar de manera que se pueda lograr el objetivo deseado.

Con la ayuda de herramientas como CmapTools Coe se puede diseñar las relaciones entre las clases de manera fácil.

Con la ayuda de Protégé se puede modelar la estructura que se diseñó en CmapTools Coe y en la cual se puede agregar diferentes características que ayudan a entender mejor la problemática con la que se está trabajando.

RECOMENDACIONES

Se debe definir bien el alcance de manera que la Ontología no se expanda mucho y así se pueda tener resultados óptimos.

BIBLIOGRAFÍA

Consultado abril del 2010, Sinbad Sistemas de Información y Base de datos: http://sinbad.dit.upm.es/docencia/doctorado/curso0809/curso0809.html

Consultado abril del 2010, RichFaces Developer Guide:

http://docs.jboss.org/richfaces/latest_3_3_X/en/devguide/html_single/

Consultado abril, mayo del 2010, Protégé:

http://protege.stanford.edu/

Buscador Semá[email protected]

[email protected]