Elaboración de un tesauro de información de actualidad y conversión en red semántica para su empleo en un sistema de recuperación periodístico.

Author

Castillo Blasco, Lourdes

Director

Cueva Martín, Alejandro de la

Date of defense

2006-09-25

ISBN

9788437066431

Legal Deposit

V-4909-2007



Department/Institute

Universitat de València. Departament d'Història de la Ciència i la Documentació

Abstract

Las experiencias iniciales con el motor de búsqueda e indización automática RetrievalWare en un centro de documentación de información de actualidad, demostraron que las asociaciones semánticas establecidas en el diccionario del sistema no ofrecían un rendimiento totalmente satisfactorio para este tipo de centros. La razón principal es la naturaleza de la red incorporada, elaborada a partir de un diccionario enciclopédico general. Por ello este trabajo plantea la posibilidad de adaptar un tesauro tradicional a las estructuras de diccionarios de este sistema y comparar el efecto de la utilización de un lenguaje controlado (tesauro) y una red semántica basada en unitérminos del lenguaje natural sobre una misma colección documental (base de datos Prensa) y sobre un sistema de recuperación basado en un motor de recuperación y de indización automática (RetrievalWare). Para conseguir este objetivo general ha sido necesario llevar a cabo la creación de un vocabulario controlado, un tesauro de información de actualidad; la conversión de las relaciones paradigmáticas de este tesauro en relaciones cuantitativas, de las que se emplean en redes semánticas, comprobar su funcionamiento y realizar una valoración paralela del rendimiento en la recuperación del tesauro construido y convertido en red semántica y de la red semántica prediseñada por los distribuidores de RetrievalWare.<br/><br/>El plan de trabajo y la metodología correspondiente se ha dividido en tres fases, atendiendo a los objetivos planteados. La primera fase ha consistido en la selección y registro de términos. Las fuentes empleadas para la extracción de los términos han tenido en cuenta tanto el criterio de autoridad literaria como el criterio de autoridad del usuario. En la segunda fase se ha elaborado el tesauro con los términos seleccionados utilizando la base de datos relacional Access y en la última fase se han exportado, también mediante Access, los términos del tesauro a un informe compatible con la estructura de la red semántica de RetrievalWare. Para la comprobación automática de errores se han utilizado programas de gestión automática de tesauros. Posteriormente se han realizado pruebas del funcionamiento del nuevo tesauro incorporado como red y además se ha comparado su rendimiento con el diccionario establecido por el sistema. El estudio del rendimiento emplea a usuarios reales que expresan sus solicitudes de información y, posteriormente, juzgan la relevancia de los resultados obtenidos en los procesos de búsqueda, permitiendo el cálculo de exhaustividad y precisión de cada sistema.

Subjects

61 - Medical sciences

Knowledge Area

Facultat de Medicina i Odontologia

Documents

castillo.pdf

6.472Mb

 

Rights

ADVERTIMENT. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal, així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas, en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs.

This item appears in the following Collection(s)