2024-03-28T13:30:09Zhttps://www.tdx.cat/oai/requestoai:www.tdx.cat:10803/75082024-03-15T10:58:10Zcom_10803_236col_10803_690280
TDX (Tesis Doctorals en Xarxa)
author
da Cunha Fanego, Iria
authoremail
iria.dacunha@upf.edu
authoremailshow
true
director
Wanner, Leo
director
Cabré, M. Teresa (Maria Teresa)
2011-04-12T16:35:36Z
2008-11-03
2008-04-25
9788469209769
http://www.tdx.cat/TDX-1103108-140334http://hdl.handle.net/10803/7508
B.40584-2008
En esta tesis se presenta un modelo lingüístico de resumen automático de artículos médicos en español que aúna criterios basados en la estructura textual, en las unidades léxicas y la estructura discursiva y sintáctico-comunicativa de los textos. El modelo se crea partiendo de la hipótesis de que los especialistas de cada ámbito emplean estrategias específicas a la hora de resumir. La validación de esta hipótesis mediante experimentos estadísticos permite tomar los artículos médicos acompañados de sus respectivos resúmenes como material de referencia para analizar, de cara a detectar las estrategias empleadas por los profesionales médicos para resumir sus textos. Una vez detectadas, estas estrategias se formalizan en forma de reglas y se diseña un modo de integración de las mismas. Esto da lugar al modelo presentado en esta tesis, del cual se implementa una parte. Los resúmenes resultantes se evalúan obteniendo buenos resultados, lo cual confirma que el modelo simula correctamente las estrategias empleadas por los especialistas y que estas se refieren a diversos aspectos lingüísticos.In this thesis a linguistic model of automatic summarization of Spanish medical articles that joins criteria based on the textual structure, on lexical units and on the discourse and syntactic-communicative structure of texts is presented. The model is developed under the hypothesis that specialists of a domain use specific strategies when they summarize. The validation of this hypothesis by means of statistical experiments allows us to draw upon medical articles and their respective abstracts as reference in order to determine the strategies used by medical professionals. Once these strategies have been determined, they are formalized in terms of an integrated rule-based system, of which a part is implemented. The resulting summaries have been evaluated. Good results were obtained, which confirms that the model simulates correctly the strategies used by specialists and that these strategies refer to different linguistic aspects.
spa
specialized discourse
linguistic analysis
medical article
extraction
automatic summarization
discurso especializado
análisis lingüístico
artículo médico
extracción
resumen automático
Hacia un modelo lingüístico de resumen automático de artículos médicos en español
info:eu-repo/semantics/doctoralThesis info:eu-repo/semantics/publishedVersion
URL
https://www.tdx.cat/bitstream/10803/7508/1/tidcf.pdf.pdf
File
MD5
e5d7d595411a1c336e8d371b2b361813
3699752
application/pdf
tidcf.pdf.pdf
URL
https://www.tdx.cat/bitstream/10803/7508/2/tidcf.pdf.pdf.txt
File
MD5
fb5f6f4294f72123c5f33aaec9d27bf2
784745
text/plain
tidcf.pdf.pdf.txt