Tailoring dependency models to NLP tasks

dc.contributor
Universitat Pompeu Fabra. Departament de Traducció i Ciències del llenguatge
dc.contributor.author
Kolz, Benjamin
dc.date.accessioned
2016-09-14T10:41:56Z
dc.date.available
2016-09-14T10:41:56Z
dc.date.issued
2016-04-22
dc.identifier.uri
http://hdl.handle.net/10803/393730
dc.description.abstract
Currently available dependency structures differ significantly in the linguistic criteria they are based on, but are not always adequate for their later use in natural language processing tasks. This dissertation analyses the needs of some of these tasks, in particular temporal and discourse parsing, and suggests task-based dependency structures. A surface-syntax dependency structure is taken as base version, which is then tailored to the needs of the corresponding task by means of head selection, customised syntactic function tagset and collapsed dependencies. The work is grounded on the Spanish corpus AnCora, establishing a surface-syntax base version from its constituent structure level. Two dependency models are created, Temporal and Discourse Dependencies, which take the base version as input and adapt it automatically to the task-based versions. The resulting versions are evaluated by network analysis methods, which confirm the adequacy of these new dependency structures with respect to the specific tasks.
en_US
dc.description.abstract
Las estructuras de dependencias disponibles actualmente incluyen diferencias significativas en cuanto a los criterios lingüísticos en que se basan, y no siempre son adecuadas para su uso en tareas del procesamiento de lenguaje natural. Esta tesis doctoral analiza las necesidades de algunas de estas tareas, concretamente los análisis temporal y discursivo, y propone la creación de estructuras de dependencias orientadas a las mismas. Una estructura de dependencias puramente sintáctica sirve como versión básica que se adapta a las necesidades de cada tarea a través de la selección del head, de un etiquetario de funciones sintácticas adecuado y del recorte de algunos caminos de dependencias. El proyecto parte de la versión castellana del corpus AnCora y establece una versión puramente sintáctica a partir de sus estructuras de constituyentes. Se crean dos modelos de dependencias, Temporal and Discourse Dependencies, que usan la versión básica como entrada y la adaptan de forma automática a las versiones orientadas en las tareas específicas. Las versiones resultantes se evalúan a través de métodos de análisis de redes, que confirman la adecuación de estas nuevas estructuras de dependencias para las respectivas tareas.
en_US
dc.format.extent
232 p.
en_US
dc.format.mimetype
application/pdf
dc.language.iso
eng
en_US
dc.publisher
Universitat Pompeu Fabra
dc.rights.license
ADVERTIMENT. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal, així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas, en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs.
dc.source
TDX (Tesis Doctorals en Xarxa)
dc.subject
Dependency parsing
en_US
dc.subject
Corpus
en_US
dc.subject
Discourse relations
en_US
dc.subject
Time expressions
en_US
dc.subject
Syntax analysis
en_US
dc.subject
Parsing de dependencias
en_US
dc.subject
Relaciones discursivas
en_US
dc.subject
Expresiones temporales
en_US
dc.subject
Análisis sintáctico
en_US
dc.title
Tailoring dependency models to NLP tasks
en_US
dc.type
info:eu-repo/semantics/doctoralThesis
dc.type
info:eu-repo/semantics/publishedVersion
dc.subject.udc
81
en_US
dc.contributor.authoremail
benjamin.kolz@upf.edu
en_US
dc.contributor.director
Badia i Cardús, Antoni
dc.contributor.director
Saurí Colomer, Roser
dc.embargo.terms
cap
en_US
dc.rights.accessLevel
info:eu-repo/semantics/openAccess
dc.description.degree
Programa de doctorat en Traducció i Ciències del Llenguatge


Documents

tbk.pdf

2.009Mb PDF

This item appears in the following Collection(s)