2024-03-28T21:17:58Zhttps://www.tdx.cat/oai/requestoai:www.tdx.cat:10803/4049852024-03-15T10:58:02Zcom_10803_236col_10803_690279
Knowledge acquisition in the information age: the interplay between lexicography and natural language processing
Espinosa-Anke, Luis
luis.espinosa@upf.edu
true
Saggion, Horacio
true
Artificial intelligence
Lexicography
Computational linguistics
Inteligencia artificial
Lexicografía
Lingüística computacional
Natural Language Processing (NLP) is the branch of Artificial Intelligence aimed at understanding
and generating language as close as possible to a human’s. Today, NLP benefits substantially of
large amounts of unnanotated corpora with which it derives state-of-the-art resources for text
understanding such as vectorial representations or knowledge graphs. In addition, NLP also
leverages structured and semi-structured information in the form of ontologies, knowledge bases
(KBs), encyclopedias or dictionaries. In this dissertation, we present several improvements in NLP
tasks such as Definition and Hypernym Extraction, Hypernym Discovery, Taxonomy Learning or
KB construction and completion, and in all of them we take advantage of knowledge repositories of
various kinds, showing that these are essential enablers in text understanding. Conversely, we use
NLP techniques to create, improve or extend existing repositories, and release them along
with the associated code for the use of the community.
El Procesamiento del Lenguaje Natural (PLN) es la rama de la Inteligencia Artificial que se ocupa
de la comprensión y la generación de lenguage, tomando como referencia el lenguaje humano. Hoy,
el PLN se basa en gran medida en la explotación de grandes cantidades de corpus sin anotar, a partir
de los cuales se derivan representaciones de gran calidad para la comprensión automática de texto,
tales como representaciones vectoriales o grafos de conocimiento. Además, el PLN también explota
información estructurada y parcialmente estructurada como ontologías, bases de conocimiento
(BCs), enciclopedias o diccionarios. En esta tesis presentamos varias mejoras del estado del arte en
tareas de PLN tales como la extracción de definiciones e hiperónimos, descubrimiento de hiperónimos,
inducción de taxonomías o construcción y enriquecimiento de BCs, y en todas ellas
incorporamos repositorios de varios tipos, evaluando su contribución en diferentes áreas del PLN.
Por otra parte, también usamos técnicas de PLN para crear, mejorar o extender repositorios ya
existentes, y los publicamos junto con su código asociado con el fin de que sean de utilidad para la
comunidad.
2017-08-01T09:39:55Z
2017-08-01T09:39:55Z
2017-07-14
info:eu-repo/semantics/doctoralThesis
info:eu-repo/semantics/publishedVersion
http://hdl.handle.net/10803/404985
eng
L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc-sa/4.0/
http://creativecommons.org/licenses/by-nc-sa/4.0/
info:eu-repo/semantics/openAccess
Universitat Pompeu Fabra
TDX (Tesis Doctorals en Xarxa)