Automatic acquisition of lexical-semantic relations: gathering information in a dense representation

dc.contributor
Universitat Pompeu Fabra. Departament de Traducció i Ciències del llenguatge
dc.contributor.author
Necşulescu, Silvia
dc.date.accessioned
2016-04-20T08:27:55Z
dc.date.available
2016-04-20T08:27:55Z
dc.date.issued
2016-02-01
dc.identifier.uri
http://hdl.handle.net/10803/374234
dc.description.abstract
Lexical-semantic relationships between words are key information for many NLP tasks, which require this knowledge in the form of lexical resources. This thesis addresses the acquisition of lexical-semantic relation instances. State of the art systems rely on word pair representations based on patterns of contexts where two related words co-occur to detect their relation. This approach is hindered by data sparsity: even when mining very large corpora, not every semantically related word pair co-occurs or not frequently enough. In this work, we investigate novel representations to predict if two words hold a lexical-semantic relation. Our intuition was that these representations should contain information about word co-occurrences combined with information about the meaning of words involved in the relation. These two sources of information have to be the basis of a generalization strategy to be able to provide information even for words that do not co-occur.
eng
dc.description.abstract
Les relacions lexicosemàntiques entre paraules són una informació clau per a moltes tasques del PLN, què requereixen aquest coneixement en forma de recursos lingüístics. Aquesta tesi tracta l’adquisició d'instàncies lexicosemàntiques. Els sistemes actuals utilitzen representacions basades en patrons dels contextos en què dues paraules coocorren per detectar la relació que s'hi estableix. Aquest enfocament s'enfronta a problemes de falta d’informació: fins i tot en el cas de treballar amb corpus de grans dimensions, hi haurà parells de paraules relacionades que no coocorreran, o no ho faran amb la freqüència necessària. Per tant, el nostre objectiu principal ha estat proposar noves representacions per predir si dues paraules estableixen una relació lexicosemàntica. La intuïció era que aquestes representacions noves havien de contenir informació sobre patrons dels contextos, combinada amb informació sobre el significat de les paraules implicades en la relació. Aquestes dues fonts d'informació havien de ser la base d'una estratègia de generalització que oferís informació fins i tot quan les dues paraules no coocorrien.
cat
dc.format.extent
147 p.
cat
dc.format.mimetype
application/pdf
dc.language.iso
eng
cat
dc.publisher
Universitat Pompeu Fabra
dc.rights.license
ADVERTIMENT. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal, així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas, en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs.
dc.source
TDX (Tesis Doctorals en Xarxa)
dc.subject
Lexical-semantic relations
cat
dc.subject
Semantics
cat
dc.subject
Semantic relations
cat
dc.subject
Natural Language Processing
cat
dc.subject
Lexical-semantic information acquisition
cat
dc.subject
Data sparsity
cat
dc.subject
Word pair representations
cat
dc.subject
Distributional hypothesis
cat
dc.subject
Latent relational hypothesis
cat
dc.subject
Hypernyms
cat
dc.subject
Co-hyponyms
cat
dc.subject
Meronyms
cat
dc.subject
Selectional preferences
cat
dc.subject
Graph theory
cat
dc.subject
Word embeddings
cat
dc.subject
Relacions lexicosemàntiques
cat
dc.subject
Semàntica
cat
dc.subject
Relacions semàntiques
cat
dc.subject
Processament del Llenguatge Natural
cat
dc.subject
Adquisicio d’informació lexicosemantica
cat
dc.subject
Representaciò de parells de paraules
cat
dc.subject
Hipòtesi distribucional
cat
dc.subject
Hiperònims
cat
dc.subject
Cohipònims
cat
dc.subject
Merònims
cat
dc.subject
Preferencies de selecció
cat
dc.subject
Teoría dels grafs
cat
dc.title
Automatic acquisition of lexical-semantic relations: gathering information in a dense representation
cat
dc.type
info:eu-repo/semantics/doctoralThesis
dc.type
info:eu-repo/semantics/publishedVersion
dc.subject.udc
81
cat
dc.contributor.authoremail
silvia.necsulescu@upf.edu
cat
dc.contributor.director
Bel Rafecas, Núria
dc.embargo.terms
cap
cat
dc.rights.accessLevel
info:eu-repo/semantics/openAccess
dc.description.degree
Programa de doctorat en Traducció i Ciències del Llenguatge


Documents

tsn.pdf

1.916Mb PDF

This item appears in the following Collection(s)