Pattern-based automatic induction of domain adapted resources for social media analysis

dc.contributor
Universitat Pompeu Fabra. Departament de Traducció i Ciències del llenguatge
dc.contributor.author
Vázquez Suárez, Silvia
dc.date.accessioned
2016-02-11T10:59:33Z
dc.date.available
2016-02-11T10:59:33Z
dc.date.issued
2016-01-22
dc.identifier.uri
http://hdl.handle.net/10803/350801
dc.description.abstract
In this dissertation, we analyze different aspects of the language used in texts published along different social media, and we propose a set of methods for the automatic extraction of polar adjectives as well as for the automatic classification of these texts. First of all, we propose a new classification of polar adjectives according to their lexical features, based on a case study. Secondly, we implement a new domain adaptable system for the automatic extraction of polar adjectives (along with their polarity values), reducing the use of external language resources. Finally, we propose two automatic classifiers (one rule-based and one based on Decision Trees) to identify documents belonging to different stages of the purchase process and texts that analyze different aspects of the product.
eng
dc.description.abstract
En esta tesis, analizamos diferentes aspectos del lenguaje utilizado en los textos publicados en diferentes medios sociales y proponemos una serie de métodos para la extracción automática de adjetivos de opinión, así como para la clasificación automática de dichos textos. En primer lugar, proponemos una nueva clasificación de los adjetivos de opinión de acuerdo con sus características léxicas, basada en un estudio de caso. En segundo lugar, implementamos un nuevo sistema de extracción automática de adjetivos de opinión (junto con sus valores de polaridad), adaptable al dominio y que reduce el uso de recursos lingüísticos externos. Finalmente, proponemos dos clasificadores automáticos (uno basado en reglas y otros basados en ´arboles de decisión) para identificar textos pertenecientes a distintas fases del proceso de compra y textos que analizan diferentes aspectos del producto.
spa
dc.description.abstract
En aquesta tesi, analitzem diferents aspectes del llenguatge utilitzat en els textos publicats en diferents mitjans socials i proposem una sèrie de mètodes per a l’extracció automàtica d’adjectius d’opinió així com per a la classificació automàtica d’aquests textos. En primer lloc, proposem una nova classificació dels adjectius d’opinió, basada en un estudi de cas, més d’acord amb les seves característiques lèxiques. En segon lloc, vam implementar un nou sistema d’extracció automàtica d’adjectius d’opinió (juntament amb els seus valors de polaritat), adaptable al domini i que redueix l’´us de recursos lingüístics externs. Finalment, proposem dos classificadors automàtics (un basat en regles i un altre basats en arbres de decisió) per identificar textos que pertanyen a diferents fases del procés de compra i textos que analitzen diferents aspectes del producte.
cat
dc.format.extent
238 p.
cat
dc.format.mimetype
application/pdf
dc.language.iso
eng
cat
dc.publisher
Universitat Pompeu Fabra
dc.rights.license
L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc-nd/3.0/es/
dc.rights.uri
http://creativecommons.org/licenses/by-nc-nd/3.0/
*
dc.source
TDX (Tesis Doctorals en Xarxa)
dc.subject
Natural language processing
cat
dc.subject
Computational linguistics
cat
dc.subject
Language resources
cat
dc.subject
Sentiment analysis
cat
dc.subject
Opinion mining
cat
dc.subject
Social media analysis
cat
dc.subject
Applied linguistics
cat
dc.subject
Procesamiento del lenguaje natural
cat
dc.subject
Lingüística computacional
cat
dc.subject
Recursos lingüísticos
cat
dc.subject
Análisis de sentimiento
cat
dc.subject
Minería de opinión
cat
dc.subject
Análisis de medios sociales
cat
dc.subject
Lingüística aplicada
cat
dc.subject
Processament del llenguatge natural
cat
dc.subject
Recursos lingüístics
cat
dc.subject
Anàlisi del sentiment
cat
dc.subject
Mineria d'opinió
cat
dc.subject
Anàlisi de mitjans socials
cat
dc.title
Pattern-based automatic induction of domain adapted resources for social media analysis
cat
dc.type
info:eu-repo/semantics/doctoralThesis
dc.type
info:eu-repo/semantics/publishedVersion
dc.subject.udc
004
cat
dc.subject.udc
81
cat
dc.contributor.authoremail
silvia.vazquez@upf.edu
cat
dc.contributor.director
Bel Rafecas, Núria
dc.embargo.terms
cap
cat
dc.rights.accessLevel
info:eu-repo/semantics/openAccess
dc.identifier.dl
B 4418-2016
cat
dc.description.degree
Programa de doctorat en Traducció i Ciències del Llenguatge


Documents

tsvs.pdf

2.659Mb PDF

This item appears in the following Collection(s)