The Information structure-prosody interface: on the role of hierarchical thematicity in an empirically-grounded model

dc.contributor
Universitat Pompeu Fabra. Departament de Tecnologies de la Informació i les Comunicacions
dc.contributor.author
Domínguez Bajo, Mónica
dc.date.accessioned
2017-11-24T11:51:16Z
dc.date.available
2017-11-24T11:51:16Z
dc.date.issued
2017-11-17
dc.identifier.uri
http://hdl.handle.net/10803/457143
dc.description.abstract
This dissertation presents an empirical study on the information structure– prosody interface based on: (i) a formal description of hierarchical thematicity within a systematic language model for natural language generation within the Meaning-Text Theory; and (ii) two approaches to prosodic representation, namely, ToBI labels and acoustic parameters. A corpus of read speech by twelve native speakers of American English is used to test the viability to approach prosody generation in synthesized speech from a communicative perspective. To this end, statistical, classification and implementation experiments are carried out. The main technical contribution consists in two tools: a data-driven module for thematicitybased prosody enrichment in a speech synthesizer and an automatic prosody tagger developed under an extension of Praat for feature annotation. Results prove that thematicity spans have distinct prosodic characteristics, as previously suggested in theoretical studies, and that a tripartite hierarchical thematicity is a more appropriate representation of information structure than traditional binary flat thematicity approaches for its integration in speech technologies.
dc.description.abstract
Esta tesis presenta un estudio empírico de la interfaz estructura informativa– prosodia basado en: (i) una descripción formal de la tematicidad jerárquica que se enmarca en un modelo del lenguaje sistemático para la generación automática del lenguaje natural dentro del marco de la Teoría Sentido-Texto; y (ii) dos representaciones prosódicas utilizando etiquetas ToBI y parámetros acústicos. Se emplea un corpus de habla leída por doce hablantes nativos de inglés americano para comprobar la validez de la generación de prosodia en síntesis de voz a partir de características comunicativas. Con este objectivo, se presentan experimentos estadísticos, de clasificación y de implementación. La principal contribución técnica consiste en dos herramientas: un módulo basado en datos para el enriquecimiento prosódico de voz sintética a partir de la tematicidad y un etiquetador automático de prosodia implementado en una extensión de Praat para la anotación de características lingüísticas. Los resultados demuestran que los segmentos de tematicidad están caracterizados por rasgos prosódicos distintivos, como se había sugerido en estudios teóricos previos y que la tematicidad tripartita jerárquica es una representación más adecuada de la estructura informativa que las anteriores propuestas tradicionales de tematicidad binaria plana para su integración en las tecnologías del habla.
dc.format.extent
193 p.
dc.format.mimetype
application/pdf
dc.language.iso
eng
dc.publisher
Universitat Pompeu Fabra
dc.rights.license
L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc-nd/4.0/
dc.rights.uri
http://creativecommons.org/licenses/by-nc-nd/4.0/
*
dc.source
TDX (Tesis Doctorals en Xarxa)
dc.subject
Information structure
dc.subject
Communicative structure
dc.subject
Thematicity
dc.subject
Theme
dc.subject
Rheme
dc.subject
Prosody
dc.subject
ToBI
dc.subject
Acoustic parameters
dc.subject
Speech synthesis
dc.subject
TTS
dc.subject
Text-to-speech
dc.subject
CTS
dc.subject
Concept-to-speech
dc.subject
Automatic prosody labeling
dc.subject
Estructura informativa
dc.subject
Estructura comunicativa
dc.subject
Tematicidad
dc.subject
Tema
dc.subject
Rema
dc.subject
Prosodia
dc.subject
Parámetros acústicos
dc.subject
Síntesis de voz
dc.subject
Texto a habla
dc.subject
Concepto a habla
dc.subject
Etiquetado automático de prosodia
dc.title
The Information structure-prosody interface: on the role of hierarchical thematicity in an empirically-grounded model
dc.type
info:eu-repo/semantics/doctoralThesis
dc.type
info:eu-repo/semantics/publishedVersion
dc.subject.udc
62
dc.contributor.authoremail
monica.dominguez@upf.edu
dc.contributor.director
Wanner, Leo
dc.contributor.director
Farrús, Mireia
dc.embargo.terms
cap
dc.rights.accessLevel
info:eu-repo/semantics/openAccess
dc.description.degree
Programa de doctorat en Tecnologies de la Informació i les Comunicacions


Documents

tmdb.pdf

7.908Mb PDF

This item appears in the following Collection(s)