Expression control of singing voice synthesis: modeling pitch and dynamics with unit selection and statistical approaches

dc.contributor
Universitat Pompeu Fabra. Departament de Tecnologies de la Informació i les Comunicacions
dc.contributor.author
Umbert Morist, Martí
dc.date.accessioned
2016-03-03T10:07:19Z
dc.date.available
2016-03-03T10:07:19Z
dc.date.issued
2016-01-29
dc.identifier.uri
http://hdl.handle.net/10803/361103
dc.description.abstract
This thesis focuses on the control of a singing voice synthesizer to achieve natural expression similar to a real singer. There are many features that should be controlled to achieve natural expression related to melody, dynamics, rhythm, and timbre. In this thesis we focus on the control of pitch and dynamics with a unit selection-based system, two statistically-based systems, and a hybrid system. These systems are trained with two possible expression databases that we have designed, recorded, and labeled. We define the basic units from which the databases are built of, which are basically sequences of three notes or rests. Our perceptual evaluation compares the proposed systems with other systems to see how these relate to each other. The objective evaluation focuses on the algorithms efficiency.
eng
dc.description.abstract
Aquesta tesi es centra en el control dels sintetitzadors de veu cantada per aconseguir una expressivitat natural semblant a la d'un cantant real. Hi ha moltes característiques que s'haurien de controlar per aconseguir una expressivitat natural relacionades amb la melodia, la dinàmica, el ritme i el timbre. En aquesta tesi ens centrem en el control de la freqüència fonamental i de la dinàmica amb un sistema basat en selecció d'unitats, dos sistemes estadístics, i un sistema híbrid. Aquests sistemes són entrenats amb dues possibles bases de dades expressives que hem dissenyat, enregistrat i etiquetat. Hem definit les unitats bàsiques a partir de les quals les bases de dades s'han construit i que són seqüències de tres notes o silencis. La nostra avaluació perceptual compara els sistemes proposats amb altres sistemes per tal de veure com els podem relacionar. L'avaluació objectiva es centra en l'eficiència dels sistemes.
cat
dc.format.extent
177 p.
cat
dc.format.mimetype
application/pdf
dc.language.iso
eng
cat
dc.publisher
Universitat Pompeu Fabra
dc.rights.license
L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc/3.0/es/
dc.rights.uri
http://creativecommons.org/licenses/by-nc/3.0/es/
*
dc.source
TDX (Tesis Doctorals en Xarxa)
dc.subject
Musical expression
cat
dc.subject
Synthesis control
cat
dc.subject
Singing voice
cat
dc.subject
Singing voice synthesis
cat
dc.subject
Expression control
cat
dc.subject
Pitch
cat
dc.subject
Dynamics
cat
dc.subject
Unit selection
cat
dc.subject
Statistical system
cat
dc.subject
Hidden Markov models
cat
dc.subject
HMM
cat
dc.subject
Naturalness
cat
dc.subject
Perceptual evaluation
cat
dc.subject
Expression contours
cat
dc.subject
Melody
cat
dc.subject
Rhythm
cat
dc.subject
Performance driven system
cat
dc.subject
Rule-based system
cat
dc.subject
Cost functions
cat
dc.subject
Vibrato
cat
dc.subject
Transition
cat
dc.subject
Sustain
cat
dc.subject
Note
cat
dc.subject
Labeling
cat
dc.subject
Attack
cat
dc.subject
Release
cat
dc.subject
Expressió musical
cat
dc.subject
Control de síntesi
cat
dc.subject
Veu cantada
cat
dc.subject
Síntesi de veu cantada
cat
dc.subject
Control d'expressivitat
cat
dc.subject
Dinàmica
cat
dc.subject
Sistema estadístic
cat
dc.subject
Models ocults de Markov
cat
dc.subject
Naturalitat
cat
dc.subject
Evaluació perceptual
cat
dc.subject
Contorns expressius
cat
dc.subject
Melodia
cat
dc.subject
Ritme
cat
dc.subject
Sistema guiat per la interpretació
cat
dc.subject
Sistema basat en regles
cat
dc.subject
Funcions de cost
cat
dc.subject
Transició
cat
dc.subject
Sosteniment
cat
dc.subject
Nota
cat
dc.subject
Etiquetatge
cat
dc.subject
Atac
cat
dc.subject
Extinció
cat
dc.subject
Selecció d'unitats
cat
dc.title
Expression control of singing voice synthesis: modeling pitch and dynamics with unit selection and statistical approaches
cat
dc.type
info:eu-repo/semantics/doctoralThesis
dc.type
info:eu-repo/semantics/publishedVersion
dc.subject.udc
004
cat
dc.subject.udc
531/534
cat
dc.subject.udc
78
cat
dc.contributor.authoremail
marti.umbert@upf.edu
cat
dc.contributor.director
Bonada, Jordi
dc.contributor.director
Serra, Xavier
dc.embargo.terms
cap
cat
dc.rights.accessLevel
info:eu-repo/semantics/openAccess
dc.description.degree
Programa de doctorat en Tecnologies de la Informació i les Comunicacions


Documents

tmum.pdf

4.583Mb PDF

This item appears in the following Collection(s)