Expression control of singing voice synthesis: modeling pitch and dynamics with unit selection and statistical approaches

Umbert Morist, Martí

Expression control of singing voice synthesis: modeling pitch and dynamics with unit selection and statistical approaches

dc.contributor

Universitat Pompeu Fabra. Departament de Tecnologies de la Informació i les Comunicacions

dc.contributor.author

Umbert Morist, Martí

dc.date.accessioned

2016-03-03T10:07:19Z

dc.date.available

2016-03-03T10:07:19Z

dc.date.issued

2016-01-29

dc.identifier.uri

http://hdl.handle.net/10803/361103

dc.description.abstract

This thesis focuses on the control of a singing voice synthesizer to achieve natural expression similar to a real singer. There are many features that should be controlled to achieve natural expression related to melody, dynamics, rhythm, and timbre. In this thesis we focus on the control of pitch and dynamics with a unit selection-based system, two statistically-based systems, and a hybrid system. These systems are trained with two possible expression databases that we have designed, recorded, and labeled. We define the basic units from which the databases are built of, which are basically sequences of three notes or rests. Our perceptual evaluation compares the proposed systems with other systems to see how these relate to each other. The objective evaluation focuses on the algorithms efficiency.

eng

dc.description.abstract

Aquesta tesi es centra en el control dels sintetitzadors de veu cantada per aconseguir una expressivitat natural semblant a la d'un cantant real. Hi ha moltes característiques que s'haurien de controlar per aconseguir una expressivitat natural relacionades amb la melodia, la dinàmica, el ritme i el timbre. En aquesta tesi ens centrem en el control de la freqüència fonamental i de la dinàmica amb un sistema basat en selecció d'unitats, dos sistemes estadístics, i un sistema híbrid. Aquests sistemes són entrenats amb dues possibles bases de dades expressives que hem dissenyat, enregistrat i etiquetat. Hem definit les unitats bàsiques a partir de les quals les bases de dades s'han construit i que són seqüències de tres notes o silencis. La nostra avaluació perceptual compara els sistemes proposats amb altres sistemes per tal de veure com els podem relacionar. L'avaluació objectiva es centra en l'eficiència dels sistemes.

cat

dc.format.extent

177 p.

cat

dc.format.mimetype

application/pdf

dc.language.iso

eng

cat

dc.publisher

Universitat Pompeu Fabra

dc.rights.license

L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc/3.0/es/

dc.rights.uri

http://creativecommons.org/licenses/by-nc/3.0/es/

dc.source

TDX (Tesis Doctorals en Xarxa)

dc.subject

Musical expression

cat

dc.subject

Synthesis control

cat

dc.subject

Singing voice

cat

dc.subject

Singing voice synthesis

cat

dc.subject

Expression control

cat

dc.subject

Pitch

cat

dc.subject

Dynamics

cat

dc.subject

Unit selection

cat

dc.subject

Statistical system

cat

dc.subject

Hidden Markov models

cat

dc.subject

HMM

cat

dc.subject

Naturalness

cat

dc.subject

Perceptual evaluation

cat

dc.subject

Expression contours

cat

dc.subject

Melody

cat

dc.subject

Rhythm

cat

dc.subject

Performance driven system

cat

dc.subject

Rule-based system

cat

dc.subject

Cost functions

cat

dc.subject

Vibrato

cat

dc.subject

Transition

cat

dc.subject

Sustain

cat

dc.subject

Note

cat

dc.subject

Labeling

cat

dc.subject

Attack

cat

dc.subject

Release

cat

dc.subject

Expressió musical

cat

dc.subject

Control de síntesi

cat

dc.subject

Veu cantada

cat

dc.subject

Síntesi de veu cantada

cat

dc.subject

Control d'expressivitat

cat

dc.subject

Dinàmica

cat

dc.subject

Sistema estadístic

cat

dc.subject

Models ocults de Markov

cat

dc.subject

Naturalitat

cat

dc.subject

Evaluació perceptual

cat

dc.subject

Contorns expressius

cat

dc.subject

Melodia

cat

dc.subject

Ritme

cat

dc.subject

Sistema guiat per la interpretació

cat

dc.subject

Sistema basat en regles

cat

dc.subject

Funcions de cost

cat

dc.subject

Transició

cat

dc.subject

Sosteniment

cat

dc.subject

Nota

cat

dc.subject

Etiquetatge

cat

dc.subject

Atac

cat

dc.subject

Extinció

cat

dc.subject

Selecció d'unitats

cat

dc.title

Expression control of singing voice synthesis: modeling pitch and dynamics with unit selection and statistical approaches

cat

dc.type

info:eu-repo/semantics/doctoralThesis

dc.type

info:eu-repo/semantics/publishedVersion

dc.subject.udc

004

cat

dc.subject.udc

531/534

cat

dc.subject.udc

cat

dc.contributor.authoremail

marti.umbert@upf.edu

cat

dc.contributor.director

Bonada, Jordi

dc.contributor.director

Serra, Xavier

dc.embargo.terms

cap

cat

dc.rights.accessLevel

info:eu-repo/semantics/openAccess

dc.description.degree

Programa de doctorat en Tecnologies de la Informació i les Comunicacions

Documents

tmum.pdf

4.583Mb PDF

This item appears in the following Collection(s)

Programa de Doctorat en Tecnologies de la Informació i les Comunicacions [376]