Automatic assessment of singing voice pronunciation: a case study with Jingju music

Gong, Rong

Automatic assessment of singing voice pronunciation: a case study with Jingju music

dc.contributor

Universitat Pompeu Fabra. Departament de Tecnologies de la Informació i les Comunicacions

dc.contributor.author

Gong, Rong

dc.date.accessioned

2018-12-19T12:21:15Z

dc.date.available

2018-12-19T12:21:15Z

dc.date.issued

2018-11-23

dc.identifier.uri

http://hdl.handle.net/10803/664421

dc.description.abstract

Online learning has altered music education remarkable in the last decade. Large and increasing amount of music performing learners participate in online music learning courses due to the easy-accessibility and boundless of time-space constraints. Singing can be considered the most basic form of music performing. Automatic singing voice assessment, as an important task in Music Information Retrieval (MIR), aims to extract musically meaningful information and measure the quality of learners' singing voice. Singing correctness and quality is culture-specific and its assessment requires culture-aware methodologies. Jingju (also known as Beijing opera) music is one of the representative music traditions in China and has spread to many places in the world where there are Chinese communities. Our goal is to tackle unexplored automatic singing voice pronunciation assessment problems in jingju music, to make the current eurogeneric assessment approaches more culture-aware, and in return, to develop new assessment approaches which can be generalized to other musical traditions.

en_US

dc.description.abstract

El aprendizaje en línea ha cambiado notablemente la educación musical en la pasada década. Una cada vez mayor cantidad de estudiantes de interpretación musical participan en cursos de aprendizaje musical en línea por su fácil accesibilidad y no estar limitada por restricciones de tiempo y espacio. Puede considerarse el canto como la forma más básica de interpretación. La evaluación automática de la voz cantada, como tarea importante en la disciplina de Recuperación de Información Musical (MIR por sus siglas en inglés) tiene como objetivo la extracción de información musicalmente significativa y la medición de la calidad de la voz cantada del estudiante. La corrección y calidad del canto son específicas a cada cultura y su evaluación requiere metodologías con especificidad cultural. La música del jingju (también conocido como ópera de Beijing) es una de las tradiciones musicales más representativas de China y se ha difundido a muchos lugares del mundo donde existen comunidades chinas.Nuestro objetivo es abordar problemas aún no explorados sobre la evaluación automática de la voz cantada en la música del jingju, hacer que las propuestas eurogenéticas actuales sobre evaluación sean más específicas culturalmente, y al mismo tiempo, desarrollar nuevas propuestas sobre evaluación que puedan ser generalizables para otras tradiciones musicales.

en_US

dc.format.extent

235 p.

en_US

dc.format.mimetype

application/pdf

dc.language.iso

eng

en_US

dc.publisher

Universitat Pompeu Fabra

dc.rights.license

L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc-nd/4.0/

dc.rights.uri

http://creativecommons.org/licenses/by-nc-nd/4.0/

dc.source

TDX (Tesis Doctorals en Xarxa)

dc.subject

MIR

en_US

dc.subject

Music information retrieval

en_US

dc.subject

CompMusic

en_US

dc.subject

Data-driven

en_US

dc.subject

Computational model

en_US

dc.subject

Singing voice

en_US

dc.subject

Automatic assessment

en_US

dc.subject

Jingju

en_US

dc.subject

Beijing opera

en_US

dc.subject

Pronunciation

en_US

dc.subject

Syllable and phoneme segmentation

en_US

dc.subject

Mispronunciation detection

en_US

dc.subject

Pronunciation similarity

en_US

dc.subject

Deep learning

en_US

dc.subject

Neural networks

en_US

dc.subject

CNNs

en_US

dc.subject

RNNs

en_US

dc.subject

Siamese networks

en_US

dc.subject

Acoustic embedding,

en_US

dc.subject

Hidden Markov model

en_US

dc.subject

HMM

en_US

dc.subject

HSMM

en_US

dc.subject

Recuperación de información musical

en_US

dc.subject

Modelo computacional basado en datos

en_US

dc.subject

Voz de canto

en_US

dc.subject

Eevaluación automática

en_US

dc.subject

Pronunciación

en_US

dc.subject

Segmentación de sílabas y fonemas

en_US

dc.subject

Detección de falsa pronunciación

en_US

dc.subject

Similitud de pronunciación

en_US

dc.subject

Aprendizaje profundo

en_US

dc.subject

Redes neuronales

en_US

dc.subject

Redes neuronales recurrentes

en_US

dc.subject

Incrustación acústica

en_US

dc.subject

Modelo oculto de Markov

en_US

dc.title

Automatic assessment of singing voice pronunciation: a case study with Jingju music

en_US

dc.type

info:eu-repo/semantics/doctoralThesis

dc.type

info:eu-repo/semantics/publishedVersion

dc.subject.udc

en_US

dc.contributor.authoremail

rong.gong@upf.edu

en_US

dc.contributor.director

Serra, Xavier

dc.embargo.terms

cap

en_US

dc.rights.accessLevel

info:eu-repo/semantics/openAccess

dc.description.degree

Programa de doctorat en Tecnologies de la Informació i les Comunicacions

Documents

trg.pdf

4.619Mb PDF

This item appears in the following Collection(s)

Programa de Doctorat en Tecnologies de la Informació i les Comunicacions [376]