Automatic assessment of singing voice pronunciation: a case study with Jingju music

dc.contributor
Universitat Pompeu Fabra. Departament de Tecnologies de la Informació i les Comunicacions
dc.contributor.author
Gong, Rong
dc.date.accessioned
2018-12-19T12:21:15Z
dc.date.available
2018-12-19T12:21:15Z
dc.date.issued
2018-11-23
dc.identifier.uri
http://hdl.handle.net/10803/664421
dc.description.abstract
Online learning has altered music education remarkable in the last decade. Large and increasing amount of music performing learners participate in online music learning courses due to the easy-accessibility and boundless of time-space constraints. Singing can be considered the most basic form of music performing. Automatic singing voice assessment, as an important task in Music Information Retrieval (MIR), aims to extract musically meaningful information and measure the quality of learners' singing voice. Singing correctness and quality is culture-specific and its assessment requires culture-aware methodologies. Jingju (also known as Beijing opera) music is one of the representative music traditions in China and has spread to many places in the world where there are Chinese communities. Our goal is to tackle unexplored automatic singing voice pronunciation assessment problems in jingju music, to make the current eurogeneric assessment approaches more culture-aware, and in return, to develop new assessment approaches which can be generalized to other musical traditions.
en_US
dc.description.abstract
El aprendizaje en línea ha cambiado notablemente la educación musical en la pasada década. Una cada vez mayor cantidad de estudiantes de interpretación musical participan en cursos de aprendizaje musical en línea por su fácil accesibilidad y no estar limitada por restricciones de tiempo y espacio. Puede considerarse el canto como la forma más básica de interpretación. La evaluación automática de la voz cantada, como tarea importante en la disciplina de Recuperación de Información Musical (MIR por sus siglas en inglés) tiene como objetivo la extracción de información musicalmente significativa y la medición de la calidad de la voz cantada del estudiante. La corrección y calidad del canto son específicas a cada cultura y su evaluación requiere metodologías con especificidad cultural. La música del jingju (también conocido como ópera de Beijing) es una de las tradiciones musicales más representativas de China y se ha difundido a muchos lugares del mundo donde existen comunidades chinas.Nuestro objetivo es abordar problemas aún no explorados sobre la evaluación automática de la voz cantada en la música del jingju, hacer que las propuestas eurogenéticas actuales sobre evaluación sean más específicas culturalmente, y al mismo tiempo, desarrollar nuevas propuestas sobre evaluación que puedan ser generalizables para otras tradiciones musicales.
en_US
dc.format.extent
235 p.
en_US
dc.format.mimetype
application/pdf
dc.language.iso
eng
en_US
dc.publisher
Universitat Pompeu Fabra
dc.rights.license
L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc-nd/4.0/
dc.rights.uri
http://creativecommons.org/licenses/by-nc-nd/4.0/
*
dc.source
TDX (Tesis Doctorals en Xarxa)
dc.subject
MIR
en_US
dc.subject
Music information retrieval
en_US
dc.subject
CompMusic
en_US
dc.subject
Data-driven
en_US
dc.subject
Computational model
en_US
dc.subject
Singing voice
en_US
dc.subject
Automatic assessment
en_US
dc.subject
Jingju
en_US
dc.subject
Beijing opera
en_US
dc.subject
Pronunciation
en_US
dc.subject
Syllable and phoneme segmentation
en_US
dc.subject
Mispronunciation detection
en_US
dc.subject
Pronunciation similarity
en_US
dc.subject
Deep learning
en_US
dc.subject
Neural networks
en_US
dc.subject
CNNs
en_US
dc.subject
RNNs
en_US
dc.subject
Siamese networks
en_US
dc.subject
Acoustic embedding,
en_US
dc.subject
Hidden Markov model
en_US
dc.subject
HMM
en_US
dc.subject
HSMM
en_US
dc.subject
Recuperación de información musical
en_US
dc.subject
Modelo computacional basado en datos
en_US
dc.subject
Voz de canto
en_US
dc.subject
Eevaluación automática
en_US
dc.subject
Pronunciación
en_US
dc.subject
Segmentación de sílabas y fonemas
en_US
dc.subject
Detección de falsa pronunciación
en_US
dc.subject
Similitud de pronunciación
en_US
dc.subject
Aprendizaje profundo
en_US
dc.subject
Redes neuronales
en_US
dc.subject
Redes neuronales recurrentes
en_US
dc.subject
Incrustación acústica
en_US
dc.subject
Modelo oculto de Markov
en_US
dc.title
Automatic assessment of singing voice pronunciation: a case study with Jingju music
en_US
dc.type
info:eu-repo/semantics/doctoralThesis
dc.type
info:eu-repo/semantics/publishedVersion
dc.subject.udc
62
en_US
dc.contributor.authoremail
rong.gong@upf.edu
en_US
dc.contributor.director
Serra, Xavier
dc.embargo.terms
cap
en_US
dc.rights.accessLevel
info:eu-repo/semantics/openAccess
dc.description.degree
Programa de doctorat en Tecnologies de la Informació i les Comunicacions


Documents

trg.pdf

4.619Mb PDF

This item appears in the following Collection(s)