Data-driven musical version identification: accuracy, scalability and bias perspectives

dc.contributor
Universitat Pompeu Fabra. Departament de Tecnologies de la Informació i les Comunicacions
dc.contributor.author
Yesiler, M. Furkan
dc.date.accessioned
2022-01-26T10:37:06Z
dc.date.available
2022-01-26T10:37:06Z
dc.date.issued
2022-01-12
dc.identifier.uri
http://hdl.handle.net/10803/673264
dc.description.abstract
This dissertation aims at developing audio-based musical version identification (VI) systems for industry-scale corpora. To employ such systems in industrial use cases, they must demonstrate high performance on large-scale corpora while not favoring certain musicians or tracks above others. Therefore, the three main aspects we address in this dissertation are accuracy, scalability, and algorithmic bias of VI systems. We propose a data-driven model that incorporates domain knowledge in its network architecture and training strategy. We then take two main directions to further improve our model. Firstly, we experiment with data-driven fusion methods to combine information from models that process harmonic and melodic information, which greatly enhances identification accuracy. Secondly, we investigate embedding distillation techniques to reduce the size of the embeddings produced by our model, which reduces the requirements for data storage and, more importantly, retrieval time. Lastly, we analyze the algorithmic biases of our systems.
en_US
dc.description.abstract
En esta tesis se desarrollan sistemas de identificación de versiones musicales basados en audio y aplicables en un entorno industrial. Por lo tanto, los tres aspectos que se abordan en esta tesis son el desempeño, escalabilidad, y los sesgos algorítmicos en los sistemas de identificación de versiones. Se propone un modelo dirigido por datos que incorpora conocimiento musical en su arquitectura de red y estrategia de entrenamiento, para lo cual se experimenta con dos enfoques. Primero, se experimenta con métodos de fusión dirigidos por datos para combinar la información de los modelos que procesan información melódica y armónica, logrando un importante incremento en la exactitud de la identificación. Segundo, se investigan técnicas para la destilación de embeddings para reducir su tamaño, lo cual reduce los requerimientos de almacenamiento de datos, y lo que es más importante, del tiempo de búsqueda. Por último, se analizan los sesgos algorítmicos de nuestros sistemas.
en_US
dc.format.extent
168 p.
en_US
dc.format.mimetype
application/pdf
dc.language.iso
eng
en_US
dc.publisher
Universitat Pompeu Fabra
dc.rights.license
L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc-sa/4.0/
dc.rights.uri
http://creativecommons.org/licenses/by-nc-sa/4.0/
*
dc.source
TDX (Tesis Doctorals en Xarxa)
dc.subject
Music information retrieval
en_US
dc.subject
Music similarity
en_US
dc.subject
Music processing
en_US
dc.subject
Audio processing
en_US
dc.subject
Deep learning
en_US
dc.subject
Representation learning
en_US
dc.subject
Music embeddings
en_US
dc.subject
Metric learning
en_US
dc.subject
Embedding distillation
en_US
dc.subject
Algorithmic bias
en_US
dc.subject
Cover songs
en_US
dc.subject
Recuperación de información musical
en_US
dc.subject
Similitud musical
en_US
dc.subject
Procesamiento de música
en_US
dc.subject
Procesamiento de audio
en_US
dc.subject
Aprendizaje profundo
en_US
dc.subject
Aprendizaje de representación
en_US
dc.subject
Aprendizaje métrico
en_US
dc.subject
Sesgo algorítmico
en_US
dc.title
Data-driven musical version identification: accuracy, scalability and bias perspectives
en_US
dc.type
info:eu-repo/semantics/doctoralThesis
dc.type
info:eu-repo/semantics/publishedVersion
dc.subject.udc
62
en_US
dc.contributor.authoremail
furkan.yesiler@upf.edu
en_US
dc.contributor.director
Gómez Gutiérrez, Emilia
dc.contributor.director
Serrà Julià, Joan
dc.embargo.terms
cap
en_US
dc.rights.accessLevel
info:eu-repo/semantics/openAccess
dc.description.degree
Programa de doctorat en Tecnologies de la Informació i les Comunicacions


Documents

tmfy.pdf

8.911Mb PDF

This item appears in the following Collection(s)