A computational approach to rhythm description - Audio features for the computation of rhythm periodicity functions and their use in tempo induction and music content processing

dc.contributor
Universitat Pompeu Fabra. Institut Universitari de l'Audiovisual
dc.contributor.author
Gouyon, Fabien
dc.date.accessioned
2011-04-12T16:35:14Z
dc.date.available
2006-02-16
dc.date.issued
2005-11-30
dc.date.submitted
2006-02-16
dc.identifier.isbn
8468972568
dc.identifier.uri
http://www.tdx.cat/TDX-0216106-141408
dc.identifier.uri
http://hdl.handle.net/10803/7484
dc.description.abstract
Aquesta dissertació tracta del ritme musical. Més exactamente, tracta de programes informàtics que extreuen automàticament descripcions rítmiques a partir de senyals musicals d'àudio.<br/>Presentem nous algorismes per a la inducció del tempo, la estimació del "tatum," la determinació del compàs, la estimació de "swing," transformacions de "swing" i la classificació d'estils de música de ball. Aquests algorismes processen directament gravacions digitalitzades de senyals acústiques de música. La base d'aquests algorismes son funcions de periodicitat rítmica: es a dir, funcions que mesuren la importància d'una pulsació rítmica en funció del període (o la freqüència) de la mateixa, calculades a partir d'atributs físics instantanis seleccionats per a posar en evidència aspectes rítmics del só. Aquests atributs es calculen amb una freqüència de mostreig constant sobre segments curts de la senyal d'àudio. <br/>Els nostres algorismes determinen el tempo i el "tatum" de música de diferents estils musicals, amb tempo constant, amb una precisió de més del 80% si no insistim en trobar el nivell mètric específic. Indentifiquen el compàs amb una precisió del 90%, si es coneixen nivells mètrics més ràpits. Classifiquen música de ball en 8 categories amb una precisió del 80% tenint en compte únicament aspectes rítmics de la música. Finalment, afegeixen (o substreuen) el "swing" de senyals musicals d'àudio de manera automàtica, conservant una alta qualitat de só.<br/>Des d'un punt de vista més general, aquesta dissertació contribueix de manera significativa al camp de la descripció computacional del ritme a) en proposar un entorn unificador d'analisi funcional; b) en revisar l'arquitectura de molts sistemes existent respecte els blocs funcionals d'aquest entorn; c) en organitzar la primera evaluació pública d'algorismes d'inducció de tempo; i d) en identificar direccions de recerca prometedores, particularment respecte a la selecció d'atributs instantanis més adients per al càlcul de funcions de periodicitat rítmica útils i l'estrategia per a combinar i processar multiples fonts d'informació rítmica.
cat
dc.description.abstract
Esta disertación trata del ritmo musical. Más precisamente, trata de programas informáticos que extraen automáticamente descripciones rítmicas a partir de señales musicales de audio.<br/>Presentamos nuevos algoritmos para la inducción del tempo, la estimación del "tatum," la determinación del compás, la estimación del "swing," transformaciones de "swing" y la clasificación de estilos de música de baile. Estos algoritmos procesan directamente grabaciones digitalizadas de señales acústicas de música. La base de estos algoritmos son funciones de periodicidad rítmica: funciones que miden la importancia de una pulsación rítmica en función del periodo (o la frecuencia) de la misma, calculadas a partir de atributos físicos instantáneos seleccionados para poner en evidencia aspectos rítmicos del sonido. Estos atributos se calculan con una frecuencia de muestreo constante sobre segmentos cortos de la señal de audio.<br/>Nuestros algoritmos determinan el tempo y el "tatum" de música de diferentes géneros, con tempo casi constante, con una precisión de más de 80% si no insistimos en encontrar un nivel métrico específico. Identifican el compás con una precisión de 90%, si se conocen niveles métricos más rápidos. Clasifican música de baile en 8 categorías con una precisión de 80% tomando en cuenta solamente aspectos rítmicos de la música. Finalmente, añaden (o sustraen) el "swing" de señales musicales de audio de manera automática, conservando una cualidad de sonido muy buena.<br/>De un punto de vista más general, está disertación contribuye de manera significativa al campo de la descripción computacional del ritmo a) en proponer un entorno unificador de análisis funcional; b) en revisar la arquitectura de muchos sistemas existentes respecto a los bloques funcionales de este entorno; c) en organizar la primera evaluación pública de algoritmos de inducción del tempo; y d) en identificar direcciones de investigación prometedoras, particularmente respecto a la selección de los mejores atributos instantáneos para el cálculo de funciones de periodicidad rítmica útiles y la estrategia para combinar y procesar múltiples fuentes de información rítmica.
spa
dc.format.mimetype
application/pdf
dc.language.iso
eng
dc.publisher
Universitat Pompeu Fabra
dc.rights.license
ADVERTIMENT. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal, així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas, en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs.
dc.source
TDX (Tesis Doctorals en Xarxa)
dc.subject
funcions de periodicitat rítmica
dc.subject
descripció computacional
dc.subject
clasificació musical
dc.subject
rítmo
dc.subject
selecció d'atributs
dc.subject
descripción computacional
dc.subject
funciones de periodicidad rítmica
dc.subject
clasificación musical
dc.subject
selección de atributos
dc.subject
tempo
dc.subject
swing
dc.subject
ritme
dc.subject
tatum
dc.title
A computational approach to rhythm description - Audio features for the computation of rhythm periodicity functions and their use in tempo induction and music content processing
dc.type
info:eu-repo/semantics/doctoralThesis
dc.type
info:eu-repo/semantics/publishedVersion
dc.subject.udc
62
cat
dc.subject.udc
78
cat
dc.contributor.authoremail
fgouyon@iua.upf.edu
dc.contributor.director
Widmer, Gerhard
dc.contributor.director
Serra, Xavier
dc.rights.accessLevel
info:eu-repo/semantics/openAccess
cat
dc.identifier.dl
B.10835-2006
dc.description.degree
Programa de doctorat en Tecnologies de la Informació i les Comunicacions


Documents

tfg1de1.pdf

2.693Mb PDF

This item appears in the following Collection(s)