A computational approach to rhythm description - Audio features for the computation of rhythm periodicity functions and their use in tempo induction and music content processing

Autor/a

Gouyon, Fabien

Director/a

Widmer, Gerhard

Serra, Xavier

Fecha de defensa

2005-11-30

ISBN

8468972568

Depósito Legal

B.10835-2006



Departamento/Instituto

Universitat Pompeu Fabra. Institut Universitari de l'Audiovisual

Programa de doctorado

Programa de doctorat en Tecnologies de la Informació i les Comunicacions

Resumen

Aquesta dissertació tracta del ritme musical. Més exactamente, tracta de programes informàtics que extreuen automàticament descripcions rítmiques a partir de senyals musicals d'àudio.<br/>Presentem nous algorismes per a la inducció del tempo, la estimació del "tatum," la determinació del compàs, la estimació de "swing," transformacions de "swing" i la classificació d'estils de música de ball. Aquests algorismes processen directament gravacions digitalitzades de senyals acústiques de música. La base d'aquests algorismes son funcions de periodicitat rítmica: es a dir, funcions que mesuren la importància d'una pulsació rítmica en funció del període (o la freqüència) de la mateixa, calculades a partir d'atributs físics instantanis seleccionats per a posar en evidència aspectes rítmics del só. Aquests atributs es calculen amb una freqüència de mostreig constant sobre segments curts de la senyal d'àudio. <br/>Els nostres algorismes determinen el tempo i el "tatum" de música de diferents estils musicals, amb tempo constant, amb una precisió de més del 80% si no insistim en trobar el nivell mètric específic. Indentifiquen el compàs amb una precisió del 90%, si es coneixen nivells mètrics més ràpits. Classifiquen música de ball en 8 categories amb una precisió del 80% tenint en compte únicament aspectes rítmics de la música. Finalment, afegeixen (o substreuen) el "swing" de senyals musicals d'àudio de manera automàtica, conservant una alta qualitat de só.<br/>Des d'un punt de vista més general, aquesta dissertació contribueix de manera significativa al camp de la descripció computacional del ritme a) en proposar un entorn unificador d'analisi funcional; b) en revisar l'arquitectura de molts sistemes existent respecte els blocs funcionals d'aquest entorn; c) en organitzar la primera evaluació pública d'algorismes d'inducció de tempo; i d) en identificar direccions de recerca prometedores, particularment respecte a la selecció d'atributs instantanis més adients per al càlcul de funcions de periodicitat rítmica útils i l'estrategia per a combinar i processar multiples fonts d'informació rítmica.


Esta disertación trata del ritmo musical. Más precisamente, trata de programas informáticos que extraen automáticamente descripciones rítmicas a partir de señales musicales de audio.<br/>Presentamos nuevos algoritmos para la inducción del tempo, la estimación del "tatum," la determinación del compás, la estimación del "swing," transformaciones de "swing" y la clasificación de estilos de música de baile. Estos algoritmos procesan directamente grabaciones digitalizadas de señales acústicas de música. La base de estos algoritmos son funciones de periodicidad rítmica: funciones que miden la importancia de una pulsación rítmica en función del periodo (o la frecuencia) de la misma, calculadas a partir de atributos físicos instantáneos seleccionados para poner en evidencia aspectos rítmicos del sonido. Estos atributos se calculan con una frecuencia de muestreo constante sobre segmentos cortos de la señal de audio.<br/>Nuestros algoritmos determinan el tempo y el "tatum" de música de diferentes géneros, con tempo casi constante, con una precisión de más de 80% si no insistimos en encontrar un nivel métrico específico. Identifican el compás con una precisión de 90%, si se conocen niveles métricos más rápidos. Clasifican música de baile en 8 categorías con una precisión de 80% tomando en cuenta solamente aspectos rítmicos de la música. Finalmente, añaden (o sustraen) el "swing" de señales musicales de audio de manera automática, conservando una cualidad de sonido muy buena.<br/>De un punto de vista más general, está disertación contribuye de manera significativa al campo de la descripción computacional del ritmo a) en proponer un entorno unificador de análisis funcional; b) en revisar la arquitectura de muchos sistemas existentes respecto a los bloques funcionales de este entorno; c) en organizar la primera evaluación pública de algoritmos de inducción del tempo; y d) en identificar direcciones de investigación prometedoras, particularmente respecto a la selección de los mejores atributos instantáneos para el cálculo de funciones de periodicidad rítmica útiles y la estrategia para combinar y procesar múltiples fuentes de información rítmica.

Palabras clave

funcions de periodicitat rítmica; descripció computacional; clasificació musical; rítmo; selecció d'atributs; descripción computacional; funciones de periodicidad rítmica; clasificación musical; selección de atributos; tempo; swing; ritme; tatum

Materias

62 - Ingeniería. Tecnología; 78 - Música

Documentos

tfg1de1.pdf

2.693Mb

 

Derechos

ADVERTIMENT. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal, així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas, en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs.

Este ítem aparece en la(s) siguiente(s) colección(ones)