Content-based audio search: from fingerprinting to semantic audio retrieval

dc.contributor
Universitat Pompeu Fabra. Departament de Tecnologia
dc.contributor.author
Cano Vila, Pedro
dc.date.accessioned
2011-04-12T16:36:19Z
dc.date.available
2007-12-28
dc.date.issued
2007-04-27
dc.date.submitted
2007-12-28
dc.identifier.isbn
9788469112052
dc.identifier.uri
http://www.tdx.cat/TDX-1228107-121317
dc.identifier.uri
http://hdl.handle.net/10803/7543
dc.description.abstract
Aquesta tesi tracta de cercadors d'audio basats en contingut. Específicament, tracta de desenvolupar tecnologies que permetin fer més estret l'interval semàntic o --semantic gap' que, a avui dia, limita l'ús massiu de motors de cerca basats en contingut. Els motors de cerca d'àudio fan servir metadades, en la gran majoria generada per editors, per a gestionar col.leccions d'àudio. Tot i ser una tasca àrdua i procliu a errors, l'anotació manual és la pràctica més habitual. Els mètodes basats en contingut àudio, és a dir, aquells algorismes que extreuen automàticament etiquetes descriptives de fitxers d'àudio, no són generalment suficientment madurs per a permetre una interacció semàntica. En la gran majoria, els mètodes basats en contingut treballen amb descriptors de baix nivell, mentre que els descriptors d'alt nivell estan més enllà de les possibilitats actuals. En la tesi explorem mètodes, que considerem pas previs per a atacar l'interval semàntic.
cat
dc.description.abstract
This dissertation is about audio content-based search. Specifically, it is on developing technologies for bridging the semantic gap that currently prevents wide-deployment of audio content-based search engines.<br/>Audio search engines rely on metadata, mostly human generated, to manage collections of audio assets.<br/>Even though time-consuming and error-prone, human labeling is a common practice.<br/>Audio content-based methods, algorithms that automatically extract description from audio files, are generally not mature enough to provide a user friendly representation for interacting with audio content. Mostly, content-based methods are based on low-level descriptions, while high-level or semantic descriptions are beyond current capabilities. In this thesis we explore technologies that can help close the semantic gap.
eng
dc.format.mimetype
application/pdf
dc.language.iso
eng
dc.publisher
Universitat Pompeu Fabra
dc.rights.license
ADVERTIMENT. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal, així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas, en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs.
dc.source
TDX (Tesis Doctorals en Xarxa)
dc.subject
búsqueda de información basada en contenido
dc.subject
classificacio d'audio
dc.subject
ontologies
dc.subject
identificacio d'audio
dc.subject
recuperacio d'informacio audio
dc.subject
cerca d'audio basada en contingut
dc.subject
audio classification
dc.subject
wordnet
dc.subject
ontology
dc.subject
audio fingerprinting
dc.subject
audio retrieval
dc.subject
content based audio search
dc.subject
recuperación de información de audio
dc.subject
identificación de audio
dc.subject
ontologías
dc.subject
clasificación de áudio
dc.title
Content-based audio search: from fingerprinting to semantic audio retrieval
dc.type
info:eu-repo/semantics/doctoralThesis
dc.type
info:eu-repo/semantics/publishedVersion
dc.subject.udc
531/534
cat
dc.subject.udc
68
cat
dc.subject.udc
78
cat
dc.contributor.authoremail
pedro.cano@iua.upf.edu
dc.contributor.director
Serra, Xavier
dc.rights.accessLevel
info:eu-repo/semantics/openAccess
cat
dc.identifier.dl
B.42899-2007
dc.description.degree
Programa de doctorat en Tecnologies de la Informació i les Comunicacions


Documents

tpcv.pdf

2.660Mb PDF

This item appears in the following Collection(s)