<?xml version="1.0" encoding="UTF-8"?>
<rss xmlns:dc="http://purl.org/dc/elements/1.1/" version="2.0">
<channel>
<title>TDX/TDR - Departament de Tecnologies de la Informació i les Comunicacions</title>
<link>http://www.tdx.cat:80/handle/10803/250</link>
<description/>
<pubDate>Wed, 19 Jun 2013 21:20:43 GMT</pubDate>
<dc:date>2013-06-19T21:20:43Z</dc:date>
<item>
<title>Exploring interactions between music and language during the early development of music cognition. A computational modelling approach.</title>
<link>http://www.tdx.cat:80/handle/10803/112058</link>
<description>Exploring interactions between music and language during the early development of music cognition. A computational modelling approach.
Salselas, Inês
This dissertation concerns the computational modelling of early life development of music perception and cognition. Experimental psychology and neuroscience show results that suggest that the development of musical representations in infancy, whether concerning pitch or rhythm features, depend on exposure both to music and language. Early musical and linguistic skills seem to be, therefore, tangled in ways we are yet to characterize.&#13;
In parallel, computational modelling has produced powerful frameworks for the study of learning and development. The use of these models for studying the development of music information perception and cognition, connecting music and language still remains to be explored.&#13;
This way, we propose to produce computational solutions suitable for studying factors that contribute to shape our cognitive structure, building our predispositions that allow us to enjoy and make sense of music.  We will also adopt a comparative approach to the study of early development of musical predispositions that involves both music and language, searching for possible interactions and correlations.&#13;
We first address pitch representation (absolute vs relative) and its relations with development. Simulations have allowed us to observe a parallel between learning and the type of pitch information being used, where the type of encoding influenced the ability of the model to perform a discrimination task correctly.&#13;
Next, we have performed a prosodic characterization of infant-directed speech and singing by comparing rhythmic and melodic patterning in two Portuguese (European and Brazilian) variants. In the computational experiments, rhythm related descriptors exhibited a strong predictive ability for both speech and singing language variants' discrimination tasks, presenting different rhythmic patterning for each variant. This reveals that the prosody of the surrounding sonic environment of an infant is a source of rich information and rhythm as a key element for characterizing the prosody from language and songs from each culture. &#13;
Finally, we built a computational model based on temporal information processing and representation for exploring how the temporal prosodic patterns of a specific culture influence the development of rhythmic representations and predispositions. The simulations show that exposure to the surrounding sound environment influences the development of temporal representations and that the structure of the exposure environment, specifically the lack of maternal songs, has an impact on how the model organizes its internal representations. &#13;
We conclude that there is a reciprocal influence between music and language. The exposure to the structure of the sonic background influences the shaping of our cognitive structure, which supports our understanding of musical experience. Among the sonic background, language's structure has a predominant role in biasing the building of musical predispositions and representations.; Esta tesis aborda la modelización computacional de algunos fenómenos de la percepción y cognición de la música durante el período de desarrollo en la primera infancia. La Psicología experimental y la Neurociencia muestran resultados que sugieren que el desarrollo de las representaciones del ritmo o de la altura musicales durante la infancia son dependientes de la exposición tanto a la música como al lenguaje de las culturas en las que se nace y crece. La capacidad musical y lingüística, durante los primeros años de desarrollo, están inter-relacionadas de formas que aún no ha sido posible caracterizar.&#13;
En paralelo, las herramientas computacionales proporcionan un marco teórico y empírico eficaz para el estudio del aprendizaje y el desarrollo. El uso de los modelos computacionales para estudiar el desarrollo de la percepción y la cognición de información musical, conectando la música y el lenguaje, todavía queda por explorar.&#13;
Así, nos proponemos producir soluciones computacionales adecuadas para el estudio de los factores que contribuyen a dar forma a nuestra estructura cognitiva y a la construcción de las predisposiciones que nos permiten disfrutar y dar sentido a la música. También adoptamos una perspectiva comparativa para la investigación que, englobando la música y el lenguaje, busca sus posibles interacciones y correlaciones.&#13;
Primeramente, hemos abordado la representación de la altura tonal (absoluta vs. relativa) y sus relaciones con el desarrollo. Las simulaciones computacionales han permitido observar que el tipo de codificación utilizada ha influido en la capacidad del modelo para efectuar correctamente una tarea de discriminación, lo cual sugiere una relación entre el aprendizaje y el tipo de información de altura que se utiliza.&#13;
Seguidamente, se ha realizado una caracterización prosódica del habla y del canto dirigidos al bebé, mediante la comparación de patrones rítmicos y melódicos en dos variantes de Portugués (Europeo y Brasileño). En los experimentos computacionales, los descriptores relacionados con el ritmo han exhibido una fuerte capacidad predictiva para el habla y canto, en tareas de discriminación de variante de lenguaje, siendo observados diferentes patrones rítmicos para cada variante. Se revela que la prosodia del entorno sonoro de un bebé es una fuente rica de información y que el ritmo es un elemento fundamental para la caracterización de la prosodia del lenguaje y las canciones de una cultura.&#13;
Por último, se construyó un modelo computacional basado en el procesamiento y representación de información temporal para explorar cómo los patrones prosódicos temporales del habla de una cultura específica influyen en el desarrollo de las representaciones y predisposiciones rítmicas. Las simulaciones muestran que la exposición al ambiente sonoro circundante influye en el desarrollo de las representaciones temporales y que la estructura del entorno a que se esta expuesto, específicamente, la falta de canciones maternales, tiene un impacto sobre la forma como el modelo organiza sus representaciones rítmicas internas.&#13;
Se concluye que existe una influencia recíproca entre la música y el lenguaje. La exposición a la estructura del entorno sonoro influye en la formación de la estructura cognitiva, que sustenta la comprensión de la experiencia musical. De entre todos los “inputs” del entorno sonoro, la estructura del lenguaje tiene una influencia predominante en la construcción de predisposiciones y representaciones musicales.
</description>
<pubDate>Thu, 16 May 2013 10:54:51 GMT</pubDate>
<guid isPermaLink="false">http://www.tdx.cat:80/handle/10803/112058</guid>
<dc:date>2013-05-16T10:54:51Z</dc:date>
</item>
<item>
<title>Structure and inference in classical planning</title>
<link>http://www.tdx.cat:80/handle/10803/101416</link>
<description>Structure and inference in classical planning
Lipovetzky, Nir
Classical planning is the problem of finding a sequence of actions for&#13;
achieving a goal from an initial state assuming that actions have&#13;
deterministic effects. The most effective approach for finding such&#13;
plans is based on heuristic search guided by heuristics extracted&#13;
automatically from the problem representation.  In this thesis, we&#13;
introduce alternative approaches for performing inference over the&#13;
structure of planning problems that do not appeal to heuristic&#13;
functions, nor to reductions to other formalisms such as SAT or&#13;
CSP. We show that many of the standard benchmark domains can be solved&#13;
with almost no search or a polynomially bounded amount of search, once&#13;
the structure of planning problems is taken into account. In certain&#13;
cases we can characterize this structure in terms of a novel width&#13;
parameter for classical planning.; Los problemas en planificación clásica consisten en encontrar la&#13;
secuencia de acciones que lleve a un agente a su objetivo desde un&#13;
estado inicial, asumiendo que los efectos de las acciones son&#13;
determinísticos. El enfoque más efectivo para encontrar dichos&#13;
planes es la búsqueda heurística, extrayendo de la&#13;
representación del problema de forma automática heurísticas que&#13;
guien la búsqueda. En esta tesis, introducimos enfoques&#13;
alternativos para realizar inferencias sobre la estructura del los&#13;
problemas de planificación, sin apelar a funciones heurísticas,&#13;
reducciones a SAT o CSP. Demostramos que la mayoría de&#13;
problemas estándares pueden ser resueltos casi sin búsqueda o con&#13;
una cantidad de búsqueda polinomialmente limitada, en algunos casos,&#13;
caracterizando la estructura de los problemas en término de un nuevo&#13;
parámetro de complejidad para la planificación clásica.
</description>
<pubDate>Mon, 04 Feb 2013 13:17:58 GMT</pubDate>
<guid isPermaLink="false">http://www.tdx.cat:80/handle/10803/101416</guid>
<dc:date>2013-02-04T13:17:58Z</dc:date>
</item>
<item>
<title>3D audio technologies : applications to sound capture, post-production and listener perception</title>
<link>http://www.tdx.cat:80/handle/10803/101415</link>
<description>3D audio technologies : applications to sound capture, post-production and listener perception
Cengarle, Giulio
La llegada del sonido 3D está imponiendo cambios en varias etapas del flujo de trabajo, desde los sistemas de captación hasta las metodologías de postproducción y las configuraciones de altavoces. Esta tesis trata varios aspectos relacionados con el audio 3D: en la parte de captación, presentamos un estudio sobre las características de los micrófonos tetraédricos y una solución para obtener las componentes Ambisonics del segundo orden usando un pequeño número de transductores del primer orden; en la parte de producción, se presenta una aplicación para la mezcla automatizada de eventos deportivos, para reducir la complexidad del multicanal en tiempo real; para la restitución del audio independiente del sistema de altavoces, en el que los niveles de salida a los altavoces son una incógnita hasta la decodificación, se propone un detector de clipping independiente del layout. Finalmente, se presentan test psico-acústicos para validar aspectos perceptivos relacionados con el audio 3D.; The advent of 3D audio is dictating changes in several stages of the audio work-flow, from recording systems and microphone configurations, to post-production methodologies and loudspeaker configurations. This thesis tackles aspects related to 3D audio arising in the various stages of production. In the recording part, we present a study on the accuracy of tetrahedral microphones and a solution for obtaining second-order Ambisonics responses from first-order transducers using a small number of sensors; in the production stage, we introduce an application for automated assisted mixing of sport events, to reduce the complexity of managing multiple audio channels in real time; a clipping detector is proposed for the rendering of layout-independent audio content to generic playback systems, where the signal levels sent to the speakers are unknown until the decoding stage; finally, psychoacoustic experiments are presented for the validation of perceptual and aesthetic aspects related to 3D audio.
</description>
<pubDate>Mon, 04 Feb 2013 13:07:26 GMT</pubDate>
<guid isPermaLink="false">http://www.tdx.cat:80/handle/10803/101415</guid>
<dc:date>2013-02-04T13:07:26Z</dc:date>
</item>
<item>
<title>Some problems on temporally consistent video editing and object recognition</title>
<link>http://www.tdx.cat:80/handle/10803/101413</link>
<description>Some problems on temporally consistent video editing and object recognition
Sadek, Rida
Video editing and object recognition are two significant fields in computer vi-&#13;
sion: the first has remarkably assisted digital production and post-production&#13;
tasks of a digital video footage; the second is considered fundamental to image&#13;
classification or image based search in large databases (e.g. the web). In this&#13;
thesis, we address two problems, namely we present a novel formulation that&#13;
tackles video editing tasks and we develop a mechanism that allows to generate&#13;
more robust descriptors for objects in an image.&#13;
Concerning the first problem, this thesis proposes two variational models to&#13;
perform temporally coherent video editing. These models are applied to change&#13;
an object’s (rigid or non-rigid) texture throughout a given video sequence. One&#13;
model is based on propagating color information from a given frame (or be-&#13;
tween two given frames) along the motion trajectories of the video; while the&#13;
other is based on propagating gradient domain information. The models we&#13;
present in this thesis require minimal user intervention and they automatically&#13;
accommodate for illumination changes in the scene.&#13;
Concerning the second problem, this thesis addresses the problem of affine&#13;
invariance in object recognition. We introduce a way to generate geometric&#13;
affine invariant quantities that are used in the construction of feature descrip-&#13;
tors. We show that when these quantities are used they do indeed achieve a&#13;
more robust recognition than the state of the art descriptors.&#13;
i; La edición de vídeo y el reconocimiento de objetos son dos áreas fundamentales&#13;
en el campo de la visión por computador: la primera es de gran utilidad en los&#13;
procesos de producción y post-producción digital de vídeo; la segunda es esencial&#13;
para la clasificación o búsqueda de imágenes en grandes bases de datos (por&#13;
ejemplo, en la web). En esta tesis se acometen ambos problemas, en concreto, se&#13;
presenta una nueva formulación que aborda las tareas de edición de vídeo y se&#13;
desarrolla un mecanismo que permite generar descriptores más robustos para&#13;
los objetos de la imagen.&#13;
Con respecto al primer problema, en esta tesis se proponen dos modelos variacionales&#13;
para llevar a cabo la edición de vídeo de forma coherente en el tiempo.&#13;
Estos modelos se aplican para cambiar la textura de un objeto (rígido o no)&#13;
a lo largo de una secuencia de vídeo dada. Uno de los modelos está basado en&#13;
la propagación de la información de color desde un determinado cuadro de la&#13;
secuencia de vídeo (o entre dos cuadros dados) a lo largo de las trayectorias de&#13;
movimiento del vídeo. El otro modelo está basado en la propagación de la información&#13;
en el dominio del gradiente. Ambos modelos requieren una intervención&#13;
mínima por parte del usuario y se ajustan de manera automática a los cambios&#13;
de iluminación de la escena.&#13;
Con respecto al segundo problema, esta tesis aborda el problema de la invariancia&#13;
afín en el reconocimiento de objetos. Se introduce un nuevo método&#13;
para generar cantidades geométricas afines que se utilizan en la generación de&#13;
descriptores de características. También se demuestra que el uso de dichas cantidades&#13;
proporciona mayor robustez al reconocimiento que los descriptores existentes&#13;
actualmente en el estado del arte.
</description>
<pubDate>Mon, 04 Feb 2013 12:40:34 GMT</pubDate>
<guid isPermaLink="false">http://www.tdx.cat:80/handle/10803/101413</guid>
<dc:date>2013-02-04T12:40:34Z</dc:date>
</item>
<item>
<title>Modelling neuronal mechanisms of the processing of tones and phonemes in the higher auditory system</title>
<link>http://www.tdx.cat:80/handle/10803/97293</link>
<description>Modelling neuronal mechanisms of the processing of tones and phonemes in the higher auditory system
Larsson, Johan P.
S'ha investigat molt tant els mecanismes neuronals bàsics de l'audició&#13;
com l'organització psicològica de la percepció de la parla. Tanmateix,&#13;
en ambdós temes n'hi ha una relativa escassetat en quant a modelització.&#13;
Aquí describim dos treballs de modelització.&#13;
Un d'ells proposa un nou mecanisme de millora de selectivitat de freqüències&#13;
que explica resultats de experiments neurofisiològics investigant&#13;
manifestacions de forward masking y sobretot auditory streaming en&#13;
l'escorça auditiva principal (A1). El mecanisme funciona en una xarxa&#13;
feed-forward amb depressió sináptica entre el tàlem y l'escorça, però&#13;
mostrem que és robust a l'introducció d'una organització realista&#13;
del circuit de A1, que per la seva banda explica cantitat de dades neurofisiològics.&#13;
L'altre treball descriu un mecanisme candidat d'explicar la trobada&#13;
en estudis psicofísics de diferències en la percepció de paraules entre&#13;
bilinguës primerencs y simultànis. Simulant tasques de decisió lèxica&#13;
y discriminació de fonemes, fortifiquem l'hipòtesi de que persones&#13;
sovint exposades a variacions dialectals de paraules poden guardar&#13;
aquestes en el seu lèxic, sense alterar representacions fonemàtiques .; Though much experimental research exists on both basic neural mechanisms&#13;
of hearing and the psychological organization of language perception,&#13;
there is a relative paucity of modelling work on these subjects. Here we&#13;
describe two modelling efforts.&#13;
One proposes a novel mechanism of frequency selectivity improvement&#13;
that accounts for results of neurophysiological experiments investigating&#13;
manifestations of forward masking and above all auditory streaming in the&#13;
primary auditory cortex (A1). The mechanism works in a feed-forward&#13;
network with depressing thalamocortical synapses, but is further showed&#13;
to be robust to a realistic organization of the neural circuitry in A1, which&#13;
accounts for a wealth of neurophysiological data.&#13;
The other effort describes a candidate mechanism for explaining differences&#13;
in word/non-word perception between early and simultaneous&#13;
bilinguals found in psychophysical studies. By simulating lexical decision&#13;
and phoneme discrimination tasks in an attractor neural network model,&#13;
we strengthen the hypothesis that people often exposed to dialectal word&#13;
variations can store these in their lexicons, without altering their phoneme&#13;
representations.; Se ha investigado mucho tanto los mecanismos neuronales básicos de la&#13;
audición como la organización psicológica de la percepción del habla. Sin&#13;
embargo, en ambos temas hay una relativa escasez en cuanto a modelización.&#13;
Aquí describimos dos trabajos de modelización.&#13;
Uno propone un nuevo mecanismo de mejora de selectividad de frecuencias&#13;
que explica resultados de experimentos neurofisiológicos investigando&#13;
manifestaciones de forward masking y sobre todo auditory streaming en&#13;
la corteza auditiva principal (A1). El mecanismo funciona en una red&#13;
feed-forward con depresión sináptica entre el tálamo y la corteza, pero&#13;
mostramos que es robusto a la introducción de una organización realista&#13;
del circuito de A1, que a su vez explica cantidad de datos neurofisiológicos.&#13;
El otro trabajo describe un mecanismo candidato de explicar el hallazgo&#13;
en estudios psicofísicos de diferencias en la percepción de palabras entre&#13;
bilinguës tempranos y simultáneos. Simulando tareas de decisión léxica&#13;
y discriminación de fonemas, fortalecemos la hipótesis de que personas&#13;
expuestas a menudo a variaciones dialectales de palabras pueden guardar&#13;
éstas en su léxico, sin alterar representaciones fonémicas.
</description>
<pubDate>Thu, 17 Jan 2013 11:10:15 GMT</pubDate>
<guid isPermaLink="false">http://www.tdx.cat:80/handle/10803/97293</guid>
<dc:date>2013-01-17T11:10:15Z</dc:date>
</item>
<item>
<title>Endovascular coiling and its influence on intra-aneurysmal hemodynamics by image-based modeling</title>
<link>http://www.tdx.cat:80/handle/10803/94493</link>
<description>Endovascular coiling and its influence on intra-aneurysmal hemodynamics by image-based modeling
Morales, Hernán G.
Nowadays, most popular therapies for cerebral aneurysms are clipping and coiling. Nonetheless, it is not easy to elucidate which therapeutic option is the most suitable and reliable for a patient-specific aneurysm. To face this challenge, computational modeling arises as a powerful helpful tool, thanks to their predictive capability. In the case of aneurysms and endovascular treatments, these techniques can help by understanding how inserted coils behave and alter the intra-aneurysmal hemodynamics. In this line, this thesis has contributed in the following aspects: (1) To understand endovascular coil distribution for both clinical applications and validation of computational techniques, (2) To develop and to validate a virtual coiling technique for image-based aneurysm models and (3) To investigate intra-aneurysmal hemodynamic alterations induced by coils using computational fluid dynamics simulations.; Hoy en día, los tratamientos más populares para aneurismas cerebrales son clipping y coiling. Sin embargo, no es fácil aclarar qué opción terapéutica es la más adecuada y confiable para un aneurisma especifico. Para enfrentar este reto, los modelados computacionales surgen como una poderosa herramienta de ayuda, gracias a su capacidad de predicción. En el caso de aneurismas y tratamientos endovasculares, estas técnicas pueden ayudar a entender cómo se comportan los coils y como modificar la hemodinámica intra-aneurismática. En este ámbito, esta tesis ha contribuido en los siguientes aspectos: (1) Entender la distribución de los coils, tanto para aplicaciones clínicas, como para validación de técnicas de computacionales, (2) Desarrollar y validar una técnica de coiling virtual para modelos de aneurismas basados en imágenes y (3) Investigar las alteraciones hemodinámicas producidas por los coils utilizando simulaciones computacionales de dinámica de fluidos.
</description>
<pubDate>Wed, 14 Nov 2012 09:55:15 GMT</pubDate>
<guid isPermaLink="false">http://www.tdx.cat:80/handle/10803/94493</guid>
<dc:date>2012-11-14T09:55:15Z</dc:date>
</item>
<item>
<title>3D reconstruction of the proximal femur and lumbar vertebrae from dual-energy x-ray absorptiometry for osteoporotic risk assessment</title>
<link>http://www.tdx.cat:80/handle/10803/94492</link>
<description>3D reconstruction of the proximal femur and lumbar vertebrae from dual-energy x-ray absorptiometry for osteoporotic risk assessment
Whitmarsh, Tristan
In this thesis a method was developed to reconstruct both the 3D shape and the BMD distribution of bone structures from Dual-energy X-ray Absorptiometry (DXA) images. The method incorporates a statistical model built from a large dataset of Quantitative Computed Tomography (QCT) scans together with a 3D-2D intensity based registration process.&#13;
The method was evaluated for its ability to reconstruct the proximal femur from a single DXA image. The resulting parameters of the reconstructions were subsequently evaluated for their hip fracture discrimination ability. The reconstruction method was finally extended to the reconstruction of the lumbar vertebrae from anteroposterior and lateral DXA, thereby incorporating a multi-object and multi-view approach.&#13;
These techniques can potentially improve the fracture risk estimation accuracy over current clinical practice.; En esta tesis se desarrolló un método para reconstruir tanto la forma 3D de estructuras óseas como la distribución de la DMO a partir de una sola imagen de DXA. El método incorpora un modelo estadístico construido a partir de una gran base de datos de QCT junto con una técnica de registro 3D-2D basada en intensidades.&#13;
Se ha evaluado la capacidad del método para reconstruir la parte proximal del fémur a partir de una imagen DXA. Los parámetros resultantes de las reconstrucciones fueron evaluados&#13;
posteriormente por su capacidad en discriminar una fractura de cadera. Por fin, se extendió el método a la reconstrucción de las vértebras lumbares a partir de DXA anteroposterior y lateral incorporando así un enfoque multi-objeto y multi-vista.&#13;
Estos técnicas pueden potencialmente mejorar la precisión en la estimación del riesgo de fractura respecto a la estimación que ofrece la práctica clínica actual.
</description>
<pubDate>Wed, 14 Nov 2012 09:43:13 GMT</pubDate>
<guid isPermaLink="false">http://www.tdx.cat:80/handle/10803/94492</guid>
<dc:date>2012-11-14T09:43:13Z</dc:date>
</item>
<item>
<title>The Hippocampus code : a computational study of the structure and function of the hippocampus</title>
<link>http://www.tdx.cat:80/handle/10803/94196</link>
<description>The Hippocampus code : a computational study of the structure and function of the hippocampus
Rennó Costa, César
Actualment, no hi ha consens científic respecte a la informació&#13;
representada en la activitat de les célules del hipocamp. D'una banda,&#13;
experiments amb humans sostenen una visión de la funció de l'hipocamp&#13;
com a un sistema per l'emmagatzematge de memóries episódiques, mentre&#13;
que la recerca amb rodents enfatitza una visió com a sistema cognitiu&#13;
espacial. Tot i que existeix abundant evidència experimental que&#13;
indica una possible sobreposició d'ambdues teories, aquesta&#13;
dissociació també es manté en part en base a dades fisiològiques&#13;
aparentment incompatibles. Aquesta tèsi poposa que l'hippocamp té un&#13;
rol funcional que s'hauría d'analitzar en termes de la seva estructura&#13;
i funció, enlloc de mitjança estudis correlació entre activitat&#13;
neuronal i comportament. La identificació d'un codi a l'hipocamp, es a&#13;
dir, el conjunt de principis computacionals que conformen les&#13;
transformacions d'entrada i sortida de l'activitat neuronal, hauría de&#13;
proporcionar un explicació unificada de la seva funció. En aquesta&#13;
tèsi presentem un model teòric que descriu quantitativament i que&#13;
interpreta la selectivitat de certes regions de l'hipocamp en funció&#13;
de variables espaials i no-espaials, tal i com observada en&#13;
experiments amb rates.  Aquest resultat suggereix que multiples&#13;
aspectes de la memòria expressada en humans i rodents deriven d'uns&#13;
mateixos principis. Per aquest motius, proposem nous principis per la&#13;
memòria, l'auto-completat de patrons i plasticitat. A més, mitjançant&#13;
aplicacions robòtiques, creem d'un nexe causal entre el circuit neural&#13;
i el comportament amb el que demostrem la naturalesa conjuntiva de la&#13;
selectivitat neuronal observada en el hipocamp es necessària per la&#13;
solució de problemes pràctics comuns, com per example la cerca&#13;
d'aliments. Tot plegat, aquests resultats avancen en l'idea general de&#13;
que el codi de l'hipocamp es genèric i aplicable als diversos tipus de&#13;
memòries estudiades en la literatura.; There is no consensual understanding on what the activity of the hippocampus neurons represents. While experiments with humans foster a dominant view of an episodic memory system, experiments with rodents promote its role as a spatial cognitive system. Although there is abundant evidence pointing to an overlap between these two theories, the dissociation is sustained by conflicting physiological data. This thesis proposes that the functional role of the hippocampus should be analyzed in terms of its structure and function rather than by the correlation of neuronal activity and behavioral performance. The identification of the hippocampus code, i.e. the set of computational principles underlying the input-output transformations of neural activity, might ultimately provide a unifying understanding of its role. In this thesis we present a theoretical model that quantitatively describes and interprets the selectivity of regions of the hippocampus to spatial and non-spatial variables observed in experiments with rats. The results suggest that the multiple aspects of memory expressed in human and rodent data are derived form similar principles. This approach suggests new principles for memory, pattern completion and plasticity. In addition, by creating a causal tie between the neural circuitry and behavior through a robotic control framework we show that the conjunctive nature of neural selectivity observed in the hippocampus is needed for effective problem solving in real-world tasks such as foraging. Altogether, these results advance the concept that the hippocampal code is generic to the different aspects of memory highlighted in the literature.
</description>
<pubDate>Tue, 13 Nov 2012 10:34:10 GMT</pubDate>
<guid isPermaLink="false">http://www.tdx.cat:80/handle/10803/94196</guid>
<dc:date>2012-11-13T10:34:10Z</dc:date>
</item>
<item>
<title>The Encoding and decoding of complex visual stimuli : a neural model to optimize and read out a temporal population code</title>
<link>http://www.tdx.cat:80/handle/10803/94143</link>
<description>The Encoding and decoding of complex visual stimuli : a neural model to optimize and read out a temporal population code
Luvizotto, André Luiz
The mammalian visual system has a remarkable capacity of processing a large amount of information within milliseconds under widely varying conditions into invariant representations. Recently a model of the primary visual system exploited the unique feature of dense local excitatory connectivity of the neo-cortex to match these criteria. The model rapidly generates invariant representations integrating the activity of spatially distributed modeled neurons into a so-called Temporal Population Code (TPC). In this thesis, we first investigate an issue that has persisted TPC since its introduction: to extend the concept to a biologically compatible readout stage. We propose a novel neural readout circuit based on wavelet transform that decodes the TPC over different frequency bands. We show that, in comparison with pure linear readouts used previously, the proposed system provides a robust, fast and highly compact representation of visual input. We then generalized this optimized encoding-decoding paradigm to deal with a number of robotics application in real-world tasks to investigate its robustness. Our results show that complex stimuli such as human faces, hand gestures and environmental cues can be reliably encoded by TPC which provides a powerful biologically plausible framework for real-time object recognition. In addition, our results suggest that the representation of sensory input can be built into a spatial-temporal code interpreted and parsed in series of wavelet like components by higher visual areas.; El sistema visual dels mamífers té una remarcable capacitat per processar informació en intervals de temps de mili-segons sota condicions molt variables i adquirir representacions invariants d'aquesta informació. Recentment un model del còrtex primari visual explota les característiques d'alta connectivitat excitatriu local del neocortex per modelar aquestes capacitats. El model integra ràpidament l'activitat repartida espaialment de les neurones i genera codificacions invariants que s'anomenen Temporal Population Codes (TPC). Aquí investiguem una qüestió que ha persistit des de la introducció del TPC: estudiar un procés biològicament possible capaç de fer la lectura d'aquestes codificacions. Nosaltres proposem un nou circuit neuronal de lectura basat en la Wavelet Transform que decodifica la senyal TPC en diferents intervals de freqüència. Monstrem que, comparat amb lectures purament lineals utilitzades previament, el sistema proposat proporciona una representació robusta, ràpida i compacta de l'entrada visual. També presentem una generalització d'aquest paradigma de codificació-decodificació optimitzat que apliquem a diferents tasques de visió per computador i a la visió dins del context de la robòtica. Els resultats del nostre estudi suggereixen que la representació d'escenes visuals complexes, com cares humanes, gestos amb les mans i senyals del medi ambient podrien ser codificades pel TPC el qual es pot considerar un poderós marc biològic per reconeixement d'objectes en temps real. A més a més, els nostres resultats suggereixen que la representació de l'entrada sensorial pot ser integrada en un codi espai-temporal interpretat i analitzat en una serie de components Wavelet per àrees visuals superiors.
</description>
<pubDate>Mon, 12 Nov 2012 13:26:57 GMT</pubDate>
<guid isPermaLink="false">http://www.tdx.cat:80/handle/10803/94143</guid>
<dc:date>2012-11-12T13:26:57Z</dc:date>
</item>
<item>
<title>Geometric modeling and characterization of the circle of willis</title>
<link>http://www.tdx.cat:80/handle/10803/94141</link>
<description>Geometric modeling and characterization of the circle of willis
Bogunovic, Hrvoje
Los derrames cerebrales son una de las causas principales de morbilidad y mortalidad en los países desarrollados. Esto ha motivado una búsqueda de configuraciones del sistema vascular que se cree que están asociadas con el desarrollo de enfermedades vasculares. En la primera contribución se ha mejorado un método de segmentación vascular para lograr robustez en la segmentación de imágenes procedentes de diferentes modalidades y centros clínicos, con una validación exhaustiva. Una vez que el sistema vascular está correctamente segmentado, en la segunda contribución se ha propuesto una metodología para caracterizar ampliamente la geometría de la arteria carótida interna (ACI). Esto ha incluido el desarrollo de un método para identificar automáticamente la ACI a partir del árbol vascular segmentado. Finalmente, en la tercera contribución, esta identificación automática se ha generalizado a una colección de arterias incluyendo su conectividad y sus relaciones topológicas. Finalmente, la identificación de las arterias en un conjunto de individuos puede permitir la comparación geométrica de sus árboles arteriales utilizando la metodología introducida para la caracterización de la ACI.; Stroke is among the leading causes of morbidity and mortality in the developed countries. This motivated a search for the configurations of vasculature that is assumed to be associated with the development of vascular diseases. In the first contribution we improve a vascular segmentation method to achieve robustness in segmenting images coming from different imaging modalities and clinical centers and we provide exhaustive segmentation validation. Once the vasculature is successfully segmented, in the second contribution we propose a methodology to extensively characterize the geometry of the internal carotid artery (ICA). This includes the development of a method to automatically identify the ICA from the segmented vascular tree. Finally in the third contribution, this automatic identification is generalized to a collection of vessels including their connectivity and topological relationships. Identifying the corresponding vessels in a population enables comparison of their geometry using the methodology introduced for the characterization of the ICA.
</description>
<pubDate>Mon, 12 Nov 2012 10:59:30 GMT</pubDate>
<guid isPermaLink="false">http://www.tdx.cat:80/handle/10803/94141</guid>
<dc:date>2012-11-12T10:59:30Z</dc:date>
</item>
<item>
<title>Brain activity during rest : a signature of the underlying network dynammics</title>
<link>http://www.tdx.cat:80/handle/10803/85414</link>
<description>Brain activity during rest : a signature of the underlying network dynammics
Cabral, Joana R. B.
La actividad cerebral exhibe complejos fenómenos oscilatorios similares a los que se observan en modelos de redes artificiales con osciladores acoplados. Por un lado, estudios sobre la actividad cerebral durante el reposo han demostrado la presencia de fluctuaciones lentas estructuradas y modulaciones de potencia a distintas  frecuencias. Simultáneamente, estudios teóricos en el ámbito de la física muestran dinámicas similares usando osciladores acoplados. En este trabajo, por primera vez, se usan modelos de osciladores de fase en redes inspiradas en la arquitectura real del cerebro. Los resultados muestran la aparición espontánea de una dinámica similar a la observada experimentalmente. Además, esta correspondencia es comparable cuantitativamente con datos de neuroimagen, lo que sugiere procesos generales de integración subyacentes a la cognición. Por otra parte, se propone que la actividad cerebral alterada observada en algunas enfermedades psiquiátricas podría tener su origen en desconexiones estructurales que afectarían el comportamiento cooperativo de regiones corticales.; Neural activity in the brain exhibits complex oscillatory phenomena that can be compared with the ones observed in artificial network models of coupled oscillators. In particular, neuroimaging studies of brain activity during rest have reported slow spatiotemporally organized fluctuations and correlated band-limited power modulations. Simultaneously, theoretical works on the area of physics have reported similar dynamic behaviours using simple models of coupled oscillators with intermittent modular synchronization. In this work, for the first time, we use models of phase oscillators in networks inspired in the brain’s wiring architecture. Results show the spontaneous emergence of a dynamics similar to the one observed experimentally. In addition, this correspondence is quantitatively comparable to neuroimaging data, which is suggestive of general integrative processes underlying cognition. Furthermore, we propose that altered brain activity observed in some psychiatric diseases might originate from structural disconnections, which affect the cooperative behaviour of coupled cortical regions.
</description>
<pubDate>Mon, 08 Oct 2012 11:19:09 GMT</pubDate>
<guid isPermaLink="false">http://www.tdx.cat:80/handle/10803/85414</guid>
<dc:date>2012-10-08T11:19:09Z</dc:date>
</item>
<item>
<title>Building ethernet connectivity services for provider networks</title>
<link>http://www.tdx.cat:80/handle/10803/85413</link>
<description>Building ethernet connectivity services for provider networks
Bonada i Cruells, Eduard
Network providers are motivated to deploy Ethernet in their infrastructures. However, this represents a new application for Ethernet technology that leads to new requirements. In Ethernet networks, the Rapid Spanning Tree Protocol (RSTP) creates an active tree on top of the physical topology to avoid potential loops and allows the bridge functionalities to work properly. However, there are some implications of using RSTP to prune the physical topology into an active tree: unused links and sub-optimal paths. In addition, RSTP suffers count-to-infinity and takes too long to recover from critical failures. In this thesis we propose a complete solution based on RSTP extensions that addresses the shortcomings. We design and evaluate two extensions: RSTP-Conf to provide quick recoveries and RSTP-SP to operate with optimal path communications.; Els proveïdors de xarxa estan motivats per implementar Ethernet en les seves infraestructures. No obstant, això representa una nova aplicació per Ethernet que comporta nous requeriments. En les xarxes Ethernet, el protocol de Rapid Spanning Tree (RSTP) crea un arbre actiu per evitar cicles i permetre que les xarxes Ethernet funcionin correctament. Hi ha però algunes implicacions de l'ús de RSTP per transformar la topologia física en un arbre actiu: alguns enllaços no utilitzats i la creació de rutes sub-òptimes. A més, RSTP pateix count-to-infinity i tarda massa temps per recuperar-se de caigudes crítiques. En aquesta tesi es proposa una solució completa basada en extensions d’RSTP que aborda les seves deficiències. Dissenyem i avaluem dues extensions: RSTP-Conf per proporcionar una ràpida recuperació i RSTP-SP per operar amb comunicacions  per camins òptims.
</description>
<pubDate>Mon, 08 Oct 2012 11:01:13 GMT</pubDate>
<guid isPermaLink="false">http://www.tdx.cat:80/handle/10803/85413</guid>
<dc:date>2012-10-08T11:01:13Z</dc:date>
</item>
<item>
<title>Towards deep content extraction from specialized discourse : the case of verbal relations in patent claims</title>
<link>http://www.tdx.cat:80/handle/10803/84174</link>
<description>Towards deep content extraction from specialized discourse : the case of verbal relations in patent claims
Ferraro, Gabriela
This thesis addresses the problem of the development of Natural Language&#13;
Processing techniques for the extraction and generalization of compositional&#13;
and functional relations from specialized written texts and, in particular, from&#13;
patent claims. One of the most demanding tasks tackled in the thesis is,&#13;
according to the state of the art, the semantic generalization of linguistic&#13;
denominations of relations between object components and processes&#13;
described in the texts. These denominations are usually verbal expressions or&#13;
nominalizations that are too concrete to be used as standard labels in&#13;
knowledge representation forms -as, for example, “A leads to B”, and “C&#13;
provokes D”, where “leads to” and “provokes” both express, in abstract&#13;
terms, a cause, such that in both cases “A CAUSE B” and “C CAUSE D”&#13;
would be more appropriate. A semantic generalization of the relations allows&#13;
us to achieve a higher degree of abstraction of the relationships between&#13;
objects and processes described in the claims and reduces their number to a&#13;
limited set that is oriented towards relations as commonly used in the generic&#13;
field of knowledge representation.; Esta tesis se centra en el del desarrollo de tecnologías del Procesamiento del&#13;
Lenguage Natural para la extracción y generalización de relaciones&#13;
encontradas en textos especializados; concretamente en las reivindicaciones&#13;
de patentes. Una de las tareas más demandadas de nuestro trabajo, desde el&#13;
punto vista del estado de la cuestión, es la generalización de las&#13;
denominaciones lingüísticas de las relaciones. Estas denominaciones,&#13;
usualmente verbos, son demasiado concretas para ser usadas como etiquetas&#13;
de relaciones en el contexto de la representación del conocimiento; por&#13;
ejemplo, “A lleva a B”, “B es el resultado de A” están mejor representadas&#13;
por “A causa B”. La generalización de relaciones permite reducir el n\'umero&#13;
de relaciones a un conjunto limitado, orientado al tipo de relaciones utilizadas&#13;
en el campo de la representación del conocimiento.
</description>
<pubDate>Wed, 03 Oct 2012 07:32:09 GMT</pubDate>
<guid isPermaLink="false">http://www.tdx.cat:80/handle/10803/84174</guid>
<dc:date>2012-10-03T07:32:09Z</dc:date>
</item>
<item>
<title>Noise-induced reversals in bistable visual perception</title>
<link>http://www.tdx.cat:80/handle/10803/83867</link>
<description>Noise-induced reversals in bistable visual perception
García Rodríguez, Pedro Ernesto
In this thesis, a set of some prevailing rate-based models for bistable perception have been considered in order to find the implications of the novel results reported in Pastukhov &amp; Braun (2011). These authors have quantified not only salient aspects of bistable perception (mean and dispersion of dominance distributions), but also some hidden hysteresis effects ignored up to now. Extensive computational simulations of different prevailing models rigorously demonstrate that the history-dependence of the perceptual process shown by Pastukhov &amp; Braun (2011), effectively constrains the region of the parameter space able to replicate the empirical data. Concretely, that just small regions residing inside a bistable or two-attractor region of the whole parameter space are actually adequate to reproduce the experimental results, both for BR and KDE displays. Remarkably, the results remain valid across all the different classes of models considered, regardless the details of the neuronal implementation. The biological plausibility of the parameter region found for each of the models considered, is further stressed with respect to the widely known Levelt’s propositions. To that end, we make use of weighted sums across the parameter regions computed for each subject in the first part of this Thesis, an algorithm that constitutes an important improvement to the methodology proposed by Shpiro et al. (2007) to fit behavioral data by rate-based models. It is shown how different neuronal mechanisms clearly differ in their suitability to replicate Levelt’s propositions. For instance, models with a slow fatiguing process given by spike-frequency adaptation Wilson (2003); Shpiro et al. (2007), no matter if they are being described by linear Shpiro et al. (2007) or nonlinear Curtu et al. (2008)) functions of the activity, replicate quite well Levelt’s second law. Oppositely, a notable discrepancy between model and empirical results is found when such negative feedback is described as a long-term depression affecting the synapses between the competing neurons representing the two alternative interpretations Laing &amp; Chow (2002); Shpiro et al. (2007). The present work finishes with a study about the capability of the mentioned models to reproduce the resonance effects happening when varying external frequencies, as shown by Kim et al. (2006). Importantly, a resonance respect to the noise dispersion (i.e., a true stochastic resonance ) is clearly demonstrated here for the first time. Previous estimations of noise dispersion (20 − 30% of the input) and its locus (adaptation variables) are questioned, by demonstrating that increased sensitivity to even weak signals of the order of less than 10% can be obtained with the models considered, with the noise variable simply entering as part of the net input feeding the neuron.; En este trabajo, son considerados una serie de modelos para frecuencia neuronal ampliamente aceptados en percepción bi-estable, con el objetivo de evaluar las implicaciones de los resultados recientemente reportados en Pastukhov &amp; Braun (2011). Estos autores han cuantificado no solamente aspectos más conocidos sobre el fenómeno (media y dispersión de las distribuciones de dominancia), sino también efectos de historia que habían sido ignorados hasta el presente. Por medio de simulaciones computacionales, se demuestra rigurosamente que la dependencia de la historia del proceso perceptual encontrada por Pastukhov &amp; Braun (2011) efectivamente restringe la región válida de parámetros que es adecuada para reproducir los datos empíricos. Concretamente, que solamente pequeñas regiones del espacio de parámetros disponible, y que se encuentran dentro de una región dinámica bi-estable caracterizada por dos atractores, son realmente adecuadas, tanto para rivalidad binocular (BR) como para estímulos de estructura por movimiento (KDE). Resulta importante destacar que los resultados permanecen válidos de un modelo a otro, independientemente de los detalles de implementación neuronal. La plausibilidad biológica de la región de parámetros encontrada para cada modelo es entonces considerada, en el contexto de las ampliamente conocidas proposiciones de Levelt. Con tal objetivo, hacemos uso de un algoritmo de suma pesada para extraer valores medios de la regiones de parámetros correspondientes a cada sujeto. Este algoritmo constituye una importante mejora a la metodología propuesta por Shpiro et al. (2007) para ajustar modelos de frecuencia neuronal a datos comportamentales de percepción bi-estable. Es entonces mostrado como cada mecanismo neuronal considerado es clara- mente diferente en su capacidad para reproducir las proposiciones de Levelt. Por ejemplo, modelos conteniendo procesos lentos de retroalimentación negativa da- dos por adaptación de frecuencia de disparo Wilson (2003); Shpiro et al. (2007), sin importar si están descritos por funciones lineales Shpiro et al. (2007) or no lineales Curtu et al. (2008)) de la actividad, consiguen reproducir de modo razonable la segunda proposición de Levelt. Por el contrario, una notable discrepancia entre modelo y resultados empíricos es encontrada cuando tales procesos están dados por la presencia de depresión sináptica de larga duración. El presente trabajo culmina con un estudio sobre la capacidad de los mencionados modelos para reproducir los efectos de resonancia que ocurren al variar la frecuencia externa de modulación Kim et al. (2006). Es de destacar que en nuestro caso, un efecto de resonancia es encontrado respecto a la dispersión del ruido, lo cual indica la presencia de una verdadera resonancia del tipo estocástico. Este efecto es claramente demostrado para estos modelos, por primera vez, en el presente trabajo. Previas estimaciones de la dispersión del ruido (20 − 30 % de la señal de entrada) y su localización (variables de adaptación) son analizadas. Se demuestra que un incremento de la sensibilidad a incluso muy pequeñas señales de menos del 10% puede ser encontrada en estos modelos, con sólo incluir la variable de ruido como parte de la corriente neta que alimenta la neurona.
</description>
<pubDate>Fri, 27 Jul 2012 11:09:04 GMT</pubDate>
<guid isPermaLink="false">http://www.tdx.cat:80/handle/10803/83867</guid>
<dc:date>2012-07-27T11:09:04Z</dc:date>
</item>
<item>
<title>Plan recognition as planning</title>
<link>http://www.tdx.cat:80/handle/10803/83524</link>
<description>Plan recognition as planning
Ramírez Jávega, Miquel
Plan recognition is the problem of inferring the goals and plans of an agent after partially&#13;
observing its behavior. This is the inverse of planning, the problem of finding&#13;
the actions that need to be done in order to achieve a goal. In this thesis we show&#13;
how the problem of plan recognition can be solved using unmodified, state-of-the-art&#13;
planning algorithms and representation languages. Along with a solid computational&#13;
framework for deriving posterior goal probabilities, we introduce a novel and crisp&#13;
model-based formulation of plan recognition whose &#13;
exibility surpasses that of previous&#13;
approaches.; Plan recognition és un problema computacional que consisteix en identificar el propòsit&#13;
d'un agent intel.ligent, havent observat parcialment el seu comportament. Aquest és&#13;
el problema invers al problema de la planificació automàtica, que consisteix en trobar&#13;
les accions que són necessàries dur a terme per tal d'aconseguir un cert objectiu.&#13;
En aquesta tesi mostrem com el problema de plan recognition és pot resoldre mitjançant els mateixos algorismes i llenguatges de representació utilitzats per resoldre&#13;
la planificació automàtica. La nostra proposta no només conté una serie d'algoritmes&#13;
eficients i robustos, sino que ve suportada per un marc teòric formal, que ofereixen&#13;
en conjunt una flexibilitat de la qual no disposen propostes prèvies per resoldre plan&#13;
recognition.
</description>
<pubDate>Mon, 09 Jul 2012 11:01:47 GMT</pubDate>
<guid isPermaLink="false">http://www.tdx.cat:80/handle/10803/83524</guid>
<dc:date>2012-07-09T11:01:47Z</dc:date>
</item>
<item>
<title>Statistical atlases of cardiac motion and deformation for the characterization of CRT responders</title>
<link>http://www.tdx.cat:80/handle/10803/81710</link>
<description>Statistical atlases of cardiac motion and deformation for the characterization of CRT responders
Duchateau, Nicolas Guillem
The definition of optimal selection criteria for maximizing the response rate to Cardiac Resynchronization Therapy (CRT) is still an issue under active debate. Recent clinical approaches propose a classification of patients into classes of mechanisms that could lead to heart failure and study their response to the therapy. In this line of research, the computation of a metric between the motion and deformation patterns of a given subject and well identified classes of CRT responders is considered in this thesis, as the basis of a new strategy to compute patient selection indexes. The thesis proposes first an improved design for the construction of statistical atlases of myocardial motion and deformation, and applies it to the characterization of populations of patients involved in CRT. The added-value of our approach is highlighted in a clinical study, applying the methodology to a large population of patients with a given pattern of dyssynchrony (septal flash) and understanding the link between its correction and CRT response. Finally, we propose a method to extend the analysis to the comparison of individuals to reference populations, either healthy or pathological, using manifold learning techniques to model a disease as progressive deviations from normality along a manifold structure, and demonstrate the potential of our method for inter-subject comparison in CRT patients.; La definición de un criterio óptimo para mejorar la respuesta a la Terapia de Resincronización Cardíaca (TRC) sigue siendo un debate abierto. Estudio clínicos recientemente publicados proponen clasificar pacientes&#13;
según diversos mecanismos patofisiológicos que pueden inducir insuficiencia cardíaca y estudian su respuesta a la terapia. Siguiendo esta línea de investigación, esta tesis considera el cálculo de una distancia entre los patrones de movimiento y deformación de un individuo y las clases de respondedores a la TRC, siendo la base de una nueva estrategia para calcular índices para seleccionar pacientes. Esta tesis presenta primero un método para construir un atlas estadístico de movimiento y deformación miocárdica, y su aplicación posterior a la caracterización de poblaciones de potenciales candidatos a la TRC. El valor añadido de nuestro método se enfatiza en un estudio clínico, en el cual se aplica la metodología a una gran población de pacientes con un patrón específico de  disincronía cardíaca (llamado septal flash), y se relaciona su corrección y la respuesta a la TRC. Finalmente, se&#13;
extiende el método para comparar individuos a una población de referencia, sana o patológica, usando técnicas de manifold learning para representar una patología como una desviación progresiva de la normalidad, con una estructura no lineal específica, y se demuestra el potencial de nuestro método para comparar entre sí candidatos a la TRC.
</description>
<pubDate>Wed, 06 Jun 2012 11:54:33 GMT</pubDate>
<guid isPermaLink="false">http://www.tdx.cat:80/handle/10803/81710</guid>
<dc:date>2012-06-06T11:54:33Z</dc:date>
</item>
<item>
<title>Automatic musical instrument recognition from polyphonic music audio signals</title>
<link>http://www.tdx.cat:80/handle/10803/81328</link>
<description>Automatic musical instrument recognition from polyphonic music audio signals
Fuhrmann, Ferdinand
En aquesta tesi presentem un mètode general per al reconeixement automàtic d’instruments musicals partint d’un senyal d’àudio. A diferència de molts enfocs relacionats, el nostre evita restriccions artificials o artificioses pel que fa al disseny algorísmic, les dades proporcionades al sistema, o el context d’aplicació. Per tal de fer el problema abordable, limitem el procés a l’operació més bàsica consistent a reconèixer  l’instrument predominant en un breu fragment d’àudio. Així ens estalviem la separació de  fonts sonores en la mescla i, més específicament, predim una font sonora a partir del timbre general del so analitzat. Per tal de compensar aquesta restricció incorporem, addicionalment, informació derivada d’una anàlisi musical jeràrquica: primer incorporem context temporal a l’hora d’extraure  etiquetes dels instruments, després incorporem aspectes formals de la peça que poden ajudar al reconeixement de l’instrument, i finalment incloem informació general gràcies a l’explotació de les associacions entre gèneres musicals i instruments.; In this dissertation we present a method for the automatic recognition of musical instruments from music audio signal. Unlike most related approaches, our specific conception mostly avoids laboratory constraints on the method’s algorithmic design, its input data, or the targeted application context. To account for the complex nature of the input signal, we limit the basic process in the processing chain to the recognition of a single predominant musical instrument from a short audio fragment. We thereby prevent resolving the mixture and rather predict one source from the timbre of the sound. To compensate for this restriction we further incorporate information derived from a hierarchical music analysis; we first incorporate musical context to extract instrumental labels from the time-varying model decisions. Second, the method incorporates information regarding the piece’s formal aspects into the process. Finally, we include information from the collection level by exploiting associations between musical genres and instrumentations.
</description>
<pubDate>Wed, 23 May 2012 10:33:54 GMT</pubDate>
<guid isPermaLink="false">http://www.tdx.cat:80/handle/10803/81328</guid>
<dc:date>2012-05-23T10:33:54Z</dc:date>
</item>
<item>
<title>Semantic annotation of music collections: A computational approach</title>
<link>http://www.tdx.cat:80/handle/10803/79132</link>
<description>Semantic annotation of music collections: A computational approach
Sordo, Mohamed
El consum de la música ha canviat dràsticament en els últims anys. Amb&#13;
l’arribada de la música digital, el cost de producció s’ha reduït considerablement.&#13;
L’expansió de la Web ha ajudat a promoure l’exploració de molt més&#13;
contingut musical. Algunes botigues musicals on-line, com iTunes o Amazon,&#13;
posseeixen milions de cançons a les seves col.leccions. No obstant, accedir a&#13;
aquestes col.leccions d’una manera eficient és encara un gran repte.&#13;
En aquesta tesis ens centrem en el problema d’anotar col.leccions musicals&#13;
amb paraules semàntiques, també conegudes com tags. Els mètodes utilitzats&#13;
en aquesta tesi estan fonamentats sobre els camps de recuperació de la&#13;
informació, l’inteligència artificial, i el procesament del senyal. Proposem un&#13;
algorisme per anotar música automàticament, utilitzant similitud d’audio a&#13;
nivell de contingut per propagar tags entre cançons. L’algorisme s’avalua extensament&#13;
utilitzant múltiples col.leccions musicals de diferent mida i qualitat&#13;
de les dades, incloent una col.lecció de més de mig milió de cançons, anotades&#13;
amb tags socials derivats d’una comunitat musical. Avaluem la qualitat del&#13;
nostre algorisme mitjançant una comparació amb algorismes de l’estat de l’art.&#13;
Addicionalment, discutim la importància d’utilitzar mesures de avaluació que&#13;
cobreixen diferents dimensions, és a dir, avaluacions a nivell de cançó i a nivell&#13;
de tag. El nostre algorisme ha estat avaluat i s’ha classificat en altes posicions&#13;
en el concurs d’avaluació internacional MIREX 2011. Els resultats obtinguts&#13;
també demostren algunes limitacions de l’anotació automàtica, relacionades&#13;
amb les inconsistències en les dades, la correlació de conceptes i la dificultat&#13;
de capturar alguns tags personals amb informació del contingut. Això és més&#13;
evident en les comunitats musicals, on els usuaris poden anotar cançons amb&#13;
qualsevol paraula, sigui aquesta contextual o no. Per tal d’abordar aquestes&#13;
limitacions, presentem un ampli estudi sobre la naturalesa de les folksonomies&#13;
musicals. Concretament, estudiem si les anotacions fetes per una gran comunitat&#13;
d’usuaris coincideixen amb un vocabulari més controlat i estructurat per&#13;
part d’experts en el camp. Els resultats revelen que alguns tags estan clarament&#13;
definits i compresos tant des del punt de vista dels experts com el de&#13;
la saviesa popular, mentre que n’hi ha d’altres sobre els quals és difícil trobar&#13;
un consens. Finalment, estenem el nostre previ treball a un ampli ventall&#13;
de conceptes semàntics. Presentem un nou métode per a descobrir conceptes&#13;
semàntics implícits en els tags socials, i classificar aquests tags pel que fa als&#13;
conceptes semàntics. Les darreres troballes poden ajudar a entendre la naturalesa&#13;
dels tags socials, i per tant ser beneficials per a una addicional millora&#13;
de la anotació automàtica de la música.; Music consumption has changed drastically in the last few years. With the&#13;
arrival of digital music, the cost of production has substantially dropped. The&#13;
expansion of the World Wide Web has helped to promote the exploration of&#13;
many more music content. Online stores, such as iTunes or Amazon, own music&#13;
collections in the order of millions of songs. Accessing these large collections&#13;
in an effective manner is still a big challenge.&#13;
In this dissertation we focus on the problem of annotating music collections&#13;
with semantic words, also called tags. The foundations of all the methods&#13;
used in this dissertation are based on techniques from the fields of information&#13;
retrieval, machine learning, and signal processing. We propose an automatic&#13;
music annotation algorithm that uses content-based audio similarity to propagate&#13;
tags among songs. The algorithm is evaluated extensively using multiple&#13;
music collections of varying size and quality of the data, including a large music&#13;
collection of more than a half million songs, annotated with social tags derived&#13;
from a music community. We assess the quality of our proposed algorithm&#13;
by comparing it with several state of the art approaches. We also discuss the&#13;
importance of using evaluation measures that cover different dimensions; per–&#13;
song and per–tag evaluation. Our proposal achieves state of the art results,&#13;
and has ranked high in the MIREX 2011 evaluation campaign. The obtained&#13;
results also show some limitations of automatic tagging, related to data inconsistencies,&#13;
correlation of concepts and the difficulty to capture some personal&#13;
tags with content information. This is more evident in music communites,&#13;
where users can annotate songs with any free text word. In order to tackle&#13;
these issues, we present an in-depth study of the nature of music folksonomies.&#13;
We concretely study whether tag annotations made by a large community (i.e.&#13;
a folksonomy) correspond with a more controlled, structured vocabulary by&#13;
experts in the music and the psychology fields. Results reveal that some tags&#13;
are clearly defined and understood both by the experts and the wisdom of&#13;
crowds, while it is difficult to achieve a common consensus on the meaning of&#13;
other tags. Finally, we extend our previous work to a wide range of semantic&#13;
concepts. We present a novel way to uncover facets implicit in social tagging,&#13;
and classify the tags with respect to these semantic facets. The latter findings&#13;
can help to understand the nature of social tags, and thus be beneficial for&#13;
further improvement of semantic tagging of music.&#13;
Our findings have significant implications for music information retrieval systems&#13;
that assist users to explore large music collections, digging for content&#13;
they might like.; El consumo de la música ha cambiado drásticamente en los últimos años. Con&#13;
la llegada de la música digital, el coste de producción se ha reducido considerablemente.&#13;
La expansión de la Web ha ayudado a promover la exploración de&#13;
mucho más contenido musical. Algunas tiendas musicales on-line, como iTunes&#13;
o Amazon, poseen millones de canciones en sus colecciones. Sin embargo,&#13;
acceder a estas colecciones de una manera eficiente es todavía un gran reto.&#13;
En esta tesis nos centramos en el problema de anotar colecciones musicales con&#13;
palabras semánticas, también conocidas como tags. Los métodos utilizados en&#13;
esta tesis están cimentados sobre los campos de recuperación de la información,&#13;
la inteligencia artifical, y el procesamiento del señal. Proponemos un algoritmo&#13;
para anotar música automáticamente, usando similitud de audio a nivel de&#13;
contenido para propagar tags entre canciones. El algoritmo se evalúa extensamente&#13;
usando múltiples colecciones musicales de distinto tamaño y calidad&#13;
de los datos, incluyendo una colección de más de medio millón de canciones,&#13;
anotadas con tags sociales derivados de una comunidad musical. Evaluamos&#13;
la calidad de nuestro algoritmo mediante una comparación con algoritmos del&#13;
estado del arte. Adicionalmente, discutimos la importancia de usar medidas de&#13;
evaluación que cubren diferentes dimensiones; es decir, evaluaciones a nivel de&#13;
canción y a nivel de tag. Nuestro algoritmo ha sido evaluado y se clasificado en&#13;
altas posiciones en el concurso de evaluación internacional MIREX 2011. Los&#13;
resultados obtenidos también demuestran algunas limitaciones de la anotación&#13;
automática, relacionadas con las inconsistencias en los datos, la correlación de&#13;
conceptos y la dificultad de capturar algunos tags personales con información&#13;
del contenido. Esto es más evidente en las comunidades musicales, donde los&#13;
usuarios pueden anotar canciones con cualquier palabra, sea esta contextual o&#13;
no. Con el fin de abordar estas limitaciones, presentamos un amplio estudio sobre&#13;
la naturaleza de las folksonomías musicales. Concretamente, estudiamos si&#13;
las anotaciones hechas por una gran comunidad de usuarios concuerdan con un&#13;
vocabulario más controlado y estructurado por parte de expertos en el campo.&#13;
Los resultados revelan que algunos tags están claramente definidos y comprendidos&#13;
tanto desde el punto de vista de los expertos como el de la sabiduría&#13;
popular, mientras que hay otros tags sobre los cuales es difícil encontrar un&#13;
consenso. Por último, extendemos nuestro previo trabajo a un amplio abanico&#13;
de conceptos semánticos. Presentamos un método novedoso para descubrir&#13;
conceptos semánticos implícitos en los tags sociales, y clasificar dichos tags&#13;
con respecto a los conceptos semánticos. Los últimos hallazgos pueden ayudar&#13;
a entender la naturaleza de los tags sociales, y por consiguiente ser beneficiales&#13;
para una adicional mejora para la anotación automática de la música.
</description>
<pubDate>Tue, 03 Apr 2012 11:10:11 GMT</pubDate>
<guid isPermaLink="false">http://www.tdx.cat:80/handle/10803/79132</guid>
<dc:date>2012-04-03T11:10:11Z</dc:date>
</item>
<item>
<title>Translation-based approaches to automated planning with incomplete information and sensing</title>
<link>http://www.tdx.cat:80/handle/10803/78939</link>
<description>Translation-based approaches to automated planning with incomplete information and sensing
Albore, Alexandre
Artificial Intelligence Planning is about acting in order to achieve a desired goal. &#13;
Under incomplete information, the task of finding the actions needed to achieve the goal can be modelled as a search problem in the belief space. This task is costly, as belief space is exponential in the number of states, which is exponential in the number of variables. Good belief representations and heuristics are thus critical for scaling up in this setting.&#13;
&#13;
The translation-based approach to automated planning with incomplete information  deals with both issues by casting the problem of search in belief space to a search problem in state space, where each node of the search space represents a belief state.&#13;
We develop plan synthesis tools that use translated versions of planning problems under uncertainty, with partial or null sensing available.&#13;
We  show formally under which conditions the introduced translations are polynomial, and capture all and only the plans of the original problems. We study empirically the value of these translations.; La Planificación es la disciplina de Inteligencia Artificial que estudia los procesos de razonamiento necesarios para conseguir las acciones que logren un objetivo dado.&#13;
&#13;
En presencia de información incompleta, el problema de planificación puede ser modelado como una búsqueda en el espacio de estados de creencia, cada uno de ellos representando un conjunto de estados posibles. Este problema es costoso ya que el numero de estados de creencia puede ser exponencial en el número de estados, lo cual es exponencial en el número de variables del problema. El uso de buenas representaciónes de los estados y de heurísticas informadas resultan cruciales para escalar en este espacio de búsqueda.&#13;
&#13;
&#13;
En esta tesis se presentan traducciones para planificación con información incompleta, que transforman el problema de búsqueda en el espacio de estados de creencia, en búsqueda en espacio de estados, donde cada nodo representa un estado de creencia.&#13;
Hemos desarrollado herramientas para la generación de planes para el problema traducido, ya sea con percepción parcial o nula. A su vez, demostramos formalmente bajo qué circunstancias las traducciones son polinómicas, completas y correctas. La evaluación empírica remarca el valor de dichas traducciones
</description>
<pubDate>Tue, 27 Mar 2012 11:28:53 GMT</pubDate>
<guid isPermaLink="false">http://www.tdx.cat:80/handle/10803/78939</guid>
<dc:date>2012-03-27T11:28:53Z</dc:date>
</item>
<item>
<title>Computing-Based Testing: conceptual model, implementations and experiments extending IMS QTI.</title>
<link>http://www.tdx.cat:80/handle/10803/69962</link>
<description>Computing-Based Testing: conceptual model, implementations and experiments extending IMS QTI.
Santos Rodríguez, Patrícia
The use of objective tests in Technology Enhanced Learning (TEL) is&#13;
based on the application of computers to support automatic assessment.&#13;
Current research in this domain is mainly focused on the design of new&#13;
question-items, being IMS Question and Test Interoperability (QTI) the&#13;
recognized de-facto standard. This thesis claims that the domain can be&#13;
extended with the design of advanced test-scenarios that integrate new&#13;
interactive contexts for the visualization of question-items and tests, and&#13;
that consider different types of devices and technologies that enable&#13;
diverse activity settings. In this context, the dissertation proposes to term&#13;
the domain as Computing-Based Testing (CBT) instead of Computer-&#13;
Based Testing because it captures better the new technological support&#13;
possibilities for testing. Advanced CBT scenarios can increase teachers’&#13;
choices in the design of more appropriate tests for their subject areas,&#13;
enabling the assessment of higher-order skills.&#13;
With the aim of modelling an advanced CBT domain that extends the&#13;
current possibilities of QTI and related work, this thesis provides a set of&#13;
contributions around three objectives. The first objective deals with&#13;
proposing a Conceptual Model for the CBT domain considering three&#13;
main dimensions: the Question-item, the Test and the Activity. To tackle&#13;
this objective, the thesis presents, on the one hand, a framework to assist&#13;
in the categorization and design of advanced CBT scenarios and, on the&#13;
other hand, two models that suggest elements for technologically&#13;
representing the Test and Question-item dimensions. The models are&#13;
platform-independent models (PIM) that extend QTI in order to support&#13;
advanced CBT. Besides, the use of patterns is proposed to complement&#13;
the modelling of the domain. The second objective seeks to show the&#13;
relevance, value and applicability of the CBT Conceptual Model through&#13;
exemplary challenging scenarios and case studies in authentic settings. To&#13;
this end, the dissertation evaluates the design and implementation of a set&#13;
of CBT systems and experiments. All the experiments use the proposed&#13;
CBT Conceptual Model for designing an advanced CBT scenario. For&#13;
each case the CBT-PIMs serve as the basis for developing a particular&#13;
CBT-PSM and system. The evaluation results show that the&#13;
implementations foster educational benefits, enable the assessment of&#13;
higher-order skills and enhance the students’ motivation. Finally, the third&#13;
objective is devoted to propose extension paths for QTI. The collection of&#13;
models proposed in the thesis suggests different extension directions for&#13;
QTI so as to enable the implementation of advanced questions, tests and&#13;
activities. The proposed systems and scenarios also represent reference&#13;
implementation and good practices of the proposed extension paths.; El uso de test de corrección automática, en el Aprendizaje Apoyado por&#13;
Tecnologías de la Información y las Comunicaciones, se basa en el uso de&#13;
ordenadores. Las propuestas actuales se centran en el diseño de nuevas&#13;
preguntas, siendo IMS Question and Test Interoperability (QTI) el&#13;
estándar de-facto. La tesis propone que este dominio puede ser extendido&#13;
con el diseño de escenarios de test avanzados que integren nuevos&#13;
contextos de interacción para la visualización de preguntas y tests, y que&#13;
consideren la aplicación de diversos dispositivos tecnológicos para&#13;
permitir diversos tipos de actividades. En este contexto se propone usar el&#13;
término inglés Computing-Based Testing (CBT) para referirse al dominio,&#13;
en vez de usar el término Computer-Based Testing, enfatizando el papel&#13;
de la tecnología para la evaluación basada en test. Los escenarios CBT&#13;
avanzados pueden aumentar la posibilidad de que los profesores puedan&#13;
diseñar test más adecuados para sus asignaturas, permitiendo la&#13;
evaluación de habilidades de alto nivel.&#13;
Con el reto principal de modelar el dominio del CBT extendiendo las&#13;
posibilidades actuales de QTI y las aproximaciones actuales, esta tesis&#13;
proporciona un conjunto de contribuciones relacionadas con tres&#13;
objetivos. El primer objetivo de la tesis es proponer un Modelo&#13;
Conceptual definiendo y relacionando tres dimensiones: Pregunta, Test y&#13;
Actividad. Por una parte, se propone un marco como guía en la&#13;
categorización y diseño de escenarios CBT. Además, se proponen dos&#13;
modelos que indican los elementos para la representación tecnológica de&#13;
preguntas y test. Estos modelos son independientes de plataforma (PIM)&#13;
que extienden QTI formulando los elementos que permiten implementar&#13;
escenarios CBT avanzados. Además, se propone el uso de patrones como&#13;
complemento en el modelado del dominio. El segundo objetivo trata de&#13;
mostrar la relevancia y aplicabilidad de las contribuciones a través de&#13;
escenarios y casos de estudio representativos en contextos reales. Para&#13;
ello, se evalúa el diseño e implementación de un conjunto de&#13;
experimentos y sistemas. En todos los experimentos se utiliza el Modelo&#13;
Conceptual para diseñar escenarios CBT avanzados. Para cada caso los&#13;
CBT-PIMs sirven como base para desarrollar modelos específicos de&#13;
plataforma (CBT-PSMs) y sistemas asociados. La evaluación muestra que&#13;
las implementaciones resultantes tienen beneficios educativos positivos,&#13;
permitiendo la evaluación de habilidades de alto nivel y mejorando la&#13;
motivación de los estudiantes. Finalmente, el tercer objetivo se centra en&#13;
proponer vías de extensión para QTI. La colección de modelos propuestos&#13;
sugiere diferentes direcciones de extensión de QTI para la&#13;
implementación de preguntas, tests y actividades avanzados. Los&#13;
escenarios y sistemas llevados a cabo representan implementaciones de&#13;
referencia y buenas prácticas para las vías de extensión propuestas.
</description>
<pubDate>Mon, 13 Feb 2012 11:47:24 GMT</pubDate>
<guid isPermaLink="false">http://www.tdx.cat:80/handle/10803/69962</guid>
<dc:date>2012-02-13T11:47:24Z</dc:date>
</item>
<item>
<title>Decision-making beyond “left or right”. A computational study on the neurophysiology behind multiple-choice decision-making and choice reevaluation.</title>
<link>http://www.tdx.cat:80/handle/10803/52754</link>
<description>Decision-making beyond “left or right”. A computational study on the neurophysiology behind multiple-choice decision-making and choice reevaluation.
Albantakis, Larissa
Neurophysiological brain processes during perceptual decision-making have mainly been investigated under the simplified conditions of two-alternative forced-choice (2AFC) tasks. How do established principles of decision-making, obtained from these simple binary tasks, extend to more complex aspects like multiple choice-alternatives and changes of mind? Here, we first address this question theoretically: based on recent experimental findings, we extend a biophysically realistic attractor model of decision-making to account for multiple choice-alternatives and choice reevaluation. Moreover, we complement our computational approach by a psychophysical experiment, exploring how changes of mind depend on the number of choice-alternatives. Our results affirm the general conformance of attractor networks with higher-level neural processes. In particular, we found evidence for the physiological relevance of a so far unregarded bifurcation. Furthermore, our findings suggest an advantage of a pooled multi-neuron representation of choice-alternatives, and a negative correlation between reaction time and changes of mind, possibly regulated by the decision threshold. Finally, we gained testable predictions on neural firing rates during changes of mind and propose future experiments to distinguish nonlinear attractor from linear diffusion models.; Los procesos neurofisiológicos que tienen lugar en el cerebro durante la toma de decisiones basadas en fenómenos de percepción han sido investigados, principalmente, en condiciones simplificadas, en particular, de tareas con dos alternativas y elección forzada (2AFC). ¿Cómo podemos extender los principios establecidos sobre la toma de decisiones obtenidas a partir de estas tareas simples y binarias, a aspectos más complejos como decisiones con alternativas múltiples y los cambios de opinión? En esta tesis, en primer lugar, abordamos esta cuestión de manera teórica: a partir de resultados experimentales recientes, extendemos un modelo de toma de decisiones, que es un modelo con atractores realista desde el punto de vista biofísico, con el objetivo de explicar la elección con alternativas múltiples y la reevaluación de la elección. Además, complementamos nuestro enfoque computacional con un experimento psicofísico, explorando cómo los cambios de opinión dependen del número de alternativas. Nuestros resultados refuerzan la tesis de que existe una correspondencia general entre las redes de atractores y los procesos neuronales superiores. En particular, revelan la importancia fisiológica de una bifurcación que hasta ahora ha pasado inadvertida. Además, sugieren la ventaja de representar las alternativas de elección con múltiples neuronas, y la existencia de una correlación negativa entre el tiempo de reacción y los cambios de opinión, posiblemente regulada por el umbral de decisión. Finalmente, proporcionamos predicciones comprobables sobre las tasas de disparo neuronal durante los cambios de la opinión y proponemos experimentos futuros para distinguir los modelos no lineales con atractores de los modelos de difusión lineal.
</description>
<pubDate>Fri, 23 Dec 2011 08:33:34 GMT</pubDate>
<guid isPermaLink="false">http://www.tdx.cat:80/handle/10803/52754</guid>
<dc:date>2011-12-23T08:33:34Z</dc:date>
</item>
<item>
<title>Recovery of cerebrovascular morphodynamics from time-resolved rotational angiography</title>
<link>http://www.tdx.cat:80/handle/10803/51921</link>
<description>Recovery of cerebrovascular morphodynamics from time-resolved rotational angiography
Zhang, Chong
Over the last decade, there has been a growing interest in assessing cerebral aneurysmal wall motion, because of its potential connections to the biomechanical conditions of the vessel wall, which could eventually aid the prediction of aneurysmal rupture risk. Such quantification could provide a valid surrogate for the vascular wall status and integrity. However, the vast majority of current morphological indices used in the literature to predict growth and rupture in cerebral aneurysms do not take into account the temporal changes that occur during the cardiac cycle. This is because these indices are derived from image modalities that do not provide sufficient temporal and/or spatial resolution to obtain dynamic aneurysm information, which is expected to be similar to or below image resolution. Among currently available vascular imaging techniques, 3D rotational angiography (3DRA) and digital subtraction angiography (DSA) have the highest spatial (and temporal) resolution. Still, for a human operator relying solely on qualitative visual observation, even when using images from these modalities, to objectively analyze the small motion and shape changes of the cerebrovasculature of an individual throughout the cardiac cycle is difficult, if not impossible. Therefore, the availability of a robust morphodynamic analysis tool is needed.  In this context, this thesis focuses on developing techniques to estimate, quantify and analyze cerebrovascular wall motion, particularly aneurysmal wall motion, using such modalities. The main contributions of the thesis are: 1) a first methodology to estimate and model patient-specific cerebrovascular morphodynamics over one cardiac cycle, through a proposed multiple 2D to 3D image registration framework; 2) an extension of this methodology to provide robust and efficient estimates of cerebrovascular wall motion for clinical evaluation and for further biomechanical modeling of the cerebrovascular wall; 3) a patient study that demonstrates the validity of the developed techniques from clinical practice, through an analysis of 3DRA and DSA images. Each of these contributions is published in or submitted to a peerreviewed international journal.; Durante la última década se ha dado un creciente interés en la evaluación del movimiento de la pared vascular en aneurismas cerebrales. Éste hecho ha sido motivado en gran medida por la relación existente entre dicha motilidad y sus condiciones biomecánicas, pudiendo éstas llegar a ser útiles en la predicción del riesgo de ruptura del aneurisma cerebral analizado. De este modo, de ésta cuantificación, se podría llegar a derivar un indicador indirecto del estado e integridad de la pared vascular. Sin embargo, la gran mayoría de los índices morfológicos utilizados en la actualidad para predecir crecimiento y ruptura de aneurismas cerebrales no consideran los cambios que se producen en el tiempo a lo largo del ciclo cardíaco. Esto se debe a que dichos índices se obtienen a partir de modalidades de imagen que no proporcionan suficiente resolución espacial y/o temporal para obtener información dinámica del aneurisma, cuyo rango de variación se espera sea similar o inferior a la resolución de la imagen. Entre las técnicas de imagen vascular disponibles en la actualidad, la angiografía rotacional 3D (3DRA) y la angiografía de substracción digital (DSA) son las que ofrecen la mayor resolución espacial (y temporal). De todos modos, aún utilizando imágenes de estas modalidades, el análisis objetivo de pequeñas diferencias de forma y movimiento en los vasos cerebrales de un individuo a lo largo de un ciclo cardíaco es difícil, si no imposible para un operador humano utilizando únicamente medidas cualitativas guiadas por inspección visual. Por lo tanto, la disponibilidad de herramientas robustas para el análisis morfodinámico de la vasculatura cerebral resulta necesaria.  En este contexto, la investigación de esta tesis se concentra en el desarrollo de técnicas para estimar, cuantificar y analizar el movimiento de las paredes de los vasos cerebrales, con particular énfasis en el movimiento de la pared en aneurismas, utilizando las modalidades indicadas anteriormente. En líneas generales, esta tesis presenta tres contribuciones principales: 1) una primera metodología de estimación y modelado morfodinámico de vasos cerebrales a lo largo de un ciclo cardíaco, utilizando una técnica de registrado de imágenes 2D-3D; 2) una metodología extendida para proporcionar una estimación robusta y eficiente del movimiento de las paredes de los vasos cerebrales para su evaluación clínica y posterior modelado biomecánico de dichas paredes; 3) un estudio sobre una población de pacientes que demuestra la validez de las técnicas desarrolladas en la práctica clínica, a través del análisis en imágenes de 3DRA y DSA. Cada una de estas contribuciones ha sido publicada o se encuentra en fase de revisión en revistas internacionales indexadas.
</description>
<pubDate>Thu, 01 Dec 2011 12:16:23 GMT</pubDate>
<guid isPermaLink="false">http://www.tdx.cat:80/handle/10803/51921</guid>
<dc:date>2011-12-01T12:16:23Z</dc:date>
</item>
<item>
<title>Automatic Classification of musical mood by content-based analysis</title>
<link>http://www.tdx.cat:80/handle/10803/51582</link>
<description>Automatic Classification of musical mood by content-based analysis
Laurier, Cyril François
In this work, we focus on automatically classifying music by mood. For this purpose, we propose computational models using information extracted from the audio signal. The foundations of such algorithms are based on techniques from signal processing, machine learning and information retrieval. First, by studying the tagging behavior of a music social network, we find a model to represent mood. Then, we propose a method for automatic music mood classification. We analyze the contributions of audio descriptors and how their values are related to the observed mood. We also propose a multimodal version using lyrics, contributing to the field of text retrieval. Moreover, after showing the relation between mood and genre, we present a new approach using automatic music genre classification. We demonstrate that genre-based mood classifiers give higher accuracies than standard audio models. Finally, we propose a rule extraction technique to explicit our models.; En esta tesis, nos centramos en la clasificación automática de música a partir de la detección de la emoción que comunica. Primero, estudiamos cómo los miembros de una red social utilizan etiquetas y palabras clave para describir la música y las emociones que evoca, y encontramos un modelo para representar los estados de ánimo. Luego, proponemos un método de clasificación automática de emociones. Analizamos las contribuciones de descriptores de audio y cómo sus valores están relacionados con los estados de ánimo. Proponemos también una versión multimodal de nuestro algoritmo, usando las letras de canciones. Finalmente, después de estudiar la relación entre el estado de ánimo y el género musical, presentamos un método usando la clasificación automática por género. A modo de recapitulación conceptual y algorítmica, proponemos una técnica de extracción de reglas para entender como los algoritmos de aprendizaje automático predicen la emoción evocada por la música
</description>
<pubDate>Mon, 21 Nov 2011 12:09:58 GMT</pubDate>
<guid isPermaLink="false">http://www.tdx.cat:80/handle/10803/51582</guid>
<dc:date>2011-11-21T12:09:58Z</dc:date>
</item>
<item>
<title>Supervised Identification of the User Intent of Web Search Queries</title>
<link>http://www.tdx.cat:80/handle/10803/51300</link>
<description>Supervised Identification of the User Intent of Web Search Queries
González-Caro, Cristina
As the Web continues to increase both in size and complexity, Web search is a ubiquitous service that allows users to find all kind of information, resources, and activities. However, as the Web evolves so do the needs of the users. Nowadays, users have more complex interests that go beyond of the traditional informational queries. Thus, it is important for Web-search engines, not only to continue answering effectively informational and navigational queries, but also to be able to identify and provide accurate results for new types of queries.&#13;
This Ph.D. thesis aims to analyze the impact of the query intent in the search behavior of the users. In order to achieve this, we first study the behavior of users with different types of query intent on search engine result pages (SERP), using eye tracking techniques. Our study shows that the query intent of the user affects all the decision process in the SERP. Users with different query intent prefer different type of search results (organic, sponsored), they attend to different main areas of interest (title, snippet, URL, image) and focus on search results with different ranking position. To be able to accurately identify the intent of the user query is an important issue for search engines, as this will provide useful elements that allow them adapting their results to changing user behaviors and needs. Therefore, in this thesis we propose a method to identify automatically the intent behind user queries. Our hypothesis is that the performance of single-faceted classification of queries can be improved by introducing information of multi-faceted training samples into the learning process. Hence, we study a wide set of facets that can be considered for the characterization of the query intent of the user and we investigate whether combining multiple facets can improve the predictability of these facets. Our experimental results show that this idea can significantly improve the quality of the classification. Since most of previous works in query intent classification are oriented to the study of single facets, these results are a first step to an integrated query intent classification model.; A medida que la Web sigue creciendo, tanto en tamaño como en complejidad, la búsqueda Web llega a ser un servicio ubicuo que permite a los usuarios encontrar todo tipo de información, recursos y actividades. Sin embargo, así como la Web evoluciona también lo hacen las necesidades de los usuarios. Hoy en día, los usuarios tienen intereses más complejos que van más allá de las tradicionales consultas informacionales. Por lo tanto, es importante para los motores de búsqueda Web, no solo continuar respondiendo efectivamente las consultas informacionales y navegacionales, sino también identificar y proveer resultados precisos para los nuevos tipos de consultas.&#13;
 El objetivo de esta tesis es analizar el impacto de la intención de la consulta en el comportamiento de búsqueda de los usuarios. Para lograr esto, primero estudiamos el comportamiento de usuarios con diferentes intenciones en las páginas de resultados de motores de búsqueda (SERP). Nuestro estudio muestra que la intención de la consulta  afecta todo el proceso de decisión en la SERP. Los usuarios con diferentes intenciones prefieren resultados de búsqueda diferentes (orgánicos, patrocinados), miran diferentes áreas de interés (título, snippet, URL, imagen) y se concentran en resultados con diferente posición en el ranking. Identificar automáticamente la intención de la consulta aportaría elementos valiosos que permitirán a los sistemas de búsqueda adaptar sus resultados a los comportamientos cambiantes del usuario. Por esto, esta tesis propone un método para identificar automáticamente la intención detrás de la consulta. Nuestra hipótesis es que el rendimiento de la clasificación de consultas basada en facetas simples puede ser mejorado con la introducción de ejemplos multi-faceta en el proceso de aprendizaje. Por lo tanto, estudiamos un grupo amplio de facetas e investigamos si la combinación de facetas puede mejorar su predictibilidad. Nuestros resultados muestran que esta idea puede mejorar significativamente la calidad de la clasificación. Dado que la mayoría de trabajos previos están orientados al estudio de facetas individuales, estos resultados son un primer paso hacia un modelo integrado de clasificación de la intención de la  consulta.
</description>
<pubDate>Fri, 11 Nov 2011 11:16:38 GMT</pubDate>
<guid isPermaLink="false">http://www.tdx.cat:80/handle/10803/51300</guid>
<dc:date>2011-11-11T11:16:38Z</dc:date>
</item>
<item>
<title>Unsupervised Identification of the User’s Query Intent in Web Search</title>
<link>http://www.tdx.cat:80/handle/10803/51299</link>
<description>Unsupervised Identification of the User’s Query Intent in Web Search
Calderón-Benavides, Liliana
This doctoral work focuses on identifying and understanding the intents that motivate a user to perform a search on the Web. To this end, we apply machine learning models that do not require more information than the one provided by the very needs of the users, which in this work are represented by their queries. The knowledge and interpretation of this invaluable information can help search engines to obtain resources especially relevant to users, and thus improve their satisfaction.&#13;
&#13;
By means of unsupervised learning techniques, which have been selected according to the context of the problem being solved, we show that is not only possible to identify the user’s intents, but that this process can be conducted automatically. &#13;
&#13;
The research conducted in this thesis has involved an evolutionary process that starts from the manual analysis of different sets of real user queries from a search engine. The work passes through the proposition of a new classification of user’s query intents; the application of different unsupervised learning techniques to identify those intents; up to determine that the user’s intents, rather than being considered as an uni–dimensional problem, should be conceived as a composition of several aspects, or dimensions (i.e., as a multi–dimensional problem), that contribute to clarify and to establish what the user’s intents are. Furthermore, from this last proposal, we have configured a framework for the on–line identification of the user’s query intent. Overall, the results from this research have shown to be effective for the problem of identifying user’s query intent.; Este trabajo doctoral se enfoca en identificar y entender las intenciones que motivan a los usuarios a realizar búsquedas en la Web a través de la aplicación de métodos de aprendizaje automático que no requieren datos adicionales más que las necesidades de información de los mismos usuarios, representadas a través de sus consultas. El conocimiento y la interpretación de esta información, de valor incalculable, puede ayudar a los sistemas de búsqueda Web a encontrar recursos particularmente relevantes y así mejorar la satisfacción de sus usuarios.&#13;
&#13;
A través del uso de técnicas de aprendizaje no supervisado, las cuales han sido seleccionadas dependiendo del contexto del problema a solucionar, y cuyos resultados han demostrado ser efectivos para cada uno de los problemas planteados, a lo largo de este trabajo se muestra que no solo es posible identificar las intenciones de los usuarios, sino que este es un proceso que se puede llevar a cabo de manera automática.&#13;
&#13;
 La investigación desarrollada en esta tesis ha implicado un proceso evolutivo, el cual inicia con el análisis de la clasificación manual de diferentes conjuntos de consultas que usuarios reales han sometido a un motor de búsqueda. El trabajo pasa a través de la proposición de una nueva clasificación de las intenciones de consulta de usuarios, y el uso de diferentes técnicas de aprendizaje no supervisado para identificar dichas intenciones, llegando hasta establecer que éste no es un problema unidimensional, sino que debería ser considerado como un problema de múltiples dimensiones, donde cada una de dichas dimensiones, o facetas, contribuye a clarificar y establecer cuál es la intención del usuario. A partir de este último trabajo, hemos creado un modelo para la identificar la intención del usuario en un escenario on–line.
</description>
<pubDate>Fri, 11 Nov 2011 11:02:53 GMT</pubDate>
<guid isPermaLink="false">http://www.tdx.cat:80/handle/10803/51299</guid>
<dc:date>2011-11-11T11:02:53Z</dc:date>
</item>
<item>
<title>Color image processing problems in digital photography</title>
<link>http://www.tdx.cat:80/handle/10803/51297</link>
<description>Color image processing problems in digital photography
Ferradans Ramonde, Sira
In this thesis, we discuss three image processing topics: High Dynamic Range (HDR)&#13;
image creation in scenes with motion, Tone Mapping (TM), and Demosaicking. The first&#13;
part of this thesis focuses on the creation of HDR images using gradient fusion&#13;
techniques, and proposes a method that deals with motion and avoids bleeding and ghost&#13;
artifacts. In the second part, we tackle the TM problem, whose goal is to produce a low&#13;
dynamic range picture from an HDR image that reproduces the sensation of an observer&#13;
in the scene. We review the perceptual principles that we find important for TM purposes&#13;
and present a new method that compares well to the state of the art. Finally, we propose&#13;
a new method to reconstruct the three color channels of a picture taken with a Bayer&#13;
filter. This problem is called Demosaicking and will be presented in the third part of this&#13;
thesis.; En esta tesis tratamos tres temas de procesamiento de imagen: creación de imágenes de&#13;
alto rango dinámico o HDR, Tone Mapping (TM) y Demosaicking. En la primera parte&#13;
proponemos un método para la creación de imágenes HDR con movimiento que permite&#13;
generar resultados sin artefactos de tipo bleeding y ghosting. En la segunda parte de la&#13;
tesis tratamos el problema de TM cuyo objetivo es comprimir el rango dinámico de una&#13;
imagen HDR para ser mostrada en una pantalla o impresa, simulando lo mejor posible la&#13;
percepción de un sujeto en la escena. Presentaremos los principios sicofísicos que&#13;
consideramos relevantes para TM y propondremos un método nuevo que mejora los&#13;
resultados del estado del arte. Finalmente, en la tercera parte presentamos un método de&#13;
Demosaicking o reconstrucción de los tres canales de color de una imagen tomada con&#13;
un filtro de Bayer.
</description>
<pubDate>Fri, 11 Nov 2011 10:11:34 GMT</pubDate>
<guid isPermaLink="false">http://www.tdx.cat:80/handle/10803/51297</guid>
<dc:date>2011-11-11T10:11:34Z</dc:date>
</item>
<item>
<title>Verification of Psychological and Neurobiological Theories of Emotions Using Virtual and Situated Agents</title>
<link>http://www.tdx.cat:80/handle/10803/51295</link>
<description>Verification of Psychological and Neurobiological Theories of Emotions Using Virtual and Situated Agents
Inderbitzin, Martin Pascal
The investigation of the influence of emotions on human cognition and behavior challenges scientist since a long time. So far the most popular approach to investigate this phenomenon was to observe brain processes and behavior. In the recent decade the field of computational neuroscience proposed a new methodology: the construction of embodied models of emotions and their verification in real world environments.&#13;
In this thesis we present different studies that use computational models of emotions to control the behavior and the expressions of situated agents. Using different methodologies we evaluate both, the performance of the models and the behavioral responses of humans interacting with them. Our results add to a deeper understanding of the multidimensional phenomena of emotions on three levels: Perception, interaction and how the processing of emotional cues influences learning and behavior; La investigació/recerca sobre la influència de les emocions en la cognició i el comportament humà constitueix un repte científic des de fa molt temps. Fins ara el mètode més popular per a investigar aquest fenòmen ha estat el d'observar els processos cerebrals i el comportament. En l'última dècada el camp de la neurociència computacional ha proposat una nova metodologia: la construcció dels models incorporats d’emocions i la seva verificació en entorns del món real.&#13;
&#13;
En aquesta tesi presentem diferents estudis que han utilitzat models computacionals de les emocions per controlar el comportament i les expressions d’agents localitzats. Utilitzant diferents metodologies, hem avaluat tant el rendiment d’aquests models així com les respostes conductuals dels éssers humans que han interactuen amb ells.Els nostres resultats se sumen a una comprensió més profunda dels fenòmens multidimensionals de les emocions en tres nivells: la percepció, la interacció i com el processament dels senyals emocionals influeixen en l'aprenentatge i el comportament
</description>
<pubDate>Fri, 11 Nov 2011 09:45:08 GMT</pubDate>
<guid isPermaLink="false">http://www.tdx.cat:80/handle/10803/51295</guid>
<dc:date>2011-11-11T09:45:08Z</dc:date>
</item>
<item>
<title>SME’s participation to Free Libre Open Source Software Communities</title>
<link>http://www.tdx.cat:80/handle/10803/38704</link>
<description>SME’s participation to Free Libre Open Source Software Communities
Batikas, Michail
Les motivacions entorn al programari lliure han estat sempre un tema de gran interès, sent la pregunta més obvia, "perquè les persones treballen de forma gratuïta?". Les motivacions dels desenvolupadors han estat establertes (per exemple, von Hippel (2001), Lerner and Tirole (2002)). De la mateixa manera que ho han estat per a les empreses grans i petites que adopten programari lliure basat en models de negoci (per exemple, Lakhani and von Hippel, 2003; Fitzgerald, 2006; Krishnamurthy, 2004). No obstant això, un nombre cada vegada més elevat de les PIMES amb estratègies que no estan directament relacionades amb aquest model de negoci estan contribuint a les comunitats de programari lliure. En aquest estudi s'investiga les motivacions d'aquestes empreses des d'un punt de vista de comportament mitjançant un model d'investigació basat en TPB (Theory of Planned Behavior). Hem demostrat que factors com la "obertura" d'una PIME, la importància percebuda del programari lliure, els desenvolupadors (empleats) d'una PIME, juntament amb l'ambient extern, podrien influir en la decisió d'una PIME a participar en comunitats de programari lliure. A més, hem demostrat que es poden identificar algunes diferències entre empreses d'alta base tecnològica i empreses amb poca base tecnològica. Aquestes conclusions poden ajudar governs nacionals o regionals per millorar el disseny de polítiques per tal d'incentivar l'ús i la participació de les empreses en les comunitats de programari lliure. Especialment ara, degut a la forta crisi econòmica que pateix Europa, el programari lliure pot ser una solució adequada per a fomentar la innovació.; Motivations in FLOSS have always been a subject of great interest, by starting with the most obvious question, “why people work for free?”. The motivations of developers have been well established (eg von Hippel (2001), Lerner and Tirole 2002). The same exists also for big and small companies adopting FLOSS based Business Models (eg Lakhani and von Hippel, 2003; Fitzgerald 2006; Krishnamurthy, 2004). However an increasing number of SMEs with strategies not directly related to the Business Model are contributing to FLOSS communities. In this study we try to investigate these motivations under a behavioral perspective by using a research model based on TPB (Theory of Planned Behavior). We demonstrated that factors like the “openness” of a SME, the perceived importance of FLOSS, the developers (employees) of a SME along with the external environment of a SME, could influence the decision of a SME to participate in FLOSS communities. Also, we have demonstrated that some differences can be identified between high tech firms and non high tech firms. These findings can help national or regional governments to design better policies in order to better promote the use and the participation of firms to FLOSS communities. Especially now, in times of heavy economical crisis in Europe, FLOSS can be an adequate solution to foster innovation.
</description>
<pubDate>Tue, 04 Oct 2011 08:33:17 GMT</pubDate>
<guid isPermaLink="false">http://www.tdx.cat:80/handle/10803/38704</guid>
<dc:date>2011-10-04T08:33:17Z</dc:date>
</item>
<item>
<title>Operationalization of collaborative blended learning scripts: a model, computational mechanisms and experiments</title>
<link>http://www.tdx.cat:80/handle/10803/38360</link>
<description>Operationalization of collaborative blended learning scripts: a model, computational mechanisms and experiments
Pérez Sanagustín, Maria del Mar
Portable and interactive technologies are changing the nature of collaborative learning practices. Learning can now occur both in and beyond the classroom and furthermore combine formal and informal activities monitored and orchestrated across spatial locations. This rises to a new type of orchestrated learning that we term Computer Supported Collaborative Blended Learning (CSCBL) scripts. This thesis investigates the challenges associated with the design of CSCBL scripts and with the technologies responsible for their enactment. Three contributions are presented. First, a conceptual model that combines 4 factors to be considered in the design of CSCBL scripts. Second, technological solutions operationalizing the aforementioned factors are proposed and evaluated through synthetic experiences. And third, four CSCBL experiments using 4SPPIces. These experiments are analyzed into two interrelated multicase case studies, whose cross-analyzed results provide an evaluation of the model, of the operationalization solutions supporting the enactment of the involved CSCBL scripts and of the educational value of the experiences themselves.; La introducción de tecnologías interactivas y móviles está produciendo un cambio significativo en la naturaleza de las prácticas educativas. Actualmente, el aprendizaje mediante colaboración se puede dar en situaciones en que secuencias de actividades formales e informales dentro y fuera del aula se combinan e integran de forma coordinada. Esto da lugar a un nuevo tipo de actividades de colaboración orquestadas en entornos mezclados que llamaremos guiones CSCBL (de su acrónimo en inglés). Esta tesis investiga los retos relacionados con diseño de los guiones CSCBL y de la selección apropiada de la tecnología para su puesta en marcha. De este trabajo de investigación se derivan tres contribuciones principales. Primero, se propone un modelo conceptual que combina 4 factores a tener en cuenta en el diseño de guiones CSCBL. Segundo, se proponen un conjunto de soluciones tecnológicas para dar soporte computacional a los diferentes factores del modelo y dar apoyo a la puesta en marcha de guiones CSCBL. Cada una de estas soluciones se evalúa mediante experimentos sintéticos. Finalmente, esta tesis presenta tres experimentos en que se usa el modelo para proponer actividades de colaboración en entornos mezclados y aplicarlas en entornos reales. Estos experimentos han sido evaluados mediante dos estudios múltiples de casos. El análisis cruzado de los resultados de los casos englobados en cada estudio ofrece una evaluación de la utilidad del modelo y de las soluciones tecnológicas adoptadas para su puesta en marcha.
</description>
<pubDate>Thu, 29 Sep 2011 11:38:17 GMT</pubDate>
<guid isPermaLink="false">http://www.tdx.cat:80/handle/10803/38360</guid>
<dc:date>2011-09-29T11:38:17Z</dc:date>
</item>
<item>
<title>Three-dimensional statistical shape models for multimodal cardiac image analysis</title>
<link>http://www.tdx.cat:80/handle/10803/37473</link>
<description>Three-dimensional statistical shape models for multimodal cardiac image analysis
Tobón Gómez, Catalina
Las enfermedades cardiovasculares (ECVs) son la principal causa de mortalidad en el mundo&#13;
Occidental. El interés de prevenir y tratar las ECVs ha desencadenado un rápido desarrollo de los&#13;
sistemas de adquisición de imágenes médicas. Por este motivo, la cantidad de datos de imagen&#13;
recolectados en las instituciones de salud se ha incrementado considerablemente. Este hecho ha&#13;
aumentado la necesidad de herramientas automatizadas para dar soporte al diagnóstico, mediante&#13;
una interpretación de imagen confiable y reproducible. La tarea de interpretación requiere traducir&#13;
los datos crudos de imagen en parámetros cuantitativos, los cuales son considerados relevantes&#13;
para clasificar la condición cardiaca de un paciente. Para realizar tal tarea, los métodos basados en&#13;
modelos estadísticos de forma han recibido favoritismo dada la naturaleza tridimensional (o 3D+t)&#13;
de las imágenes cardiovasculares. Deformando el modelo estadístico de forma a la imagen de un&#13;
paciente, el corazón puede analizarse de manera integral.&#13;
Actualmente, el campo de las imágenes cardiovasculares esta constituido por diferentes modalidades.&#13;
Cada modalidad explota diferentes fenómenos físicos, lo cual nos permite observar el&#13;
órgano cardiaco desde diferentes ángulos. El personal clínico recopila todas estas piezas de información&#13;
y las ensambla mentalmente en un modelo integral. Este modelo integral incluye información&#13;
anatómica y funcional que muestra un cuadro completo del corazón del paciente. Es&#13;
de alto interés transformar este modelo mental en un modelo computacional capaz de integrar la&#13;
información de manera global. La generación de un modelo como tal no es simplemente un reto de&#13;
visualización. Requiere una metodología capaz de extraer los parámetros cuantitativos relevantes&#13;
basados en los mismos principios técnicos. Esto nos asegura que las mediciones se pueden comparar&#13;
directamente. Tal metodología debe ser capaz de: 1) segmentar con precisión las cavidades&#13;
cardiacas a partir de datos multimodales, 2) proporcionar un marco de referencia único para integrar&#13;
múltiples fuentes de información, y 3) asistir la clasificación de la condición cardiaca del&#13;
paciente.&#13;
Esta tesis se basa en que los modelos estadísticos de forma, y en particular los Modelos Activos&#13;
de Forma, son un método robusto y preciso con el potencial de incluir todos estos requerimientos.&#13;
Para procesar múltiples modalidades de imagen, separamos la información estadística de forma&#13;
de la información de apariencia. Obtenemos la información estadística de forma a partir de una&#13;
modalidad de alta resolución y aprendemos la apariencia simulando la física de adquisición de&#13;
otras modalidades.&#13;
Las contribuciones de esta tesis pueden ser resumidas así: 1) un método genérico para construir&#13;
automáticamente modelos de intensidad para los Modelos Activos de Forma simulando la&#13;
física de adquisición de la modalidad en cuestión, 2) la primera extensión de un simulador de Resonancia&#13;
Magnética Nuclear diseñado para producir estudios cardiacos realistas, y 3) un método&#13;
novedoso para el entrenamiento automático de modelos de intensidad y de fiabilidad aplicado a&#13;
estudios cardiacos de Resonancia Magnética Nuclear. Cada una de estas contribuciones representa&#13;
un artículo publicado o enviado a una revista técnica internacional.; Cardiovascular diseases (CVDs) are the major cause of death in the Western world. The desire&#13;
to prevent and treat CVDs has triggered a rapid development of medical imaging systems. As&#13;
a consequence, the amount of imaging data collected in health care institutions has increased&#13;
considerably. This fact has raised the need for automated analysis tools to support diagnosis with&#13;
reliable and reproducible image interpretation. The interpretation task requires to translate raw&#13;
imaging data into quantitative parameters, which are considered relevant to classify the patient’s&#13;
cardiac condition. To achieve this task, statistical shape model approaches have found favoritism&#13;
given the 3D (or 3D+t) nature of cardiovascular imaging datasets. By deforming the statistical&#13;
shape model to image data from a patient, the heart can be analyzed in a more holistic way.&#13;
Currently, the field of cardiovascular imaging is constituted by different modalities. Each modality&#13;
exploits distinct physical phenomena, which allows us to observe the cardiac organ from&#13;
different angles. Clinicians collect all these pieces of information to form an integrated mental model.&#13;
The mental model includes anatomical and functional information to display a full picture&#13;
of the patient’s heart. It is highly desirable to transform this mental model into a computational&#13;
model able to integrate the information in a comprehensive manner. Generating such a model is&#13;
not simply a visualization challenge. It requires having a methodology able to extract relevant&#13;
quantitative parameters by applying the same principle. This assures that the measurements are&#13;
directly comparable. Such a methodology should be able to: 1) accurately segment the cardiac&#13;
cavities from multimodal datasets, 2) provide a unified frame of reference to integrate multiple&#13;
information sources, and 3) aid the classification of a patient’s cardiac condition.&#13;
This thesis builds upon the idea that statistical shape models, in particular Active Shape Models,&#13;
are a robust and accurate approach with the potential to incorporate all these requirements.&#13;
In order to handle multiple image modalities, we separate the statistical shape information from&#13;
the appearance information. We obtain the statistical shape information from a high resolution&#13;
modality and include the appearance information by simulating the physics of acquisition of other&#13;
modalities.&#13;
The contributions of this thesis can be summarized as: 1) a generic method to automatically&#13;
construct intensity models for Active Shape Models based on simulating the physics of acquisition&#13;
of the given imaging modality, 2) the first extension of a Magnetic Resonance Imaging (MRI)&#13;
simulator tailored to produce realistic cardiac images, and 3) a novel automatic intensity model and&#13;
reliability training strategy applied to cardiac MRI studies. Each of these contributions represents&#13;
an article published or submitted to a peer-review archival journal.
</description>
<pubDate>Tue, 20 Sep 2011 11:24:55 GMT</pubDate>
<guid isPermaLink="false">http://www.tdx.cat:80/handle/10803/37473</guid>
<dc:date>2011-09-20T11:24:55Z</dc:date>
</item>
</channel>
</rss>
