Desarrollo de diferentes métodos de selección de variables para sistemas multisensoriales

Author

Gualdron Guerrero, Oscar Eduardo

Director

Brezmes Llecha, Jesús

Llobet Valero, Eduard

Date of defense

2006-07-13

ISBN

9788469340707

Legal Deposit

T1167-2010



Department/Institute

Universitat Rovira i Virgili. Departament d'Enginyeria Electrònica, Elèctrica i Automàtica

Abstract

Los sistemas de olfato electrónico son instrumentos que han sido desarrollados para emular a los sistemas de olfato biológicos. A este tipo de ingenios se les ha conocido popularmente como narices electrónicas (NE). Los científicos e ingenieros que siguen perfeccionando este tipo de instrumento trabajan en diferentes frentes, como son el del desarrollo de nuevos sensores de gases (con mejor discriminación y mayor sensibilidad), el de la adaptación de técnicas analíticas como la espectrometría de masas (MS) en substitución de la tradicional matriz de sensores químicos, la extracción de nuevos parámetros de la respuesta de los sensores (preprocesado) o incluso en el desarrollo de técnicas más sofisticadas para el procesado de datos.<br/>Uno de los principales inconvenientes que en la actualidad presentan los sistemas de olfato artificial es la alta dimensionalidad de los conjuntos a analizar, debido a la gran cantidad de parámetros que se obtienen de cada medida. El principal objetivo de esta tesis ha sido estudiar y desarrollar nuevos métodos de selección de variables con el fin de reducir la dimensionalidad de los datos y así poder optimizar los procesos de reconocimiento en sistemas de olfato electrónico basados en sensores de gases o en espectrometría de masas.<br/>Para poder evaluar la importancia de los métodos y comprobar si ayudan realmente a solucionar la problemática de la dimensionalidad se han utilizado cuatro conjuntos de datos pertenecientes a aplicaciones reales que nos permitieron comprobar y comparar los diferentes métodos implementados de forma objetiva. Estos cuatro conjuntos de datos se han utilizado en tres estudios cuyas conclusiones repasamos a continuación:<br/>En el primero de los estudios se ha demostrado que diferentes métodos (secuenciales o estocásticos) pueden ser acoplados a clasificadores fuzzy ARTMAP o PNN y ser usados para la selección de variables en problemas de análisis de gases en sistemas multisensoriales. Los métodos fueron aplicados simultáneamente para identificar y cuantificar tres compuestos orgánicos volátiles y sus mezclas binarias construyendo sus respectivos modelos neuronales de clasificación.<br/>El segundo trabajo que se incluye en esta tesis propone una nueva estrategia para la selección de variables que se ha mostrado eficaz ante diferentes conjuntos de datos provenientes de sistemas olfativos basados en espectrometría de masas (MS). La estrategia ha sido aplicada inicialmente a un conjunto de datos consistente de mezclas sintéticas de compuestos volátiles. Este conjunto ha sido usado para mostrar que el proceso de selección es viable para identificar un mínimo número de fragmentos que permiten la discriminación correcta entre mezclas usando clasificadores fuzzy ARTMAP. Además, dada la naturaleza simple del problema planteado, fue posible mostrar que los fragmentos seleccionados, son fragmentos de ionización característicos de las especies presentes en las mezclas a ser discriminadas. Una vez demostrado el correcto funcionamiento de esta estrategia, se aplicó esta metodología a otros dos conjuntos de datos (aceite de oliva y jamones ibéricos, respectivamente).<br/>El tercer estudio tratado en esta tesis ha girado en torno al desarrollo de un nuevo método de selección de variables inspirado en la concatenación de varios procesos de "backward selection". El método está especialmente diseñado para trabajar con Support Vector machines (SVM) en problemas de clasificación o de regresión. La utilidad del método ha sido evaluada usando dos de los conjuntos de datos ya utilizados anteriormente.<br/>Como conclusión se puede decir que para los diferentes conjuntos estudiados, la inclusión de un proceso previo de selección de variables da como resultado una reducción drástica en la dimensionalidad y un aumento significativo en los correspondientes resultados de clasificación. Los métodos introducidos aquí no solo son útiles para resolver problemas de narices electrónicas basadas en MS, sino también para cualquier aplicación de sistemas de olfato artificial que presenten problemas de alta dimensionalidad como en el caso de los conjuntos de datos estudiados en este trabajo.


The electronic noses systems are instruments that have been developed to emulate olfactory biologic systems. These systems are known as electronic noses (EN).<br/>Nowadays, researchers and engineers working in this area are trying to optimize these systems considering different directions, such as: development of new gas sensors (with better discrimination and greater sensitivity), adaptation of analytical techniques such as mass spectrometry (MS) in substitution of chemical sensors matrix and extraction of new parameters of the sensors responses (pre-processing) or even development of sophisticated techniques for the data processing.<br/>One of the main disadvantages that have artificial olfactory systems is high dimensionality of sets to analyze. The main objective of this thesis have been study and development of new variable selection methods with the purpose of reducing dimensionality of data and thus to be able to optimize recognition processes in electronic olfactory systems based on gas sensors or mass spectrometry.<br/>These methods have been used with four datasets which belong to real applications.<br/>They allowed us to verify and to compare different implemented methods. These four datasets have been used in three studies whose conclusions are reviewed as follows.<br/>The first study has demonstrated that different methods (either deterministic or stochastic) can be coupled to a fuzzy ARTMAP or a PNN classifier and be used for variable selection in gas analysis problems by multisensor systems. The methods were applied to simultaneously identify and quantify three volatile organic compounds and their binary mixtures by building neural classification models.<br/>The second study, proposes a new strategy for feature selection in dataset of system olfactory based on mass spectrometry (MS). This strategy has been introduced and its good performance demonstrated using different MS e-nose databases. The strategy has been applied initially to a database consisting of synthetic mixtures of volatile compounds. This simple database has been used to show that the feature selection process is able to identify a minimal set of fragments that enables the correct discrimination between mixtures using a simple fuzzy ARTMAP classifier.<br/>Furthermore, given the simple nature of the problem envisaged, it was possible to show that the fragments selected 'made sense' were characteristic ionisation fragments of the species present in the mixtures which were discriminated. Once demonstrated the correct operation of this strategy, this methodology was applied to other two data sets (olive oil, Iberian ham).<br/>In the third study of this thesis has been introduced a new method of variable selection based on sequential backward selection. The method is specifically designed to work with Support vector machines (SVM) either for classification or regression. The usefulness of the method has been assessed using two multisensor system databases (measurements of vapour simples and vapour mixtures performed using an array of metal oxide gas sensors and measurement of Iberian ham).<br/>For different databases studied, dramatic decrease in dimensionality of model and an increase in classification performance is result of using variable selection. The methods introduced here are useful not only to solve MS-based electronic nose problems, but are of interest for any electronic nose application suffering from highdimensionality problems, no matter which sensing technology is used.

Keywords

SVM; simulated annealing; narices electrónicas; métodos estocasticos; redes neuronales; Sistemas multisensoriales; selección de variables

Subjects

621.3 Electrical engineering

Documents

Tesis_Oscar_Gualdron.pdf

5.001Mb

 

Rights

ADVERTIMENT. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal, així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas, en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs.

This item appears in the following Collection(s)