2024-03-28T17:56:48Zhttps://www.tdx.cat/oai/requestoai:www.tdx.cat:10803/85902017-09-25T20:31:05Zcom_10803_311col_10803_318
00925njm 22002777a 4500
dc
Martínez Brito, Izacar Jesús
author
2010-05-26
Key physicochemical properties for a wide spectrum of chemical pollutants are unknown. This thesis analyses the prospect of assessing the environmental distribution of chemicals directly from supervised learning algorithms using molecular descriptors, rather than from multimedia environmental models (MEMs) using several physicochemical properties estimated from QSARs. Dimensionless compartmental mass ratios of 468 validation chemicals were compared, in logarithmic units, between: a) SimpleBox 3, a Level III MEM, propagating random property values within statistical distributions of widely recommended QSARs; and, b) Support Vector Regressions (SVRs), acting as Quantitative Structure-Fate Relationships (QSFRs), linking mass ratios to molecular weight and constituent counts (atoms, bonds, functional groups and rings) for training chemicals. Best predictions were obtained for test and validation chemicals optimally found to be within the domain of applicability of the QSFRs, evidenced by low MAE and high q2 values (in air, MAE≤0.54 and q2≥0.92; in water, MAE≤0.27 and q2≥0.92).
Las propiedades fisicoquímicas de un gran espectro de contaminantes químicos son desconocidas. Esta tesis analiza la posibilidad de evaluar la distribución ambiental de compuestos utilizando algoritmos de aprendizaje supervisados alimentados con descriptores moleculares, en vez de modelos ambientales multimedia alimentados con propiedades estimadas por QSARs. Se han comparado fracciones másicas adimensionales, en unidades logarítmicas, de 468 compuestos entre: a) SimpleBox 3, un modelo de nivel III, propagando valores aleatorios de propiedades dentro de distribuciones estadísticas de QSARs recomendados; y, b) regresiones de vectores soporte (SVRs) actuando como relaciones cuantitativas de estructura y destino (QSFRs), relacionando fracciones másicas con pesos moleculares y cuentas de constituyentes (átomos, enlaces, grupos funcionales y anillos) para compuestos de entrenamiento. Las mejores predicciones resultaron para compuestos de test y validación correctamente localizados dentro del dominio de aplicabilidad de los QSFRs, evidenciado por valores bajos de MAE y valores altos de q2 (en aire, MAE≤0.54 y q2≥0.92; en agua, MAE≤0.27 y q2≥0.92).
9788469345979
http://www.tdx.cat/TDX-0825110-122638
http://hdl.handle.net/10803/8590
T.1010-2010
principal component analysis(PCA)
physicochemical properties
multimedia environmental model (MEM)
molecular descriptors
fate estimations
domain of applicability(DOA)
supervised learning algorithms
self organizing map(SOM)
radial basis function(RBF)
quantitative stucture-fate relationship(QSFR)
quantitative property-fate relationship(QPFR)
support vector regression(SVR)
uncertainty analysis
unsupervised learning algorithms
artificial neural network(ANN)
backpropagation network(BPN)
Quantitative structure fate relationships for multimedia environmental analysis