Decoding Chemical Processes: The Power of Data-Driven Descriptors

Author

Morán González, Lucía

Director

Maseras Cuní, Feliu

Date of defense

2023-12-15

Pages

224 p.



Department/Institute

Universitat Rovira i Virgili. Departament de Química Analítica i Química Orgànica

Abstract

Els descriptors químics són objectes matematics utilitzats per extreure conceptes clau de processos químics. Duran! l'última década, hi ha hagut un creixement exponencial en la seva aplicabilitat. Aquests fets han comporta! que el desenvolupament deis descriptors químics sigui ara una area de recerca activa. En aquesta tesi, basant-nos en treballs anteriors del nostre grup, vam buscar representacions químiques eficaces per descobrir les forces que regeixen diversos escenaris químics. En aquest context, primer vam provar l'aplicabilitat d'un objecte matematic alternatiu, anomenat hidden descriptors, per avaluar les propietats electróniques deis lligands carbens N-heterocíclic. A més, utilitzant la mateixa eina deis hidden descriptors, vam intentar identificar fragments metal·lics adequats per coordinar el lligand d'hidrogen monohapto. Vam aprofundir encara més en les capacitats de l'estratégia deis hidden descriptors per identificar les forces cinétiques d'una reacció organica bimolecular de substitució nucleofílica. En aquesta transformació, el paper deis nucleófils es va descriure de manera matematicament óptima. D'altra banda, també vam desenvolupar una metodología diferent, anomenada AABBA, dissenyada per derivar representacions moleculars de longitud fixa de complexos a partir de grafos moleculars. Vam avaluar l'efectivitat d'aquests vectors innovadors en dues tasques de regressió. Per tant, aquesta tesi proporciona un profund coneixement teóric sobre els descriptors químics alternatius que descriuen i correlacionen eficientment les propietats d'interés.


Los descriptores químicos son objetos matemáticos utilizados para extraer conceptos clave de procesos químicos. Durante la última década, ha habido un crecimiento exponencial en su aplicabilidad. Estos hechos han dado lugar a que el desarrollo de los descriptores químicos sea un ahora de investigación activa. En esta tesis, basándonos en trabajos anteriores de nuestro grupo, buscamos eficaces representaciones químicas para descubrir las fuerzas que rigen diversos escenarios químicos. En este contexto, primero probamos la aplicabilidad de un objeto matemático alternativo, denominado hidden descriptors, para evaluar las propiedades electrónicas de los ligandos carbenos N­ heterocíclico. Además, utilizando la misma herramienta de los hidden descriptors, intentamos identificar fragmentos metálicos adecuados para coordinar el ligando de hidrógeno monohapto. Profundizamos aún más en las capacidades de la estrategia de los hidden descriptors para identificar las fuerzas cinéticas de una reacción orgánica bimolecular de sustitución nucleofílica. En esta transformación, el papel de los nucleófilos se describió de manera matemáticamente óptima. Por otro lado, también desarrollamos una metodología diferente, denominada AABBA, diseñada para derivar representaciones moleculares a partir de grafos moleculares. Evaluamos la efectividad de estos vectores novedosos en dos tareas de regresión. Por lo tanto, esta tesis proporciona un profundo conocimiento teórico sobre los descriptores químicos alternativos que describen y correlacionan eficientemente propiedades de interés.


Chemical descriptors are mathematical constructs used to extrae! insights from chemistry. Over the past decade, there has been an exponential growth in their applicability. This has transformed chemical featurization into an active area of research. In this thesis, building on previous work from our group, we sought optimal chemical representations to uncover the key forces governing diverse chemical scenarios. In this context, we first tested the applicability of an alternative mathematical object namely the hidden descriptors to envisage the electronic tendencies of N-heterocyclic carbene ligands. Additionally, employing the same hidden descriptor tool, we attempted to pinpoint suitable metal fragments far coordinating monohapto hydrogen ligands. We further delved into the capabilities of the hidden descriptor approach to identify kinetic forces of an organic bimolecular nucleophilic substitution reaction. In this transformation, the role of the nucleophiles was described in a mathematical optimal manner. On the other hand, we also developed a different methodology, namely AABBA, designed to derive fixed-length molecular representations of complexes from molecular graphs. We assessed the effectiveness of this novel vectors within two regression tasks. Therefore, this thesis provides a deep theoretical knowledge about the alternative chemical descriptors that efficiently describe and correlate target properties.

Keywords

Química computacional; Descriptors químics; Anàlisi de dades; Química computacional; Descriptores químicos; Análisis de datos; Computational chemistry; Chemical descriptors; Data analysis

Subjects

311 - Statistics as a science. Statistical theory; 54 - Chemistry. Crystallography. Mineralogy; 544 - Physical chemistry

Knowledge Area

Ciències

Documents

This document contains embargoed files until 2024-06-12

Rights

ADVERTIMENT. Tots els drets reservats. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal, així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas, en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs.

This item appears in the following Collection(s)