Nuevos Algoritmos Basados en Grafos y Clustering para el Tratamiento de Complejidades de los Datos

Author

Guzmán Ponce, Angélica

Director

Valdovinos Rosas, Rosa María

Sánchez Garreta, José Salvador

Date of defense

2021-03-17

Pages

171 p.



Department/Institute

Universitat Jaume I. Escola de Doctorat

Doctorate programs

Programa de Doctorat en Informàtica

Abstract

La distribución no balanceada de los datos entre las clases, así como la presencia de ruido y el traslape de clases, son complejidades de los datos que a menudo interfieren en el rendimiento de clasificadores. Para afrontar estos problemas, la presente tesis presenta una serie de propuestas basadas en algoritmos de clustering para la eliminación de instancias de la clase mayoritaria consideradas como ruido, así como en técnicas de la teoría de grafos para balancear la distribución de clases. Los resultados experimentales muestran una mejora en el rendimiento de los modelos de aprendizaje aquí propuestos en comparación con diversos algoritmos del estado del arte.


The imbalance data distribution between classes, as well as the existence of noise and class overlap, are data complexities that often affect the classifier performance. To face these problems, this thesis gives a series of proposals based on clustering algorithms to remove noisy instances from the majority class, as well as algorithms from the graph theory to balance the classes. The experimental results show an improvement in the learning models performance here proposed when compared to several state-of-the-art techniques.

Keywords

Clustering; Teoría de grafos; Complejidades de los datos; Desbalance de clases; Traslape de clases; Ruido

Subjects

004 - Computer science and technology. Computing. Data processing; 519.1 - Combinatorial analysis. Graph theory

Knowledge Area

Tecnologies de la informació i les comunicacions (TIC)

Documents

2021_Tesis_Guzman Ponce_Angelica.pdf

3.552Mb

 

Rights

ADVERTIMENT. Tots els drets reservats. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal, així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas, en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs.

This item appears in the following Collection(s)