Interconexiones balanceadas y eficientes para supercomputadores Exascale

Author

Fuentes Sáez, Pablo

Director

Beivide Palacio, Ramón

Vallejo Gutiérrez, Enrique

Date of defense

2017-09-25

ISBN

978-84-697-6819-8

Pages

182 p.



Department/Institute

Universidad de Cantabria. Departamento de Electrónica y Computadores

Abstract

El aumento de las necesidades de cómputo hace necesaria la aparición de supercomputadores Exascale. Una de las estrategias para su desarrollo es aumentar el número de nodos del sistema, incrementando así los requisitos de la red de interconexión. Dichos requisitos son aún más exigentes con el aumento de la importancia de aplicaciones BigData, que presentan un mayor número de comunicaciones con una distribución más regular que en cargas de trabajo tradicionales de HPC. Esta tesis presenta un modelo de tráfico sintético de las comunicaciones del benchmark Graph500, que permite simplificar la evaluación y predicción del rendimiento de sistemas bajo aplicaciones intensivas en datos. Mediante simulaciones con patrones de tráfico sintéticos sobre una red Dragonfly de gran tamaño, se ha realizado también un análisis de las desigualdades en el uso de la red, el cual puede degradar significativamente el rendimiento de aplicaciones tanto HPC como BigData. Esta tesis propone además dos mecanismos para mejorar el rendimiento de red y simplificar la implementación de los routers: el uso de información de contención para mejorar la decisión de misrouting en mecanismos de encaminamiento adaptativos nomínimos, y FlexVC, un mecanismo de gestión de los canales virtuales que relaja las restricciones del uso de recursos necesarias para evitar deadlock. Ambas propuestas son competitivas frente a alternativas actuales, y su combinación alcanza el mejor rendimiento bajo encaminamiento adaptativo en tránsito a la par que reduce a la mitad el número de buffers del router.


Increasing computational needs demand Exascale machines; one of the approaches to develop such machines is to increase the number of nodes, what places a stronger demand on the system interconnect. Those requirements are further stressed with the surge of BigData applications, with a higher amount of more evenly distributed communications than traditional High-Performance Computing (HPC) workloads. This thesis introduces a synthetic traffic model of the communications in the Graph500 benchmark, to simplify the evaluation and performance prediction of data-intensive applications. Using simulations with synthetic traffic patterns over a large Dragonfly network, it is also performed an analysis of the throughput fairness, which can affect significantly the performance of both BigData and HPC workloads. The thesis proposes two mechanisms to improve network performance and simplify the router implementation: the use of contention information to improve the misrouting decision in nonminimal adaptive routing mechanisms, and FlexVC, a virtual channel management that relaxes the resource restrictions for deadlock avoidance. Both mechanisms provide competitive performance against state-of-the-art alternatives, and the combination of both achieves the best overall performance with in-transit adaptive routing while halving the number of buffers required in the router.

Keywords

Evitación de deadlock; Evaluación de rendimiento; Contención; Red de interconexión; Throughput fairness; Graph500; Dragonfly; Exascale; Deadlock avoidance; Performance evaluation; Contention; Interconnection network

Subjects

004 - Computer science and technology. Computing. Data processing; 621.3 Electrical engineering

Knowledge Area

Arquitectura y Tecnología de Computadores

Documents

Tesis PFS.pdf

7.984Mb

 

Rights

ADVERTENCIA. El acceso a los contenidos de esta tesis doctoral y su utilización debe respetar los derechos de la persona autora. Puede ser utilizada para consulta o estudio personal, así como en actividades o materiales de investigación y docencia en los términos establecidos en el art. 32 del Texto Refundido de la Ley de Propiedad Intelectual (RDL 1/1996). Para otros usos se requiere la autorización previa y expresa de la persona autora. En cualquier caso, en la utilización de sus contenidos se deberá indicar de forma clara el nombre y apellidos de la persona autora y el título de la tesis doctoral. No se autoriza su reproducción u otras formas de explotación efectuadas con fines lucrativos ni su comunicación pública desde un sitio ajeno al servicio TDR. Tampoco se autoriza la presentación de su contenido en una ventana o marco ajeno a TDR (framing). Esta reserva de derechos afecta tanto al contenido de la tesis como a sus resúmenes e índices.

This item appears in the following Collection(s)