Interconexiones balanceadas y eficientes para supercomputadores Exascale

dc.contributor
Universidad de Cantabria. Departamento de Electrónica y Computadores
dc.contributor.author
Fuentes Sáez, Pablo
dc.date.accessioned
2017-10-23T09:27:02Z
dc.date.available
2017-10-23T09:27:02Z
dc.date.issued
2017-09-25
dc.identifier.isbn
978-84-697-6819-8
en_US
dc.identifier.uri
http://hdl.handle.net/10803/440520
dc.description.abstract
El aumento de las necesidades de cómputo hace necesaria la aparición de supercomputadores Exascale. Una de las estrategias para su desarrollo es aumentar el número de nodos del sistema, incrementando así los requisitos de la red de interconexión. Dichos requisitos son aún más exigentes con el aumento de la importancia de aplicaciones BigData, que presentan un mayor número de comunicaciones con una distribución más regular que en cargas de trabajo tradicionales de HPC. Esta tesis presenta un modelo de tráfico sintético de las comunicaciones del benchmark Graph500, que permite simplificar la evaluación y predicción del rendimiento de sistemas bajo aplicaciones intensivas en datos. Mediante simulaciones con patrones de tráfico sintéticos sobre una red Dragonfly de gran tamaño, se ha realizado también un análisis de las desigualdades en el uso de la red, el cual puede degradar significativamente el rendimiento de aplicaciones tanto HPC como BigData. Esta tesis propone además dos mecanismos para mejorar el rendimiento de red y simplificar la implementación de los routers: el uso de información de contención para mejorar la decisión de misrouting en mecanismos de encaminamiento adaptativos nomínimos, y FlexVC, un mecanismo de gestión de los canales virtuales que relaja las restricciones del uso de recursos necesarias para evitar deadlock. Ambas propuestas son competitivas frente a alternativas actuales, y su combinación alcanza el mejor rendimiento bajo encaminamiento adaptativo en tránsito a la par que reduce a la mitad el número de buffers del router.
en_US
dc.description.abstract
Increasing computational needs demand Exascale machines; one of the approaches to develop such machines is to increase the number of nodes, what places a stronger demand on the system interconnect. Those requirements are further stressed with the surge of BigData applications, with a higher amount of more evenly distributed communications than traditional High-Performance Computing (HPC) workloads. This thesis introduces a synthetic traffic model of the communications in the Graph500 benchmark, to simplify the evaluation and performance prediction of data-intensive applications. Using simulations with synthetic traffic patterns over a large Dragonfly network, it is also performed an analysis of the throughput fairness, which can affect significantly the performance of both BigData and HPC workloads. The thesis proposes two mechanisms to improve network performance and simplify the router implementation: the use of contention information to improve the misrouting decision in nonminimal adaptive routing mechanisms, and FlexVC, a virtual channel management that relaxes the resource restrictions for deadlock avoidance. Both mechanisms provide competitive performance against state-of-the-art alternatives, and the combination of both achieves the best overall performance with in-transit adaptive routing while halving the number of buffers required in the router.
en_US
dc.format.extent
182 p.
en_US
dc.format.mimetype
application/pdf
dc.language.iso
eng
en_US
dc.publisher
Universidad de Cantabria
dc.rights.license
ADVERTENCIA. El acceso a los contenidos de esta tesis doctoral y su utilización debe respetar los derechos de la persona autora. Puede ser utilizada para consulta o estudio personal, así como en actividades o materiales de investigación y docencia en los términos establecidos en el art. 32 del Texto Refundido de la Ley de Propiedad Intelectual (RDL 1/1996). Para otros usos se requiere la autorización previa y expresa de la persona autora. En cualquier caso, en la utilización de sus contenidos se deberá indicar de forma clara el nombre y apellidos de la persona autora y el título de la tesis doctoral. No se autoriza su reproducción u otras formas de explotación efectuadas con fines lucrativos ni su comunicación pública desde un sitio ajeno al servicio TDR. Tampoco se autoriza la presentación de su contenido en una ventana o marco ajeno a TDR (framing). Esta reserva de derechos afecta tanto al contenido de la tesis como a sus resúmenes e índices.
dc.source
TDR (Tesis Doctorales en Red)
dc.subject
Evitación de deadlock
en_US
dc.subject
Evaluación de rendimiento
en_US
dc.subject
Contención
en_US
dc.subject
Red de interconexión
en_US
dc.subject
Throughput fairness
en_US
dc.subject
Graph500
en_US
dc.subject
Dragonfly
en_US
dc.subject
Exascale
en_US
dc.subject
Deadlock avoidance
en_US
dc.subject
Performance evaluation
en_US
dc.subject
Contention
en_US
dc.subject
Interconnection network
en_US
dc.subject.other
Arquitectura y Tecnología de Computadores
en_US
dc.title
Interconexiones balanceadas y eficientes para supercomputadores Exascale
en_US
dc.type
info:eu-repo/semantics/doctoralThesis
dc.type
info:eu-repo/semantics/publishedVersion
dc.subject.udc
004
en_US
dc.subject.udc
621.3
en_US
dc.contributor.authoremail
pablo.fuentes@unican.es
en_US
dc.contributor.director
Beivide Palacio, Ramón
dc.contributor.director
Vallejo Gutiérrez, Enrique
dc.embargo.terms
cap
en_US
dc.rights.accessLevel
info:eu-repo/semantics/openAccess
dc.identifier.pdf
http://mediaserver.csuc.cat/tdx/documents/11/31/35/113135325219389321371439472411164557187/


Documents

Tesis PFS.pdf

7.984Mb PDF

This item appears in the following Collection(s)