The pairwise problem with High Performance Computing Systems, contextualized as a key part to solve the Multiple Sequence Alignment problem

dc.contributor
Universitat de Lleida. Departament d'Informàtica i Enginyeria Industrial
dc.contributor.author
Montañola Lacort, Alberto
dc.date.accessioned
2016-06-08T11:41:41Z
dc.date.available
2017-02-01T06:45:12Z
dc.date.issued
2016-02-02
dc.identifier.uri
http://hdl.handle.net/10803/385282
dc.description.abstract
L'alineació múltiple de seqüencies (MSA), com a repte dins de la bioinformàtica, es un element clau per entendre el funcionament del genoma. Aquest consisteix en alinear en un temps òptim aquestes seqüencies garantint un nivell de qualitat. Aquest problema esdevé un repte de computació de altes prestacions degut als requeriments de recursos de memòria i còmput. S'han estudiat diferents implementacions, les quals es comparen i es presenten en aquesta investigació. Hem contribuït en la millora dels primers passos del problema MSA de diverses maneres. Amb l'objectiu de reduir el temps de càlcul i l'ús de memòria, adaptem T-Coffee per treballar en paral·lel amb ús de fils lleugers. Seguidament, hem desenvolupat un mètode de alineació de parells paral·lel, amb una assignació eficient de seqüències a nodes. Finalment es presenta un mètode per determinar la quantitat mínima de recursos del sistema, necessaris per resoldre un problema d'una mida determinada, per tal de configurar el sistema per un ús eficient.
cat
dc.description.abstract
El alineamiento múltiple de secuencias (MSA), como reto dentro de la bioinformática, es un elemento clave para entender el funcionamiento del genoma. Este consiste en alinear en un tiempo óptimo esta secuencias garantizando un nivel de calidad. Este problema es un reto de computo de altas prestaciones debido a los altos requerimientos de memoria y computo. Se han estudiado diferentes implementaciones, las cuales se comparan y se presentan en esta investigación. Hemos contribuido en la mejora de los primeros pasos del problema MSA de diversas formas. Con el objetivo de reducir el tiempo de cálculo y el uso de memoria, adaptamos T-Coffee para trabajar en paralelo con el uso de hilos ligeros. Seguidamente, hemos desarrollado un método de alineación de pares en paralelo, con una asignación eficiente de secuencias a nodos. Finalmente se presenta un método para determinar la cantidad mínima de recursos del sistema, necesarios para resolver el problema de un tamaño determinado, para poder configurar el sistema para un uso eficiente.
spa
dc.description.abstract
The multiple sequence alignment (MSA), as a challenge in bioinformatics, becomes a key element for understanding the inner working of the genome. This consists on aligning these sequences in an optimal time, with a good level of quality. This problem is a challenge for the high performance computing, because of the high memory and processing requirements. Different implementations were studied, which are being compared and presented on this thesis. We have contributed in the improvement of the first steps of the MSA problem in different ways. With the goal of reducing the computing time and the memory usage, we adapted T-Coffee for working in parallel with the usage of threads. Furthermore, we have developed a pair-wise sequence alignment method, with an efficient mapping of sequences to nodes. Finally, we are presenting the method for determining the minimal amount of resources, required for solving the problem of a determined size, in order to configure the system for an efficient use.
eng
dc.format.extent
140 p.
cat
dc.format.mimetype
application/pdf
dc.language.iso
eng
cat
dc.publisher
Universitat de Lleida
dc.rights.license
L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc-sa/3.0/es/
dc.rights.uri
http://creativecommons.org/licenses/by-nc-sa/3.0/es/
*
dc.source
TDX (Tesis Doctorals en Xarxa)
dc.subject
Alineació múltiple de seqüencies
cat
dc.subject
Computació distribuïda
cat
dc.subject
Bioinformàtica
cat
dc.subject
Alineamiento múltiple de secuencias
cat
dc.subject
Computación distribuida
cat
dc.subject
Bioinformática
cat
dc.subject
Multiple sequence alignment
cat
dc.subject
Distributed computing
cat
dc.subject
Bioinformatics
cat
dc.subject.other
Arquitectura i tecnologia d'ordinadors
cat
dc.title
The pairwise problem with High Performance Computing Systems, contextualized as a key part to solve the Multiple Sequence Alignment problem
cat
dc.type
info:eu-repo/semantics/doctoralThesis
dc.type
info:eu-repo/semantics/publishedVersion
dc.subject.udc
004
cat
dc.contributor.director
Roig Mateu, Concepció
dc.contributor.director
Hernández Budé, Porfidio
dc.embargo.terms
12 mesos
cat
dc.rights.accessLevel
info:eu-repo/semantics/openAccess


Documents

Taml1de1.pdf

5.039Mb PDF

This item appears in the following Collection(s)