Novel approaches in the identification of pathogenic variants in the clinical diagnosis

Author

Riera Ribas, Casandra

Director

de la Cruz, Xavier

Tutor

Querol, Enric

Date of defense

2016-09-20

ISBN

9788449068478

Pages

201 p.



Department/Institute

Universitat Autònoma de Barcelona. Departament d'Enginyeria Química, Biològica i Ambiental

Abstract

El rápido crecimiento experimentado por las técnicas de secuenciación de última generación ha impulsado a su vez el desarrollo de aplicaciones bioinformáticas destinadas a la anotación funcional e interpretación de las variantes identificadas. De hecho, el uso de estas herramientas es cada vez más popular, habiéndose extendido al ámbito del diagnóstico clínico. Sin embargo, la tasa de éxito promedio de estos métodos se sitúa en torno al 80 %, bastante por debajo todavía de los niveles requeridos para su uso independiente en casos de diagnóstico. En la presente tesis se aborda este problema con la finalidad de extender la precisión de estos métodos y así mejorar su aplicabilidad. Para ello abordamos este desafío desde cuatro perspectivas distintas. En primer lugar, identificamos la existencia de un límite en la tasa de acierto de estas herramientas, y determinamos que la aproximación denominada “protein-specific” (específica de proteína) es realmente prometedora. En segundo lugar, aplicamos dicha aproximación al caso de la enfermedad de Fabry, desarrollando un predictor que identifica sus variantes causales con una tasa de acierto del 90-95 %, compitiendo holgadamente con la de los métodos habitualmente utilizados (ej. SIFT, PolyPhen-2, etc.). En tercer lugar, extendemos esta aproximación a un conjunto de 82 proteínas, contrastando la calidad de los predictores específicos con la de un amplio conjunto de herramientas estándar. Finalmente, proponemos una nueva forma de comparar los métodos de predicción basada en el coste. Este planteamiento considera de forma implícita tanto la enfermedad como los tratamientos asociados disponibles. Como resultado se presenta un criterio de selección de predictores más adaptado al contexto clínico.


The rapid growth experienced by next-generation sequencing techniques has fuelled the development of bioinformatic applications for the functional annotation and interpretation of the variants identified. In fact, the use of these tools is becoming increasingly popular, having been extended to the field of clinical diagnosis. However, the average success rate of these methods is around 80%, still well below the levels required for their independent use in diagnosis. In this thesis we address this problem with the goal of extending the accuracy of pathogenicity predictors and thus improve their applicability. We have approached this challenge from four different directions. First, we have identified the existence of an upper limit in the success rate of these tools and determined that the approach known as "protein-specific" is a good option to surpass this threshold. Second, we have applied this approximation to Fabry disease, developing a predictor that identifies causal variants with a success rate of 90-95%, comfortably competing with common methods (e.g. SIFT, PolyPhen-2, etc.). Thirdly, we have extended this approach to a set of 82 proteins, benchmarking the quality of the resulting protein-specific predictors against that of standard tools. Finally, we have proposed a new way to compare prediction methods, based on the cost. This approach implicitly considers both the disease and the associated treatments available. As a result, it constitutes a criterion for selecting predictors adapted to the clinical context.

Keywords

Bioinformàtica; Bioinformatica; Bioinformatics; Mutacions; Mutaciones; Mutations

Subjects

577 - Material bases of life. Biochemistry. Molecular biology. Biophysics

Knowledge Area

Tecnologies

Documents

crr1de1.pdf

2.506Mb

 

Rights

L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc-nd/4.0/
L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc-nd/4.0/

This item appears in the following Collection(s)