Low-complexity regions in proteins as a source of evolutionary innovation

Author

Radó i Trilla, Núria

Director

Albà Soler, Mar

Date of defense

2013-05-03

Legal Deposit

B. 15380-2013

Pages

129



Department/Institute

Universitat Pompeu Fabra. Departament de Ciències Experimentals i de la Salut

Doctorate programs

Programa de doctorat en Biomedicina

Abstract

In this thesis we aimed to study evolutionary implications of low-complexity regions, protein sequences of very simple amino acid composition. Its uncontrolled expansion causes several human diseases, including Huntington’s disease and other neurodegenerative and developmental diseases. However, they are surprisingly abundant in proteins, which seem paradoxical given their high pathogenic potential. Moreover, experimental data has shown that the formation of novel LCRs, or the modification of existing ones, can have functional consequences. First we wanted to perform a descriptive analysis of low-complexity regions in chordates focusing on lineage and age related features of LCR evolution. Second, we want to assess why low-complexity regions are so common in eukaryotic proteins. Two hypotheses have been proposed: on one hand, they may be an important source of genetic variability and might be involved in adaptive processes. To investigate whether LCRs are important players in the acquisition of novel functions, we examined transcription factor gene duplicates. On the other hand, low-complexity regions may also contribute to the formation of novel coding sequences, facilitating the generation of novel protein functions. We have tested this hypothesis by examining the content of low-complexity sequences in proteins of different age. Both analysis let us to conclude that low-complexity regions may be involved in protein diversification, either providing new functional sequences that will modify existing proteins or being involved in the formation of novel protein coding sequences.


L'objectiu d'aquesta tesi és estudiar les implicacions evolutives de les regions de baixa complexitat (LCRs, en anglès), seqüències de proteïnes amb una composició d'aminoàcids molt simple. La seva expansió incontrolada causa diverses malalties humanes, incloent la malaltia de Huntington i altres malalties neurodegeneratives i del desenvolupament. No obstant això, són sorprenentment abundants en les proteïnes, cosa que pot semblar paradoxal, donat el seu potencial patogènic. A més, estudis experimentals han demostrat que la formació de noves LCRs, o la modificació de les ja existents, pot tenir conseqüències funcionals. En primer lloc hem volgut fer una anàlisi descriptiva de les regions de baixa complexitat en cordats, incidint en les característiques relacionades amb el llinatge i l'edat de les LCRs des d'un punt de vista evolutiu. En segon lloc, hem volgut avaluar per què les LCRs són tan freqüents en les proteïnes d'eucariotes. S'han proposat dues hipòtesis: d'una banda, poden ser una important font de variabilitat genètica i podrien estar implicades en processos d'adaptació. Per tal d'investigar si les LCRs juguen un paper important en L'adquisició de noves funcions, hem examinat factors de transcripció que han patit una duplicació o. D'altra banda, les regions de baixa complexitat també poden contribuir a la formació de noves seqüències codificants, facilitant la generació de funcions noves de les proteïnes. Per comprovar aquesta hipòtesi, hem examinat el contingut de les seqüències de baixa complexitat en proteïnes d'edats diferents. Les dues anàlisis permeten concloure que les regions de baixa complexitat poden estar involucrades en la diversificació de les proteïnes, ja sigui proporcionant noves seqüències funcionals que modifiquen les proteïnes existents o participant en la formació de noves seqüències codificants de proteïnes.

Keywords

Low-complexity regions; Amino acid tandem repeats; Simple sequence; Gene age; Protein domain evolution; Transcription factor; Paralogous protein; Repeticions en tandem d’aminoàcids; Seqüències simples; Edat dels gens; Evolució de dominis de proteïnes; Factor de transcripció; Proteïnes paràlogues; Regions de baixa complexitat

Subjects

575 - General genetics. General cytogenetics; 616.8 - Neurology. Neuropathology. Nervous system

Related items

Dades de recerca

Link to the related item

Documents

tnrt.pdf

14.25Mb

 

Rights

L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nd/3.0/es/
L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nd/3.0/es/

This item appears in the following Collection(s)