Computational genomics of selenoproteins

Author

Mariotti, Marco

Director

Guigó Serra, Roderic

Date of defense

2013-12-13

Legal Deposit

B 16883-2015

Pages

248 p.



Department/Institute

Universitat Pompeu Fabra. Departament de Ciències Experimentals i de la Salut

Doctorate programs

Programa de doctorat en Biomedicina

Abstract

Selenoproteins are a diverse class of proteins containing selenocysteine, the 21st aminoacid. Selenocysteine is inserted co-translationally, recoding very specific UGA codons through a dedicated machinery. Standard gene prediction programs consider UGA only as translational stop, and for this reason selenoprotein genes are typically misannotated. In the past years, we developed computational tools to predict selenoproteins at genomics scale. With these, we characterized the set of selenoproteins across many sequenced genomes, and we inferred their phylogenetic history. We dedicated particular attention to selenophosphate synthetase, a selenoprotein family required for selenocysteine biosynthesis, that can be used as marker of the selenocysteine coding trait. We show that selenoproteins went through a very diverse evolution in different lineages. While very conserved in vertebrates, selenoproteins were lost independently in many other organisms. Using genome sequencing, we traced with precision the path of genomic events that lead to recent selenoprotein extinctions in certain fruit flies.


Les selenoproteïnes s’agrupen en una classe heterogènia de proteïnes les quals contenen selenocysteïna, l’aminoàcid 21. La selenocisteïna és insertada durant el procés de traducció, recodificant codons UGA molt específics, mitjançant una maquinàiria dedicada. Els programes estàndard de predicció de gens interpreten el codó UGA només com a senyal d’stop de la traducció, i per aquesta raó els gens de selenoproteïness solen estar mal anotats. En els darrers anys, hem desenvolupat eines computacionals per a predir selenoproteïnes a escala genòmica. Amb aquestes, hem caracteritzat el conjunt de selenoproteïnes en aquells genomes que han estat seqüenciats, inferint la seva història filogenèitca. Hem dedicat especial ateníció a la família selenophosphate synthetase, selenoproteïna necessària per a la síntesi de selenocisteïna, i que per tant pot ser utilitzada com a marcador de codificació de selenocisteïna Mostrem que les selenoproteïnes han patit una evolució molt diversa en diferents llinatges. Tot i que es troben molt conservades en vertebrats, les selenoproteïnes van ser perdudes de manera independent en molts altres organismes. Gràcies a la sequenciació de genomes, vam traçar amb precisió els esdeveniment que van portar a l’extinció de selenoproteïnes a diverses espècies de drosòfila.

Keywords

Selenoprotein; Selenocysteine; Gene prediction; Genome annotation; Phylogeny; Selenophosphate synthetase; Genomics; Selenoproteína; Selenocisteína; Predicción de genes; Anotación de genomas; Filogenia; Selenofosfato sintetasa; Genòmica

Subjects

575 - General genetics. General cytogenetics

Documents

tmm.pdf

45.51Mb

 

Rights

L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by/3.0/es/
L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by/3.0/es/

This item appears in the following Collection(s)