Codon usage adaptation in prokaryotic genomes

Author

Puigbó Avalos, Pedro

Director

García Vallvé, Santiago

Date of defense

2007-11-29

ISBN

9788469106532

Legal Deposit

T.2224-2007



Department/Institute

Universitat Rovira i Virgili. Departament de Bioquímica i Biotecnologia

Abstract

La tesi esta basada en l'adaptació de l'ús de codons a genomes procariotes, especialment l'adaptació de l'ús de codons a una alta expressió. Hi ha un grup de genomes procariotes, els quals estan sota una selecció traduccional, que tenen un grup de gens amb un ús de codons esbiaixat de la resta de gens del genoma i adaptats a l'abundància dels tRNA. Hem desenvolupat un nou algoritme per a avaluar si un genoma esta sota selecció traduccional i predir els gens altament expressat de tots els genomes sota selecció traduccional. Aquestes prediccions són públiques a la base de dades HEG-DB (http://genomes.urv.cat/HEG-DB), la qual s'ha publicat a la revista Nucleic Acids Research. Les prediccions de gens altament expressats s'han fet servir com a filtre en les prediccions de gens adquirits per transferència horitzontal, ja que els gens altament expressats molts cops son predits com a falsos positius en la predicció de gens adquirits. Amb les dades de la predicció de gens altament expressats, també hem desenvolupat una nova eina Bioinformàtica, anomenada OPTIMIZER (http://genomes.urv.cat/OPTIMIZER) i publicada al Nucleic Acids Research, per tal d'optimitzar l'ús de codons d'un gen per a incrementar la seva expressió en experiments d'expressió heteròloga de proteïnes. També hem estudiat un cas particular d'adaptació de l'ús de codons. El cas de l' 'amelioration', que és l'adaptació de l'ús de codons que pateix un gen inserit en un genoma hoste. Aquest cas l'hem estudiat amb els gens mitocondrials que varen saltar al genoma nuclear i varen haver d'adaptar el seu us de codons mitocondrial a l'ús de codons del genoma nuclear. Per tal d'estudiar l''amelioration', hem desenvolupat un nou índex anomenat CAI esperat (eCAI) i una nova eina Bioinformàtica anomenada CAIcal (http://genomes.urv.cat/CAIcal), que està en procés de revisió a la revista BMC Bioinformatics. Analitzant l'anàlisi de l'ús de codons dels genomes completament sequenciats vàrem realitzar una troballa que s'aparta una mica del tema central de la tesi. Vàrem veure que els genomes que estan adaptats a la (hiper)termofília tenen un patró de l'ús de codons i d'aminoàcids diferent a la resta de genomes (mesòfils). Aquest fet ens ha permès descobrir casos de guany i pèrdua (recents i antics) de la capacitat d'adaptació termofílica en genomes procariotes. Aquests resultats han donat lloc a una publicació a la revista Trends in Genetics. Durant la tesi he realitzat una estada de 4 mesos (Febrer - Juny, 2006) en el laboratori de bioinformàtica del departament de biologia de la universitat nacional d'Irlanda a Maynooth sota la supervisió del Dr James McInerney on vaig desenvolupar un nou programa per a la comparació d'arbres filogenètics anomenat TOPD/FMTS (http://genomes.urv.cat/topd) el qual està publicat a la revista Bioinformatics.


This thesis is based in codon usage adaptation in prokaryotic genomes, especially the codon usage adaptation to a high expression. In genomes under translational selection, the group of highly expressed genes has a codon usage adapted to the most abundant tRNA species. We have developed a new iterative algorithm which predicts a group of highly expressed genes in genomes under translational selection by using the Codon Adaptation Index and the group of ribosomal protein genes as a seed. We have developed a new genomic database, called HEG-DB, to store genes that are predicted as highly expressed in prokaryotic complete genomes under strong translational selection. The database is freely available at http://genomes.urv.cat/HEG-DB and it has been published in Nucleic Acids Research. The predicted highly expressed genes are used as an initial filter to reduce the number of false positives of the Horizontal Gene Transfer Database, due to highly expressed genes are usually false positive in predictions of acquired genes. We have developed a new web sever, called OPTIMIZER (http://genomes.urv.cat/OPTIMIZER), which has been published in Nucleic Acids Research, to optimize the codon usage of DNA or RNA sequences. This new web server can be used to predict and optimize the level expression of a gene in heterologous gene expression or to express new genes that confer new metabolic capabilities in a given species. We have also analyzed an especial case of codon usage adaptation, which is called 'amelioration'. The 'amelioration' is the adaptation of foreign genes to a new genome. This is the case of mitochondrial genes encoded in the human nuclear genome and originally encoded in the proto-mitochondria. To test the 'amelioration' process we have developed an expected value of CAI (eCAI) to find out whether the differences in the CAI are statistically significant or whether they are the product of biased nucleotide and/or amino acid composition and a new bioinformatics tool called CAIcal (http://genomes.urv.cat/CAIcal). We have also analyzed the evolution of thermophilic adaptation in prokaryotes and we suggest that the amino acid composition signature in thermophilic organisms is a consequence of or an adaptation to living at high temperatures, not its cause. Our findings suggest that there have been several cases where the capacity for thermophilic adaptation has been gained or lost throughout the evolution of prokaryotes. These results have been published in Trends in Genetics. During my thesis I have worked for four months in the Bioinformatics Laboratory of the Biology Department at the National University of Ireland under the supervision of Dr James O. McInerney where I developed a new software program to compare phylogenetic trees called TOPD/FMTS (http://genomes.urv.cat/topd), that has been published in Bioinformatics.

Keywords

Codon usage adaptation; highly expressed genes; translational selection

Subjects

57 - Biological sciences in general; 573 - General and theoretical biology; 577 - Material bases of life. Biochemistry. Molecular biology. Biophysics

Documents

thesis.pdf

4.295Mb

 

Rights

ADVERTIMENT. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal, així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas, en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs.

This item appears in the following Collection(s)