Assessing the relationship between chromatin and splicing factors in alternative splicing

Author

Kremsky, Isaac Jacob

Director

Eyras Jiménez, Eduardo

Date of defense

2015-07-14

Legal Deposit

B 26894-2015

Pages

84 p.



Department/Institute

Universitat Pompeu Fabra. Departament de Ciències Experimentals i de la Salut

Doctorate programs

Programa de doctorat en Biomedicina

Abstract

Proteins that bind to DNA or RNA are both known to influence alternative splicing. However, there has not been so far a systematic experimental exploration of the relationship between these factors in their effect on splicing. In this thesis, we make use of the large amounts of publicly available high throughput sequencing data that now make it possible to explore this question on a genome-wide scale. We made exhaustive use of a method known as profiling to address this question. As most profiling methods in common use are merely qualitative, the first task of the thesis was to generate a quantitative profiling method and bioinformatics tool, ProfileSeq, which we validated by reproducing previous results from the literature. ProfileSeq and other methods were combined to mine for relationships between DNA and RNA binding factors with potential relevance to splicing. We found significant associations between the transcription factor CTCF and the RNA binding protein LIN28A, and similarly between SPI1 and RNA-binding proteins that bind to AC-rich motifs, such as hnRNPL. These represent putative relationships relevant to splicing, as these results were reached by more than one independent method with independent datasets. We also show evidence that CTCF acts as a barrier between regions of H3K4me3 marking inside genes. A number of other results of potential interest to both the bioinformatics and molecular biology communities are also described


Las proteínas que se unen al DNA o al RNA pueden influir el splicing alternativo. Sin embargo, no ha habido aún una exploración sistemática de la relación entre estos dos tipos de factores en su acción sobre el splicing. En esta tesis hacemos uso de datos públicos de secuenciación de alto rendimiento para explorar esta cuestión a escala de todo el genoma. Hemos hecho un uso sistemático de la construcción de perfiles de información genómica para abordar esta cuestión. Debido a que los métodos i comúnmente utilizados para construir perfiles hace sólo comparaciones cualitativas, la primera tarea de esta tesis consistió en desarrollar un método para cuantificar perfiles e implementarlo en una herramienta bioinformática, ProfileSeq, la cual hemos validado mediante la reproducción de resultados previamente descritos en la literatura. Posteriormente, ProfileSeq se usó con datos de actividad de unión al DNA o al RNA de distintas proteínas para estudiar la relevancia en el splicing. Se encontraron varias asociaciones significativas. Entre ellas, la del factor de transcripción CTCF y la proteína de unión a RNA LIN28A. De manera similar, se encontró una relación entre SPI1 y proteínas de unión a RNA que se unen a motivos ricos en AC, como hnRNPL. Estos resultados representan relaciones putativas relevantes para el splicing, ya que se alcanzaron por más de un método diferente y usando datos independientes, También mostramos evidencia de que CTCF actúa como una barrera entre las regiones intragénicas de marcaje diferencial con H3K4me3. También se describen otros resultados de interés potencial tanto para la bioinformática como para la biología molecular.

Keywords

Alternative splicing; Chromatin; Sequencing; Motifs; CTCF; Empalmament alternatiu; Cromatina; Seqüenciació; Motius

Subjects

575 - General genetics. General cytogenetics

Documents

tijk.pdf

9.485Mb

 

Rights

L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-sa/3.0/es/
L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-sa/3.0/es/

This item appears in the following Collection(s)