Detection and classification of positive selection in human populations

Author

Pybus Oliveras, Marc

Director

Bertranpetit, Jaume

Date of defense

2015-09-28

Pages

222 p.



Department/Institute

Universitat Pompeu Fabra. Departament de Ciències Experimentals i de la Salut

Doctorate programs

Programa de doctorat en Biomedicina

Abstract

Detecting positive selection in genomic regions is a recurrent topic in human population genetics studies. Over the years, many positive selection tests have been implemented to highlight specific genomic patterns left by a selective event when compared to neutral expectations. However, there is little consistency among the regions detected in several genome-wide scans using different tests and/or populations: population-specific demographic dynamics, local genomic features or different types of selection acting along the genome at different times and selective coefficients might explain such discrepancies. The present doctoral thesis is focused in the study of this problem and the development of a innovative solution: a machine-learning classification framework that exploits the combined ability of some selection tests to uncover the different features expected under the hard sweep model, such as sweep completeness and age of onset. The method was calibrated and applied to three reference populations from The 1000 Genome Project to generate a genome-wide classification map of hard selective sweeps. This study improves the way a selective sweep is detected by overcoming the classical selection vs. no-selection classification strategy, and offers an explanation to the lack of consistency observed among selection tests when applied to real data.


La detecció de selecció positiva en regions genòmiques ha estat un tema recurrent en molts estudis de genètica de poblacions humanes. En conseqüència, durant els últims anys s'han publicat molts mètodes estadístics per detectar els senyals genòmics creats per un procés de selecció molecular. No obstant això, en general hi ha poca consistència entre les regions detectades pels diferents mètodes: dinàmiques demogràfiques especifiques de població, propietats locals de les regions analitzades o diferents tipus de selecció actuant a diferents marcs temporals i intensitats podrien explicar aquestes discrepàncies. Aquesta tesi doctoral està centrada en l'estudi d'aquest problema i en el desenvolupament d'una solució: un mètode de classificació de selecció positiva basat en algoritmes d'aprenentatge automàtic. El mètode combina diferents tests per detectar selecció positiva per obtenir informació sobre el tipus i mode de selecció que afecta una regió genòmica determinada. Aquest nou mètode presenta una alta sensitivitat cap a senyals de selecció positiva i és capaç de proveir informació sobre l'edat del esdeveniment selectiu, així com del seu estat final. Aquest treball millora la forma en què la selecció positiva és detectada avui en dia i proporciona una explicació a la falta de consistència observada entre els mètodes de detecció de selecció positiva quan s'apliquen en dades reals.

Keywords

Positive selection; Machine-learnong; Human population genetics; Simulations; Selective sweep; Selecció positiva; Aprenentatge supervisat; Genètica de poblacions humanes; Simulacions

Subjects

575 - General genetics. General cytogenetics

Documents

tmpo.pdf

105.0Mb

 

Rights

ADVERTIMENT. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal, així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas, en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs.

This item appears in the following Collection(s)