Applications of next-generation sequencing in conservation genomics: kinship analysis and dispersal patterns

Author

Escoda Assens, Lídia

Director

Castresana Villamor, José

Tutor

Riutort León, Marta

Date of defense

2018-05-11

Pages

211 p.



Department/Institute

Universitat de Barcelona. Departament de Genètica

Abstract

Knowledge of the genealogical relationships among individuals of a population and their dispersal patterns are essential to many studies of endangered species, especially those with small and fragmented populations. The main objective of this doctoral thesis is to use genomic data obtained with next-generation sequencing techniques to infer contemporary dispersal patterns of species from relatedness networks, to construct pedigrees from kinship categories, and to quantify the effect of anthropogenic and geographic barriers on the dispersal of individuals, using as a model the Pyrenean desman (Galemys pyrenaicus), a small semi-aquatic mammal endemic to the Iberian Peninsula. First, the contact zone between two lineages of the Pyrenean desman in the Iberian Range (La Rioja) was studied using SNPs obtained from ddRAD (double-digest restriction associated DNA) genomic libraries. According to the genomic tree, the principal component analysis, and the population structure analyses, the genetic variability in the area was structured by rivers instead of by mitochondrial lineages. Relatedness and inbreeding coefficients were then calculated with a maximum-likelihood estimator. Mean relatedness was found to be very high in the area. Individuals also showed high inbreeding levels. The reliability of these estimates was assessed with bioinformatics simulations based on artificial pedigrees that included as founders actual genotypes of the studied population. The relatedness networks showed a low level of contemporary inter-river dispersal compared to intra-river dispersal, indicating poor connectivity between rivers. Then, kinship relationships and pedigrees of Pyrenean desmans of two rivers of the northwestern part of the Iberian Peninsula (Zamora) were inferred. The ddRAD protocol was modified to allow processing each sample independently, which enabled the use of minimally invasive hair samples. Mean relatedness and inbreeding coefficients obtained from the SNPs were much lower than those from La Rioja. In addition, relatedness was higher for female dyads than for male dyads, suggesting a higher degree of female philopatry. Kinship categories were determined and their reliability was assessed using bioinformatics simulations based on artificial pedigrees. Using these kinship categories, pedigrees were reconstructed and their congruence was evaluated with the age of the individuals, the mitochondrial haplotypes, and the inbreeding coefficients. Pedigrees allowed the estimation of the average dispersal distance per generation, as well as preliminary data about the reproductive biology of the species. Finally, the assortativity coefficient obtained from the kinships networks was used to quantify the effect of specific barriers on the dispersal of individuals in the two rivers studied of Zamora, the Tera and the Tuela. The most important barrier found with this approach was the watershed divide between both rivers, followed by a dam located in one of them. These results were highly congruent with those obtained from the population structure analysis. The information obtained with the approaches presented in this thesis can be used to unravel fundamental aspects about the biology of endangered species, such as their dispersal patterns and their reproductive biology, as well as to quantify the effect of potential barriers on dispersal. These data may be fundamental to develop conservation plans aimed at improving the connectivity between populations.


El conocimiento de las relaciones genealógicas entre individuos de una población y sus patrones de dispersión son esenciales en muchos estudios sobre especies amenazadas, especialmente de aquellas con poblaciones pequeñas y fragmentadas. El objetivo principal de esta tesis doctoral es utilizar datos genómicos obtenidos con técnicas de secuenciación de última generación para inferir patrones de dispersión contemporánea de las especies a partir de redes de parentesco, construir pedigríes a partir de categorías de parentesco y cuantificar el efecto de barreras antropogénicas y geográficas en la dispersión de individuos, usando como modelo el desmán ibérico (Galemys pyrenaicus), un pequeño mamífero semi-acuático endémico de la Península Ibérica. En primer lugar, se estudió la zona de contacto entre dos linajes de desmán ibérico en el Sistema Ibérico (La Rioja) usando SNPs obtenidos mediante bibliotecas genómicas ddRAD (DNA asociado a sitios de restricción con doble digestión). De acuerdo con el árbol genómico, el análisis de componentes principales y el análisis de estructura poblacional, la variabilidad genética en el área estudiada resultó estar estructurada por ríos en lugar de por linajes mitocondriales. A continuación, los coeficientes de parentesco y de consanguinidad fueron calculados con un estimador de máxima verosimilitud. La media del coeficiente de parentesco encontrada en el área fue muy alta. Los individuos también mostraron altos niveles de consanguinidad. La fiabilidad de estas estimaciones se comprobó mediante simulaciones bioinformáticas basadas en pedigríes artificiales que incluían como fundadores genotipos reales de la población estudiada. Las redes de parentesco construidas mostraron un bajo nivel de dispersión contemporánea entre ríos en comparación con la dispersión dentro de ríos, lo que indicaba una mala conectividad entre los ríos del Sistema Ibérico. Después se infirieron las relaciones de parentesco y los pedigríes de desmanes ibéricos de dos ríos del noroeste de la Península Ibérica (Zamora). El protocolo de ddRAD se modificó y optimizó para poder procesar cada muestra de forma independiente, lo que permitió el uso de muestras de pelo mínimamente invasivas. Las medias de los coeficientes de parentesco y de consanguinidad obtenidos a partir de los SNPs fueron mucho más bajas que en La Rioja. Además, la media del coeficiente de parentesco fue mayor para las parejas de hembras que para las de machos, lo que sugiere un mayor grado de filopatría de las hembras. Se determinaron las categorías de parentesco existentes y se evaluó su fiabilidad con simulaciones bioinformáticas basadas en pedigríes artificiales. Usando estas categorías de parentesco, se reconstruyeron pedigríes y se evaluó su congruencia mediante la comprobación de la edad de los individuos, los haplotipos mitocondriales y los coeficientes de consanguinidad. La reconstrucción de pedigríes permitió estimar el promedio de la distancia de dispersión por generación, así como datos preliminares sobre la biología reproductiva de la especie. Por último, se usó el coeficiente de asortatividad obtenido a partir de las redes de parentesco para cuantificar el efecto de barreras específicas en la dispersión de los individuos en los dos ríos estudiados en Zamora, el Tera y el Tuela. La barrera más importante encontrada en el área fue la divisoria de aguas entre ambos ríos, seguida por una presa situada en uno de ellos. Estos resultados fueron altamente congruentes con los obtenidos con el análisis de estructura poblacional. La información obtenida con el enfoque metodológico presentado en esta tesis puede ser usada para desentrañar aspectos fundamentales sobre la biología de especies amenazadas, como pueden ser sus patrones de dispersión y su biología reproductiva, así como para cuantificar el efecto de barreras potenciales en la dispersión. Estos datos pueden ser fundamentales para desarrollar planes de conservación dirigidos a la mejora de la conectividad entre diferentes poblaciones.

Keywords

Genètica humana; Genética humana; Human genetics; Genètica microbiana; Genética microbiana; Microbial genetics; Genòmica; Genómica; Genomics

Subjects

575 - General genetics. General cytogenetics

Knowledge Area

Ciències Experimentals i Matemàtiques

Documents

LIA_PhD_THESIS.pdf

30.19Mb

 

Rights

L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc-nd/4.0/
L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc-nd/4.0/

This item appears in the following Collection(s)