• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 30
  • 11
  • 4
  • 2
  • 2
  • 2
  • 1
  • Tagged with
  • 73
  • 26
  • 25
  • 17
  • 17
  • 16
  • 16
  • 16
  • 14
  • 14
  • 14
  • 13
  • 13
  • 12
  • 12
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
11

DNA-based Species Delimitation of the Agriculturally Important Genus, Ravinia (Diptera: Sarcophagidae)

Wong, Evan S. 12 October 2015 (has links)
No description available.
12

Topics in Phylogenetic Species Tree Inference under the Coalescent Model

Tian, Yuan January 2016 (has links)
No description available.
13

Species trees from gene trees: reconstructing Bayesian posterior distributions of a species phylogeny using estimated gene tree distributions

Liu, Liang 14 September 2006 (has links)
No description available.
14

Estimation of Species Tree Using Approximate Bayesian Computation

Fan, Hang 25 October 2010 (has links)
No description available.
15

Influence des variations spatio-temporelles de l’environnement sur la distribution actuelle de la diversité génétique des populations / Impact of spatiotemporal environmental variations onto the current patterns of genetic diversity among populations

Tournebize, Rémi 30 November 2017 (has links)
Ce projet vise à comprendre comment la structure génétique intra-spécifique d'espèces végétales tropicales emblématiques et de l’espèce humaine a été affectée par les variations spatio-temporelles de l’environnement actuel et passé. Nous avons développé une approche d’inférence génétique basée sur la théorie de la coalescence pour évaluer l’influence potentielle des changements climatiques passés sur l’évolution de la distribution géographique et de la diversité génétique neutre et/ou adaptative d’Amborella trichopoda Baill. en Nouvelle-Calédonie (espèce-sœur des angiospermes, données NGS et microsatellites), de Coffea canephora Pierre ex A. Froehn en Afrique tropicale (caféier Robusta, données NGS) et de populations européenne et africaine (Luhya, Kenya) d’humains anatomiquement modernes (données NGS issues du Projet 1000 Génomes). Nos travaux suggèrent que les fluctuations climatiques du Pleistocène tardif ont joué un rôle majeur sur l’évolution de la diversité génétique des espèces étudiées de milieux tropicaux et tempérés, avec une empreinte remarquable du Dernier Maximum Glaciaire (DMG, 21 000 ans avant le présent). Les contractions démographiques associées à la glaciation planétaire ont vraisemblablement conduit à la divergence entre les lignées génétiques d’Amborella et participé à l’accumulation des différences génétiques entre les lignées de C. canephora. Nos résultats suggèrent que les événements de glaciation planétaire ont probablement entraîné une différenciation génétique idiosyncratique dans les forêts tropicales humides mais l’intensité de cette réponse semble avoir varié entre espèces. Nous avons également identifié de nombreux événements passés de sélection dans les génomes de la population humaine européenne qui ont été vraisemblablement provoquées par les conditions environnementales au cours du DMG. Les adaptations phénotypiques associées ont probablement assuré le maintien de l’expansion démographique en dépit des pressions de sélection nouvelles auxquelles les populations étaient confrontées au cours du dernier âge glaciaire en Europe. / This project aims at understanding how the structure of the intra-specific genetic diversity in emblematic tropical plant species and in the human species was shaped by the spatiotemporal variation of current and past environments. We developed a genetic inference approach based on the coalescent theory to assess the potential impact of past climatic change onto the evolution of the geographic range and of the neutral and/or adaptive genetic diversity in Amborella trichopoda Baill. in New Caledonia (sister-species of all extant angiosperms, NGS and microsatellite datasets), in Coffea canephora Pierre ex A. Froehn in tropical Africa (Robusta coffee, NGS dataset) and in North-Western European and African (Luhya, Kenya) human populations (NGS dataset 1000 Genomes Project). We found that the climatic fluctuations of the Late Pleistocene influenced the evolution of genetic diversity in these species distributed in temperate and tropical environments. The environmental conditions during the Last Glacial Maximum (LGM, 21.000 years before present) appear as an important factor. The demographic contraction associated with the last global glaciation influenced the divergence between Amborella genetic lineages and contributed to the accumulation of genetic differences between C. canephora lineages. Our results suggest that global glaciation events likely drove idiosyncratic genetic differentiation in tropical rain forests but the intensity of this response varied between species. We also identified multiple events of selection in the genomes of the European human population which were likely triggered by the environmental conditions during the LGM. The associated phenotypic adaptations probably allowed the paleo-populations to maintain their demographic expansion despite the new kinds of selective pressure they faced during the last glacial age in Europe.
16

Nouvelles méthodes d'inférence de l'histoire démographique à partir de données génétiques / New methods for inference on demographic history from genetic data

Merle, Coralie 12 December 2016 (has links)
Cette thèse consiste à améliorer les outils statistiques adaptés à des modèles stochastiques de génétiques des populations et de développer des méthodes statistiques adaptées à des données génétiques de nouvelle génération. Pour un modèle paramétrique basé sur le coalescent, la vraisemblance en un point de l'espace des paramètres s'écrit comme la somme des probabilités de toutes les histoires (généalogies munies de mutations) possibles de l'échantillon observé. À l'heure actuelle, les meilleures méthodes d'inférence des paramètres de ce type de modèles sont les méthodes bayésiennes approchées et l'approximation de la fonction de vraisemblance.L'algorithme d'échantillonnage préférentiel séquentiel (SIS) estime la vraisemblance, en parcourant de manière efficace l'espace latent de ces histoires. Dans ce schéma, la distribution d'importance propose les histoires de l'échantillon observé les plus probables possibles. Cette technique est lourde en temps de calcul mais fournit des estimations par maximum de vraisemblance d'une grande précision.Les modèles que nous souhaitons inférer incluent des variations de la taille de la population. Les méthodes d'IS ne sont pas efficaces pour des modèles en déséquilibre car les distributions d'importance ont été développées pour une population de taille constante au cours du temps. Le temps de calcul augmente fortement pour la même précision de l'estimation de la vraisemblance. La première contribution de cette thèse a consisté à explorer l'algorithme SIS avec ré-échantillonnage (SISR). L'idée est de ré-échantillonner de façon à apprendre quelles sont les histoires proposées par la distribution d'importance qui seront les plus probables avant d'avoir terminé leur simulation et diminuer le temps de calcul. Par ailleurs, nous avons proposé une nouvelle distribution de ré-échantillonnage, tirant profit de l'information contenue dans la vraisemblance composite par paire de l'échantillon.Le développement récent des technologies de séquençage à haut débit a révolutionné la génération de données de polymorphisme chez de nombreux organismes. Les méthodes d'inférence classiques de maximum de vraisemblance ou basées sur le Sites Frequency Spectrum, adaptées à des jeux de données de polymorphisme génétique de quelques loci, supposent l'indépendance des généalogies des loci. Pour tirer parti de données beaucoup plus denses sur le génome, nous considérons la dépendance des généalogies sur des positions voisines du génome et modéliser la recombinaison génétique. Alors, la vraisemblance prend la forme d'une intégrale sur tous les graphes de recombinaison ancestraux possibles pour les séquences échantillonnées, un espace de bien plus grande dimension que l'espace des généalogies. Les méthodes d'inférence basées sur la vraisemblance ne peuvent plus être utilisées sans plus d'approximations. De nombreuses méthodes infèrent les changements historiques de la taille de la population mais ne considèrent pas la complexité du modèle ajusté. Même si certaines proposent un contrôle d'un potentiel sur-ajustement du modèle, à notre connaissance, aucune procédure de choix de modèle entre des modèles démographiques de complexité différente n'a été proposée à partir de longueurs de segments identiques. Nous nous concentrons sur un modèle de taille de population constante et un modèle de population ayant subit un unique changement de taille dans le passé. Puisque ces modèles sont emboîtés, la deuxième contribution de cette thèse a consisté à développer un critère de choix de modèle pénalisé basé sur la comparaison d'homozygotie haplotypique observée et théorique. Notre pénalisation, reposant sur des indices de sensibilité de Sobol, est liée à la complexité du modèle. Ce critère pénalisé de choix de modèle nous a permis de choisir entre un modèle de taille de population constante ou présentant un changement passé de la taille de la population sur des jeux de données simulés et sur un jeux de données de vaches. / This thesis aims to improve statistical methods suitable for stochastic models of population genetics and to develop statistical methods adapted to next generation sequencing data.Sequential importance sampling algorithms have been defined to estimate likelihoods in models of ancestral population processes. However, these algorithms are based on features of the models with constant population size, and become inefficient when the population size varies in time, making likelihood-based inferences difficult in many demographic situations. In the first contribution of this thesis, we modify a previous sequential importance sampling algorithm to improve the efficiency of the likelihood estimation. Our procedure is still based on features of the model with constant size, but uses a resampling technique with a new resampling probability distribution depending on the pairwise composite likelihood. We tested our algorithm, called sequential importance sampling with resampling (SISR) on simulated data sets under different demographic cases. In most cases, we divided the computational cost by two for the same accuracy of inference, in some cases even by one hundred. This work provides the first assessment of the impact of such resampling techniques on parameter inference using sequential importance sampling, and extends the range of situations where likelihood inferences can be easily performed.The recent development of high-throughput sequencing technologies has revolutionized the generation of genetic data for many organisms : genome wide sequence data are now available. Classical inference methods (maximum likelihood methods (MCMC, IS), methods based on the Sites Frequency Spectrum (SFS)) suitable for polymorphism data sets of some loci assume that the genealogies of the loci are independent. To take advantage of genome wide sequence data with known genome, we need to consider the dependency of genealogies of adjacent positions in the genome. Thus, when we model recombination, the likelihood takes the form of an integral over all possible ancestral recombination graph for the sampled sequences. This space is of much larger dimension than the genealogies space, to the extent that we cannot handle likelihood-based inference while modeling recombination without further approximations.Several methods infer the historical changes in the effective population size but do not consider the complexity of the demographic model fitted.Even if some of them propose a control for potential over-fitting, to the best of our knowledge, no model choice procedure between demographic models of different complexity have been proposed based on IBS segment lengths. The aim of the second contribution of this thesis is to overcome this lack by proposing a model choice procedure between demographic models of different complexity. We focus on a simple model of constant population size and a slightly more complex model with a single past change in the population size.Since these models are embedded, we developed a penalized model choice criterion based on the comparison of observed and predicted haplotype homozygosity.Our penalization relies on Sobol's sensitivity indices and is a form of penalty related to the complexity of the model.This penalized model choice criterion allowed us to choose between a population of constant size and a population size with a past change on simulated data sets and also on a cattle data set.
17

Applications du processus ancestral avec recombinaison et conversion en génétique statistique

Saidi, Lamiae 12 1900 (has links)
Le processus ancestral est appliqué pour étudier la variabilité génétique et la mesure de déséquilibre de liaison de séquences d’ADN, et faire de l’inférence statistique sur les divers facteurs responsables de cette variabilité. En tenant compte, en premier lieu, des facteurs de dérive génétique, de mutation, et de recombinaison, les calculs exacts de la mesure de déséquilibre de liaison de deux loci sont retrouvés. De plus, une approximation du processus exact, SMC (sequentially Markov chain), est utilisée pour trouver la mesure d’association à deux loci, et une formule de covariance pour calculer cette mesure est corrigée. En intégrant le facteur de conversion dans le modèle de Moran, on trouve l’espérance des mesures de polymorphisme exprimées par les espérances des mesures de variation intra-locus et inter-locus. Celles-ci sont calculées à l’aide de temps espérés dans les états ancestraux. De plus, l’espérance du déséquilibre de liaison est trouvée et il est montré qu’elle diminue quand le taux de recombinaison augmente. En utilisant ces résultats théoriques, on présente une méthode pour estimer les paramètres de mutation, de recombinaison, et de conversion. / The ancestral process is applied to investigate the amount of DNA variation and the amount of linkage disequilibrium ; it is also applied to make statistical inference about the multiple factors responsible for this variation. Considering genetic drift, mutation, and recombination events, the exact solutions for linkage disequilibrium between two loci are obtained. Furthermore, the association measure between two loci is obtained by using an approximation of the exact process, SMC (sequentially Markov chain), and correcting a covariance formula. After introducing intrachromosomal gene conversion under the Moran model, the expected amounts of variation within and between two loci are obtained using expected times spent in the ancestral states. Furthermore, the expectation of linkage disequilibrium is obtained and it is shown to decrease as the recombination rate is increased. Using these theoretical results, a method for estimating the mutation, recombination and gene conversion parameters is presented. / Les diagrammes de transitions d'états ont été réalisés avec le logiciel Latex.
18

Applications du processus ancestral avec recombinaison et conversion en génétique statistique

Saidi, Lamiae 12 1900 (has links)
Les diagrammes de transitions d'états ont été réalisés avec le logiciel Latex. / Le processus ancestral est appliqué pour étudier la variabilité génétique et la mesure de déséquilibre de liaison de séquences d’ADN, et faire de l’inférence statistique sur les divers facteurs responsables de cette variabilité. En tenant compte, en premier lieu, des facteurs de dérive génétique, de mutation, et de recombinaison, les calculs exacts de la mesure de déséquilibre de liaison de deux loci sont retrouvés. De plus, une approximation du processus exact, SMC (sequentially Markov chain), est utilisée pour trouver la mesure d’association à deux loci, et une formule de covariance pour calculer cette mesure est corrigée. En intégrant le facteur de conversion dans le modèle de Moran, on trouve l’espérance des mesures de polymorphisme exprimées par les espérances des mesures de variation intra-locus et inter-locus. Celles-ci sont calculées à l’aide de temps espérés dans les états ancestraux. De plus, l’espérance du déséquilibre de liaison est trouvée et il est montré qu’elle diminue quand le taux de recombinaison augmente. En utilisant ces résultats théoriques, on présente une méthode pour estimer les paramètres de mutation, de recombinaison, et de conversion. / The ancestral process is applied to investigate the amount of DNA variation and the amount of linkage disequilibrium ; it is also applied to make statistical inference about the multiple factors responsible for this variation. Considering genetic drift, mutation, and recombination events, the exact solutions for linkage disequilibrium between two loci are obtained. Furthermore, the association measure between two loci is obtained by using an approximation of the exact process, SMC (sequentially Markov chain), and correcting a covariance formula. After introducing intrachromosomal gene conversion under the Moran model, the expected amounts of variation within and between two loci are obtained using expected times spent in the ancestral states. Furthermore, the expectation of linkage disequilibrium is obtained and it is shown to decrease as the recombination rate is increased. Using these theoretical results, a method for estimating the mutation, recombination and gene conversion parameters is presented.
19

Coalescent distingués échangeables et processus de Fleming-Viot généralisés avec immigration.

Foucart, Clément 11 September 2012 (has links) (PDF)
L'objet de la thèse est d'étudier des processus stochastiques coalescents modélisant la généalogie d'une population échangeable avec immigration. On représente la population par l'ensemble des entiers N = {1, 2, ..}. Imaginons que l'on échantillonne n individus dans la population aujourd'hui. On cherche à regrouper ces n individus selon leur ancêtre en remontant dans le temps. En raison de l'immigration, il se peut qu'à partir d'une certaine génération, certains individus n'aient pas d'ancêtre dans la population. Par convention, nous les regrouperons dans un bloc que nous distinguerons en ajoutant l'entier 0. On parle du bloc distingué. Les coalescents distingués échangeables sont des processus à valeurs dans l'espace des partitions de Z+ := {0, 1, 2, ...}. A chaque temps t est associée une partition distinguée échangeable, c'est-à-dire une partition dont la loi est invariante sous l'action des permu- tations laissant 0 en 0. La présence du bloc distingué implique de nouvelles coagulations, inexistantes dans les coalescents classiques. Nous déterminons un critère suffisant (et né- cessaire avec conditions) pour qu'un coalescent distingué descende de l'infini. C'est-à-dire qu'immédiatement après 0, le processus n'ait plus qu'un nombre fini de blocs. D'autre part, nous nous intéressons à une relation de dualité entre ces coalescents et des processus à valeurs dans les mesures de probabilité, appelés processus de Fleming-Viot généralisés avec immigration. Nous établissons des liens entre ces derniers et les processus de branchement continus avec immigration. Dans le cas d'un processus de branchement avec reproduction α-stable et immigration (α−1)-stable, nous montrons que le processus à valeurs mesures associé, renormalisé, est un processus de Fleming-Viot avec immigration changé de temps.
20

Stochastic tree models and probabilistic modelling of gene trees of given species networks

Zhu, Sha (Joe) January 2013 (has links)
In the pre-genomic era, the relationships among species and their evolutionary histories were often determined by examining the fossil records. In the genomic era, these relationships are identified by analysing the genetic data, which also enables us to take a close-up view of the differences between the individual samples. Nevertheless, these relationships are often described by a tree-like structure or a network. In this thesis, we investigate some of the models that are used to describe these relationships. This thesis can be divided into two main parts. The first part focuses on investigating the theoretical properties of several neutral tree models that are often considered in phylogenetics and population genetics studies, such as the Yule–Harding model, the proportional to distinguishable arrangements and the Kingman coalescent models. In comparison to the first part, the other half of the thesis is more computationally oriented: we focus on developing and implementing methods of calculating gene tree probabilities of given species networks, and simulating genealogies within species networks.

Page generated in 0.0727 seconds