Global ETD Search

1	Analyses théoriques de l'expansion des familles de gènes impliqués dans des maladies dominantes / Theoretical analyses of the expansion of gene families implicated in dominant diseases Malaguti, Giulia 17 October 2014 (has links) Les familles de gènes impliqués dans le cancer et autres maladies génétiques se sont beaucoup élargies via deux Duplications Globales de Génome (DGG) qui ont eu lieu à l'origine des vertébrés. La rétention des copies de ces gènes implique une susceptibilité plus grande aux maladies génétiques et constitue une énigme du point de vue de l'évolution. Dans cette thèse, nous avons généralisé des modèles classiques de génétique des populations pour révéler le mécanisme non-adaptatif qui a conduit à cette conservation de gènes potentiellement délétères chez les vertébrés. Nous avons résolu un modèle déterministe haploïde, nous avons étendu ce modèle à des génomes diploïdes et nous avons analysé les effets de taille finie des populations et de la sélection positive par une approche stochastique. Les résultats montrent, en accord avec les données génomiques du cancer chez l'homme, que les copies DGG susceptibles aux mutations délétères dominantes sont conservées indirectement via la sélection de purification dans les espèces post-DGG, qui présentent nécessairement une incompatibilité de ploïdie avec la population pre-DGG. Les résultats obtenus en étendant des méthodes avancées d'inférence bayésienne, quantifiant les effets causaux directs, soutiennent l'hypothèse d'une influence directe de la susceptibilité aux mutations délétères dominantes sur la rétention des copies DGG. Ces résultats révèlent le mécanisme d'évolution non-adaptatif responsable de la rétention de gènes DGG susceptibles aux mutations délétères dominantes et notre extension de méthodes d'inférence bayesienne ouvre la voie à la quantification des relations causales directes dans un large ensemble de problématiques. / Gene families implicated in cancer and other genetic diseases have been greatly expanded through two rounds of whole-genome duplication (WGD) that occurred at the onset of jawed vertebrates. However, such gene duplicates are expected to lead to an enhanced susceptibility to genetic diseases, and thus their retention represents an evolutionary puzzle from a natural selection perspective. In this thesis, we have expanded classical population genetics models to reveal the non-adaptive mechanism through which such potentially deleterious ohnologs (WGD-duplicated genes) were retained in the vertebrate genomes. We have solved a deterministic haploid model, we have considered extensions to diploid genotypes, and we have analyzed population size effects and the impact of positive selection through a stochastic approach. The results demonstrate, consistently with available human cancer genome data, that ohnologs prone to dominant deleterious mutations are indirectly selected through purifying selection in post-WGD species, arisen through the ploidy incompatibility between post-WGD individuals and the rest of the pre-WGD population. Extending advanced Bayesian inference methods to quantify direct and indirect causal effects, we have found further supporting evidences for the direct role of the gene susceptibility to deleterious mutations on ohnolog retention. Our findings rationalize the evolutionary mechanism responsible for the expansion of ohnologs prone to dominant deleterious mutations, highlighting the role of WGD-induced speciation. Our extension of Bayesian inference methods paves the way for the identification of direct causal relationships in a huge variety of problems. Modèles de génétique des populations Duplication globale du génome Spéciation Mutations délétères dominantes Méthodes d'inférence bayesiénne Effets causaux directs Graphe causal Whole genome duplication Population genetics models 530
2	Échantillonnage préférentiel adaptatif et méthodes bayésiennes approchées appliquées à la génétique des populations. / Adaptive multiple importance sampling and approximate bayesian computation with applications in population genetics. Sedki, Mohammed Amechtoh 31 October 2012 (has links) Dans cette thèse, on propose des techniques d'inférence bayésienne dans les modèles où la vraisemblance possède une composante latente. La vraisemblance d'un jeu de données observé est l'intégrale de la vraisemblance dite complète sur l'espace de la variable latente. On s'intéresse aux cas où l'espace de la variable latente est de très grande dimension et comportes des directions de différentes natures (discrètes et continues), ce qui rend cette intégrale incalculable. Le champs d'application privilégié de cette thèse est l'inférence dans les modèles de génétique des populations. Pour mener leurs études, les généticiens des populations se basent sur l'information génétique extraite des populations du présent et représente la variable observée. L'information incluant l'histoire spatiale et temporelle de l'espèce considérée est inaccessible en général et représente la composante latente. Notre première contribution dans cette thèse suppose que la vraisemblance peut être évaluée via une approximation numériquement coûteuse. Le schéma d'échantillonnage préférentiel adaptatif et multiple (AMIS pour Adaptive Multiple Importance Sampling) de Cornuet et al. [2012] nécessite peu d'appels au calcul de la vraisemblance et recycle ces évaluations. Cet algorithme approche la loi a posteriori par un système de particules pondérées. Cette technique est conçue pour pouvoir recycler les simulations obtenues par le processus itératif (la construction séquentielle d'une suite de lois d'importance). Dans les nombreux tests numériques effectués sur des modèles de génétique des populations, l'algorithme AMIS a montré des performances numériques très prometteuses en terme de stabilité. Ces propriétés numériques sont particulièrement adéquates pour notre contexte. Toutefois, la question de la convergence des estimateurs obtenus parcette technique reste largement ouverte. Dans cette thèse, nous montrons des résultats de convergence d'une version légèrement modifiée de cet algorithme. Sur des simulations, nous montrons que ses qualités numériques sont identiques à celles du schéma original. Dans la deuxième contribution de cette thèse, on renonce à l'approximation de la vraisemblance et onsupposera seulement que la simulation suivant le modèle (suivant la vraisemblance) est possible. Notre apport est un algorithme ABC séquentiel (Approximate Bayesian Computation). Sur les modèles de la génétique des populations, cette méthode peut se révéler lente lorsqu'on vise uneapproximation précise de la loi a posteriori. L'algorithme que nous proposons est une amélioration de l'algorithme ABC-SMC de DelMoral et al. [2012] que nous optimisons en nombre d'appels aux simulations suivant la vraisemblance, et que nous munissons d'un mécanisme de choix de niveauxd'acceptations auto-calibré. Nous implémentons notre algorithme pour inférer les paramètres d'un scénario évolutif réel et complexe de génétique des populations. Nous montrons que pour la même qualité d'approximation, notre algorithme nécessite deux fois moins de simulations par rapport à laméthode ABC avec acceptation couramment utilisée. / This thesis consists of two parts which can be read independently.The first part is about the Adaptive Multiple Importance Sampling (AMIS) algorithm presented in Cornuet et al.(2012) provides a significant improvement in stability and Effective Sample Size due to the introduction of the recycling procedure. These numerical properties are particularly adapted to the Bayesian paradigm in population genetics where the modelization involves a large number of parameters. However, the consistency of the AMIS estimator remains largely open. In this work, we provide a novel Adaptive Multiple Importance Sampling scheme corresponding to a slight modification of Cornuet et al. (2012) proposition that preserves the above-mentioned improvements. Finally, using limit theorems on triangular arrays of conditionally independant random variables, we give a consistensy result for the final particle system returned by our new scheme.The second part of this thesis lies in ABC paradigm. Approximate Bayesian Computation has been successfully used in population genetics models to bypass the calculation of the likelihood. These algorithms provide an accurate estimator by comparing the observed dataset to a sample of datasets simulated from the model. Although parallelization is easily achieved, computation times for assuring a suitable approximation quality of the posterior distribution are still long. To alleviate this issue, we propose a sequential algorithm adapted fromDel Moral et al. (2012) which runs twice as fast as traditional ABC algorithms. Itsparameters are calibrated to minimize the number of simulations from the model. Méthodes bayésiennes approchées Algorithmes MCMC Modèles de génétique des populations Importance sampling scheme Bayesian methods MCMC algorithms Population genetics models

Search results

Analyses théoriques de l'expansion des familles de gènes impliqués dans des maladies dominantes / Theoretical analyses of the expansion of gene families implicated in dominant diseases

Échantillonnage préférentiel adaptatif et méthodes bayésiennes approchées appliquées à la génétique des populations. / Adaptive multiple importance sampling and approximate bayesian computation with applications in population genetics.