Spelling suggestions: "subject:"computational statistics"" "subject:"computationnel statistics""
1 |
Statistiques bayésiennes en génétique des populations : modèle à facteurs et processus gaussiens pour étudier la variation génétique neutre et adaptative / Bayesian statistics in population genetics : factor model and gaussian processes to study neutral and adaptive genetic variationDuforet-Frebourg, Nicolas 02 October 2014 (has links)
Nous présentons dans cette thèse plusieurs travaux de statistiques bayésiennes appliquées à la génétique des populations. La génétique des populations a pour but d'expliquer les variations génétiques au sein d'une espèce, et d'inférer les processus ayant conduits à ces variations. Pour cela, des données génétiques massives sont utilisées et il y a un besoin grandissant de méthodes statistiques pour traiter ces données. Le travail de cette thèse s'inscrit dans cet effort de modélisation statistique pour répondre aux enjeux de la génétique des populations, et de la biologie de l'évolution. Nous nous intéressons tout particulièrement à la détection de traces d'adaptation locale dans les génomes, et à l'inférence des variations spatiales non stationnaires.Un modèle d'analyse factorielle bayésien est proposé pour détecter les traces d'adaptation locale. Nous comparons notre approche aux méthodes existantes, et démontrons qu'elle permet d'obtenir un plus faible taux de fausses découvertes. Nous présentons également un modèle bayésien basé sur des processus gaussiens pour caractériser les variations génétiques spatiales dans l'aire de répartition d'une espèce. Les performances de ces méthodes sont démontrées sur différents exemples issus de simulations ou de données. Plusieurs logiciels open source qui implémentent ces méthodes ont été développés pendant la thèse. / In this thesis we present several works related to Bayesian statistics in population genetics. Population genetics aims at explaining genetic variation within natural species, and infer the different processes that lead to current genetic variation. Large scale genomic datasets are produced, and there is an increasing need of statistical methods to extract information from these datasets. My thesis work is part of this statistical modeling effort to answer to evolutionary biology and population genetic questions. We are interested in detecting footprints of local adaptation without, and infering non-stationary patterns of spatial variation. A Bayesian factor model is used to detect genes involved in local adaptation. We compare our factor model to existing methods, and show that it can reduce the false discovery rate. We also present a Bayesian model based on Gaussian processes to caracterize spatial genetic variations within species. The performances of these methods are tested on simulations and real datasets. Several open source software are available online.
|
Page generated in 0.1274 seconds