De nombreuses méthodes ont été développées dans le but d’estimer les apports génétiques (taux de mélange) de populations parentales au pool génétique d’une population mélangée. Certaines de ces méthodes ont été implémentées dans des logiciels, permettant une estimation plus ou moins rapide et précise des taux de mélange. Une comparaison complète des logiciels ADMIX (méthode des moindres carrés pondérés), ADMIX95 (méthode basée sur les identités géniques), Admix 2.0 (méthode basée sur la coalescence), Mistura (méthode de maximum de vraisemblance), LEA (méthode bayésienne de vraisemblance), et LEADMIX (méthode de maximum de vraisemblance basée sur la coalescence) a été menée. L’analyse a été faite à deux niveaux : intra-logiciel (test de chaque logiciel sous un jeu de paramètres définis), inter-logiciel (comparaison des logiciels entre eux). Les taux de mélange ont été estimés à partir de quatre types de marqueurs : autosomaux (groupes sanguins et gènes KIR), et uniparentaux (ADNmt et chromosome Y). Notre étude révèle que la précision et la fiabilité des estimations dépendent de l’adéquation du mélange étudié avec le modèle de la méthode employée, mais également d’un choix judicieux des loci et des populations parentales utilisés. La variabilité des estimations lors de modifications, même minimes, des paramètres de l’étude, nous amène à considérer que les contributions ne doivent pas être présentées sous forme de taux de mélange, mais d’« intervalles indicatifs de mélange » soulignant les tendances migratoires générales. / Different methods have been developed to estimate the genetic admixture contributions of parental populations to a hybrid one. Most of these methods are implemented in different software programs that provide estimates having variable accuracy. A full comparison between ADMIX (weighted least square), ADMIX95 (gene identity), Admix 2.0 (coalescent-based), Mistura (maximum-likelihood), LEA (likelihood-based) and LEADMIX (maximum-likelihood) software programs has been carried out, both at the “intra” (test of each software programs) and “inter” level (comparisons between them). We tested all of these programs on a real human population data set, using four kinds of markers, autosomal (Blood groups and KIR genes) and uniparental (mtDNA and Y-Chromosome). We demonstrated that the accuracy of the results depends not only on the method itself but also on the choice of loci and of parental populations. We consider that the results of admixture contribution rates obtained from human population data set should not be considered as an accurate value but rather as an indicative result and we suggest using an “Admixture Indicative Interval” as a measurement of admixture.
Identifer | oai:union.ndltd.org:theses.fr/2010AIX20686 |
Date | 19 October 2010 |
Creators | Gourjon, Géraud |
Contributors | Aix-Marseille 2, Boetsch, Gilles, Degioanni, Anna |
Source Sets | Dépôt national des thèses électroniques françaises |
Language | French |
Detected Language | French |
Type | Electronic Thesis or Dissertation, Text |
Page generated in 0.0039 seconds