Global ETD Search

1	Étude de la variation naturelle de traits phénologiques chez Arabidopsis thaliana par une approche de génomique écologique / Using ecological genomics to study the natural variation of phenological traits in Arabidopsis thaliana Brachi, Benjamin 16 December 2010 (has links) L’étude de la l’adaptation de traits complexes passe par deux approches complémentaires. La première approche vise à décrire les architectures et les bases génétiques de variation naturelle adaptative. La seconde approche, vise à décrire les échelles géographiques de la variation phénotypique et les facteurs écologiques agissant comme pressions de sélection sur le trait étudié. Ces deux approches sont utilisées pour étudier la variation naturelle de traits phénologiques chez Arabidopsis thaliana.Les architectures et les bases génétiques de la variation naturelle de traits phénologiques, phénotypés dans deux environnements, ont été étudiées en tirant avantage de la combinaison ‘genome-wide association (GWA) mapping’ et cartographie de QTL. Cette combinaison a permis de mettre en évidence que les effets alléliques et l’identité des gènes liés à la variation naturelle étaient fortement dépendants de l’environnement et que les populations naturelles pourraient avoir suivi des marches adaptatives différentes. La caractérisation phénologique, écologique et génétique d’un échantillonnage hiérarchique de populations d’A. thaliana a mis en évidence que la variation des traits phénologiques était adaptative à une échelle très locale en réponse à de nombreux facteurs climatiques et édaphiques. Cette double approche génomique - écologie suggère que l’étude des marches adaptatives des populations naturelles d’A. thaliana vers des optimums phénotypiques doit passer par l’étude des architectures et des bases génétiques à différentes échelles géographiques, suivant un dispositif hiérarchisé et que l’estimation de la variation naturelle doit s’effectuer dans des conditions réalistes. / Two complementary approaches need to be considered in the study of adaptation. The first approach aims at describing the genetic architectures and the genetic bases of phenotypic variation in order to better understand the adaptive walk followed by natural populations toward a phenotypic optimum. The second approach aims to identify the environmental grain of the ecological factors acting as selective pressures in natural populations. In this work we studied the natural variation of phenological traits in Arabidopsis thaliana. We used a powerful combination of genome wide association (GWA) mapping and traditional QTL mapping to fine map the genetics of phenological traits measured under two environments. This dual mapping strategy revealed a strong environmental dependency of both allelic effect and identity of the genes underlying natural variation, but also that natural A. thaliana populations may have followed different adaptive walks. A. thaliana populations were sampled according a hierarchical geographic pattern and characterized ecologically, phenologically and genetically. This strategy revealed that phenological traits were adaptive to fine-grained environmental conditions defined by both climate and soil conditions. In the study of the adaptive walks followed by A. thaliana natural populations, this two sided approach, combining both genomics and ecology, suggests that the description of the genetic architectures and the identification of causal genes should be performed at different spatial scales, following a hierarchical geographic design, and that phenotypes must be measured in ecologically realistic conditions. Génétique d'association
2	Optimisation des stratégies de génétique d'association et de sélection génomique pour des populations de diversité variable : Application au maïs / Optimization of association genetics and genomic selection strategies for populations of different diversity levels : Application in maize (Zea mays L.) Rincent, Renaud 11 April 2014 (has links) D'importants progrès ont été réalisés dans les domaines du génotypage et du séquençage, ce qui permet de mieux comprendre la relation génotype/phénotype. Il est possible d'analyser l'architecture génétique des caractères (génétique d'association, GA), ou de prédire la valeur génétique des candidats à la sélection (sélection génomique, SG). L'objectif de cette thèse était de développer des outils pour mener ces stratégies de manière optimale. Nous avons d'abord dérivé analytiquement la puissance du modèle mixte de GA, et montré que la puissance était plus faible pour les marqueurs présentant une faible diversité, une forte différentiation entre sous groupes et une forte corrélation avec les marqueurs utilisés pour estimer l'apparentement (K). Nous avons donc considéré deux estimateurs alternatifs de K. Des simulations ont montré qu'ils sont aussi efficaces que la méthode classique pour contrôler les faux positifs et augmentent la puissance. Ces résultats ont été confirmés sur les panels corné et denté du programme Cornfed, avec une augmentation de 40% du nombre de SNP détectés. Ces panels, génotypés avec une puce 50k SNP et phénotypés pour leur précocité et leur biomasse ont permis de décrire la diversité de ces groupes et de détecter des QTL. En SG, des études ont montré l'importance de la composition du jeu de calibration sur la fiabilité des prédictions. Nous avons proposé un algorithme d'échantillonnage dérivé de la théorie du G-BLUP permettant de maximiser la fiabilité des prédictions. Par rapport à un échantillon aléatoire, il permettrait de diminuer de moitié l'effort de phénotypage pour atteindre une même fiabilité de prédiction sur les panels Cornfed. / Major progresses have been achieved in genotyping technologies, which makes it easier to decipher the relationship between genotype and phenotype. This contributed to the understanding of the genetic architecture of traits (Genome Wide Association Studies, GWAS), and to better predictions of genetic value to improve breeding efficiency (Genomic Selection, GS). The objective of this thesis was to define efficient ways of leading these approaches. We first derived analytically the power from classical GWAS mixed model and showed that it was lower for markers with a small minimum allele frequency, a strong differentiation among population subgroups and that are strongly correlated with markers used for estimating the kinship matrix K. We considered therefore two alternative estimators of K. Simulations showed that these were as efficient as classical estimators to control false positive and provided more power. We confirmed these results on true datasets collected on two maize panels, and could increase by up to 40% the number of detected associations. These panels, genotyped with a 50k SNP-array and phenotyped for flowering and biomass traits, were used to characterize the diversity of Dent and Flint groups and detect QTLs. In GS, studies highlighted the importance of relationship between the calibration set (CS) and the predicted set on the accuracy of predictions. Considering low present genotyping cost, we proposed a sampling algorithm of the CS based on the G-BLUP model, which resulted in higher accuracies than other sampling strategies for all the traits considered. It could reach the same accuracy than a randomly sampled CS with half of the phenotyping effort. Génétique végétale Sélection génomique Génétique d'association Maïs Vegetal genetics Genomic selection Association mapping Maize 631.5233
3	Biodiversité et adaptation au pathogène racinaire Verticillium alfalfae chez Medicago truncatula : Importance de la micro-évolution / Biodiversity and adaptation towards the root pathogen verticillium alfalfae in medicago truncatula Mazurier, Mélanie 16 April 2018 (has links) Les légumineuses font parties des familles les plus cultivées à la fois pour l'alimentation humaine et pour l'alimentation animale. Une des maladies principales de la luzerne (Medicago sativa), plante fourragère la plus cultivée au monde, est la verticilliose causée par Verticillium alfalfae, un champignon du sol. Sans traitements phytosanitaires efficaces et pratiques pour les maladies causées par des pathogènes du sol, la protection des cultures passe par la sélection de variétés résistantes. Dans cette thèse, la légumineuse modèle Medicago truncatula a été utilisée afin d'identifier des gènes candidats à la résistance quantitative à Verticillium alfalfae V31-2 (Va V31-2). La première étape de ces travaux a révélé des sources de résistance à la souche Va V31-2 au sein de l'espèce M. truncatula. Pour cela, 261 lignées (dont 246 accessions issues du projet MtHapMap) ont été inoculées et le développement de flétrissements foliaires a été suivi pendant quatre semaines, suivi d'un réisolement du pathogène à partir des parties aériennes. Ces analyses ont révélé une grande biodiversité de réponse à la verticilliose au sein de l'espèce Medicago truncatula, avec une variabilité inter et intra-populations. Dans une seconde partie, des QTL pour la résistance partielle à la verticilliose ont été identifiés par génétique d'association (GWAS) permettant la découverte de nouveaux QTL de résistance à Va V31-2 et la confirmation de la présence d'un QTL majeur sur le chromosome 7 précédemment décrit. Selon les phénotypes de maladie utilisés pour l'étude de GWAS, les QTL détectés sont différents, ce qui suggère des contrôles génétiques différents pour l'évolution des symptômes de maladie et la colonisation des parties aériennes par Va V31-2. Une seconde analyse de GWAS menée sur 90 accessions de la population tunisienne Soliman a révélé des gènes candidats différents de ceux identifiés à partir de la collection MtHapmap, suggérant une possible adaptation locale. La validation fonctionnelle de gènes candidats pour la résistance partielle a été entamée, en privilégiant ceux situés sur le chromosome 7, à la convergence de différentes études génétiques. La mise en place d'un système d'inoculation in vitro de racines transgéniques a permis de révéler le rôle du gène Medtr7g070480 codant pour une protéine SEC14 dans la résistance à Va V31-2. L'extinction de l'expression de ce gène par microARN artificiel dans le génotype A17 (résistant) et F83005.5 (sensible) diminue la colonisation des racines par Va V31-2, alors que sa surexpression augmente la colonisation chez A17 : il s'agirait donc d'un gène de sensibilité. L'unique polymorphisme génétique entraînant une substitution non synonyme entre A17 et F83005.5 explique 18,5% de la variation du niveau de résistance observée au sein des 246 accessions MtHapmap. L'étude de l'expression racinaire du gène MtSEC14 24 heures après inoculation par Va V31-2 dans un panel de 14 accessions sensibles et résistantes n'a pas montré de différences significatives entre ces deux types d'accessions. En parallèle, des gènes orthologues aux gènes candidats à la résistance à V. alfalfae ont été identifiés chez d'autres plantes modèles (Lotus japonicus, Arabidopsis thaliana, Nicotiana sp.), puis la pathogénicité de Va V31-2 a été testée chez ces espèces en vue de leur éventuelle utilisation pour valider le rôle de ces gènes. Un unique orthologue à MtSEC14 a également été identifié chez Medicago sativa. Grâce à la synténie entre M. truncatula et M. sativa, nos travaux pourront très probablement être transférés à la luzerne cultivée. A notre connaissance, ces travaux mettent en évidence pour la première fois le rôle d'un gène de sensibilité dans une résistance partielle à un micro-organisme chez les Légumineuses. / Pathogens, animals and weeds are responsible for losses ranging from 20% to 40% of global agricultural yield. Legumes are the second most grown crops after cereals as human and animal food, and their yield is also affected by pathogens. Verticillium alfalfae is a soil-borne pathogen causing high yield losses in alfalfa fields (Medicago sativa), the most worldwide legume forage crop grown. To date, there is no chemical control and crop breeding is the best way to protect alfalfa against V. alfalfae. However, Medicago sativa has a complex genome (allogamous and tetraploid), therefore in this work the model legume Medicago truncatula (diploid and self-fertile) was used to investigate genetic mechanisms involved in V. alfalfae V31-2 (Va V31-2) resistance. First, several sources of resistance were identified in M. truncatula biodiversity by assessing disease symptoms development in 261 lines from the Mediterranean basin inoculated by V. alfalfae V31-2. Reisolation of V. alfalfae V31-2 in M. truncatula stems was also led. These analyses revealed a great biodiversity of M. truncatula response towards Va V31-2. A genome wide association study (GWAS) on various disease phenotypes pinpointed several quantitative trait loci (QTL): one of them colocalized with a previous major QTL on chromosome 7 detected on LR4 and LR5 RILs populations. Both phenotypic and genetic analyses thus suggest the occurrence of different resistance mechanisms in M. truncatula populations towards V. alfalfae. Resistant candidate genes towards Va V31-2 were also identified by GWAS using 90 accessions of M. truncatula Soliman Tunisian population. These candidate genes are different from the pinpointed candidate gene of our previous GWAS analysis. These results might underline a local adaptation towards Verticillium. Consistencies between GWAS results with previous QTL and transcriptomic data led us to perform the functional validation with the candidate genes localized on chromosome 7. An original in vitro inoculation system of M. truncatula transgenic roots was used to validate Medtr7g070480 (gene encoding a SEC14 protein) as a key player towards V. alfalfae V31.2 in M. truncatula. Silencing the SEC14 gene using artificial microRNA in A17 (resistant) and F83005.5 (susceptible) lines decreases Va V31-2 colonization rate on transgenic roots whereas overexpressing MtSEC14 increases the colonization rate in A17. This MtSEC14 gene appears as a disease susceptibility gene. Moreover, 18.5% of the disease variation in the studied M. truncatula accessions is explained by the unique non-synonymous polymorphism between A17 and F83005.5 in MtSEC14. Root expression patterns of the SEC14 gene one day after inoculation by Va V31-2 was also analyzed in response to inoculation among a panel of 14 susceptible and resistant M. truncatula accessions of diverse geographic origins. No significant differences were found. At the same time, orthologous resistance candidate genes towards Va V31.2 in several other model species (Lotus japonicus, Arabidopsis thaliana, Nicotiana sp.) were discovered. Pathogenicity of Va V31-2 in these species was monitored to use them as potential model for functional validation. Only one orthologous gene of MtSEC14 has been identified in Medicago sativa. Because of a great synteny between M. truncatula and M. sativa, our work could be useful for alfalfa breeding. In this work and for the first time, a susceptibility gene involved in a quantitative resistance against microorganisms in Legumes was identified. Maladies racinaires Légumineuses Verticilliose Génétique d'association Résistance quantitative Validation fonctionnelle Protéine SEC14 Sensibilité
4	Exploration de la diversité des résistances génétiques à la maladie sud-américaine des feuilles de l'hévéa (Microcyclus ulei) par cartographie et génétique d'association au sein de populations naturelles Le Guen, Vincent 12 December 2008 (has links) (PDF) Menace potentielle pour l'hévéaculture mondiale, la maladie sud-américaine des feuilles de l'hévéa provoquée par le champignon Microcyclus ulei est aussi responsable du faible développement de cette culture en Amérique latine. La sélection de variétés résistantes est privilégiée pour anticiper une apparition accidentelle de la maladie dans les pays encore épargnés et pour développer la culture de l'hévéa dans les zones infestées. La principale source de résistance décrite jusqu'à présent n'est pas fonctionnelle face à des isolats très agressifs du champignon. Une autre source de résistance identifiée chez un cultivar originaire du Pérou se maintient depuis plus de trente ans en conditions de forte infestation. La cartographie génétique réalisée sur la descendance de ce cultivar en croisement révèle l'existence de deux gènes majeurs de résistance, l'un situé sur le groupe de liaison g15 et efficace contre les isolats de Guyane et l'autre sur le groupe de liaison g13 efficace vis-à-vis des isolats de l'état de Bahia. L'analyse de la diversité des populations naturelles du sud-ouest Amazonien fait apparaître une structure en trois groupes principaux recouvrant les états brésiliens de l'Acre, du Rondônia et du Mato Grosso. La population Madre de Dios au Pérou est rattachée au groupe de l'Acre. La différentiation entre les populations est expliquée principalement par l'isolement par la distance et secondairement par l'existence de bassins hydrographiques. Le déséquilibre de liaison entre marqueurs liés est plus étendu dans le groupe Acre que dans le groupe Rondônia, mais reste faible dans les deux cas. Une association avec le caractère de résistance à M. ulei est détectée avec un marqueur microsatellite situé à proximité du gène majeur de résistance du groupe de liaison g15. Une autre association est détectée dans une portion du génome où aucun locus de résistance n'était identifié jusqu'à présent. L'importance de ces résultats pour la sélection de nouveaux cultivars résistants à M. ulei est discutée. [SDV:BV] Life Sciences/Vegetal Biology Hevea brasiliensis Microcyclus ulei SALB cartographie génétique QTL microsatellites structure des populations déséquilibre de liaison génétique d'association
5	Variabilité fonctionnelle de gènes candidats de la lignification chez l’eucalyptus Mandrou, Eric 16 December 2010 (has links) La lignine représente 25% de la biomasse des végétaux terrestre. Sa quantité et sa qualité sont variables au sein des populations naturelles et sont devenues des cibles de l’amélioration génétique des eucalyptus. L’identification des polymorphismes génétiques impliqués dans la variation de ces caractères permettrait de disposer d’outils de diagnostic moléculaire pour une sélection précoce des meilleurs géniteurs et ainsi contribuer à l’augmentation des gains génétiques par unité de temps. Dans ce travail de thèse nous avons décrit la variabilité nucléotidique de gènes impliqués dans la biosynthèse des lignines, ainsi que la part de la variation génétique de ces deux caractères chez trois espèces d’Eucalyptus. En intégrant ces deux niveaux de variabilité au sein de plans de croisement factoriels, nous avons identifié des polymorphismes associés à la variation des caractères. Ces travaux posent les bases de la sélection assistée par marqueurs chez l’eucalyptus. / Lignins represent 25% of plant biomass on earth. Lignins quantity and quality vary within natural populations and have become major targets for genetic improvement of eucalyptus. Identifying genetic polymorphisms involved in the variation of these traits could provide molecular tools for early selection of plus trees and contribute to increase genetic gains expected by time units. In this thesis work, we described the nucleotide diversity of genes involved in lignin biosynthesis and the genetic part of the variation of lignins quantity and quality in three eucalyptus species. Integrating these two levels of variation in a factorial matting design, we identified Single Nucleotide Polymorphisms statistically associated to the variation of lignin quality. This work paves the way to marker assisted selection in eucalyptus. Lignines Eucalyptus Génétique d'association Polymorphisme d'un seul nucléotide Gènes candidats Lignins Eucalyptus Association study Single Nucleotide Polymorphism Candidate genes
6	Modélisation pangénomique du déséquilibre de liaison à l'aide de réseaux bayésiens hiérarchiques latents et applications Mourad, Raphaël 22 September 2011 (has links) (PDF) Les récentes technologies génomiques à haut-débit ont ouvert la voie aux études d'association visant la caractérisation systématique à l'échelle du génome des facteurs génétiques impliqués dans l'apparition des maladies génétiques complexes, telles que l'asthme et le diabète. Dans ces études, le déséquilibre de liaison (linkage disequilibrium, LD) reflète l'existence de dépendances complexes au sein des données génétiques et joue un rôle central, puisqu'il permet une localisation précise des facteurs génétiques. Néanmoins, la haute complexité du LD, ainsi que la dimension élevée des données génétiques, constituent autant de difficultés à prendre en compte. Les travaux de recherche réalisés au cours de cette thèse se sont placés dans cette perspective. La contribution des travaux de recherche présentés est double, puisqu'elle est à la fois théorique et appliquée. Sur le plan théorique, nous avons proposé une nouvelle approche de modélisation du LD. Elle est basée sur le développement d'un modèle issu du domaine de l'intelligence artificielle et de l'apprentissage automatique, la forêt de modèles hiérarchiques à classes latentes (FMHCL). Les nouveautés les plus significatives introduites sont la possibilité de prendre en compte la nature floue du LD et de hiérarchiser les différents degrés de LD. Un nouvel algorithme d'apprentissage supportant le passage à l'échelle, nommé CFHLC, a été développé et décliné en deux versions: la première nécessitant le découpage du génome en fenêtres contiguës pour résoudre le problème de passage à l'échelle, et la seconde (CFHLC+), plus récente et évoluée, résolvant le problème au moyen d'une fenêtre glissante sur le chromosome. A l'aide d'un jeu de données réelles, la comparaison de la méthode CFHLC avec des méthodes concurrentes a montré qu'elle offre une modélisation plus fine du LD. En outre, l'apprentissage sur des données présentant des patrons de LD variés a démontré la capacité de la FMHCL a reproduire fidèlement la structure du LD. Enfin, l'analyse empirique de la complexité de l'apprentissage a montré la linéarité en temps lorsque le nombre de variables à traiter augmente. Sur le plan appliqué, nous avons exploré deux pistes de recherche: la recherche de causalités et la visualisation synthétique et intuitive du LD. D'une part, une étude systématique de la capacité des FMHCL à la recherche de causalités est illustrée dans le contexte de la génétique d'association. Ce travail a établi les bases du développement de nouvelles méthodes de recherche dédiées à la découverte de facteurs génétiques causaux pour les études d'association à l'échelle du génome. D'autre part, une méthode a été développée pour la visualisation synthétique et intuitive du LD adaptée aux trois principales situations que peut rencontrer le généticien: la visualisation du LD de courte distance, de longue distance et dans un contexte pangénomique. Cette nouvelle méthode apporte des atouts majeurs qui sont les suivants: (i) le LD par paires (deux variables) et le LD multilocus (deux variables ou plus) sont simultanément visualisés, (ii) le LD de courte distance et le LD de longue distance sont facilement distingués, et (iii) l'information est synthétisée de manière hiérarchique. [SDV] Life Sciences Génétique d'association pangénomique Déséquilibre de liaison Réseaux bayésiens Apprentissage automatique
7	Étude de l’adaptation du mil à la variation climatique : analyse phénotypique, d’association génotype / phénotype et de sélection / Study of the adaptation of pearl millet to climate variation : phenotypic analysis, association of genotype / phenotype and selection Issaka Salia, Ousseini 15 November 2016 (has links) En Afrique subsaharienne, une large partie de la population pratique l’agriculture pluviale. Cette agriculture est particulièrement sensible à la variabilité climatique. Le mil (Pennisetum glaucum L Br) est une des céréales pluviales qui jouent un rôle majeur dans la sécurité alimentaire en Afrique subsaharienne. L’apparenté sauvage du mil cultivé pousse dans des environnements encore plus extrêmes que la forme cultivée. L’objectif de la thèse est l’étude de l’adaptation du mil à la variation environnementale. En utilisant des approches d’association génotype /phénotype, nous avons démontré que le gène de la myosine 11 est associé à la variation du nombre de fleurs chez le mil sauvage observée le long d’un gradient environnemental. En plus, ce gène a également été identifié dans les candidats pour les gènes sélectionnés durant la domestication. En utilisant des données génomiques, nous avons aussi démontré que le gène du Photochrome C déjà connu pour son rôle dans le contrôle de la variation du temps de floraison chez le mil cultivé, est aussi associé à la variation du temps de floraison chez le mil sauvage. Nous avons aussi démontré l'existence d'un polymorphisme fonctionnel cryptique (caché) qui n’apparaît que dans certaines conditions particulières associées au temps de floraison. Ce polymorphisme cryptique peut être mobilisé dans des conditions climatiques ou environnementales particulières. Chez le mil cultivé, nous avons aussi pu mettre en évidence la sélection in situ sur deux gènes de floraison. Nos résultats suggèrent que de nombreux polymorphismes associés à l’adaptation sont présents dans les populations et peuvent être partagés entre forme sauvage et cultivée. En réponse aux changements environnementaux, ces polymorphismes pourraient être mobilisés pour proposer des variétés mieux adaptées. / In sub-Saharan Africa, a large fraction of the population practice rainfed agriculture. Rainfed agriculture is particularly sensitive to climate variability. Pearl millet (Pennisetum glaucum L R) is one of the main cereals that play an important role in food security in sub-Saharan Africa. Wild pearl millet populations grow also in more extreme climate conditions up to the limit of the desert. The aim of this PhD was to study pearl millet adaptation to climate variation. Using an association genotype / phenotype approach, we demonstrated that the myosin 11 gene is associated with flower number variation in wild millet along an environmental gradient. Interestingly, this gene was also a candidate gene target of selection during domestication. The Myosin XI gene is thus a good candidate for fitness related adaptation in wild populations. We also demonstrated that Photochrome C gene, already known for its role in cultivated pearl millet, is also related to flowering time variation in wild pearl millet. We have demonstrated the existence of cryptic functional polymorphisms associated with flowering time. Such cryptic functional polymorphism might contribute to adaptation in specific new environment. In cultivated pearl millet, we also show in situ selection on two flowering genes. Our results suggest that the functional polymorphisms are observed in these populations, some genes are also associated with both adaptations in wild and cultivated populations. In response to environmental changes, such polymorphism could be used to propose better adapted cultivated varieties. Pennisetum glaucum Variation climatique Adaptation Génétique d'association Génétique des populations Amélioration Pennisetum glaucum Climate variation Adaptation Association genetic Population genetics Improvement
8	Développement de méthodes statistiques pour l'identification de gènes d'intérêt en présence d'apparentement et de dominance, application à la génétique du maïs / Development of Statistical Methods for the Identification of Interesting Genes with Relatedness and Dominance, Application to the Maize Genetic Laporte, Fabien 13 March 2018 (has links) La détection de gènes est une étape importante dans la compréhension des effets de l'information génétique d'un individu sur ses caractères phénotypiques. Durant mon doctorat, j'ai étudié les méthodes statistiques pour conduire les analyses de génétique d'association, avec les hybrides de maïs comme modèle d'application. Je me suis tout d'abord intéressé à l'estimation des paramètres d'apparentement entre individus à partir de données de marqueurs bialléliques. Cette estimation est réalisée dans le cadre d'un modèle de mélange paramétrique. J'ai étudié l'identifiabilité de ce modèle dans un cadre général mais aussi dans un cadre plus spécifique où les individus étudiés étaient issus de croisements entre lignées, cadre représentatif des plans de croisement classiquement utilisés en génétique végétale. Je me suis ensuite intéressé à l'estimation des paramètres des modèles mixtes à plusieurs composantes de variance et plus particulièrement à la performance des algorithmes pour tester l'effet de très nombreux marqueurs. J'ai comparé pour cela des logiciels existants et optimisé un algorithme Min-Max. La pertinence des différentes méthodes développées a finalement été illustrée dans le cadre de la détection de QTL à travers une analyse d'association réalisée sur un panel d'hybrides de maïs. / The detection of genes is a first step to understand the impact of the genetic information of individuals on their phenotypes. During my PhD, I studied statistical methods to perform genome-wide association studies, with maize hybrids as an application case. Firstly, I studied the inference of relatedness coefficients between individuals from biallelic marker data. This estimation is based on a parametric mixture model. I studied the identifiability of this model in the generic case but also in the specific case of mating design where observed individuals are obtained by crossing lines, a representative case of classical mating design in plant genetics. Then I studied inference of variance component mixed model parameters and particularly the performance of algorithms to test effects of numerous markers. I compared existing programs and I optimized a Min-Max algorithm. Relevance of developed methods had been illustrated for the detection of QTLs through a genome-wide association analysis in a maize hybrids panel. Modèle de mélange Modèle mixte Identifiabilité Apparentement Génétique d'Association Mixture model Mixed model Identifiability Relatedness Genome-Wide Association Studies
9	Contribution des variations structurales de type insertions/délétions à l'adaptation, la variation des caractères et les performances hybrides chez le maïs / Contribution of insertions/deletions-type structural variations to adaptation, phenotypic variation and hybrid performances in maize Mabire, Clément 23 April 2019 (has links) Le récent développement des méthodes de séquençage permet aujourd’hui d’identifier des variations structurales chez de nombreuses espèces. Chez le maïs, des milliers de grandes insertions et délétions (InDel) de quelques pb à plusieurs centaines de Kbp ont été découvertes entre le génome de référence B73 et de nombreux autres génomes reséquencés. Ces InDel peuvent changer la composition des gènes entre les individus et donc être impliquées dans la variation du phénotype, mais cet effet sur le phénotype reste mal connu. L’objectif de cette thèse était d'étudier la contribution des InDel à l'adaptation, aux variations phénotypiques et aux performances hybrides chez le maïs. Nous avons développé une puce de génotypage des InDel Affymetrix® Axiom® capable de génotyper 105 927 InDel de 35bp à 129,7Kbp. 79 969 de ces InDel ont leur séquences absentes du génome de référence B73 et ont été identifiées par l’assemblage 3 génomes (F2, C103, and PH207). Nous avons sélectionné 61 492 InDel polymorphiques pour génotyper 362 lignées de maïs représentant une large gamme de diversité pour étudier la contribution des InDel à la diversité génétique, l’adaptation et la variation des caractères. Nous avons également génotypé 1 million de SNP à partir de deux puces de génotypage et du génotypage par séquençage pour étudier la complémentarité entre les InDel et les SNP. Qu’ils soient calculés avec les InDel ou les SNP la structuration génétique et les valeurs d’apparentement entre les lignées sont très similaires, ce qui suggère que la plupart des InDel ont suivi la même trajectoire évolutive que les SNP. 51% des InDel ne sont pas en déséquilibre de liaison élevé (>0.8) avec aucun SNP proche donc l’effet de ces InDel n’est donc a priori pas capturé pas des SNP à cette densité. Parmi les 294 régions génomiques associées au phénotype (QTL), 13 nouveaux QTL ont été détectés grâce aux InDel par rapport aux SNP par une approche de génétique d’association (GA). Nous avons détecté un enrichissement en InDel sous sélection entre les lignées tropicales, cornées et dentées par rapport aux SNP, avec 56 sur 188 régions sous sélection détectées avec les InDel. Ces régions contiennent des gènes impliqués dans l’adaptation et/ou la tolérance aux stress. De plus, le plus grand nombre d’associations a été découvert pour la floraison, caractère adaptatif chez le maïs. Ces résultats suggèrent que les InDel sont plus souvent impliquées dans l’adaptation et la tolérance aux stress. Nous avons enfin testé l’effet des InDel sur les performances hybride en analysant un panel de 287 hybrides issus du croisement de 210 lignées tempérées du panel précédent. Nous avons décomposé la variance des performances hybrides en distinguant les effets de dominance et d’additivité pour la floraison femelle (FF), la hauteur (PH) et le rendement (GY). La plus forte part de dominance et d’interaction génotype-environnement a été observée pour le GY et la plus faible pour la FF. L’effet additif et de dominance de 51,844 InDel et 469 267 SNP a été testé pour 4 combinaisons d’environnements par une approche de GA. 78 et 133 QTL avec un effet additif et dominant respectivement ont été identifiés, dont 6 et 11 avec des InDel. 83% de ces QTL ont été identifiés dans une seule combinaison d’environnements. Un des QTL de rendement identifié avec des InDel est situé dans un large cluster d’InDel sur le chromosome 6 et colocalise avec un QTL déjà identifié avec des SNP avec un effet fort dans l’augmentation du rendement sous des températures élevées. L’ajout de l’effet de dominance en plus de l’effet additif permet d’augmenter la précision des prédictions génomiques jusqu’à 5,6% pour le rendement. Cependant, l’ajout du génotypage des InDel en plus de celui des SNP n’a pas permis d’améliorer les prédictions des phénotypes hybrides. / In the last decades, the rapid development of genome sequencing allowed to identify structural variations in many species. In maize, thousands of large insertions and deletions (InDels) from few bp to hundreds of Kbp were discovered by comparing the reference genome B73 and many other resequenced genomes. These InDel sequences can carry genes and therefore be involved in phenotypic variation by changing the gene composition between individuals, but their effect on phenotype was not well studied. The aim of this thesis was to study the contribution of InDels to adaptation, phenotypic variations and hybrid performances in maize. We developed an Affymetrix® Axiom® genotyping array that allowed to genotype 105,947 InDels sequences ranging from 35bp to 129,7Kbp of size. 79,969 out 105,947 sequences of these InDels were not present in B73 reference genome and have been discovered by assembling three genomes (F2, C103, and PH207). We selected 61,492 polymorphic InDels to genotype a 362 maize inbred lines panel representing a broad range of diversity to study the contribution of InDels to genetic diversity, adaptation and trait variation. We also assembled one million of SNPs from two genotyping arrays and genotyping by sequencing to study the complementarity between InDels and SNPs. Genetic structuration and relatedness between inbred lines displayed by SNPs or by InDels were highly similar suggesting that almost all indels and SNPs followed a similar evolutionary trajectory. 51% of InDels were not in high linkage disequilibrium (LD>0.8) with any nearby SNP suggesting that the effect of these InDels was not be well captured using this density of SNP. Thanks to InDels, we detected 13 new quantitative trait loci (QTLs) among 294 QTLs identified for 23 traits by a genome wide association studies (GWAS). Similarly, 56 out 188 regions under selection between tropical, dent and flint maize lines were identified by InDels leading to an enrichment of genomic regions under selection detected by InDels compared to SNPs. These InDels include genes involved in tolerance to biotic and abiotic stress and/or adaptive traits as flowering time. Accordingly, the highest number of associated InDels was found for flowering time. These results suggest that InDels were often involved in adaptation and stress tolerance. In order to study the effect of InDels on hybrid performances, we analyzed a panel of 287 hybrids derived from the crossing of 210 maize temperate inbred lines from the previous panel. We decomposed the variance of female flowering (FF), plant height (PH) and grain yield (GY) by distinguishing the additive and dominant genetic effects. We observed the highest dominance and genotype by environment effects for GY and the lowest for FF. We performed GWAS on this panel by testing additive and dominance effects of 51,844 InDels and 469,267 SNPs on these three traits in 4 different environment combinations. We identified 78 and 133 QTLs with an additive and dominance effect, respectively including 6 and 11 QTLs discovered only by InDels. 83% of all QTLs were found with only one environment combination. One QTL for GY detected with InDels was located in a large cluster of InDels on chromosome 6, previously identified to have a strong effect on GY in heat conditions. We finally used InDels and/or SNPs genotyping to predict hybrid performances. Whereas including a dominance effect in genomic prediction models increased by 1.5 to 5.6% predictive abilities (PA) for GY, including InDels genotyping did not increased PA. Maïs Variations structurales Insertions Délétions Génétique d'association Génotypage Maize Structural variations Insertions Deletions Genome wide association studies Genotyping
10	Exploration du polymorphisme moléculaire et protéique de la tomate pour l'identification de QTL de qualité du fruit Xu, Jiaxin 31 October 2012 (has links) (PDF) L'amélioration de la qualité du fruit de tomate dépend largement de la variation génétique. A la suite de la domestication et de la sélection moderne, la diversité moléculaire chez la tomate a été profondément réduite, limitant les possibilités d'amélioration. De nouveaux marqueurs moléculaires révélant les polymorphismes nucléotidiques (SNP) constituent des outils précieux pour saturer les cartes génétiques et identifier des QTL (quantitative trait loci) et des associations chez une espèce peu polymorphe comme la tomate. Les objectifs de cette étude étaient de caractériser la diversité génétique de la tomate au niveau moléculaire et de tenter d'identifier des QTL, des gènes et des protéines responsables de la variation de caractères de qualité du fruit. Pour cela, trois études indépendantes ont conduit à (1) la découverte de nouveaux marqueurs SNP, (2) leur utilisation en génétique d'association et (3) l'analyse de la diversité du protéome en relation avec des caractères physiologiques du fruit.Dans la première étude, nous avons comparé deux plateformes de reséquençage pour reséquencer des zones ciblées couvrant environ 0.2% du génome de deux accessions contrastées. Plus de 3000 SNP sont été identifiés. Nous avons ensuite validé 64 SNPs en développant des marqueurs CAPS. Nous avons ainsi montré l'intérêt des techniques de reséquençage pour la découverte de SNP chez la tomate et produit des marqueurs simples qui peuvent être utiles pour caractériser de nouvelles ressources.Nous avons ensuite développé un ensemble de 192 SNPs et génotypé une collection de 188 accessions comportant des accessions cultivées, des types "cerise" et des formes sauvages apparentées et recherché des associations avec 10 caractères de qualité du fruit. Une quarantaine d'associations a été détectée dans des régions où des QTL avaient été préalablement identifiés. D'autres associations ont été identifiées dans de nouvelles régions. Nous avons ainsi confirmé le potentiel de la génétique d'association pour la découverte de QTL chez la tomate. Finalement une approche combinant l'analyse du protéome, du métabolome et de traits phénotypiques a été mise en oeuvre pour étudier la variabilité naturelle de la qualité du fruit de huit lignées contrastées et de quatre de leurs hybrides, à deux stades de développement (expansion cellulaire et orange-rouge). Nous avons identifié 424 spots protéiques variables en combinant électrophorèse bidimensionnelle et nano LC MS/MS et construit une carte de référence du protéome de fruit de tomate. En parallèle, nous avons mesuré la variation de teneurs en 34 métabolites, les activités de 26 enzymes et cinq caractères phénotypiques. La variabilité génétique et les modes d'hérédité ont été décrits. L'intégration des données a été réalisée par construction de réseaux de corrélations et régression sPLS. Plusieurs associations ont été détectées intra et inter niveau d'expression, permettant une meilleure compréhension de la variation de la qualité des fruits de tomate Tomate Qualité des fruits Marqueurs moléculaires QTL Génétique d'association Protéome Biologie des systèmes

Search results