• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 23
  • 5
  • Tagged with
  • 27
  • 27
  • 14
  • 14
  • 13
  • 9
  • 8
  • 8
  • 7
  • 7
  • 5
  • 5
  • 5
  • 5
  • 4
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
21

Méthodes statistiques pour identifier l'adaptation locale dans les populations continues et mélangées / Statistical Methods to Identify Local Adaptation in Continuous and Admixed Populations

Martins, Helena 26 September 2018 (has links)
La recherche des signatures génétiques de l'adaptation locale est d'un grand intérêt pour de nombreuses études de génétique des populations. Les approches pour trier les loci sélectifs à partir de leur contexte génomique, se concentrent sur les valeurs extrêmes de l'indice de fixation, FST, à travers les loci. Cependant, le calcul de l'indice de fixation devient difficile lorsque la population est génétiquement continue, lorsque la prédéfinition des sous-populations est une tâche difficile et en présence d'individus mélangés dans l'échantillon. Dans cette thèse, nous présentons une nouvelle méthode pour identifier les loci sous sélection basée sur une extension de la statistique FST à des échantillons avec des individus mélangés. Considérant notre objectif d'explorer des méthodes statistiques pour identifier l'adaptation locale dans la population mélangée, nous avons inclus des données spatiales pour calculer les coefficients d'ascendance et les fréquences d'allèles. Pour enrichir notre travail, nous avons investigué les effets du déséquilibre de liaison et des méthodes d'élagage de LD dans les analyses de génomes pour la sélection. / Finding genetic signatures of local adaptation is of great interest for many population genetic studies. Common approaches to sorting selective loci from their genomic background focus on the extreme values of the fixation index, FST, across loci. However, the computation of the fixation index becomes challenging when the population is genetically continuous, when predefining subpopulations is a difficult task, and in the presence of admixed individuals in the sample. In this thesis, we present a new method to identify loci under selection based on an extension of the FST statistic to samples with admixed individuals. Considering our goal of exploring statistical methods to identify local adaptation in admixed population, we included spatial data to compute ancestry coefficients and allele frequencies. To enrich our work, we investigated the effects of linkage disequilibrium and LD-pruning methods in genome scans for selection.
22

Hunting for causal variants in microbial genomes

Chen, Peter 11 1900 (has links)
L'un des objectifs centraux de la biologie est de comprendre comment l'ADN, la séquence primaire, donne lieu à des traits observables. À cette fin, nous examinons ici des méthodes pour identifier les composants génétiques qui influencent les traits microbiens. Par « identifier », nous entendons l'élucidation à la fois l'état allélique et de la position physique de chaque variante causale d'un phénotype d'intérêt à la résolution des nucléotides de paires de bases. Nous nous sommes concentrés sur les études d'association génomique (genome-wide association studies; GWAS) en tant qu'approche générale d’étudier l'architecture génétique des traits. L'objectif global de cette thèse était d'examiner de manière critique les méthodologies GWAS et de les considérer en pratique dans des populations microbiennes fortement clonales et non- clonales (i.e. avec recombinaison fréquent). Le domaine de la GWAS microbienne est relativement nouveau par rapport aux quinze dernières années de la GWAS humaine, et en tant que tel, nous avons commencé par un examen de l'état de la GWAS microbienne. Nous avons posé deux questions principales : 1) Les méthodes GWAS humaines fonctionnent-elles facilement et sans modification pour les populations microbiennes ? 2) Et sinon, quels sont les problèmes méthodologiques centraux et les modifications nécessaires pour la GWAS microbienne? À partir de ces résultats, nous avons ensuite détaillé le déséquilibre de liaison (linkage disequilibrium; LD) comme principal obstacle dans la GWAS microbien, et nous avons présenté une nouvelle méthode, POUTINE, pour relever ce défi en exploitant les mutations homoplasiques pour briser implicitement la structure LD. Le reste de la thèse présente à la fois les méthodes traditionnelles GWAS (comptage des allèles) et POUTINE (comptage d’homoplasies) appliquées à une population hautement recombinogène de génomes de vibrions marins. Malgré une taille d'échantillon modeste, nous donnons un premier aperçu de l'architecture génétique de la résistance aux bactériophages dans une population naturelle, tout en montrant que les récepteurs des bactériophages jouent un rôle primordial. Ce résultat est en pleine cohérence avec des expériences en laboratoire de coévolution phage-bactérie. Il est important de noter que cette architecture met en évidence à quel point la sélection positive peut sculpter certains traits microbiens différemment de nombreux traits complexes humains, qui sont généralement soumis à une faible sélection purificatrice. Plus précisément, nous avons identifié des mutations à effet important à haute fréquence qui sont rarement observées dans les phénotypes complexes humains où de nombreuses mutations à faible effet contribuent à l'héritabilité. La thèse se termine par des perspectives sur les voies à suivre pour la GWAS microbienne. / One of the central goals of biology is to understand how DNA, the primary sequence, gives rise to observable traits. To this aim, we herein examine methods to identify the genetic components that influence microbial traits. By "identify" we mean the elucidation of both the allelic state and physical position of each causal variant of a phenotype of interest down to the base-pair nucleotide resolution. Our focus has been on genome-wide association studies (GWAS) as a general approach to dissecting the genetic architecture of traits. The overarching aim of this thesis was to critically examine GWAS methodologies and to consider them in practice in both strongly clonal and highly recombining microbial populations. The field of microbial GWAS is relatively new compared to the over fifteen years of human GWAS, and as such, we began this work with an examination of the state of microbial GWAS. We asked and attempted to answer two main questions: 1) Do human GWAS methods readily work without modification for microbial populations? 2) And if not, what are the central methodological problems and changes that are required for a successful microbial GWAS? Building from these findings, we then detailed linkage disequilibrium (LD) as the primary obstacle in microbial GWAS, and we presented a new method, POUTINE, to address this challenge by harnessing homoplasic mutations to implicitly break LD structure. The remainder of the thesis showcases both traditional GWAS methods (allele counting) and POUTINE applied to a highly recombining population of marine vibrio genomes. Despite a small sample size, we provide a first glimpse into the genetic architecture of bacteriophage resistance in a natural population and show that bacteriophage receptors play a primary role consistent with experimental populations of phage-bacteria coevolution. Importantly, this architecture highlights how strong positive selection can sculpt some microbial traits differently than many human complex traits, which are generally under weak purifying selection. Specifically, we identified common frequency, large-effect mutations that are rarely observed in human complex phenotypes where many low-effect mutations are thought to contribute to the bulk of heritability. The thesis concludes with perspectives on ways forward for microbial GWAS.
23

Détection et validation fonctionnelle de régions du génome affectant la résistance aux strongles gastro-intestinaux chez le mouton / Detection and functional validation of genomic reigons affecting resistance to gastro-intestinal nematodes in sheep

Sallé, Guillaume 17 December 2012 (has links)
Les strongles gastro-intestinaux, dont Haemonchus contortus constituent un problème majeur pour l'élevage des ovins allaitants. Ils entrainent des pertes de production et le recours aux anthelminthiques est remis en question par l'apparition de souches de vers résistantes. La sélection d'ovins plus résistants fait partie des stratégies complémentaires de lutte les plus sérieuses. Cependant sa mise en oeuvre requiert une meilleure compréhension des mécanismes sous-jacents. Cette thèse vise à identifier les régions du génome ovin impliquées dans la résistance aux strongles gastro-intestinaux. Une analyse statistique d'association entre des marqueurs génétiques et des mesures de résistance d'un troupeau d'ovins croisés Martinik Black-belly x Romane a mis en évidence un nombre limité de régions d'intérêt. Parmi celles-ci, un segment du chromosome 12 a été choisi pour effectuer des accouplements raisonnés et valider son rôle dans la résistance à H. contortus. L'effet de cette région a été validé chez les descendants issus d'accouplements assistés par marqueurs génétiques. Cette région semble limiter fertilité des vers femelles tout en contribuant à une réponse immunitaire plus forte. Le rôle d'une région du chromosome 21 dans la variation de concentration plasmatique en pepsinogène, un marqueur de lésions abomasales, a également été confirmé. Un gène candidat sous-jacent est en cours de séquençage et l'analyse des polymorphismes devrait contribuer à la validation de son rôle. Deux autres gènes très proches pourraient également être impliqués et mériteraient une considération future. Ces travaux illustrent à la fois la variation génétique disponible pour les caractères de résistance à H. contortus et la complexité des mécanismes mis en jeu. Des études complémentaires de séquençage et d'étude d'expression par séquençage devrait contribuer à une meilleure compréhension des fonctions des gènes impliqués et de leurs interactions. / Gastro-intestinal nematodes, among which Haemonchus contortus are a major threat to the meat sheep industry. They are responsible for production losses and the apparition of worm populations resistant to drugs limits their use as worm control strategy. Breeding more resistant sheep is among the most practicable alternative strategy. However its implementation requires a deeper understanding of underlying mechanisms. This PhD aims at identifying regions of the ovine genome affecting resistance to gastro-intestinal nematodes. A statistical analysis of existing associations between genetic markers and resistance traits of a Martinik Black-belly x Romane cross-bred sheep flock unraveled a limited number of key players. Among these, a fragment of the chromosome 12 was chosen to perform marker-assisted matings and to validate its role in resistance to H. contortus. The effect of this region was validated in the progenies born from matings. It seems this chromosomic fragment limits female worms fertility and is associated to a stronger immune response. The putative role played by a fragment of the chromosome 21 in plasmatic pepsinogen concentration (a biomarker of abomasal lesions) was also confirmed in this work. A candidate gene underlying this region has been sequenced and the analysis of the detected polymorphisms should confirm its role. Further, two other genes in its vicinity could also play a role in this biological phenomenon and they should also deserve future considerations. This work illustrated both the existing genetic variation for resistance to H. contortus and the associated complexity of underlying mechanisms. Additional sequencing and gene expression sequencing studies should help understanding gene functions and interactions.
24

Bases génétiques de la résistance à la sécheresse chez le riz : des QTLs aux gènes et des gènes aux allèles

Courtois, Brigitte 09 June 2008 (has links) (PDF)
L'objectif scientifique de mon travail de recherche et d'encadrement d'étudiants a principalement concerné la détermination des bases génétiques de la résistance à la sécheresse du riz. Une partie de ces travaux ont été menés à l'Institut International de Recherche sur le Riz aux Philippines, dans le cadre d'un programme de sélection du riz pluvial pour l'Asie du Sud et du Sud-Est. Le riz pluvial ne dépend que la pluviométrie pour son alimentation hydrique et souffre donc de déficits hydriques fréquents. La nature des sécheresses rencontrées dans les environnements cibles m'ont conduite à travailler plus particulièrement sur la morphologie du système racinaire et sur l'ajustement osmotique. L'approche choisie a été celle de la génétique moléculaire. Les travaux conduits ont permis des progrès dans la compréhension du déterminisme génétique de ces caractères et la localisation de QTL d'intérêt dans des populations de cartographie classique, puis des populations de back-cross avancés, plus adaptées à un programme de sélection. Des lignées quasi isogéniques introgressées avec des QTLs de profondeur racinaire ont été produites par sélection assistée par marqueurs et utilisées pour valider l'existence et l'effet des QTLs. <br /> Mon projet de recherche actuel conduit à Montpellier dans l'UMR "Développement et Amélioration des Plantes" se situe dans la continuité des travaux précédents. Il consiste à relier les nombreux QTL de morphologie racinaire identifiés à ce jour chez le riz aux gènes sous jacents, puis à analyser la variabilité allélique de ces gènes dans différents fonds génétiques. Plusieurs approches complémentaires seront utilisées pour réaliser la cartographie fine des QTLs. La large gamme de données disponibles va d'abord être utilisée pour affiner la position des QTLs par une approche statistique de méta-analyse. L'approche d'étude d'association a également été retenue ce qui suppose, en préalable, de clarifier l'étendue du déséquilibre de liaison chez le riz. Des approches au niveau du génome entier seront suivies d'approches ciblées sur des gènes candidats, en ayant largement recours aux données de séquençage total du génome de 2 variétés de riz et de séquençage partiel de 20 autres. Enfin, en utilisant les lignées quasi-isogéniques produites à l'IRRI, le clonage d'un QTL de profondeur racinaire a été entrepris.<br /> L'intégration de ces approches de génétique directe avec les approches complémentaires de génétique inverse utilisées par d'autres personne de l'équipe "Développement et adaptation du riz" se fera autour des gènes dont la fonction aura été validée. La combinaison des allèles les plus adaptés aux environnements cibles dans des variétés d'élite constituera le but ultime de mon travail.
25

Invasion, démographie et évolution : le cas de l'hybridation / Invasion, demography and evolution : the case of hybridization

Bermond, Gérald 16 December 2013 (has links)
Cette thèse s’inscrit dans le contexte de la biologie de l’invasion de la chrysomèle des racines du maïs, Diabrotica virgifera virgifera (Dvv), en Europe. Les introductions multiples de cette peste sur le vieux continent à partir des années 1990 et en provenance des États-Unis ont conduit à la formation de plusieurs foyers envahissants dont deux principaux, différenciés génétiquement et situés en Italie du Nord-Ouest (Italie NO) et en Europe Centrale et du Sud-Est (Europe CSE). Ces deux foyers sont entrés en contact en 2008, en Italie du Nord, dans la région de la Vénétie. L’objectif principal de ces trois années de recherche était de détecter, d’étudier et de documenter un cas précis d’hybridation au cours d’une invasion biologique. Dans un premier temps, j'ai montré que la zone de contact détectée en Vénétie résultait bien en une zone hybride. Pour cela plusieurs types d’analyses de génétique des populations ont été réalisés à l’aide de marqueurs micro-satellites. Dans un second temps, j'ai exploité cette zone hybride et utilisé la théorie des clines neutres et le déséquilibre de liaison pour estimer la dispersion (σ) de Dvv en Italie du Nord aux alentours de 20 km.génération−1/2. Enfin j'ai montré l’absence d'impact de l’hybridation au cours de l’invasion européenne de Dvv in natura, en mesurant sur des génotypes hybrides et parentaux, de nombreux traits phénotypiques positivement liés à la fitness des individus. Ainsi, une sélection ou contre sélection des hybrides est à exclure dans ce cas précis d’hybridation et la dynamique de l’invasion de cette peste en Europe ne devrait être affectée en aucune façon. / This thesis deals with the invasion biology of the western corn rootworm, (WCR) in Europe. Multiple introductions of this pest in Europe from the United States and the 90’s, led to the formation of two main invasive outbreaks, genetically differentiated and located in Northwest Italy (NW Italy) and in Central and South-Eastern Europe (CSE Europe). Both outbreaks converged towards each other and came into contact in 2008, in the region of Veneto (Northern Italy). The main objective of these three years of research was to detect study and document a precise case of hybridization during a biological invasion. First of all, I showed that the contact zone detected in Veneto results in a hybrid zone. For that, several types of population genetics analyses were performed using microsatellite markers. In a second time, I exploited this hybrid zone and used the theory of neutral clines and the linkage disequilibrium to estimate dispersal (σ) of WCR in Northern Italy around 20 km.generation-1/2. Finally I showed the absence of impact of hybridization in the european invasion of WCR in natura, by measuring on hybrid and parental genotypes, numerous phenotypic traits positively associated to the fitness of individuals. Thus, a selection or a selection against hybrids is excluded in this particular case of hybridization and the invasion dynamics of WCR in Europe should not be affected in any way.
26

Optimisation des méthodes statistiques d'analyse de la variabilité des caractères à l'aide d'informations génomiques / Optimization of statistical methods using genomic data for QTL detection

Jacquin, Laval 10 October 2014 (has links)
L’avènement du génotypage à haut débit permet aujourd’hui de mieux exploiter le phénomène d’association, appelé déséquilibre de liaison (LD), qui existe entre les allèles de différents loci sur le génome. Dans ce contexte, l’utilité de certains modèles utilisés en cartographie de locus à effets quantitatifs (QTL) est remise en question. Les objectifs de ce travail étaient de discriminer entre des modèles utilisés en routine en cartographie et d’apporter des éclaircissements sur la meilleure façon d’exploiter le LD, par l’utilisation d’haplotypes, afin d’optimiser les modèles basés sur ce concept. On montre que les modèles uni-marqueur de liaison, développés en génétique il y a vingtaine d’années, comportent peu d’intérêts aujourd’hui avec le génotypage à haut débit. Dans ce contexte, on montre que les modèles uni-marqueur d’association comportent plus d’avantages que les modèles uni-marqueur de liaison, surtout pour des QTL ayant un effet petit ou modéré sur le phénotype, à condition de bien maîtriser la structure génétique entre individus. Les puissances et les robustesses statistiques de ces modèles ont été étudiées, à la fois sur le plan théorique et par simulations, afin de valider les résultats obtenus pour la comparaison de l’association avec la liaison. Toutefois, les modèles uni-marqueur ne sont pas aussi efficaces que les modèles utilisant des haplotypes dans la prise en compte du LD pour une cartographie fine de QTL. Des propriétés mathématiques reliées à la cartographie de QTL par l’exploitation du LD multiallélique capté par les modèles haplotypiques ont été explicitées et étudiées à l’aide d’une distance matricielle définie entre deux positions sur le génome. Cette distance a été exprimée algébriquement comme une fonction des coefficients du LD multiallélique. Les propriétés mathématiques liées à cette fonction montrent qu’il est difficile de bien exploiter le LD multiallélique, pour un génotypage à haut débit, si l’on ne tient pas compte uniquement de la similarité totale entre des haplotypes. Des études sur données réelles et simulées ont illustré ces propriétés et montrent une corrélation supérieure à 0.9 entre une statistique basée sur la distance matricielle et des résultats de cartographie. Cette forte corrélation a donné lieu à la proposition d’une méthode, basée sur la distance matricielle, qui aide à discriminer entre les modèles utilisés en cartographie. / The advent of high-throughput genotyping nowadays allows better exploitation of the association phenomenon, called linkage disequilibrium (LD), between alleles of different loci on the genome. In this context, the usefulness of some models to fine map quantitative trait locus (QTL) is questioned. The aims of this work were to discriminate between models routinely used for QTL mapping and to provide enlightenment on the best way to exploit LD, when using haplotypes, in order to optimize haplotype-based models. We show that single-marker linkage models, developed twenty years ago, have little interest today with the advent of high-throughput genotyping. In this context, we show that single-marker association models are more advantageous than single-marker linkage models, especially for QTL with a small or moderate effect on the phenotype. The statistical powers and robustness of these models have been studied both theoretically and by simulations, in order to validate the comparison of single-marker association models with single-marker linkage models. However, single-marker models are less efficient than haplotype-based models for making better use of LD in fine mapping of QTL. Mathematical properties related to the multiallelic LD captured by haplotype-based models have been shown, and studied, by the use of a matrix distance defined between two loci on the genome. This distance has been expressed algebraically as a function of the multiallelic LD coefficients. The mathematical properties related to this function show that it is difficult to exploit well multiallelic LD, for a high-throughput genotyping, if one takes into account the partial and total similarity between haplotypes instead of the total similarity only. Studies on real and simulated data illustrate these properties and show a correlation above 0.9 between a statistic based on the matrix distance and mapping results. Hence a new method, based on the matrix distance, which helps to discriminate between models used for mapping is proposed.
27

La consanguinité à l'ère du génome haut-débit : estimations et applications / Consanguinity in the High-Throughput Genome Era : Estimations and Applications

Gazal, Steven 24 June 2014 (has links)
Un individu est dit consanguin si ses parents sont apparentés et s’il existe donc dans sa généalogie au moins une boucle de consanguinité aboutissant à un ancêtre commun. Le coefficient de consanguinité de l’individu est par définition la probabilité pour qu’à un point pris au hasard sur le génome, l’individu ait reçu deux allèles identiques par descendance qui proviennent d’un seul allèle présent chez un des ancêtres communs. Ce coefficient de consanguinité est un paramètre central de la génétique qui est utilisé en génétique des populations pour caractériser la structure des populations, mais également pour rechercher des facteurs génétiques impliqués dans les maladies. Le coefficient de consanguinité était classiquement estimé à partir des généalogies, mais des méthodes ont été développées pour s’affranchir des généalogies et l’estimer à partir de l’information apportée par des marqueurs génétiques répartis sur l’ensemble du génome.Grâce aux progrès des techniques de génotypage haut-débit, il est possible aujourd’hui d’obtenir les génotypes d’un individu sur des centaines de milliers de marqueurs et d’utiliser ces méthodes pour reconstruire les régions d’identité par descendance sur son génome et estimer un coefficient de consanguinité génomique. Il n’existe actuellement pas de consensus sur la meilleure stratégie à adopter sur ces cartes denses de marqueurs en particulier pour gérer les dépendances qui existent entre les allèles aux différents marqueurs (déséquilibre de liaison). Dans cette thèse, nous avons évalué les différentes méthodes disponibles à partir de simulations réalisées en utilisant de vraies données avec des schémas de déséquilibre de liaison réalistes. Nous avons montré qu’une approche intéressante consistait à générer plusieurs sous-cartes de marqueurs dans lesquelles le déséquilibre de liaison est minimal, d’estimer un coefficient de consanguinité sur chacune des sous-cartes par une méthode basée sur une chaîne de Markov cachée implémentée dans le logiciel FEstim et de prendre comme estimateur la médiane de ces différentes estimations. L’avantage de cette approche est qu’elle est utilisable sur n’importe quelle taille d’échantillon, voire sur un seul individu, puisqu’elle ne demande pas d’estimer les déséquilibres de liaison. L’estimateur donné par FEstim étant un estimateur du maximum de vraisemblance, il est également possible de tester si le coefficient de consanguinité est significativement différent de zéro et de déterminer la relation de parenté des parents la plus vraisemblable parmi un ensemble de relations. Enfin, en permettant l’identification de régions d’homozygoties communes à plusieurs malades consanguins, notre stratégie peut permettre l’identification des mutations récessives impliquées dans les maladies monogéniques ou multifactorielles.Pour que la méthode que nous proposons soit facilement utilisable, nous avons développé le pipeline, FSuite, permettant d’interpréter facilement les résultats d’études de génétique de populations et de génétique épidémiologique comme illustré sur le panel de référence HapMap III, et sur un jeu de données cas-témoins de la maladie d’Alzheimer. / An individual is said to be inbred if his parents are related and if his genealogy contains at least one inbreeding loop leading to a common ancestor. The inbreeding coefficient of an individual is defined as the probability that the individual has received two alleles identical by descent, coming from a single allele present in a common ancestor, at a random marker on the genome. The inbreeding coefficient is a central parameter in genetics, and is used in population genetics to characterize the population structure, and also in genetic epidemiology to search for genetic factors involved in recessive diseases.The inbreeding coefficient was traditionally estimated from genealogies, but methods have been developed to avoid genealogies and to estimate this coefficient from the information provided by genetic markers distributed along the genome.With the advances in high-throughput genotyping techniques, it is now possible to genotype hundreds of thousands of markers for one individual, and to use these methods to reconstruct the regions of identity by descent on his genome and estimate a genomic inbreeding coefficient. There is currently no consensus on the best strategy to adopt with these dense marker maps, in particular to take into account dependencies between alleles at different markers (linkage disequilibrium).In this thesis, we evaluated the different available methods through simulations using real data with realistic patterns of linkage disequilibrium. We highlighted an interesting approach that consists in generating several submaps to minimize linkage disequilibrium, estimating an inbreeding coefficient of each of the submaps based on a hidden Markov method implemented in FEstim software, and taking as estimator the median of these different estimates. The advantage of this approach is that it can be used on any sample size, even on an individual, since it requires no linkage disequilibrium estimate. FEstim is a maximum likelihood estimator, which allows testing whether the inbreeding coefficient is significantly different from zero and determining the most probable mating type of the parents. Finally, through the identification of homozygous regions shared by several consanguineous patients, our strategy permits the identification of recessive mutations involved in monogenic and multifactorial diseases.To facilitate the use of our method, we developed the pipeline FSuite, to interpret results of population genetics and genetic epidemiology studies, as shown on the HapMap III reference panel, and on a case-control Alzheimer's disease data.

Page generated in 0.3038 seconds