151 |
Étude structurale conformationnelle des toxines de l’anthrax par cryo-microscopie et dynamique moléculaireFabre, Lucien 01 1900 (has links)
Les toxines de l’anthrax font partie de la famille des toxines A-B dans laquelle la moitié B se fixe à la membrane de la cellule permettant par la suite la translocation de la moitié A. Dans le cas de l’anthrax, la moitié B est représentée par le Protective Antigen (PA) et la moitié A par les deux protéines Edema Factor (EF) et Lethal Factor (LF). Après le recrutement par les récepteurs cellulaires (CMG2 et TEM8), PA s’organise en heptamère. Il peut fixer jusqu'à 3 ligands (EF et LF) avant d'être endocyté. Les modèles actuels de PA suggèrent que la baisse de pH à l’intérieur des endosomes permet un changement de conformation de la forme pré-pore vers la forme pore et que les ligands EF et LF passeraient au travers le pore pour entrer dans le cytoplasme. Cependant, le diamètre du pore est environ dix fois inférieur à celui des ligands (10 Å contre 100 Å). Un processus de folding/unfolding a été proposé mais demeure controversé.
Afin d'identifier le processus de passage des facteurs EF et LF dans le cytoplasme, nous avons déterminé par cryo-microscopie électronique combinée avec l’analyse d’image les structures tridimensionnelles des complexes formés par PA et LF aux étapes prépore et pore. Par la suite, une étude complémentaire par dynamique moléculaire nous a permis de modéliser à haute résolution les différentes interactions qui ont lieu au sein du complexe.
La structure 3D du complexe prépore combiné à 3 LF a été déterminée à une résolution de 14 Å. Nous avons aussi calculé une structure préliminaire du complexe pore également combiné à 3 LF Celles-ci n’ont jamais été résolues auparavant et leur connaissance permet d’envisager l’étude en profondeur du mécanisme infectieux de l’Anthrax in vivo. / The anthrax toxins are part of the A-B toxin family in which the B moiety binds to the cell membrane allowing subsequent translocation of the A moiety. In the case of anthrax, the B moiety consists of the Protective Antigen (PA), and the A moiety is composed of the two proteins Edema Factor (EF) and the Lethal Factor (LF). After being recruited by the cell receptors (CGM2 or TEM8), PA organizes itself into a heptamer. It can bind up to three ligands (either EF or LF) before being endocytosed. Current models suggest that the decrease of pH inside the endosomes allows a conformational change of PA from a prepore form to a pore form that allows the EF and LF ligands to pass through the pore and enter the cytoplasm. However, the pore diameter is about ten times smaller than the diameter of the ligands (10Å versus 100Å). A process of ligand folding / unfolding has been proposed, but remains controversial.
To identify the mechanism by which EF and LF enter the cytoplasm, we have used cryo-electron microscopy and three-dimensional image analysis to determine the 3D structure of the PA-LF complexes in the pre-pore and pore conformations. Then, we used molecular dynamics to modelise at high resolution the different interactions that occur within the complex.
The 3D structure of the pre-pore complex bound with three LF ligands has been determined at 14Å resolution. We also calculated a preliminary structure of the LF-bound pore complex. These structures have never been reported before. They provide the necessary information to study in depth the mechanism of anthrax infection in vivo.
|
152 |
Évolution de familles de gènes par duplications et pertes : algorithmes pour la correction d’arbres bruitésDoroftei, Andrea 02 1900 (has links)
Les gènes sont les parties du génome qui codent pour les protéines. Les gènes d’une ou plusieurs espèces peuvent être regroupés en "familles", en fonction de leur similarité de séquence. Cependant, pour connaître les relations fonctionnelles entre ces copies de gènes, la similarité de séquence ne suffit pas. Pour cela, il est important d’étudier l’évolution d’une famille par duplications et pertes afin de pouvoir distinguer entre gènes orthologues, des copies ayant évolué par spéciation et susceptibles d’avoir conservé une fonction commune, et gènes paralogues, des copies ayant évolué par duplication qui ont probablement développé des nouvelles fonctions.
Étant donnée une famille de gènes présents dans n espèces différentes, un arbre de gènes (obtenu par une méthode phylogénétique classique), et un arbre phylogénétique pour les n espèces, la "réconciliation" est l’approche la plus courante permettant d’inférer une histoire d’évolution de cette famille par duplications, spéciations et pertes. Le degré de confiance accordé à l’histoire inférée est directement relié au degré de confiance accordé à l’arbre de gènes lui-même. Il est donc important de disposer d’une méthode préliminaire de correction d’arbres de gènes.
Ce travail introduit une méthodologie permettant de "corriger" un arbre de gènes : supprimer le minimum de feuilles "mal placées" afin d’obtenir un arbre dont les sommets de duplications (inférés par la réconciliation) sont tous des sommets de "duplications apparentes" et obtenir ainsi un arbre de gènes en "accord" avec la phylogénie des espèces. J’introduis un algorithme exact pour des arbres d’une certaine classe, et une heuristique pour le cas général. / Genes are segments of genomes that code for proteins. Genes of one or more species can be grouped into gene families based on their sequence similarity. In order to determine functional relationships among these multiple gene copies of a family, sequence homology is insufficient as no direct information on the evolution of the gene family by duplication, speciation and loss can be inferred directly from a family of homologous genes. And it is precisely this information that allows us to distinguish between orthologous gene copies, that have evolved by speciation and are more likely to preserve the same function and paralogous gene copies that have evolved by duplication and usually acquire new functions.
For a given gene family contained within n species, a gene tree (inferred by typical phylogenetic methods) and a phylogenetic tree of the considered species, reconciliation between the gene tree and the species tree is the most commonly used approach to infer a duplication, speciation and loss history for the gene family. The main criticism towards reconciliation methods is that the inferred duplication and loss history for a gene family is strongly dependent on the gene tree considered for this family. Indeed, just a few misplaced leaves in the gene tree can lead to a completely different history, possibly with significantly more duplications and losses. It is therefore important to have a preliminary method for "correcting” the gene tree, i.e. removing potentially misplaced branches.
N. El-Mabrouk and C. Chauve introduced "non-apparent duplications" as nodes that are likely to result from the misplacement of one leaf in the gene tree. Simply put, such a node indicates that one or more triplets contradict the phylogeny given by the species tree. In this work, the problem of eliminating non-apparent duplications from a given gene tree by a minimum number of leaf removals is considered. Depending on the disposition of this type of nodes in the gene tree, the algorithm introduced leads to an O(nlogn) performance and an optimal solution in a best case scenario . The general case however is solved using an heuristic method.
|
153 |
Simulations numériques de la dynamique des protéines : translation de ligands, flexibilité et dynamique des bouclesSt-Pierre, Jean-François 03 1900 (has links)
La flexibilité est une caractéristique intrinsèque des protéines qui doivent, dès le mo- ment de leur synthèse, passer d’un état de chaîne linéaire à un état de structure tridimen- sionnelle repliée et enzymatiquement active. Certaines protéines restent flexibles une fois repliées et subissent des changements de conformation de grande amplitude lors de leur cycle enzymatique. D’autres contiennent des segments si flexibles que leur structure ne peut être résolue par des méthodes expérimentales. Dans cette thèse, nous présentons notre application de méthodes in silico d’analyse de la flexibilité des protéines :
• À l’aide des méthodes de dynamique moléculaire dirigée et d’échantillonnage pa- rapluie, nous avons caractérisé les trajectoires de liaison de l’inhibiteur Z-pro- prolinal à la protéine Prolyl oligopeptidase et identifié la trajectoire la plus pro- bable. Nos simulations ont aussi identifié un mode probable de recrutement des ligands utilisant une boucle flexible de 19 acides aminés à l’interface des deux domaines de la protéine.
• En utilisant les méthodes de dynamique moléculaire traditionnelle et dirigée, nous avons examiné la stabilité de la protéine SAV1866 dans sa forme fermée insérée dans une membrane lipidique et étudié un des modes d’ouverture possibles par la séparation de ses domaines liant le nucléotide.
• Nous avons adapté auproblème de la prédiction de la structure des longues boucles flexibles la méthode d’activation et de relaxation ART-nouveau précédemment uti- lisée dans l’étude du repliement et de l’agrégation de protéines. Appliqué au replie- ment de boucles de 8 à 20 acides aminés, la méthode démontre une dépendance quadratique du temps d’exécution sur la longueur des boucles, rendant possible l’étude de boucles encore plus longues. / Flexibility is an intrinsic characteristic of proteins who from the moment of synthesis into a linear chain of amino acids, have to adopt an enzymatically active tridimensionnel structure. Some proteins stay flexible once folded and display large amplitude confor- mational changes during their enzymatic cycles. Others contain parts that are so flexible that their structure can’t be resolved using experimental methods. In this thesis, we present our application of in silico methods to the study of protein flexibility.
• Using steered molecular dynamics and umbrella sampling, we characterized the binding trajectories of the Z-pro-prolinal inhibiter to the Prolyl oligopeptidase pro- tein and we identified the most probable trajectory. Our simulations also found a possible ligand recrutement mechanism that involves a 19 amino acids flexible loop at the interface of the two domains of the protein.
• Using traditional and steered molecular dynamics, we examined the stability of the SAV1866 protein in its closed conformation in a lipid membrane and we studied one of its proposed opening modes by separating its nucleotide binding domains.
• We also adapted the activation-relaxation technique ART-nouveau which was pre- viously used to study protein folding and aggregation to the problem of structure prediction of large flexible loops. When tested on loops of 8 to 20 amino acids, the method demonstrate a quadratic execution time dependance on the loop length, which makes it possible to use the method on even larger loops.
|
154 |
Riboswitches : le cas des atténuateurs de la transcription du type terminateur/antiterminateur chez les bactériesAbella, Maria de los A. 12 1900 (has links)
Il est essentiel pour chaque organisme d’avoir la possibilité de réguler ses fonctions afin de permettre sa survie et d’améliorer sa capacité de se reproduire en divers habitats. Avec l’information disponible, il semble que les organismes consacrent une partie assez importante de leur matériel génétique à des fonctions de régulation. On peut envisager que certains mécanismes de régulation ont persisté dans le temps parce qu’ils remplissent bien leurs rôles.
Les premières études sur les procaryotes ont indiqué qu’il y avait peu de mécanismes de régulation exerçant le contrôle des gènes, mais il a été démontré par la suite qu’une variété de ces mécanismes est utilisée pour la régulation de gènes et d’opérons. En particulier, les opérons bactériens impliqués dans la biosynthèse des acides aminés, l’ARNt synthétase, la dégradation des acides aminés, les protéines ribosomales et l’ARN ribosomal font l’objet d’un contrôle par l’atténuation de la transcription. Ce mécanisme d’atténuation de la transcription diffère d’autres mécanismes pour la génération de deux structures différentes de l’ARNm, où l’une de ces structures réprime le gène en aval, et l’autre permet de continuer la transcription/traduction.
Dans le cadre de cette recherche, nous nous sommes intéressé au mécanisme d’atténuation de la transcription chez les procaryotes où aucune molécule ne semble intervenir comme facteur de régulation, en me concentrant sur la régulation des opérons bactériens. Le but principal de ce travail est de présenter une nouvelle méthode de recherche des riborégulateurs qui combine la recherche traditionnelle des riborégulateurs avec la recherche structurale. En incorporant l’étude du repliement de l’ARNm, nous pouvons mieux identifier les atténuateurs répondant à ce type de mécanisme d’atténuation.
Ce mémoire est divisé en quatre chapitres. Le premier chapitre présente une revue de la littérature sur l’ARN et un survol sur les mécanismes de régulation de l’expression génétique chez les procaryotes. Les chapitres 2 et 3 sont consacrés à la méthodologie utilisée dans cette recherche et à l’implémentation du logiciel TA-Search. Enfin, le chapitre 4 expose les conclusions et les applications potentielles de la méthode. / It is essential for each organism to have the possibility to regulate its functions to allow its survival and improve its capacity to reproduce in different environments. With the information available, it is apparent that most organisms dedicate an important piece of their genetic material to regulating functions. We could think that certain regulating mechanisms have most likely persisted over time because they fulfilled their roles.
The first prokaryotes studies indicated that there are few regulating mechanisms that take control over genes, but it has been proven that a variety of these mechanisms are used in the regulation of genes and operons. In particular, the bacterial operons involved in the biosynthesis of amino acids, tRNA synthetase, the degradation of amino acids, the ribosomal proteins and RNA ribosomal could be controlled by transcription attenuation. This mechanism of regulation differs from others for the creation of two different structures of the mRNA where one of these structures represses the gene in 3’ and the other one allows the transcription/translation to continue.
In this work, I’m interested in the mechanism of transcription attenuation in prokaryotes where no molecule appears to act as a regulatory factor. In particular, I’m interested in the regulation of bacterial operons. The principal goal of this work is to present a new method for detecting riboswitches that combines the traditional research of these elements with the structural research by incorporating the study of mRNA folding.
This thesis is divided into four chapters. Chapter 1 is a review of the literature on RNA and an overview of the regulatory mechanism of gene expression in prokaryotes. Chapter 2 and 3 present the method developed for this work and its implementation in new software, TA-Search. Finally, Chapter 4 is dedicated to providing a discussion and conclusion for this work.
|
155 |
Algorithmes pour la reconstruction de génomes ancestrauxGagnon, Yves 05 1900 (has links)
L’inférence de génomes ancestraux est une étape essentielle pour l’étude de l’évolution
des génomes. Connaissant les génomes d’espèces éteintes, on peut proposer des
mécanismes biologiques expliquant les divergences entre les génomes des espèces modernes.
Diverses méthodes visant à résoudre ce problème existent, se classant parmis deux
grandes catégories : les méthodes de distance et les méthodes de synténie. L’état de l’art
des distances génomiques ne permettant qu’un certain répertoire de réarrangements pour
le moment, les méthodes de synténie sont donc plus appropriées en pratique.
Nous proposons une méthode de synténie pour la reconstruction de génomes ancestraux
basée sur une définition relaxée d’adjacences de gènes, permettant un contenu en
gène inégal dans les génomes modernes causé par des pertes de gènes de même que des
duplications de génomes entiers (DGE). Des simulations sont effectuées, démontrant
une capacité de former une solution assemblée en un nombre réduit de régions ancestrales
contigües par rapport à d’autres méthodes tout en gardant une bonne fiabilité. Des
applications sur des données de levures et de plantes céréalières montrent des résultats
en accord avec d’autres publications, notamment la présence de fusion imbriquée de
chromosomes pendant l’évolution des céréales. / Ancestral genome inference is a decisive step for studying genome evolution. Knowing
genomes from extinct species, one can propose biological mecanisms explaining
divergences between extant species genomes.
Various methods classified in two categories have been developped : distance based
methods and synteny based methods. The state of the art of distance based methods only
permit a certain repertoire of genomic rearrangements, thus synteny based methods are
more appropriate in practice for the time being.
We propose a synteny method for ancestral genome reconstruction based on a relaxed
defenition of gene adjacencies, permitting unequal gene content in extant genomes
caused by gene losses and whole genome duplications (WGD). Simulations results demonstrate
our method’s ability to form a more assembled solution rather than a collection of
contiguous ancestral regions (CAR) with respect to other methods, while maintaining a
good reliability. Applications on data sets from yeasts and cereal species show results
agreeing with other publications, notably the existence of nested chromosome fusion
during the evolution of cereals.
|
156 |
Évolution moléculaire : un modèle Markov-modulé pour les processus de substitutionFournier, Eric 01 1900 (has links)
Les processus Markoviens continus en temps sont largement utilisés pour tenter d’expliquer l’évolution des séquences protéiques et nucléotidiques le long des phylogénies. Des modèles probabilistes reposant sur de telles hypothèses sont conçus pour satisfaire la non-homogénéité spatiale des contraintes fonctionnelles et environnementales agissant sur celles-ci. Récemment, des modèles Markov-modulés ont été introduits pour décrire
les changements temporels dans les taux d’évolution site-spécifiques (hétérotachie). Des études ont d’autre part démontré que non seulement la force mais également la nature de la contrainte sélective agissant sur un site peut varier à travers le temps. Ici nous proposons de prendre en charge cette réalité évolutive avec un modèle Markov-modulé pour les protéines sous lequel les sites sont autorisés à modifier leurs préférences en acides aminés au cours du temps. L’estimation a posteriori des différents paramètres modulants
du noyau stochastique avec les méthodes de Monte Carlo est un défi de taille que nous avons su relever partiellement grâce à la programmation parallèle. Des réglages computationnels sont par ailleurs envisagés pour accélérer la convergence vers l’optimum global de ce paysage multidimensionnel relativement complexe. Qualitativement, notre modèle semble être capable de saisir des signaux d’hétérogénéité temporelle à partir d’un jeu de données dont l’histoire évolutive est reconnue pour être riche en changements de régimes substitutionnels. Des tests de performance suggèrent de plus qu’il serait mieux ajusté aux données qu’un modèle équivalent homogène en temps. Néanmoins, les histoires substitutionnelles tirées de la distribution postérieure sont bruitées et restent difficilement interprétables du point de vue biologique. / Time-continuous Markovian process are widely used to understand the mechanism of nucleotidic acids and proteins evolution along phylogeny. Already existing probabilistic models based on such hypothesis are designed to satisfy the non-homogeneity of functional and environmental constraints acting across those biological sequences. Recently, Markov-modulated models have been introduced to describe site-specific temporal rate variation (heterotachy). Moreover, studies have demonstrated that not only strength but
also the nature of the constraint acting on a specific site can vary over time. Here we propose to accommodate this evolutionary reality with a Markov-modulated model for proteins under which sites are authorized to change their amino acids propensities across time. Posterior estimation of the stochastic kernel hidden parameters with Monte Carlo methods is a challenging approach that we partially overcome with parallel computing. Fine-tuning are otherwise planned to accelerate convergence toward the target posterior stationnary distribution. Qualitatively, our model seems to be able to capture temporal
heterogeneity from real sequences data sets whose evolutionary history is assumed to be rich in substitutional switch events. Furthermore, evaluation of the model performance suggest that he provides a better fit to the data set than the time-homogeneous equivalent model. Nonetheless, substitutional histories sampled from the posterior distribution are quite noisy and remain difficult to interpret biologically.
|
157 |
Typage de la classe génotypique du gène PRDM9 à partir de données de séquençage de Nouvelle GénérationAng Houle, Marie-Armande 07 1900 (has links)
Les positions des évènements de recombinaison s’agrègent ensemble, formant des hotspots déterminés en partie par la protéine à évolution rapide PRDM9. En particulier, ces positions de hotspots sont déterminées par le domaine de doigts de zinc (ZnF) de PRDM9 qui reconnait certains motifs d’ADN. Les allèles de PRDM9 contenant le ZnF de type k ont été préalablement associés avec une cohorte de patients affectés par la leucémie aigüe lymphoblastique. Les allèles de PRDM9 sont difficiles à identifier à partir de données de séquençage de nouvelle génération (NGS), en raison de leur nature répétitive. Dans ce projet, nous proposons une méthode permettant la caractérisation d’allèles de PRDM9 à partir de données de NGS, qui identifie le nombre d’allèles contenant un type spécifique de ZnF. Cette méthode est basée sur la corrélation entre les profils représentant le nombre de séquences nucléotidiques uniques à chaque ZnF retrouvés chez les lectures de NGS simulées sans erreur d’une paire d’allèles et chez les lectures d’un échantillon. La validité des prédictions obtenues par notre méthode est confirmée grâce à analyse basée sur les simulations. Nous confirmons également que la méthode peut correctement identifier le génotype d’allèles de PRDM9 qui n’ont pas encore été identifiés. Nous conduisons une analyse préliminaire identifiant le génotype des allèles de PRDM9 contenant un certain type de ZnF dans une cohorte de patients atteints de glioblastomes multiforme pédiatrique, un cancer du cerveau caractérisé par les mutations récurrentes dans le gène codant pour l’histone H3, la cible de l’activité épigénétique de PRDM9. Cette méthode ouvre la possibilité d’identifier des associations entre certains allèles de PRDM9 et d’autres types de cancers pédiatriques, via l’utilisation de bases de données de NGS de cellules tumorales. / The positions of recombination events cluster tightly together in recombination hotspots, which are determined in part by the rapidly evolving protein PRDM9 via its tri- methyltransferase activity. The locations of hotspots are determined by the repetitive ZnF array of PRDM9, which binds to DNA. Alleles of PRDM9 containing the k-ZnF have previously been associated with patients affected with childhood acute lymphoblastic leukaemia. PRDM9 alleles are notoriously difficult to type due to the repetitive nature of the ZnF arrays. Here, we propose a method to characterize the alleles of PRDM9 from next- generation sequencing samples, by identifying the number of alleles containing a specific ZnF type. Our method is based on the correlation between profiles from the sample, representing the counts of nucleotide sequences unique to each ZnF, and from ideal sets of short reads representing an allele pair. We conduct a simulation analysis to examine the validity of the predictions obtained by our method with all pairs of known alleles. We confirm that the method can accurately genotype previously unobserved PRDM9 alleles. We also conducted a preliminary analysis to identify the PRDM9 k-ZnF genotype in a cohort of paediatric glioblastoma (pGBM), a childhood cancer characterized by the recurrent mutations in the coding sequence of the histone H3, the target of the enzymatic activity of PRDM9. Although no associations of k-ZnF containing PRDM9 alleles is found in our pGBM cohort, this method opens the possibility of identifying associations between certain PRDM9 alleles with other types of early onset childhood cancers, through a data-mining effort in public cancer databases.
|
158 |
Inference and modeling of biological networks : a statistical-physics approach to neural attractors and protein fitness landscapes / Inférence et modélisation de réseaux biologiques par la physique statistique : des attracteurs neuronaux au paysage de fitness des protéinesPosani, Lorenzo 07 December 2018 (has links)
L'avènement récent des procédures expérimentales à haut débit a ouvert une nouvelle ère pour l'étude quantitative des systèmes biologiques. De nos jours, les enregistrements d'électrophysiologie et l'imagerie du calcium permettent l'enregistrement simultané in vivo de centaines à des milliers de neurones. Parallèlement, grâce à des procédures de séquençage automatisées, les bibliothèques de protéines fonctionnelles connues ont été étendues de milliers à des millions en quelques années seulement. L'abondance actuelle de données biologiques ouvre une nouvelle série de défis aux théoriciens. Des méthodes d’analyse précises et transparentes sont nécessaires pour traiter cette quantité massive de données brutes en observables significatifs. Parallèlement, l'observation simultanée d'un grand nombre d'unités en interaction permet de développer et de valider des modèles théoriques visant à la compréhension mécanistique du comportement collectif des systèmes biologiques. Dans ce manuscrit, nous proposons une approche de ces défis basée sur des méthodes et des modèles issus de la physique statistique, en développent et appliquant ces méthodes au problèmes issu de la neuroscience et de la bio-informatique : l’étude de la mémoire spatiale dans le réseau hippocampique, et la reconstruction du paysage adaptatif local d'une protéine. / The recent advent of high-throughput experimental procedures has opened a new era for the quantitative study of biological systems. Today, electrophysiology recordings and calcium imaging allow for the in vivo simultaneous recording of hundreds to thousands of neurons. In parallel, thanks to automated sequencing procedures, the libraries of known functional proteins expanded from thousands to millions in just a few years. This current abundance of biological data opens a new series of challenges for theoreticians. Accurate and transparent analysis methods are needed to process this massive amount of raw data into meaningful observables. Concurrently, the simultaneous observation of a large number of interacting units enables the development and validation of theoretical models aimed at the mechanistic understanding of the collective behavior of biological systems. In this manuscript, we propose an approach to both these challenges based on methods and models from statistical physics. We present an application of these methods to problems from neuroscience and bioinformatics, focusing on (1) the spatial memory and navigation task in the hippocampal loop and (2) the reconstruction of the fitness landscape of proteins from homologous sequence data.
|
159 |
Contrôle génétique de l’épissage alternatif dans le contexte de la réponse immunitaire innéeTastet, Olivier 08 1900 (has links)
No description available.
|
160 |
Méthodes de factorisation matricielle pour la génomique des populations et les tests d'association / Matrix factorization methods for population genomics and association mappingCaye, Kévin 11 December 2017 (has links)
Nous présentons des méthodes statistiques reposant sur des problèmes de factorisation matricielle. Une première méthode permet l'inférence rapide de la structure de populations à partir de données génétiques en incluant l'information de proximité géographique. Une deuxième méthode permet de corriger les études d'association pour les facteurs de confusion. Nous présentons dans ce manuscrit les modèles, ainsi que les aspects théoriques des algorithmes d'inférence. De plus, à l'aide de simulations numériques, nous comparons les performances de nos méthodes à celles des méthodes existantes. Enfin, nous utilisons nos méthodes sur des données biologiques réelles. Nos méthodes ont été implémentées et distribuées sous la forme de packages R : tess3r et lfmm. / We present statistical methods based on matrix factorization problems. A first method allows efficient inference of population structure from genetic data and including geographic proximity information. A second method corrects the association studies for confounding factors. We present in this manuscript the models, as well as the theoretical aspects of the inference algorithms. Moreover, using numerical simulations, we compare the performance of our methods with those of existing methods. Finally, we use our methods on real biological data. Our methods have been implemented and distributed as R packages: tess3r and lfmm.
|
Page generated in 0.0805 seconds