Spelling suggestions: "subject:"variabilité frénétique"" "subject:"variabilité phénétique""
1 |
Caractérisation et exploitation de la variation structurale chez le soyaLemay, Marc-André 13 December 2023 (has links)
Titre de l'écran-titre (visionné le 15 mai 2023) / Les variations structurales (SV, de l'anglais structural variation) sont des variations génétiques impliquant une différence de 50 nucléotides ou plus entre deux séquences d'ADN homologues. Ces variations incluent les insertions, délétions, inversions, duplications, ainsi que d'autres types de réarrangements plus complexes. Étant donné leur grande taille, plusieurs SV ont un impact fonctionnel en affectant des séquences codantes ou régulatrices. Malgré leur importance fonctionnelle et évolutive, l'étude des SV est limitée par des obstacles technologiques et informatiques importants. Par conséquent, les SV sont souvent ignorés dans les études de description de la variation génétique et lors d'études d'association pangénomiques (GWAS, de l'anglais genome-wide association study). Dans cette thèse, j'ai développé et évalué des méthodes facilitant l'étude des SV en utilisant une espèce cultivée d'importance, le soya (Glycine max), comme modèle. Dans la première étude, nous avons développé une approche bio-informatique de découverte de variations du nombre de copies (ou CNV, de l'anglais copy number variation) chez une collection de lignées mutantes irradiées de soya en utilisant le génotypage par séquençage (GBS, de l'anglais genotyping-by-sequencing). Cette approche novatrice repose sur l'identification de régions génomiques présentant une profondeur de séquençage plus faible ou élevée que la moyenne ainsi que sur un algorithme de segmentation pour déterminer les limites de telles régions. Nous avons démontré l'utilité de l'approche GBS et avons évalué en profondeur les résultats obtenus en les comparant aux données d'une puce d'hybridation comparative génomique. Comparé aux approches utilisées précédemment, le GBS est moins coûteux et permet un plus haut débit d'analyse tout en détectant la majorité des CNV. Dans la deuxième étude, nous avons combiné les technologies de séquençage Illumina et Oxford Nanopore Technologies (ONT) pour décrire les SV observés à l'échelle du génome dans une population de 102 cultivars de soya canadiens. Nous avons démontré que les SV découverts par la technologie à reads longs ONT, beaucoup plus puissante, pouvaient être génotypés avec précision au moyen de la technologie à reads courts Illumina. Cela représente une avancée méthodologique importante puisque le séquençage de reads courts est beaucoup moins cher et plus facile à effectuer que le séquençage de reads longs. Nous avons démontré la qualité du jeu de données de SV ainsi génotypé en confirmant qu'il pouvait 1) décrire avec exactitude la structure de la population et 2) reproduire des résultats déjà documentés sur l'enrichissement en SV de certaines régions du génome. Nous avons aussi utilisé ce jeu de données pour réaliser des analyses originales sur les contraintes fonctionnelles à la formation de SV et la biologie des éléments transposables chez le soya. Dans la troisième et dernière étude, nous avons utilisé les génotypes de SV ainsi que la présence/absence de k-mers dans le cadre d'analyses GWAS sur une collection internationale de plus de 360 lignées de soya. Nous avons utilisé 13 caractères qualitatifs et quantitatifs qui ont été préalablement étudiés au moyen de polymorphismes d'un seul nucléotide et pour lesquels les gènes ou les variations déterminant ces caractères sont connus dans certains cas. D'un côté, nos résultats soulignent l'impressionnante capacité de la présence/absence de k-mers à identifier directement des variations causales ou des gènes candidats. D'un autre côté, bien que les SV puissent être utiles pour l'analyse de signaux significatifs, il ne vaut probablement pas la peine d'effectuer des analyses GWAS employant des SV génotypés à l'échelle du génome. Notre étude fournit également des nouvelles méthodes bio-informatiques pour l'analyse de k-mers significatifs tout en identifiant des lacunes méthodologiques qui doivent encore être comblées. En plus de contribuer à notre compréhension de la génétique et de la biologie du soya, nous croyons que les résultats et outils bio-informatiques rapportés dans cette thèse pourront orienter l'étude des SV chez le soya et d'autres plantes cultivées. La disponibilité accrue du séquençage de reads longs, les avancées bio-informatiques en théorie des graphes de variation, ainsi que le nombre croissant d'échantillons pour lesquels des données de reséquençage sont disponibles, représentent des développements palpitants pour l'étude des SV. Combinées avec ces avancées, nos méthodes fournissent de nouveaux outils pour mieux comprendre les SV et leur impact fonctionnel. / Structural variants (SVs) are genetic variants that imply a difference of 50 nucleotides or more between two homologous DNA sequences. These variants include insertions, deletions, inversions, duplications, as well as many other types of more complex rearrangements. Given their large size, SVs commonly impact genome function through the disruption of coding or regulatory sequences. Despite their functional importance and evolutionary relevance, the study of SVs is hindered by non-trivial technological and computational hurdles. As a consequence, SVs are often ignored in genome-wide assessments of genetic variation and in genome-wide association studies (GWAS). In this thesis, I have sought to develop and assess methods to ease the study of SVs by using a major crop, soybean (Glycine max ), as a model species. In the first study, we developed a computational method to enable the discovery of copy number variants (CNVs) in a collection of irradiated soybean mutant lines using genotyping-by-sequencing (GBS) data. This novel approach relies on the identification of genomic regions with higher or lower sequencing depth compared to average and on a segmentation algorithm to determine the boundaries of such regions. We demonstrated the usefulness of such a GBS approach and extensively benchmarked the results obtained by comparing them to array comparative genomic hybridization data. Compared to previously used methods, GBS provides lower cost and higher through put while still detecting the majority of CNVs. In the second study, we combined Illumina and Oxford Nanopore Technologies (ONT) sequencing data to provide a genome-wide assessment of SVs in a population of 102 Canadian soybean cultivars. We demonstrated that SVs discovered using the more powerful ONT long-read technology could be accurately genotyped at population scale using Illumina short-read data. This represents significant methodological progress because short-read data is comparatively much cheaper and easier to obtain. We demonstrated the quality of the SV dataset thus genotyped on the whole population by confirming that it could 1) accurately describe population structure and 2) replicate previously documented results regarding the enrichment of SVs in some genomic regions. We also used this dataset to gain novel insights into functional constraints to SV occurrence and transposable element biology in soybean. In the third and last study, we used SV genotypes and the presence/absence of k-mers to conduct GWAS on an international collection of over soybean 360 cultivars. We used 13 qualitative and quantitative traits that had been previously studied using single-nucleotide polymorphism (SNP) data and for which the genes and/or variants controlling the traits are known in some cases. On one hand, our results underline the impressive ability of k-mer presence/absence to pinpoint causal variants and candidate genes. On the other hand, while SVs may prove useful for assisting in the down stream analysis of significant signals, it might not be worth conducting GWAS using population-scale SV genotypes. Our study also provides novel computational tools for the downstream analysis of significant k-mers while identifying methodological gaps that have yet to be addressed. In addition to contributing to our understanding of soybean genetics and biology, we believe that the results and computational tools presented in this thesis will provide useful guidance for the study of SVs in soybean and other crop species. The increased availability of long-read sequencing, computational advances in variation graph theory, and the growing amount of samples for which resequencing data is available, represent exciting developments for the study of structural variation. Combined with these advances, our methods provide building blocks for enhancing our understanding of SVs and their functional impacts.
|
2 |
Dynamique de la diversité génétique et effets fondateurs : l'exemple du mouflon (Ovis aries) de KerguelenKaeuffer, Renaud January 2008 (has links) (PDF)
Le maintien de la diversité génétique des populations d'espèces fragiles, en voie de disparition, est un sujet primordial de la biologie de la conservation. Dans ce cadre, la compréhension des mécanismes qui vont affecter la diversité génétique au cours du temps est essentielle. Mon travail de doctorat a consisté en l'étude de la dynamique de la diversité génétique d'une population de mouflons Ovis aries, fondée en 1957 par un unique couple sur une île de l'archipel de Kerguelen (océan Indien). Durant cette étude, j'ai tout d'abord suivi les variations de l'hétérozygotie (He, évaluée à partir du typage génétique des individus à 25 marqueurs microsatellites) depuis la fondation jusqu'à 2003. J'ai montré que la valeur observée de He est supérieure à celle attendue à partir de modèles théoriques. Nos résultats, complétés par une étude par simulation, suggèrent que cette forte He pourrait être due à la sélection. Puis, pour mesurer la dérive, je me suis intéressé à la taille efficace de la population de mouflons. Malgré des conditions défavorables (démographie cyclique et système de reproduction de
promiscuité caractérisé par une forte compétition entre les mâles), la dérive est apparue limitée. Mes résultats suggèrent que les variations de densité diminuent la compétition entre mâles, ce qui permet à la plupart de se reproduire, limitant ainsi la perte de la diversité génétique. La structure génétique des populations peut aussi influencer la perte de la diversité génétique. A partir d'un logiciel couramment utilisé (STRUCTURE, Pritchard et al. 2000), j'ai pu détecter une structure génétique dans la population de mouflons. Pourtant cette structure ne semble pas avoir de sens biologique et serait causée par des particularités des marqueurs génétiques utilisés. Enfin, j'ai mesuré les effets de la diversité génétique sur la valeur sélective des individus. J'ai tout d'abord pu révéler les effets négatifs de la diversité génétique et de la charge parasitaire sur la condition physique des femelles de mouflon, en mettant en évidence des effets simples de chacun de ces facteurs mais aussi en interaction. Contrairement à toutes les attentes, les femelles les plus consanguines ont une plus grande probabilité de donner naissance à des jumeaux. Des effets de sélection densité-dépendante à l'encontre des femelles seraient un des facteurs qui permettrait le maintien d'une forte hétérozygotie dans la population de mouflons de l'archipel de Kerguelen. Ces résultats originaux permettent de mieux comprendre l'évolution de la diversité génétique des populations. ______________________________________________________________________________ MOTS-CLÉS DE L’AUTEUR : Diversité génétique, Structure génétique, Taille efficace, Démographie cyclique, Ovis aries.
|
3 |
Identification de variations génétiques associées à la bicuspidie valvulaire aortique chez les hommes et les femmesDargis, Natasha 23 April 2018 (has links)
Introduction. La bicuspidie valvulaire aortique (BVA) est la malformation congénitale cardiaque la plus fréquente. Les causes et les origines génétiques de la BVA sont actuellement inconnues. Objectif. Ce projet de recherche vise à identifier des variations génétiques impliquées dans le développement de la BVA chez les Canadiens français. Méthodes. Neuf gènes candidats pour la BVA ont été séquencés chez 48 patients atteints. Des variations génétiques sélectionnées ont été génotypées chez 323 patients atteints de BVA et 584 contrôles et les fréquences alléliques ont été comparées entre les deux groupes. Résultats. Une variation dans le gène EGFR (rs17290301) démontre une association avec la BVA. Différentes variations sont associées à la BVA spécifiquement chez les hommes (EGFR rs533525993 et TEX26 rs12857479) et les femmes (NOTCH1 rs61751489, TGFBR2 rs1155705 et NKX2-5 rs2277923). Conclusions. Ces résultats supportent pour la première fois l’implication de variations génétiques spécifiques au genre dans le développement de la BVA. / Introduction. Bicuspid aortic valve (BAV) is the most frequent congenital heart disease. Its etiology and genetic origins are still largely unknown. Objective. This study sought to identify genetic variants associated with BAV in a French Canadian population. Methods. Nine candidate genes for BAV were sequenced in 48 BAV patients. A selection of genetic variants was genotyped in 323 BAV patients and 584 controls and their allelic frequencies were compared between the two groups. Results. A EGFR variant (rs17290301) was associated with BAV in this population. Gender-specific variants were also significantly associated with BAV (EGFR rs533525993 and TEX26 rs12857479 in men and NOTCH1 rs61751489, TGFBR2 rs1155705 and NKX2-5 rs2277923 in women). Conclusions. These results suggest for the first time a possible implication of gender-specific variants in the development of BAV.
|
4 |
Nouveau cadre statistique pour la cartographie-fineAccrachi, El Hadji Ousseynou 02 February 2024 (has links)
Des études d’association à l’échelle du génome (GWAS) ont permis l’identification de milliers de régions du génome comportant des variants génétiques associés à des traits et qui peuvent être à l’origine de certaines maladies complexes. Cependant faire des tests biologiques pour tous les variants génétiques découverts à l’aide de GWAS est pratiquement impossible. Ainsi, les études de cartographie-fine visent à déterminer un ensemble cible de variants génétiques susceptibles d’être associés à un trait d’intérêt. Les principales difficultés pour les méthodes statistiques pour la cartographie-fine sont la présence de milliers de variants génétiques pour seulement une centaine d’individus et la présence d’une forte structure de corrélation, ou déséquilibre de liaison (LD) entre les variants génétiques. Il existe de nombreuses contributions dans les études de cartographie-fine notamment CAVIAR [19], CAVIAR-Gene [30], PAINTOR [28], fastPAINTOR [27] etc. Ces études se basent sur des méthodes statistiques de sélection d’un ensemble crédible de variants génétiques pour aider à prioriser les variants et à discerner les conséquences fonctionnelles du risque de maladies des variants sélectionnés. Dans ce mémoire, nous proposons un nouveau cadre statistique avec une procédure de sélection de variants génétiques (SNPs). Nous utilisons une méthode conditionnelle ou bayésienne pour identifier les SNPs susceptibles d’être causaux. Ainsi la statistique d’association d’un SNP est réécrite et sa loi asymptotique est déterminée. Notre procédure de sélection est itérative et grâce à une loi a priori, elle calcule les probabilités a posteriori pour qu’un SNP soit significatif pour le trait d’intérêt. À chaque étape les statistiques d’association des SNPs sont calculées et le SNP avec la plus forte probabilité a posteriori est choisi. Dans nos simulations, nous montrons que la correction sur la loi asymptotique de la statistique d’association apporte une amélioration significative dans la sélection des SNPs qui ont un lien avec le trait d’intérêt
|
5 |
Etude de l’impact de la variabilité génétique de la protéine NS5A du virus de l’hépatite C dans la pathogenèse et la réplication virale / Impact of Hepatitis C Virus NS5A Genetic Variability on Liver Pathogenesis and Viral ReplicationMaqbool, Muhammad Ahmad 06 January 2012 (has links)
Le virus de l’Hépatite C (VHC), de la famille Flaviviridae, est à l’origine d’une pandémiemondiale. L’infection par le VHC provoque le dévelopment d’hépatites chroniques, decirrhoses et de carcinomes hépatocellulaires (CHC). Les fonctions de la majorité des protéinesvirales sont connues, mis à part pour NS5A dont la seule fonction directe attribuée à ce jour,équivaut à celle d’un facteur d'activation transcriptionnelle. Notre laboratoire a montréprécédemment que les variants de quasiespèce de NS5A isolés à partir du sérum d’un mêmepatient présentaient des différences significatives dans leurs propriétés intrinsèques detransactivation. Fort de ces résultats, nous avons analysé des variants de NS5A isolés à partirde tissu hépatique d’un patient chroniquement infecté par le VHC de génotype 1b. Cesanalyses ont révélé une compartimentation génétique et fonctionnelle des variants de NS5Aentre le tissu tumoral et le tissu non-tumoral adjacent. Nous avons donc émis l’hypothèse queles propriétés transactivatrices de NS5A pourraient jouer un rôle dans la pathogenèse ainsique dans la réplication virale, et que la variabilité naturelle de NS5A pourrait influencer sespropriétés transactivatrices. L’objectif de ce travail de thèse était d’analyser le rôle despropriétés transactivatrices de NS5A dans la pathogenèse hépatique viro-induite ainsi quedans la réplication virale. Pour étudier le rôle des propriétés de transactivation de NS5A dans la pathogenèse hépatique,nous avons développé des vecteurs lentiviraux pour exprimer dans les hépatocytes primaireshumains les variants choisis de NS5A portants différents potentiels de transactivation. Enutilisant la technologie RNA-Seq d’Illumina, l’analyse des transcriptomes d’hépatocytestransduits exprimant les variants transactivateurs fort et faible de NS5A, sera utiliser pouridentifier les voies cellulaires ciblées par les propriétés transactivatrices de NS5A. Pour lesétudes in vivo, nous avons lancé le développement des souris transgénique permettantl’activation conditionnelle de l’expression des variants de NS5A avec fort et faible potentielde transactivation, spécifiquement dans le foie. Ces souris transgéniques seront utilisées pourétudier le rôle potentiel des propriétés transactivatrices dans la pathogenèse VHC induite etplus particulièrement dans le développement des cancers. Pour étudier le rôle des propriétés de transactivation de NS5A dans la réplication virale, nousavons utilisé le système de réplicon subgénomique de VHC exprimant les variants de NS5Aprécédemment caractérisés. Pour exercer ses propriétés transactivatrices, NS5A doit êtrelocalisée au moins partiellement dans le noyau. Nous avons démontré qu’une partie de NS5Ase retrouve dans noyau et est recruté sur des promoteurs cellulaires, modulant ainsidirectement l’expression de gènes cellulaires essentiels pour la réplication de l’ARN viral.Nous avons observé que les variants de NS5A avec différents potentiels de transactivation,confèrent différentes capacités de réplication au réplicon subgénomique, et corrèlent avec lepotentiel de transactivation de variant correspondant. En accord avec ces observations,l’inhibition de translocation nucléaire de NS5A entraine une inhibition de la réplication virale,suggerant un rôle potentiel des propriétés transactivatrices de NS5A dans la réplication l’ARNvirale. En conclusion, nous avons démontré que l’activation transcriptionnelle des gènes cellulairespar la NS5A est essentielle pour la réplication de l’ARN du VHC. Cette modulation des gènescellulaires pourrait également être impliquée dans les mécanismes de la pathogenèse viroinduite.Nous confirmerons cette hypothèse grâce aux souris NS5A. Par ailleurs, ces résultatspourraient contribuer au développement de nouvelles thérapies anti-VHC, basées surl’inhibition de translocation nucléaire de NS5A / Hepatitis C virus (HCV) causes a chronic infection in the majority of infected patients,ultimately leading to liver cirrhosis and hepatocellular carcinoma (HCC). Although the rolesof the HCV proteins in the viral life cycle are increasingly understood, the precise function ofthe HCV NS5A protein has yet to be elucidated. To date, the only putative direct functionattributed to NS5A is its transcriptional transactivation properties. Our group has previouslyshown that quasispecies variants of NS5A isolated from the serum samples of the samepatient bear different transactivating properties according to their amino acid sequence. Basedon these observations, we performed preliminary phylogenetic and functional analysis ofNS5A variants isolated from liver tissue of individuals infected with HCV of genotype 1b.This analysis revealed genetic and functional compartmentation of NS5A variants in tumoraland adjacent non-tumoral tissue. We hypothesized that the natural variability of NS5A mayimpact its proposed transactivation properties. We also hypothesized that NS5A’s putativetransactivation properties could play a role in HCV replication and in liver pathogenesis. Theaim of the study presented in this thesis was to investigate the role of NS5A transactivationproperties in the development of HCV-induced liver pathogenesis as well as in viralreplication. To study the role of NS5A transcriptional activation properties in liver pathogenesis, wedeveloped lentiviral vectors for the expression of selected NS5A variants bearing differenttransactivation potentials in cultured primary human hepatocytes. We now intend to extendthese preparations using RNAseq technology to analyse the, transcriptome of primaryhepatocytes transduced with lentiviral vectors encoding strongly and weakly transactivatingNS5A variants to identify the cellular pathways targeted by NS5A, allowing us to decipherthe role of NS5A mediated host gene regulation in development of HCV inducedpathogenesis. For in vivo studies, we have begun the development of transgenic mice allowingliver-specific conditional expression of NS5A variants with high and low transactivationpotentials. These transgenic mice will be used to study the possible role of NS5Atransactivation properties in development of HCC. To study the role of NS5A transcriptional activation properties in HCV RNA replication, weused the sub-genomic replicon system expressing previously characterized NS5A sequences..Using this system, we have demonstrated that a subset of NS5A protein can translocate to thenucleus and is recruited to cellular promoters of host cell genes known to be required forefficient replication of HCV replicon RNA as well as those implicated in pathogenesis.Moreover, we have shown that NS5A directly regulate the expression of these genes.Consequently, it was observed that replicons encoding NS5A variants with differenttransactivation potentials exhibited different replication capacities, and that this correlatedwith the transactivation potential of the corresponding NS5A variant. In agreement with theseobservations, inhibition of nuclear translocation of NS5A resulted in the inhibition ofreplication of the HCV subgenomic replicon, further confirming the role of NS5Atransactivation properties in viral RNA replication. In conclusion, we have demonstrated that NS5A-mediated transcriptional regulation ofcellular genes is required for HCV replication. Such NS5A-mediated modulation of cellulargenes may also constitute one of the mechanisms involved in HCV-related liver pathogenesisand development of HCC, an aspect which is currently under investigation using the toolsdeveloped during this project. This study will contribute towards deciphering the role ofNS5A in viral replication as well as providing insight into its role in HCV-induced liverpathogenesis...
|
6 |
Caractérisation fonctionnelle de variations génétiques dans PALB2, un gène de susceptibilité au cancer du seinDucy, Mandy 26 June 2019 (has links)
PALB2 (Partner And Localizer of BRCA2) est un gène de prédisposition au cancer du sein à forte pénétrance. En effet, les mutations pathogéniques dans PALB2 augmentent le risque de développer la maladie de 8 à 9 fois pour les porteuses de moins de 40 ans et de 3 à 4 fois au cours de leur vie. À ce jour, environ 200 variations de type faux sens localisées dans PALB2 ont été identifiées en clinique, chez des patientes atteintes d’un cancer du sein, mais très peu ont été caractérisées fonctionnellement. De plus, aucune méthode d’analyse fonctionnelle à grande échelle de ces variants de signification incertaine n’a été élaborée pour le moment. Par conséquent, les médecins et conseillers en génétique ne sont pas en mesure d’interpréter l’effet de ces variations en termes de risque et la prise de décision quant au suivi de ces porteuses, la communication de leur risque, la divulgation aux membres de la famille, le recours aux chirurgies préventives ou encore le choix des stratégies de traitement est complexe. La compréhension de l’effet des variations faux sens sur la fonction de PALB2 est donc indispensable pour leur classification et leur interprétation en clinique. PALB2 étant un médiateur de la réparation des cassures double-brin par recombinaison homologue, nous avons proposé d’établir une méthode systématique d’essais biochimiques et cellulaires, centrée sur la fonction de PALB2 dans la recombinaison homologue. Nous avons émis l’hypothèse que cette méthode de caractérisation fonctionnelle est suffisante pour classer ces variants comme bénins ou délétères pour la fonction de PALB2 dans la recombinaison homologue. Ainsi, au cours de mon doctorat, j’ai participé à la caractérisation fonctionnelle d’une centaine de variations faux sens ainsi qu’une mutation tronquante localisées dans PALB2. Nos travaux montrent que notre méthode systématique est pertinente pour la caractérisation fonctionnelle des variants de signification incertaine. En effet, nous avons identifié plusieurs variants faux sens qui présentent des défauts importants ou intermédiaires de recombinaison homologue et qui favorisent ainsi l’instabilité génomique et la carcinogénèse. Enfin, nous avons montré que le score de formation de foyers RAD51 est un bon marqueur des tumeurs de cancer du sein avec des défauts de recombinaison homologue sensibles aux traitements basés sur les inhibiteurs de PARP.
|
7 |
Distribution et transmission de variants génétiques impliqués dans la marche atopique et dans l'asthme dans la population canadienneSimard, Mathieu 10 February 2024 (has links)
La dermite atopique (DA) est caractérisée par une barrière cutanée endommagée qui laisse pénétrer les allergènes ce qui peut mener à une sensibilisation accrue aux allergènes chez les individus ayant une prédisposition génétique et à une augmentation du risque de développer les autres phénotypes de la marche atopique, dont les allergies alimentaires, la rhinite allergique et l’asthme. Ce projet avait pour but de développer un indice de risque polygénique (de l’anglais polygenic risk score [PRS]) visant à identifier les nouveau-nés qui sont plus à risque de développer la DA dans la population canadienne afin de prévenir cette pathologie ainsi que sa progression dans la marche atopique. La cohorte régionale d’asthme du Saguenay‒Lac-Saint-Jean et la cohorte de naissances CHILD qui incluent respectivement des données génomiques pour 1 200 individus canadiens français et 5 300 individus des provinces canadiennes anglophones (Vancouver, Edmonton, Winnipeg et Toronto) incluant diverses ethnies ont été employées pour les analyses. Deux scénarios ont été évalués : un avec les meilleurs loci de la couverture pangénomique (Genome-wide association study [GWAS] et données imputées) réalisée dans la population canadienne et un second avec les meilleures associations issues de la littérature scientifique. Les PRS des patients ont été calculés à partir des rapports des chances et du nombre d’allèles à risque pour chacun des loci sélectionnés. Un PRS avec une aire sous la courbe de 85% expliquant donc 36% de la variance dans la DA a été établi avec 25 loci à l’aide d’un modèle incluant l’âge, le sexe ainsi que l’ethnie parentale comme covariables. Un modèle avec uniquement les 6 variants les plus fortement associés (avec un p-value < 1 x 10-40) pourrait également être utilisé car il préserve une bonne discrimination (AUC de 85%), ce qui renforce la possibilité de concevoir un outil diagnostique, un PRS pour la DA, qui permettra d’identifier les nouveau-nés (<3 mois) à risque de développer la DA dans l’optique de prévenir son développement et de surcroît la progression de la marche atopique. / Atopic dermatitis (AD) is characterized by a damaged skin barrier that allows allergens to penetrate the body, leading to a sensitization and a higher risk to develop food allergy, asthma and/or allergic rhinitis, all characterizing the atopic march. This study aims to prevent these diseases by building a polygenic risk score (PRS) to identify newborns with a higher risk of developing AD in the Canadian population. The Saguenay–Lac-Saint-Jean (SLSJ) asthma cohort and the CHILD birth cohort, which includes respectively imputed GWAS data from 1,200 French-Canadian individuals and 5,300 individuals from Vancouver, Edmonton, Winnipeg and Toronto, have been used for analyses. The pooling of these two cohorts have increased the power of analysis and have considered the ethnic variability of the Canadian population. Loci associated with AD in the literature were tested with a general regression model and best associations will be included in the PRS. Patients PRS’ were calculated according to the odds ratio and the number of risk allele(s) for selected loci. A ROC curve will be built to determine the cut-off threshold of the PRS, and analyses have been run on the risk categories and random samples, tested with and without potential covariates, to assess its sensitivity and specificity. A PRS having an area under the curve (AUC) of 85% and explaining 36% of AD variance was built with loci identified from GWAS results and with the contribution of covariates. The PRS developed is aimed to allow to discriminate newborns (<3 months old) that are at risk of developing AD in the perspective
|
8 |
Caractérisation de la diversité génétique des gènes d'avirulence chez Phytophthora sojaeArsenault-Labrecque, Geneviève 02 February 2024 (has links)
L'utilisation de lignées de soya possédant différents gènes Rps (« Resistant to Phytophthorasojae ») demeure la meilleure méthode de lutte pour combattre la pourriture phytophthoréenne. La résistance conférée par les gènes Rps repose sur le concept gène-pour-gène où une relation existe entre un gène de résistance (gène Rps) chez la plante et un facteur d'avirulence correspondant (gène Avr) chez l'agent pathogène. Sept gènes Rps ont été introduits avec succès dans les cultivars commerciaux, soit les gènes Rps1a, Rps1b, Rps1c, Rps1d, Rps1k, Rps3a et Rps6. À long terme, l'agent pathogène arrive à contourner la résistance conférée par ces différents gènes Rps par la diversification génétique de ces gènes d'avirulence, entraînant la complexification des pathotypes de P. sojae. Afin d'exploiter efficacement ce type de résistance, il devient donc primordial de pouvoir identifier ces pathotypes pour connaître l'interaction des différentes souches de P. sojae avec les gènes Rps utilisés. Ce projet de doctorat avait donc comme objectif une meilleure compréhension de la diversité haplotypique des populations de P. sojae, concernant l'interaction avec les gènes Rps d'intérêt commercial, afin de permettre aux producteurs de faire un choix éclairé qu and vient le temps de choisir des lignées résistantes à la maladie. Dans un premier volet de recherche, notre hypothèse stipulait que l'analyse des variations nucléotidiques et structurales associées aux sept principaux gènes d'avirulence de P. sojae permettrait d'identifier le spectre des haplotypes associés aux phénotypes des isolats, relativement à leur compatibilité avec les gènes de résistance Rps correspondants. Le séquençage du génome complet de 31 isolats représentant la diversité des pathotypes canadiens a permis d'identifier les différents haplotypes des sept principaux gènes d'avirulence (1a, 1b, 1c, 1d, 1k, 3a et 6) et d'y associer un profil de virulence pour chaque gène Rps correspondant. L'utilisation d'une méthode de phénotypage en bassin hydroponique a permis de constater que le test traditionnel d'inoculation de l'hypocotyle menait à une proportion importante de faux positifs, ce qui a pu nuire à la compréhension de certaines interactions Rps-Avr par le passé. Notre étude a révélé que l'utilisation unique des signatures génomiques permettait de prédire 99,5 % des interactions possibles et que ces dernières pouvaient donc être utilisées pour prédire précisément le profil de virulence des isolats de P.sojae. Ces résultats ont mené à notre deuxième volet de recherche qui visait à démontrer que les marqueurs discriminants identifiés dans le premier volet de l'étude permettraient de s'affranchir du test de phénotypage, par le développement d'un outil moléculaire de type multiplex PCR, capable de prédire le pathotype des isolats de P. sojae. Des amorces spécifiques permettant d'amplifier les allèles associés à l'avirulence envers chaque gène Rps ont été conçues et multiplexées. Le multiplex PCR développé a démontré une efficacité de 97 % lorsque testé sur un panel d'isolats au profil inconnu de virulence. Le troisième volet de recherche visait à mieux comprendre l'interaction de P. sojae avec le gène de résistance Rps8. Notre hypothèse suggérait que l'avirulence de P. sojae envers le produit du gène de résistance Rps8 était déterminée par un effecteur RXLR, codé par un gène d'avirulence correspondant. L'analyse d'une descendance F2 en ségrégation par génotypage par séquençage couplée à l'utilisation des données de séquençage des 31 isolats de P. sojae a permis de cibler Avr3a comme le meilleur gène candidat. En utilisant la méthode d'édition de génome médiée par CRISPR/Cas9, nous avons démontré que le knock-out complet du gène Avr3a chez P. sojae induisait un gain de virulence envers Rps8. Nous avons aussi démontré qu'un allèle spécifique d'Avr3a était reconnu de façon différentielle par Rps3a et Rps8, ce qui représente la première distinction nette entre ces deux gènes de résistance. L'ensemble de ce projet de doctorat a permis de fournir de nouvelles informations sur la complexité des gènes Avr en plus de démontrer que leurs signatures génomiques pouvaient être utilisées pour prédire précisément l'interaction de l'agent pathogène avec les différents gène Rps du soya. Le développement d'un test moléculaire simple et précis offre aux producteurs et sélectionneurs une solution concrète afin d'exploiter efficacement l'utilisation des gènes Rps. L'identification du gène d'avirulence reconnu par Rps8 permet également d'avoir une longueur d'avance dans la gestion de la maladie, en prévision de l'apparition inévitable de nouveaux pathotypes dans le futur. / The use of soybean lines with different Rps ("Resistant to Phytophthora sojae") genes remains the best control method to control Phytophthora root rot. The resistance conferred by Rps genes is based on the gene-for-gene concept where a relationship exists between a resistance gene (Rps gene) in the plant and a corresponding avirulence factor (Avr gene) in the pathogen. Seven Rps genes have been successfully introduced into commercial cultivars, namely Rps1a, Rps1b, Rps1c, Rps1d, Rps1k, Rps3a and Rps6. In the long term, the pathogen manages to by pass the resistance conferred by these different Rps genes by the genetic diversification of its avirulence genes, leading to the complexification of P. sojae pathotypes. To effectively exploit this type of resistance, it is therefore essential to be able to identify those pathotypes in order to know the interaction of the different strains of P. sojae with the Rps genes in use. This doctoral project aims to have a better understanding of the haplotypic diversity of P. sojae populations, concerning their interaction with the Rps genes of commercial interest, in order to allow producers to make an informed choice when the time comes to choose soybean lines resistant to the disease. In a first approach, our hypothesis stipulated that the analysis of the nucleotide and structural variations associated with the seven main avirulence genes of P. sojae would allow the identification of the spectrum of haplotypes associated with the phenotypes of the isolates, relative to their compatibility with the corresponding Rps resistance genes. The whole-genome-sequencing of 31 isolates representing the diversity of Canadian pathotypes made it possible to identify the different haplotypes of the seven main avirulence genes (1a, 1b, 1c, 1d, 1k, 3a and 6) and to associate a virulence profile for each corresponding Rps gene. The use of a hydroponic phenotyping method showed that the traditional hypocotyl inoculation test leads to a high proportion of false positives, which could have hampered the understanding of certain Rps-Avr interactions in the past. Our study found that the unique use of genomic signatures predicted 99.5% of the possible interactions and that these could therefore be used to accurately predict the virulence profile of P. sojae isolates. These results led to the second part of this doctoral project, which aimed to demonstrate that the discriminating markers identified in the first part of the study would make it possible to bypass the cumbersome phenotyping method by the development of a molecular tool capable of predicting the pathotype of P. sojae isolates. Specific primers for amplifying the alleles associated with avirulence towards each Rps gene were designed and multiplexed. The multiplex PCR developed demonstrated an efficiency of 97% when tested on a panel of isolates with an unknown virulence profile. The third objective of this project was to understand the interaction of P. sojae with the resistance gene Rps8. Our hypothesis suggested that the avirulence of P. sojae towards the Rps8 resistance gene product was determined by an RXLR effector encoded by a corresponding avirulence gene. Analysis of a segregating F2 progeny by using a genotyping-by-sequencing method coupled with the use of sequencing data from the 31 P. sojae isolates led to the identification of Avr3a as the best candidate gene. Using the CRISPR/Cas9-mediated genome editing method, we demonstrated that the complete knockout of the Avr3a gene in P. sojae induced a gain of virulence towards Rps8. We also demonstrated that a specific Avr3a allele is differentially recognized by Rps3a and Rps8, which results in the first clear distinction between those two resistance genes. This doctoral project provided new information about the complexity of Avr genes and demonstrated that their genomic signatures could be used to precisely predict the interaction of the pathogen with the various Rps genes in soybean. The development of a simple and precise molecular test offers to producers and breeders a concrete solution to effectively exploit the use of Rps genes. Identifying the avirulence gene recognized by Rps8 also provides a head start in disease management, in anticipation of the inevitable emergence of new pathotypes in the future.
|
9 |
Étude de la variabilité et de l'assise génétique de l'architecture du système racinaire chez le soya (Glycine max (L.) Merr.)Seck, Waldiodio 27 January 2024 (has links)
L'architecture du système racinaire (ASR) est un aspect fondamental de la productivité des plantes, en particulier dans les environnements aux ressources limitées. Bien que l'importance de l’ASR soit connue, peu d'études ont exploré sa variabilité et son assise génétique chez les plantes, sans doute parce que les racines sont sous terre et sont difficiles à observer. Dans cette étude, nous avons étudié la variation naturelle de l’ASR au sein d’une collection de 137 lignées de soya hâtif représentative de ce qui est cultivé dans l’est du Canada. Nous avons utilisé des « rhizo boîtes », des enceintes constituées de plaques en acrylique, au sein desquelles nous avons documenté le développement du système racinaire en deux dimensions. Des photos ont été prises à l’aide d’une caméra et traitées à l’aide de logiciels d’analyse d’images pour mesurer différents caractères racinaires. Les analyses statistiques ont montré des différences phénotypiques significatives (P < 0,001) pour les caractères étudiés. Pour cette même collection de 137 lignées, nous avions des données génotypiques importantes issues de génotypage par séquençage et de reséquençage (2,18Mde marqueurs SNP). Au moyen de ces données phénotypiques et génotypiques, nous avons effectué des analyses pangénomiques ou GWAS (« Genome-wide association study ») pour identifier des locus de caractère quantitatif (QTL) contrôlant les caractères racinaires à l’étude. Au total, 10 QTL sont détectés pour deux caractères importants : la longueur totale des racines et le diamètre de la racine principale. Au sein de ces régions génomiques, deux gènes candidats sont identifiés dont les fonctions sont connues pour avoir un impact majeur sur l’ASR chez les plantes et qui expliquent de 15 à 25 % de la variation phénotypique observée. Ces gènes pourront servir à développer de nouvelles variétés de soya dotées de meilleurs systèmes racinaires afin d’assurer de meilleurs rendements en conditions de stress. / Root system architecture (RSA) is a fundamental aspect of plant productivity, particularly in resource-limited environments. Despite the importance of RSA, few studies have explored its variability and genetic basis in crops, because roots are underground and are so difficult to observe. In this work, we explored the phenotypic variation in RSA traits in a panel of 137 early soybean linesfrom Eastern Canada. We used rhizoboxes, transparent plastic enclosures, that allowed the study of root system development in two dimensions. Root systems were photographed using a camera and image analysis softwares were used to measure various components of RSA. Significant phenotypic differences for different RSA-related traits were found. The same panel of 137 lines had been characterized through a mixed genotyping approach (Genotyping by sequencing (GBS) and Whole genome sequencing (WGS)) to yield a catalog of 2.18M SNPs. The phenotypic and genotypic data were used for to perform a genome-wide association study (GWAS) to identify quantitative trait loci (QTL) controlling RSA-related traits. In total, 10 QTL regions were detected for two RSA-related traits, namely total root length and main root diameter. These genomic regions harbored two candidate genes whose predicted functions are known to play a role in RSA and which explained from 15 to 25% of the phenotypic variation. These genes can serve to develop new soybean varieties with better root systems to ensure productivity in stressful environments.
|
10 |
Intégration d'annotations fonctionnelles dans les tests d'agrégation de variants rares sous vraisemblance rétrospective dans le cadre de devis familiauxMangnier, Loïc 09 November 2022 (has links)
Depuis ces vingt dernières années et la démocratisation des technologies de séquençage haut débit de l'ADN, l'accessibilité des données génomiques a permis le développement de nouveaux outils analytiques, notamment dans l'étude des maladies complexes. Au-delà de la simple perspective descriptive, il y a un intérêt croissant des chercheurs à étudier les phénomènes biologiques menant à l'émergence ou au développement de maladies chez l'humain. En effet, la vaste majorité des troubles complexes sont la résultante de la combinaison de variations rares et communes situées dans des régions non codantes du génome, rendant l'interprétation des mécanismes biologiques en jeu difficile. Ce dernier point a été l'occasion pour les chercheurs de caractériser, à travers de nouvelles technologies, certaines régions du génome selon leur profil épigénétique et d'intégrer cette information dans de nouveaux outils statistiques dans une optique de détection de variants impliqués dans les maladies. Premièrement, à l'heure actuelle les modèles existant pour caractériser les régions non codantes et les lier à leur(s) gènes cibles n'intègrent pas la notion de réseaux d'interaction. Ainsi il devient critique de proposer un modèle computationnel, valide biologiquement, capable de capturer les contacts entre gènes et éléments de régulation à travers des réseaux, afin de mettre en lumière les mécanismes biologiques impliqués dans les maladies complexes. D'un autre côté, bien que des modèles permettant de tenir compte de la rareté des variants et de leur implication fonctionnelle dans les maladies ont déjà été proposés, ces derniers ne se limitent qu'aux devis cas-témoins d'individus non apparentés, pouvant nécessiter des tailles d'échantillon souvent élevées pour détecter des associations. Il y a alors un réel besoin méthodologique d'étendre ces approches aux études familiales, lorsque ces dernières sont plus performantes pour identifier des variants rares impliqués dans les maladies. Ainsi, dans cette perspective, nous proposons un nouveau modèle de réseaux intégrant l'information épigénétique au travers des contacts physiques entre gènes et enhancers, appelé pôles de régulation cis. Aussi, parce que cette information peut être exploiter afin de mettre en lumière de nouvelles régions associées avec des maladies, nous proposons un nouveau test d'association de variants rares, appelé RetroFun-RVS, exploitant la structure familiale et permettant l'intégration des annotations fonctionnelles sous forme de réseaux. Enfin, nous avons démontré que notre modèle de pôles de régulation cis en plus d'être biologiquement valide est capable de mieux cerner les mécanismes épigénétiques impliqués dans l'étiologie de maladies complexes. Par ailleurs, RetroFun-RVS en incorporant les pôles de régulation cis, en tant qu'annotations fonctionnelles et l'information familiale, a été démontré une approche puissante pour détecter de nouveaux variants causaux. Dans une perspective mécanistique, proposer des modèles unifiant approches familiales et information fonctionnelle ouvre alors de nouvelles voies dans l'étude des maladies complexes, notamment en permettant de cibler plus précisément les phénomènes de régulation impliqués. / Over the past few years, with the development of whole-genome sequencing technologies, improvements have been made in the understanding of complex diseases. Indeed, most phenotypes are characterized by a combination of common and rare variants, mainly located within noncoding regions, making the underlying biological mechanisms difficult to interpret. The increased availability of genomics data has provided opportunities for researchers to characterize noncoding regions and assess their roles in diseases, by incorporating this information in analytical tools to detect new causal variants involved in diseases. On the one side, to date, methods to detect enhancers and link to their target genes do not integrate complex networks of interactions. Indeed, no network-based model integrating physical contacts between genes and enhancers has been proposed. Thus, it remains crucial to provide a computational model which is biologically relevant and able to capture complex regulatory interactions, in order to gain insights in epigenetics mechanisms involved in the etiology of complex diseases. On the other side, although rare-variant association tests integrating functional information have already been proposed, models currently available suffer from two major limitations. Firstly, they are restricted to case-control designs of unrelated people, where tens or hundreds thousand of individuals are often required to reach sufficient power, limiting their applicability in practice. Secondly, these approaches have been mainly evaluated using continuous scores. Indeed, no functional annotations corresponding to regions with regulatory impacts have been assessed. To overcome these limitations, there is an important need to provide family-based rare-variant association tests, incorporating functional annotations through active noncoding regions. Hence, in this thesis, we are firstly proposing Cis-Regulatory Hubs (CRHs), a new 3D-based model integrating contacts between genes and enhancers within networks of complex interactions. Also, we argue that this information can be used to highlight new risk variants involved in complex diseases. Thus, we have developed a new family-based rare variant association test, called RetroFun-RVS, integrating 3D-based functional annotations, such as CRHs. We have demonstrated that CRHs represent biological relevant structures to gain insights into complex disease etiology, such as schizophrenia. Moreover, RetroFun-RVS incorporating CRHs as functional annotations has been shown to be powerful in detecting new risk variants. We argue that these aspects are crucial to highlighting epigenetics mechanisms involved in complex traits. Finally, by proposing an unified framework combining both family-based studies and functional annotations, progress is made in the understanding of the etiology of complex diseases.
|
Page generated in 0.091 seconds