Global ETD Search

21	Approche intégrative du développement musculaire afin de décrire le processus de maturation en lien avec la survie néonatale Voillet, Valentin 29 September 2016 (has links) (PDF) Depuis plusieurs années, des projets d'intégration de données omiques se sont développés, notamment avec objectif de participer à la description fine de caractères complexes d'intérêt socio-économique. Dans ce contexte, l'objectif de cette thèse est de combiner différentes données omiques hétérogènes afin de mieux décrire et comprendre le dernier tiers de gestation chez le porc, période influençant la mortinatalité porcine. Durant cette thèse, nous avons identifié les bases moléculaires et cellulaires sous-jacentes de la fin de gestation, en particulier au niveau du muscle squelettique. Ce tissu est en effet déterminant à la naissance car impliqué dans l'efficacité de plusieurs fonctions physiologiques comme la thermorégulation et la capacité à se déplacer. Au niveau du plan expérimental, les tissus analysés proviennent de foetus prélevés à 90 et 110 jours de gestation (naissance à 114 jours), issus de deux lignées extrêmes pour la mortalité à la naissance, Large White et Meishan, et des deux croisements réciproques. Au travers l'application de plusieurs études statistiques et computationnelles (analyses multidimensionnelles, inférence de réseaux, clustering et intégration de données), nous avons montré l'existence de mécanismes biologiques régulant la maturité musculaire chez les porcelets, mais également chez d'autres espèces d'intérêt agronomique (bovin et mouton). Quelques gènes et protéines ont été identifiées comme étant fortement liées à la mise en place du métabolisme énergétique musculaire durant le dernier tiers de gestation. Les porcelets ayant une immaturité du métabolisme musculaire seraient sujets à un plus fort risque de mortalité à la naissance. Un second volet de cette thèse concerne l'imputation de données manquantes (tout un groupe de variables pour un individu) dans les méthodes d'analyses multidimensionnelles, comme l'analyse factorielle multiple (AFM) (ou multiple factor analysis (MFA)). Dans notre contexte, l'AFM fut particulièrement intéressante pour l'intégration de données d'un ensemble d'individus sur différents tissus (deux ou plus). Afin de conserver ces individus manquants pour tout un groupe de variables, nous avons développé une méthode, appelée MI-MFA (multiple imputation - MFA), permettant l'estimation des composantes de l'AFM pour ces individus manquants. Statistiques Biologie de la reproduction
22	Génomique écologique de la réponse à la compétition chez Arabidopsis thaliana / Ecological genomics of response to competition in Arabidopsis thaliana Baron, Étienne 17 December 2014 (has links) La compétition est considérée comme un facteur majeur responsable de la structure, de la diversité et de la dynamique des communautés végétales. Cependant, la génétique sous-jacente à cette dynamique éco-évolutive est encore peu connue. Notamment, à l’échelle d’une population, la variation génétique naturelle de la réponse à différentes conditions de compétition, l’identité des traits phénotypiques sous sélection génotypique et des bases génétiques impliquées dans la réponse à la compétition sont mal compris. Par une approche de génomique écologique ciblant l’espèce modèle Arabidopsis thaliana, l’objectif principal de cette thèse est de caractériser la génétique associée à la capacité compétitrice à une échelle locale selon une complexité d’interactions avec des espèces compétitrices progressive. En me focalisant d’abord sur la compétition monospécifique, j’ai montré que l’identité du compétiteur et le décalage de sa germination permettaient un maintien de diversité génétique et fonctionnelle au sein de la population-cible. Par une approche de Genome Wide Association (GWA) mapping, j’ai identifié différents QTLs de réponse à la compétition selon les conditions de compétition monospécifique. Puis, j’ai démontré que le contexte d’interactions plurispécifiques modifiait la réponse à la compétition d’une population locale. De plus, j’ai montré que la réponse à la compétition d’une population locale pouvait évoluer en huit générations, en lien avec des changements de composition spécifique au sein de la communauté. Enfin, j’ai démontré que la dynamique adaptative d’A. thaliana pouvait être fortement influencée par l’intensité de la compétition en conditions naturelles. / Competition is considered as a major factor responsible for plant communities structure, diversity and dynamics. However, the genetics underlying this local eco-evolutionary dynamics remains poorly understood. Notably, at the population scale, the natural genetic variation of response to different competition conditions, the identity of phenotypic traits under genotypic selection and of genetic basis implied in the response to competition still need to be addressed. By an ecological genomics approach using the model species Arabidopsis thaliana, the main goal of this thesis is to characterize the genetics related to the competitive ability at a local scale, according to an increasing complexity of interactions between the competitor species. First, by focusing on monospecific competition, I showed that both the competitor identity and the lag of competitor germination time promote the maintenance of the genetic and functional diversities within the target population. Based on an approach of Genome Wide Association (GWA) mapping, I detected QTLs of response to competition that were strongly dependent on the conditions of monospecific competition. Second, in the context of multispecific interactions, I demonstrated that the response of a local population to competition was highly specific to the surrounding communities considered. In addition, based on a resurrection approach, I showed that the response of a local population to competition could evolve in less than eight generations, likely in relationship to community shifts. Third, I demonstrated that the adaptive dynamic of A. thaliana was highly influenced by the competition intensity in natural conditions. Génomique écologique Interactions plante-Plante 576.58
23	Caractérisation des mutations menant à l'inactivation du gène codant pour l'enzyme 21-hydroxylase Gingras, Marianne January 1994 (has links) Mémoire numérisé par la Direction des bibliothèques de l'Université de Montréal. Génétique humaine Duplication Recombinaison ADN génomique
24	Investigation des éléments génomiques impliqués dans la perte de virulence d'Aeromonas salmonicida ssp. salmonicida suite à un stress thermique Marcoux, Pierre-Étienne 02 February 2024 (has links) Aeromonas salmonicida ssp. salmonicida est l'agent étiologique de la furonculose chez les salmonidés, spécialement les poissons d'élevage. Les pertes économiques pour l'aquaculture au Québec liées à cette maladie sont considérables. En raison des traitements par antibiotiques, on observe une émergence de souches d'A. salmonicida ssp. salmonicida résistantes aux antibiotiques. C'est pourquoi différentes alternatives, dont la vaccination, sont étudiées afin de prévenir la furonculose. Généralement, les vaccins utilisés injectent des bactéries mortes. En revanche cette méthode peut être laborieuse et inefficace. Ce projet s'intéresse au développement de souches vivantes atténuées qui pourraient être utilisées comme vaccin dans les piscicultures. Des études antérieures ont démontré que la virulence de la bactérie pouvait être atténuée lorsqu'exposée à un stress. Cela est expliqué par la perte des gènes du système de sécrétion de type trois (SSTT), qui ont un rôle essentiel dans la virulence de la bactérie. Cependant, le mécanisme reste encore inconnu et conséquemment, ce projet avait comme principal objectif d'identifier et caractériser les différents éléments génomiques pouvant contribuer à l'instabilité du SSTT. Tout d'abord, plusieurs souches d'A. salmonicida ssp. salmonicida ont été cultivées à 25 °C, ce qui est supérieur à leur température optimale de 18 °C. Les résultats ont révélé que certaines souches pouvaient perdre leur SSTT, mais que d'autres étaient réfractaires à la délétion des gènes malgré leur exposition à un stress. Une analyse génomique de ces différentes souches a permis d'identifier la présence d'un regroupement de gènes qui semble jouer un rôle dans l'instabilité du SSTT. Ces gènes sont retrouvés en majorité chez les souches sensibles et ils sont absents pour les souches réfractaires. Ce regroupement de gènes sera étudié en vue de créer des souches atténuées à partir de souches réfractaires. Ces souches seront ensuite testées sur les poissons pour déterminer l'efficacité de cette approche vaccinale contre la furonculose. / Aeromonas salmonicida ssp. salmonicida is the causative agent of furunculosis in salmonids, especially in farmed fish. The economic losses for aquaculture in Quebec related to this disease are considerable. As a result of antibiotic treatments, there is the emergence of antibiotic-resistant strains of Aeromonas salmonicida ssp. salmonicida. This is why different alternatives, including vaccination, are being studied to prevent furunculosis. Historically, the vaccines used are composed of dead bacteria. However, this method can be laborious and inefficient. This project is interested in the development of live attenuated strains that could be used as a vaccine in fish farms. Previous studies have shown that the virulence of the bacteria can be reduced when exposed to stress. This is explained by the loss of the genes of the type three secretion system (TTSS), which is essential in the virulence of the bacteria. However, the mechanism is still not fully understood and consequently the main objective of this project was to identify and characterize the different genomic elements that can contribute to the instability of TTSS. First, several strains of A. salmonicida ssp. salmonicida were grown at 25 °C, which is above their optimum temperature of 18 °C. The results revealed that some strains could lose their TTSS, but others were resistant to gene deletion despite their exposure to stress. Genomic analysis of these different strains identified the presence of a cluster of genes that appears to play a role in the instability of TTSS. These genes are found mostly in sensitive strains and they are absent in refractory strains. This cluster of genes will be studied to create attenuated strains from refractory strains. These strains will then be tested on fish to determine the effectiveness of these strains as a vaccine approach against furunculosis. Aeromonas salmonicida. Génomique. Virulence (Microbiologie) Salmonidés -- Vaccination.
25	Génomique fonctionnelle des gènes uniques chez Pseudomonas aeruginosa LESB58 et essentiels à l'infection pulmonaire chronique Lemieux, Andrée-Ann 18 April 2018 (has links) Pseudomonas aeruginosa est un pathogène opportuniste responsable des infections pulmonaires chroniques chez les patients atteints de fibrose kystique (FK). L’émergence de nouvelles souches épidémiques hypervirulentes, multi-résistantes aux antibiotiques et possédant une grande capacité de transmission, telles que LESB58, entraîne de grandes difficultés de traitement et une augmentation de la mortalité chez ces patients. Le séquençage complet de LESB58 a révélé un génome à 90% hautement conservé additionné de 455 gènes regroupés sous six prophages (PPs) et cinq îlots génomiques (GIs). Cette étude a pour objectif de déterminer l’implication de ces régions supplémentaires dans la pathogénie de LESB58. Une mutagenèse à étiquette signature (STM) suivie de plusieurs criblages ont permis de sélectionner 162 mutants dont 11 portant une insertion dans un GI ou PP. Des analyses subséquentes ont été réalisées sur ces mutants afin d’évaluer leur niveau de virulence in vivo dans un modèle d’infection pulmonaire chronique chez le rat. Des analyses de génomique ont été effectuées sur deux de ces mutants afin de mieux comprendre leur incapacité à établir l’infection dans le modèle d’infection in vivo. / Pseudomonas aeruginosa is an opportunistic pathogen and causes chronic pulmonary infection to cystic fibrosis (CF) patients. The hypervirulent epidemic strain LESB58 is associated with high transmissibility and is highly resistant to antibiotics causing increased morbidity and mortality. Whole genome sequencing of LESB58 revealed a 90% highly conserved core genome and 455 additional genes grouped in five genomics islands (GIs) and six prophages (PPs). The aim of this study was to determine the implication of the accessory genome in LESB58 virulence. We performed a signature tagged mutagenesis (STM) followed by an in vivo screening of the mutants. From 162 STM mutants defective for in vivo maintenance, we selected 11 harbouring an insertion in GI or PP for further virulence analysis. Two of these mutants were used for genomics analysis in order to better understand their incapacity for in vivo maintenance in the rat model of chronic lung infection. Virulence (Microbiologie)
26	Assemblage adaptatif de génomes et de méta-génomes par passage de messages Boisvert, Sébastien 20 April 2018 (has links) De manière générale, les procédés et processus produisent maintenant plus de données qu’un humain peut en assimiler. Les grosses données (Big Data), lorsque bien analysées, augmentent la compréhension des processus qui sont opérationnels à l’intérieur de systèmes et, en conséquence, encouragent leur amélioration. Analyser les séquences de l’acide désoxyribonucléique (ADN) permet de mieux comprendre les êtres vivants, en exploitant par exemple la biologie des systèmes. Les séquenceurs d’ADN à haut débit sont des instruments massivement parallèles et produisent beaucoup de données. Les infrastructures informatiques, comme les superordinateurs ou l’informatique infonuagique, sont aussi massivement parallèles de par leur nature distribuée. Par contre, les ordinateurs ne comprennent ni le français, ni l’anglais – il faut les programmer. Les systèmes logiciels pour analyser les données génomiques avec des superordinateurs doivent être aussi massivement parallèles. L’interface de passage de messages permet de créer de tels logiciels et une conception granulaire permet d’entrelacer la communication et le calcul à l’intérieur des processus d’un système de calcul. De tels systèmes produisent des résultats rapidement à partir de données. Ici, les logiciels RayPlatform, Ray (incluant les flux de travail appelé Ray Meta et Ray Communities) et Ray Cloud Browser sont présentés. L’application principale de cette famille de produits est l’assemblage et le profilage adaptatifs de génomes par passage de messages. / Generally speaking, current processes – industrial, for direct-to-consumers, or researchrelated – yield far more data than humans can manage. Big Data is a trend of its own and concerns itself with the betterment of humankind through better understanding of processes and systems. To achieve that end, the mean is to leverage massive amounts of big data in order to better comprehend what they contain, mean, and imply. DNA sequencing is such a process and contributes to the discovery of knowledge in genetics and other fields. DNA sequencing instruments are parallel objects and output unprecedented volumes of data. Computer infrastructures, cloud and other means of computation open the door to the analysis of data stated above. However, they need to be programmed for they are not acquainted with natural languages. Massively parallel software must match the parallelism of supercomputers and other distributed computing systems before attempting to decipher big data. Message passing – and the message passing interface – allows one to create such tools, and a granular design of blueprints consolidate production of results. Herein, a line of products that includes RayPlatform, Ray (which includes workflows called Ray Meta and Ray Communities for metagenomics) and Ray Cloud Browser are presented. Its main application is scalable (adaptive) assembly and profiling of genomes using message passing. Génomique -- Informatique Assemblage (Informatique) Systèmes adaptatifs (Informatique)
27	Intégration de la toxicogénomique à l'évaluation du risque à la santé humaine : une étude exploratoire Vachon, Julien 03 July 2024 (has links) L’évaluation du risque à la santé humaine (ÉRSH) doit s’adapter aux défis du 21e siècle, et la toxicogénomique est au cœur des changements que les agences réglementaires veulent implantés. Cependant, l’utilisation de données issues de la toxicogénomique en ÉRSH est encore marginale. L’objectif de cette étude est d’étudier l’état de l’utilisation de la toxicogénomique en ÉRSH au Canada et de caractériser, de façon exploratoire, les facteurs individuels et organisationnels entravant une telle utilisation. L’étude comporte deux volets. Le premier consistait en une enquête par questionnaire électronique menée auprès d’évaluateurs de risque canadiens. Vingt-neuf (29) participants ont complété et retourné le questionnaire. Le deuxième consistait en un examen de la portée des publications toxicogénomiques portant sur les trihalométhanes. L’examen de la portée a identifié 9 publications satisfaisant aux critères de sélection, lesquelles ont été incluses dans l’analyse. Les résultats démontrent que l’utilisation de la toxicogénomique en ÉRSH reste marginale, 85% des répondants au sondage ayant rapporté n’avoir jamais utilisé de telles données dans leur pratique. Le principal facteur individuel entravant l’utilisation de données toxicogénomiques en ÉRSH semble être le manque de connaissance en toxicogénomique chez les évaluateurs de risque (68% des répondants n’étant « pas » ou « peu familiers » avec le concept). Les principaux facteurs organisationnels identifiés sont le manque de lignes directrices guidant l’utilisation de la toxicogénomique en ÉRSH, et le manque de leadership et de soutien de la part des organisations envers le développement de telles lignes directrices ainsi qu'envers la formation des évaluateurs de risque. Les résultats de l’examen de la portée démontrent que la faible disponibilité (n=9) et la qualité faible ou incertaine des publications toxicogénomiques (3/9 satisfaisant aux critères de qualité) peuvent également être des freins importants. Les résultats permettent de suggérer des pistes d’interventions visant à appuyer l’application de la toxicogénomique en ÉRSH. / Human health risk assessment (HHRA) must be adapted to the challenges of the 21st century, and toxicogenomics data are at the centre of the paradigm that regulatory agencies worldwide are trying to implement. However, the use of toxicogenomics data in HHRA is still limited. The study aims to explore the state of the use of toxicogenomics in HHRA and to characterise individual and organisational factors that impede such a use. The study was conducted in two parts. The first part consisted in an online survey targeted at Canadian risk assessors. Twenty-nine (29) completed surveys were returned after two months of solicitation. The second part consisted in a scoping review of the toxicogenomics publications on trihalomethanes. The scoping review identified nine (9) publications satisfying the eligibility criteria, and were included in the analysis. Results show that the use of toxicogenomics in HHRA is still marginal, 85% of survey respondents having reported having never used such data in their practice. The main individual factor impeding the use of toxicogenomics in HHRA is the lack of knowledge of toxicogenomics by risk assessors (68% of respondents are “not at all” or “only a little” familiar with the concept). The main organisational factors are the lack of recognised guidelines guiding the use of toxicogenomics in HHRA, and the lack of leadership and support of organisations towards the development of such guidelines and towards training of risk assessors. Results from the scoping review show that the low availability (n=9) and the low or uncertain quality of toxicogenomics publications (3/9 satisfying the essential quality criteria) can also be an important barrier. The results allowed to suggest interventions aimed at supporting the use of toxicogenomics data in HHRA. Génomique. Toxicologie. Risques pour la santé -- Évaluation
28	Étude de la diversité génomique de la levure d'intérêt fromager, Geotrichum candidum Perkins, Vincent 27 January 2024 (has links) Geotrichum candidum est une levure dimorphique utilisée en fromagerie pour l’affinage des fromages de spécialité. Elle s’implante à la surface des fromages et utilise les constituants de la matrice fromagère (protéines, lipides, acides organiques, etc.), ce qui confère aux fromages leurs propriétés sensorielles typiques. Ces capacités technologiques dépendent toutefois de la souche. Les études récentes basées sur l’analyse phylogénétique et transcriptomique de souches de G. candidum ont révélé une diversité génétique importante au sein de cette espèce, ce qui pourrait expliquer la variabilité des capacités technologiques. Cependant, peu d’informations sont disponibles quant aux caractéristiques génétiques des souches responsables de leurs propriétés aromatisantes et fonctionnelles lors de l’affinage des fromages. La compréhension fine des activités de G. candidum est prioritaire tant pour les artisans-fromagers que pour les grandes fromageries industrielles afin de sélectionner les souches les plus performantes pour leur produit. L’objectif principal de cette étude était de déterminer la diversité génétique entre les souches de la levure Geotrichum candidum par utilisation de la génomique comparative et de proposer une méthode moléculaire pour l’identification et la caractérisation rapide des souches. Les génomes de huit souches de G. candidum d’origine laitière ont été séquencés. Les génomes obtenus avaient une taille moyenne de 24,5 Mb et 5 230 gènes prédits. L’homologie des séquences de chaque souche a permis de les regrouper en trois groupes phylogénétiques distincts pour lesquels des gènes uniques ont pu être identifiés. Sur la base de l’analyse des séquences génomique, une méthode optimisée de génotypage par MLST a été développée et validée sur 41 souches de G. candidum. Cette méthode a permis de reproduire les résultats obtenus avec l’analyse génomique et permet une identification rapide des souches et de leurs groupements phylogénétiques. Les résultats générés dans ce projet permettront de développer des outils pour la sélection optimale des ferments d’affinages basés sur leurs capacités technologiques spécifiques. Ils serviront également à améliorer notre compréhension de la physiologie de cette levure et de décrire et optimiser l’utilisation des souches de G. candidum lors de l’affinage afin d’ultimement contrôler davantage la qualité des fromages. / The yeast Geotrichum candidum is used in several specialty cheeses varieties, such as mold and smear-ripened cheeses, and plays several roles during cheese ripening. Its ability to metabolize proteins, lipids and organic acids enables its growth on the cheese surface and participate to the development of organoleptic properties. By alkalinizing the surface duringi ts growth, it also establishes suitable conditions for the growth of other ripening microorganisms. Yet, several technological abilities of G. candidum are strains dependent. However, little information is available related to the genetic characteristics that define the flavoring and functional properties of this yeast during the ripening of cheeses. A detailed understanding of G. candidum metabolic activities is a priority for both artisanal cheese makers and large industrial cheese factories in order to detect the most efficient strains for their product. The main objective of this study was to determine the genetic diversity within the G. candidum species by comparative genomic and to propose a rapid molecular method for the identification and characterization of the strains. Eight strains of G. candidum of dairy origin was sequenced. The genomes obtained had an average of 24.5 Mb and 5,230 putative genes. The sequence homologies show that the strains divide into three distinct groups for which each contains unique genes. On the basis of the genomic sequences, a MLST method was optimized and validated for 41 G. candidum strains. This method reproduces the results obtained for the genomic analysis and allows a rapid identification of the strains and their grouping.The results generated in this project will improve our understanding of the physiology and the utility of the G. candidum strains during the ripening of cheese to ultimately be able to better control it. Geotrichum candidum -- Génétique. Génomique comparative. Fromage -- Microbiologie.
29	Pan-génome du riz africain cultivé Oryza glaberrima et son ancêtre sauvage Oryza barthii / Pan-genome of cultivated african rice Oryza glaberrima and his wild ancestor Oryza barthii Monat, Cécile 10 November 2016 (has links) La diversité d’une espèce est représentée par la somme de la diversité de chacun des individus qui la compose. Elle peut être observée à différentes échelles : individuelle, organique, tissulaire, cellulaire, génomique, génique, ou bien à l’échelle de la base nucléotidique. L’étude de la diversité d’une espèce est importante pour mieux la comprendre et nous permettre de retracer son histoire évolutive, de la comparer avec d’autres espèces notamment entre espèces sauvages et cultivées. Nous nous intéressons aux processus de domestication, et particulièrement à leurs impacts sur la structure du pan-génome. Le pan-génome est divisé en trois compartiments : (i) le core-génome qui contient tous les gènes présents chez tous les individus de l’espèce ; (ii) le génome dispensable qui contient l’ensemble des gènes qui sont absents chez au moins un individu ; (iii) et enfin le génome individu-spécifique qui contient les gènes présents uniquement chez un individu.L’objectif de ce travail de thèse était de mettre au point une nouvelle méthode d’analyse pan-génomique applicable sur un grand nombre d’individus. Pour cela, nous avons travaillé sur un jeu de données de reséquençage massif du riz Africain cultivé O. glaberrima et de son ancêtre sauvage O. barthii. Dans un premier temps nous avons vérifié l’existence d’une structure pan-génomique sur notre modèle. Pour cela nous avons travaillé à petite échelle avec trois accessions de l’espèce cultivée. Elles ont d’abord été séquencées, assemblées, annotées puis nous avons cherché à détecter des séquences spécifiques à chacune de ces accessions.Dans un second temps nous avons mis au point notre méthode en travaillant avec près de 200 génomes des deux espèces.Ces génomes ont été séquencés grâce aux technologies NGS puis directement mappés sur un génome de référence externe, celui du riz Asiatique. Nous avons alors appliqué notre méthode d’analyse pan-génomique basée sur la déviation de la profondeur deséquençage pour chaque gène. Nous avons ensuite comparé les enrichissement d’ontologies par compartiments et par espèce dans le but d’identifier des différences liées aux processus de domestication. Enfin, nous avons étudié plus précisément les appartenances pan-génomiques des membres de famille de gènes.Parce que le pan-génome de l’espèce cultivé est plus petit que le core-génome de l’espèce sauvage nous avons confirmé la perte de diversité en terme de présence/ absence de gènes chez le riz Africain au cours du processus de domestication. Curieusement nous avons aussi mis en avant l’augmentation du nombre de gènes dispensable chez l’espèce cultivée par rapport à son relatif sauvage.Ainsi, malgré une forte réduction du pan-génome de l’espèce cultivé lors de la « première » sélection, les 1000 générations de processus de domestication ont suffit à réintroduire une forme de diversité à travers l’augmentation du nombre de gènes dispensables.Afin d’automatiser une grande partie des manipulations d’analyses de données NGS nous avons aussi développé un outil de génération de pipelines d’analyses. De part sa généricité et sa robustesse il pourra être utilisé dans différents domaines, pour plu-sieurs types de données. Grâce aux nombreux logiciels qui y sont intégrés et de par le suivi que l’équipe de développement entend poursuivre, il pourra être utilisé dans la caractérisation de plus en plus de choses. Par exemple les variations structurales, les associations génotypes-phénotypes, l’épigénétique et pourquoi pas la métagénomique.Ce travail a permis la mise au point d’une nouvelle méthode d’analyse des données pan-génomiques rapide de par sa vision globale plutôt que via des comparaisons deux-à-deux. Cette méthode s’adresse aux génomes grands et complexes comme ceux des plantes, mais aussi aux jeux de données massifs. / Species diversity is represented by the sum of the diversity of each of the individuals composing it. It can be seen at differents cales: individual, organic, tissular, cellular, genomic, gene, and even nucleotic. The study of the diversity of species is important to better understand and allow tracking its evolutionary history, comparing it to other species, in particular wild to cultivated. We focused on the domestication, and particularly its impact on the pan-genome structure.The pan-genome is divided into three compartments: (i) the core-genome containing all the genes present in all individuals of the species; (ii) the dispensable genome containing all genes absent in at least one individual; (iii) and finally the individual-specific genome containing genes present only in one individual.The objective of this thesis was to develop a new method for pan-genomic analysis that can apply to a large number of indi-viduals. For this, we worked on a massive resequencing data set of cultivated African rice O. glaberrima and of its wild ancestor O. barthii. At first we checked the existence of a pan-genomic structure on our model. For this we worked on a small scale, with three accessions of cultivated species. They were sequenced, assembled, annotated then analyzed to detect specific sequences for each accession.Secondly we developed our approach working with nearly 200 genomes of both species. These genomes were sequenced using Illumina technology and mapped to the external reference genome, of the Asian rice. We applied our pan-genomic method analysis based on the deviation of the depth of sequencing for each gene. We then compared the ontology enrichment compartments and species in order to identify differences related to the domestication process. Finally, we looked specifically to pan-genomic genes belonging to gene family. Because the pan-genome of the cultivated species is smaller than the core-genome of the wild one, we confirmed the loss ofdiversity in terms of presence/ absence of genes in African rice during the domestication process. Curiously we have also high lighted the increase in the number of dispensable genes in the crop from its wild relative. Thus, despite a sharp reduction of the pan-genomeof the species cultivated in the “first” selection, the 1,000 generations of domestication process were enough to reintroduce a formof diversity through increasing the number of dispensable genes.To automate much of the data analysis of NGS manipulations we have also developed a tool to generate analysis pipelines.Due to its generic and robustness it can be used in different areas, for several types of data. With many softwares integrated and by monitoring that the development team will continue, it may be used in the characterization of more and more things. For example,structural variations, genotype-phenotype associations, epigenetics and metagenomics. This work enabled the development of a new analytical method for rapid genome-wide data through its global vision ratherthan through two by two comparisons. This method is for large and complex genomes such as those of plants, but also to massivedata sets. Pan-Génome Génomique Génomique comparative Bioinformatique Riz africain Pan-Genome Genomic Comparative genomic Bioinformatic African rice
30	Population structure and genome-wide association in the malaria vectors Anopheles gambiae and Anopheles coluzzii / Structure de population et large génome association dans les vecteurs de malaria Anopheles gambiae et Anopheles coluzzii Redmond, Seth 23 February 2015 (has links) Malgré le succès des insecticides pour le contrôle du paludisme, la transmission continue dans la plupart des pays d’Afrique sub-saharienne. La recherche pour de nouveaux moyens de contrôle (plus spécialement la modification génétique des populations vecteurs), ou l'utilisation plus efficace des contrôles actuels, vont nécessiter une recherche sur les structures de populations de moustiques et les processus d’immunisation qui importent pour la transmission du Plasmodium chez les moustiques sauvages. Par ailleurs, l’utilisation des techniques d’association génomique ‘GWAS’ est basée sur un réelle compréhension des structures des populations.Ma thèse inclura une description detaillée du système immunitaire du moustique, basée sur la recherche actuelle et des comparaisons génomiques; ainsi que des descriptions des principales voies immunitaires, et des gênes potentiels mal-caracterisés qui peuvent être trouvés dans une étude GWAS. Ainsi qu’une description des connaissances actuelles des structures des populations, dont la speciation du gambiae / coluzzii, et les effets des grandes variations structurelles.Je présenterai le développement d’un nouveau moyen d'identification des variations structurelles ; utilisant les techniques d’ “apprentissage automatique” permettant d'identifier les karyotypes directement à partir des séquences haut-débit, menant à des résultats d’une précision sans précédent.Je présenterai également la première vraie cartographie génomique du ‘tout-génome’ du moustique. Les colonies sont fondées par des moustiques sauvages; les fondateurs sont controlées par strates, incluant également des sous-espèces et variations structurelles majeures. Avec ces colonies une méthode innovant de cartographie est utilisée: dans un premier temps, une identification des grandes régions au sein des groupes phenotypées par la perte de hétérogénéité; puis dans un second temps, le génotypage individuel ‘Sequenom’ sera utilisé pour une cartographie exacte. Cette méthode est utilisée pour l’identification d’une région avec un effet phenotypique sur la prévalence des infections dans la nature.Enfin, je suggèrerai comment ces techniques peuvent être importantes à l’avenir pour l’application du contrôle génomique dans la nature. / Despite successes in the use of insecticides in the control of malaria, malaria transmission continues in much of sub-saharan Africa. The search for novel methods of control (in particular genetic modification of vector populations), or of superior implementation of the currently available methods will require both greater knowledge of the population structure of the mosquito, and of the immune processes that are important in the wild. It is important to note that the mapping of novel immune genes, via genome wide association studies (GWAS) is predicated on a firm understanding of the population structure.My thesis will include a detailed description of the mosquito innate immune system based on current research and comparative genomics; this will illustrate the major pathways that might be employed in the anti-malarial response, and some potential uncharacterised genes that might be implicated in any GWAS study. It will also include a summary of what is known about the mosquito’s population structure, in particular the gambiae / coluzzii speciation event and the implication of chromosomal inversions in the speciation process.I will present the development of a novel approach to the identification of chromosomal inversions; using machine-learning techniques in order to call inversion karyotypes directly from sequence, leading to calls of unprecedented accuracy.I will also present the first truly genome-wide association study to have been performed in the mosquito. Strata-controlled populations of mosquitoes were derived from the wild, including restriction on the basis of subspecies and chromosomal inversion. A two-stage mapping design was then devised in which loss-of-heterozygosity is used to identify broad regions in phenotype pools, before fine-resolution mapping by Sequenom genotyping in individuals. This was used to identify a novel locus with a phenotypic effect on infection prevalence.Finally I will describe how these techniques and findings could be important in the future application of genetic control in the wild. Compétence des vecteurs Immunité antipaludique Cartographie génomique GWAS Génomique des populations Anti-malarial response GWAS 571.157

Search results