Global ETD Search

21	Génomique comparative et fonctionnelle de familles de gènes liés au métabolisme secondaire de la vigne (Vitis vinifera) et de ses proches parents / Comparative and functional genomics of gene families linked to secondary metabolism in grapevine (Vitis vinifera) and its relatives Arista, Gautier 31 January 2017 (has links) La vigne (Vitis vinifera) possède un métabolisme secondaire particulièrement riche donnant naissance à une large palette de molécules dont certaines sont impliquées dans les défenses contre les pathogènes et d'autres dans la grande diversité d’arômes qui fait la renommée des vins. L’analyse de la séquence de référence du génome de la vigne a permis de mettre en évidence une remarquable expansion de certaines familles de gènes liés au métabolisme secondaire par rapport aux autres plantes. Dans ce travail, j'ai étudié les familles gènes codant pour les cytochromes P450, dont certains sont impliqués dans la production d’arômes, les gènes codant pour les stilbènes synthases (STS), les endo-β-1,3-glucanases et les gènes de résistance de type NBS impliqués dans les défenses de la vigne. Ma thèse vise à proposer des hypothèses expliquant l’organisation structurale de ces familles de gènes et ainsi à mieux comprendre pourquoi certaines familles présentent une amplification dans le génome de la vigne. Des approches bioinformatiques ont été utilisées afin d’étudier ces différentes familles de gènes. Les gènes cytochromes P450 et gènes R de type NBS ont tout d'abord été annotés de manière manuelle dans le génome de référence de la vigne. L’expression des gènes endo-β-1,3- glucanases, STS et cytochromes P450 a été analysée en utilisant une approche transcriptomique à grande échelle. Pour ce faire, un outil a été développé durant cette thèse pour estimer le niveau d’expression des gènes à partir de données RNA-Seq disponibles dans les banques de données publiques. Parallèlement, des données de reséquençage d’ADN de 56 cépages et espèces de vigne ont été analysées, afin de déterminer les variations structurales de type CNV au sein des familles de gènes à domaine NBS et de gènes STS. Ces différents travaux ont permis de montrer que l’amplification des familles de gènes étudiées n’est pas spécifique du génome de référence mais est retrouvée dans l'ensemble du genre Vitis, mais également de mettre en évidence des variations structurales au sein des différents génomes étudiés. L'analyse de la famille STS a montré que ces gènes sont organisés en blocs de duplication, et que les gènes plus conservés sont aussi les plus exprimés. Nous avons également montré que les gènes à domaine NBS sont organisés en cluster, dont certains sont particulièrement soumis à variation. Ces travaux contribuent à une meilleure connaissance de facteurs de défense efficaces et durables ainsi que des gènes impliqués dans la synthèse d’arômes dans la vigne. Ces connaissances pourront bénéficier aux programmes de création variétale mis en œuvre à l’INRA de Colmar. / Grapevine (Vitis vinifera) has a particularly rich secondary metabolism, giving rise to a wide range of molecules, some of which are involved in defences against pathogens and others in the great diversity of aromas that make wines famous. Analysis of grapevine reference genome has shown a remarkable expansion of certain families of genes linked to secondary metabolism in comparison with the other plants. In this work, I have analysed gene families coding for cytochromes P450, some of them being involved in the production of aromas, genes coding for stilbene synthases (STS), endo-β-1,3-glucanases and NBS type resistance genes involved in grapevine defences. My thesis intends to propose hypothesis to explain the structural organisation of these families and therefore better understand why some of these families are amplified in the grapevine genome. Bioinformatic approaches have been used to study these different genes families. The cytochromes P450 and R genes of NBS type were manually annotated to improve the knowledge of these families of genes. The expression of endo-β-1,3-glucanases, STS and cytochromes P450 genes has been quantified using a large-scale transcriptomic approach. To this purpose, a tool has been developed during this thesis to estimate the level of genes expression from RNA- Seq data available in public databases. In the meantime, DNA resequencing data from 56 cultivars and grapevine species have been analysed to identify structural variations of CNV types within the genes with a NBS domain and the STS genes. These works showed that the amplification of the gene families of interest was not specific to the reference genome but occurred at the scale of the Vitis genus, but also to highlighted structural variations in different genomes. Regarding the STS genes, blocks of duplication and more conserved and expressed genes were identified. For the genes with NBS domain, a clustered organisation has been highlighted with some clusters varying more than others in the studied genotypes. These works contribute to a better knowledge of gene families for efficient and durable defence against pathogens and optimal aromas synthesis in grapevine. This knowledge will benefit to breeding programs currently in progress at INRA Colmar. Vigne Familles de gènes Génomique comparative Transcriptomique CNV Grapevine Family of genes Comparative genomics Transcriptomics CNV 572.8 581
22	Méthodes in silico pour l'étude des réarrangements génomiques : de l'identification de marqueurs communs à la reconstruction ancestrale. Jean, Géraldine 09 December 2008 (has links) (PDF) L'augmentation du nombre de génomes totalement séquencés rend de plus en plus efficace l'étude des mécanismes évolutifs à partir de la comparaison de génomes contemporains. L'un des principaux problèmes réside dans la reconstruction d'architectures de génomes ancestraux plausibles afin d'apporter des hypothèses à la fois sur l'histoire des génomes existants et sur les mécanismes de leur formation. Toutes les méthodes de reconstruction ancestrale ne convergent pas nécessairement vers les mêmes résultats mais sont toutes basées sur les trois mêmes étapes : l'identification de marqueurs commun dans les génomes contemporains, la construction de cartes comparatives des génomes, et la réconciliation de ces cartes en utilisant le critère de parcimonie maximum. La quantité importante des données à analyser nécessite l'automatisation des traitements et résoudre ces problèmes représente de formidables challenges computationnels. Affiner les modèles et outils mathématiques existants par l'ajout de contraintes biologiques fortes rend les hypothèses établies biologiquement plus réalistes. Dans cette thèse, nous proposons une nouvelle méthode permettant d'identifier des marqueurs communs pour des espèces évolutivement distantes. Ensuite, nous appliquons sur les cartes comparatives reconstituées une nouvelle méthode pour la reconstruction d'architectures ancestrales basée sur les adjacences entre les marqueurs calculés et les distances génomiques entre les génomes contemporains. Enfin, après avoir corrigé l'algorithme existant permettant de déterminer une séquence optimale de réarrangements qui se sont produits durant l'évolution des génomes existants depuis leur ancêtre commun, nous proposons un nouvel outil appelé VIRAGE qui permet la visualisation animée des scénarios de réarrangements entre les espèces. [INFO:INFO_OH] Computer Science/Other génome ancestral génomique comparative réarrangement point de<br /> cassure permutation
23	Reconstruction de génomes ancestraux chez les vertébrés Muffato, Matthieu 15 December 2010 (has links) (PDF) La génomique comparative est une discipline de la biologie qui s'intéresse à l'évolution des génomes par le biais de la comparaison entre espèces de leur structure et de l'information qu'ils contiennent. Implicitement, identifier des similarités entre deux génomes revient à décrire une propriété ancestrale qu'ils partagent encore de nos jours. L'abondance de données génomiques provenant de centaines d'espèces différentes rend possible de nombreuses comparaisons de ce type, mais souvent restreinte à deux espèces comparées l'une à l'autre, hors de tout cadre unifié et sans références particulières. Ce travail de thèse décrit une nouvelle méthode, appelée AGORA (Algorithms for Gene Order Reconstruction in Ancestors), pour reconstruire de manière automatique et systématique l'ordre des gènes et les caryotypes de toutes les espèces ancestrales dans une phylogénie donnée. AGORA est capable de gérer les duplications de gènes, les délétions, et les gains, et interprète de manière réaliste des phylogénies complexes de gènes. Nous avons appliqué la méthode chez 46 espèces de vertébrés séquencées et annotées (en utilisant 8 espèces supplémentaires en référence externe) pour reconstruire des ordres de gènes ancestraux dans 43 génomes ancestraux sur près de 600 millions d'années d'évolution. Les performances d'AGORA ont été mesurées par des simulations de génomes de vertébrés, et par confrontation à des génomes ancestraux déjà connus. Les données, présentées graphiquement dans un serveur web nommé Genomicus (http://www.dyogen.ens.fr/genomicus) fournissent un nouveau cadre unifié dans lequel les génomes ancestraux peuvent servir de référence naturelle auxquelles comparer les génomes modernes qui en descendent. À ce titre, ces données fournissent une nouvelle ressource pour étudier l'évolution de l'organisation de l'information génétique dans les génomes. Génomes ancestraux génomique comparative évolution des génomes algorithmique des graphes
24	Comparaisons de génomes avec gènes dupliqués : étude théorique et algorithmes Angibaud, Sébastien 07 October 2009 (has links) (PDF) La génomique comparative étudie les similarités et/ou les dissimilarités entre génomes et permet d'établir des relations entre les espèces afin notamment de construire des phylogénies. Elle permet également de mettre en évidence des régions conservées au sein des génomes et de trouver ainsi des ensembles de gènes impliqués dans des processus biologiques conservés au cours de l'évolution. Dans ce mémoire, nous nous intéressons au calcul de mesures entre deux génomes en présence de gènes dupliqués, et plus particulièrement aux mesures à base de points de cassure, d'adjacences, d'intervalles communs et d'intervalles conservés. Suivant une démarche informatique, nous proposons tout d'abord une étude avancée de la complexité algorithmique des problèmes rencontrés, en prouvant notamment pour la plupart d'entre eux soit leur NP-Complétude soit leur APX-Difficulté. Par la suite, nous exposons plusieurs méthodes de calcul de mesures entre deux génomes, à savoir (i) une approche exacte basée sur une transformation en un problème de contraintes à variables booléennes, (ii) une heuristique et (iii) une méthode hybride qui s'appuie sur la méthode exacte et l'heuristique proposées. Par une étude sur un jeu de données réel, nous montrons les qualités respectives de ces méthodes. Enfin, nous proposons un protocole de calcul des intervalles communs et mettons en évidence, par son utilisation et par un outil de visualisation, l'aspect fonctionnel de certains intervalles communs. [INFO] Computer Science génomique comparative distances intergénomiques complexité algorithmique point de cassure adjacence intervalle commun intervalle conservé
25	Etude des mécanismes évolutifs perturbant l'organisation des gènes dans les génomes de vertébrés Berthelot, Camille 28 September 2012 (has links) (PDF) Les phénomènes évolutifs qui perturbent l'organisation des gènes dans les génomes eucaryotes sont de deux types : les changements dans l'ordre des gènes, ou réarrangements, et les modifications du contenu en gènes du génome, par duplications, délétions ou gains de gènes. Ces processus sont mal connus, tant au niveau de leurs mécanismes d'apparition que de leur impact fonctionnel et sélectif. Ce travail de thèse s'articule autour de deux projets. Le premier s'intéresse à la distribution des points de cassure de réarrangements évolutifs entre un génome ancestral et ses descendants modernes. Cette distribution a été modélisée en fonction des caractéristiques locales du génome pour mettre en évidence quels facteurs influencent la probabilité de cassure. Nos résultats montrent que la distribution des cassures peut s'expliquer simplement comme une fonction de la longueur des espaces intergéniques, fonction qui est cependant non-linéaire contrairement aux attentes sous un régime aléatoire classique. La répartition des points de cassure dans les génomes semble principalement liée à des propriétés de structure, et n'est que peu soumise à des contraintes de sélection. Elle pourrait être liée à la structure chromatinienne du génome. Le second projet s'inscrit dans le cadre du séquençage du génome du poisson zèbre, et fournit un aperçu global de l'organisation de ce génome. Les génomes de poissons téléostéens sont anciennement dupliqués : l'analyse est axée sur les conséquences de cette duplication. Les résultats montrent que le génome du poisson zèbre présente une organisation assez typique d'un génome téléostéen. Les gènes retenus en deux copies après la duplication du génome appartiennent à des catégories fonctionnelles particulières, et sont biaisés vers des gènes déjà conservés après les duplications 1R et 2R ayant eu lieu au début de l'histoire des vertébrés. [INFO:INFO_OH] Computer Science/Other Réarrangements évolutifs Duplication complète du génome Génomique comparative
26	Évolution du génome des spartines polyploïdes envahissant les marais salés : apport des nouvelles techniques de séquençage haut-débit Ferreira de Carvalho, Julie 19 February 2013 (has links) (PDF) Les Spartines jouent un rôle écologique majeur sur les marais salés. Elles représentent un excellent modèle pour appréhender les conséquences écologiques de la spéciation par hybridation et polyploïdie dans le contexte d'invasion biologique. On s'intéresse plus particulièrement, à l'hybridation récente entre une espèce hexaploïde d'origine américaine Spartina alterniflora et une espèce hexaploïde européenne S. maritima ayant donnés deux hybrides F1 (S. x townsendii et S. x neyrautii) et la nouvelle espèce envahissante allododécaploïde (S. anglica). Les nouvelles technologies de séquençage haut-débit facilitent l'exploration de ces génomes peu connus. L'assemblage et l'annotation d'un transcriptome de référence ont permis d'annoter 16 753 gènes chez les spartines hexaploïdes et d'identifier des gènes d'intérêts écologique et évolutif. Une sélection de ces gènes a ensuite été analysée à travers une étude d'expression par PCR quantitative sur les populations naturelles des 5 espèces du complexe. Les résultats ont permis de mettre en évidence une expression homogène intra-populations mais une grande variabilité entre les espèces. L'analyse du génome des Spartines a ciblé prioritairement le développement de ressources génomiques concernant l'espèce S. maritima pour l'analyse des compartiments codant et répété à l'aide de séquençage d'une banque BAC et d'un run de pyroséquençage d'ADN génomique. Les analyses ont permis d'évaluer une proportion d'éléments répétés représentant près de 30% du génome. Les données générées ont alors été comparées avec les génomes séquencés phylogénétiquement proches et ont permis de premières comparaisons entre les spartines et les autres Poaceae. Evolution Ecologie Spartina Poaceae Séquençage haut-débit Transcriptome Génomique comparative Bioinformatique
27	Génomique comparative d'isolats phylogénétiquement proches appartenant au genre Thermococcus, une archée hyperthermophile / Comparative genomics of closely related Thermococcus isolates, a genus of hyperthermophilic Archaea Courtine, Damien 19 December 2017 (has links) L'immense diversité génomique des microorganismes leur permet de vivre partout, même dans les environnements extrêmes tels que Ies sources hydrothermales profondes. Ces dernières, disséminées sur l’ensemble des fonds océaniques, sont un bon modèle pour étudier la biogéographie et la diversification des génomes. Une approche de génomique comparative a été employée sur des isolats du genre Thermococcus proches d'un point de vue évolutif. Ce travail visait à identifier des mécanismes ayant un rôle dans Ia diversification de ces génomes, et également d'identifier des gènes impliqués dans cette différenciation. A cette fin, deux groupes d'une vingtaine d'isolats ayant des origines géographiques diverses ont été sélectionnés et séquencés. L'éloignement géographique résultant de la colonisation de nouveaux systèmes hydrothermaux semble être un facteur de diversification et de spéciation pour certains isolats. Cependant, lorsque les sites hydrothermaux sont relativement proches, il semblerait qu'un transfert de gènes entre les isolats soit toujours possible. Dans ce cas, l’adaptation à de nouvelles niches écologiques serait un facteur de la diversification des génomes. L'approche de génomique comparative a permis d'identifier des gènes spécifiques à certains sous-groupes, apparentés à des espèces. Ces gènes sont notamment impliqués dans les métabolismes des acides aminés, de production d'énergie et de transport d'ions inorganiques. Ceci reflète les pressions de sélections que peuvent subir ces organismes dans ces environnements hostiles à de nombreuses formes de vie. / The immense genomic diversity of microorganisms allows them to live everywhere, even in extreme environments such as deep hydrothermal vents. Scattered over the seabed, these are a good model for studying the biogeography and genomes diversification. A comparative genomics approach has been used on closely related isolates, of the genus Thermococcus. This work aimed at identifying mechanisms that have a role in the diversification of these genomes, and also to identify genes involved in this differentiation. For this purpose, two groups of about 20 isolates with different geographical origins were selected and sequenced.The geographical isolation resulting from colonization of new hydrothermal systems is likely to be a diversification and speciation factor for some isolates. But when hydrothermal sites are relatively close, it would seem that gene transfer between isolates is still possible. In this case, adaptation to new ecological niches would be a factor contributing to the genomes diversification. The comparative genomics approach allowed highlighting genes specific to certain subgroups, related to species. These genes are involved in amino acid metabolism, energy production and the transport of inorganic ions. This reflects selection pressures that these organisms may experience in these environments, otherwise hostile to many forms of life. Génomique comparative Thermococcus Diversification Génome Hyperthermophile Comparative genomics Thermococcus Diversification Genome Hyperthermophile
28	Pan-génome du riz africain cultivé Oryza glaberrima et son ancêtre sauvage Oryza barthii / Pan-genome of cultivated african rice Oryza glaberrima and his wild ancestor Oryza barthii Monat, Cécile 10 November 2016 (has links) La diversité d’une espèce est représentée par la somme de la diversité de chacun des individus qui la compose. Elle peut être observée à différentes échelles : individuelle, organique, tissulaire, cellulaire, génomique, génique, ou bien à l’échelle de la base nucléotidique. L’étude de la diversité d’une espèce est importante pour mieux la comprendre et nous permettre de retracer son histoire évolutive, de la comparer avec d’autres espèces notamment entre espèces sauvages et cultivées. Nous nous intéressons aux processus de domestication, et particulièrement à leurs impacts sur la structure du pan-génome. Le pan-génome est divisé en trois compartiments : (i) le core-génome qui contient tous les gènes présents chez tous les individus de l’espèce ; (ii) le génome dispensable qui contient l’ensemble des gènes qui sont absents chez au moins un individu ; (iii) et enfin le génome individu-spécifique qui contient les gènes présents uniquement chez un individu.L’objectif de ce travail de thèse était de mettre au point une nouvelle méthode d’analyse pan-génomique applicable sur un grand nombre d’individus. Pour cela, nous avons travaillé sur un jeu de données de reséquençage massif du riz Africain cultivé O. glaberrima et de son ancêtre sauvage O. barthii. Dans un premier temps nous avons vérifié l’existence d’une structure pan-génomique sur notre modèle. Pour cela nous avons travaillé à petite échelle avec trois accessions de l’espèce cultivée. Elles ont d’abord été séquencées, assemblées, annotées puis nous avons cherché à détecter des séquences spécifiques à chacune de ces accessions.Dans un second temps nous avons mis au point notre méthode en travaillant avec près de 200 génomes des deux espèces.Ces génomes ont été séquencés grâce aux technologies NGS puis directement mappés sur un génome de référence externe, celui du riz Asiatique. Nous avons alors appliqué notre méthode d’analyse pan-génomique basée sur la déviation de la profondeur deséquençage pour chaque gène. Nous avons ensuite comparé les enrichissement d’ontologies par compartiments et par espèce dans le but d’identifier des différences liées aux processus de domestication. Enfin, nous avons étudié plus précisément les appartenances pan-génomiques des membres de famille de gènes.Parce que le pan-génome de l’espèce cultivé est plus petit que le core-génome de l’espèce sauvage nous avons confirmé la perte de diversité en terme de présence/ absence de gènes chez le riz Africain au cours du processus de domestication. Curieusement nous avons aussi mis en avant l’augmentation du nombre de gènes dispensable chez l’espèce cultivée par rapport à son relatif sauvage.Ainsi, malgré une forte réduction du pan-génome de l’espèce cultivé lors de la « première » sélection, les 1000 générations de processus de domestication ont suffit à réintroduire une forme de diversité à travers l’augmentation du nombre de gènes dispensables.Afin d’automatiser une grande partie des manipulations d’analyses de données NGS nous avons aussi développé un outil de génération de pipelines d’analyses. De part sa généricité et sa robustesse il pourra être utilisé dans différents domaines, pour plu-sieurs types de données. Grâce aux nombreux logiciels qui y sont intégrés et de par le suivi que l’équipe de développement entend poursuivre, il pourra être utilisé dans la caractérisation de plus en plus de choses. Par exemple les variations structurales, les associations génotypes-phénotypes, l’épigénétique et pourquoi pas la métagénomique.Ce travail a permis la mise au point d’une nouvelle méthode d’analyse des données pan-génomiques rapide de par sa vision globale plutôt que via des comparaisons deux-à-deux. Cette méthode s’adresse aux génomes grands et complexes comme ceux des plantes, mais aussi aux jeux de données massifs. / Species diversity is represented by the sum of the diversity of each of the individuals composing it. It can be seen at differents cales: individual, organic, tissular, cellular, genomic, gene, and even nucleotic. The study of the diversity of species is important to better understand and allow tracking its evolutionary history, comparing it to other species, in particular wild to cultivated. We focused on the domestication, and particularly its impact on the pan-genome structure.The pan-genome is divided into three compartments: (i) the core-genome containing all the genes present in all individuals of the species; (ii) the dispensable genome containing all genes absent in at least one individual; (iii) and finally the individual-specific genome containing genes present only in one individual.The objective of this thesis was to develop a new method for pan-genomic analysis that can apply to a large number of indi-viduals. For this, we worked on a massive resequencing data set of cultivated African rice O. glaberrima and of its wild ancestor O. barthii. At first we checked the existence of a pan-genomic structure on our model. For this we worked on a small scale, with three accessions of cultivated species. They were sequenced, assembled, annotated then analyzed to detect specific sequences for each accession.Secondly we developed our approach working with nearly 200 genomes of both species. These genomes were sequenced using Illumina technology and mapped to the external reference genome, of the Asian rice. We applied our pan-genomic method analysis based on the deviation of the depth of sequencing for each gene. We then compared the ontology enrichment compartments and species in order to identify differences related to the domestication process. Finally, we looked specifically to pan-genomic genes belonging to gene family. Because the pan-genome of the cultivated species is smaller than the core-genome of the wild one, we confirmed the loss ofdiversity in terms of presence/ absence of genes in African rice during the domestication process. Curiously we have also high lighted the increase in the number of dispensable genes in the crop from its wild relative. Thus, despite a sharp reduction of the pan-genomeof the species cultivated in the “first” selection, the 1,000 generations of domestication process were enough to reintroduce a formof diversity through increasing the number of dispensable genes.To automate much of the data analysis of NGS manipulations we have also developed a tool to generate analysis pipelines.Due to its generic and robustness it can be used in different areas, for several types of data. With many softwares integrated and by monitoring that the development team will continue, it may be used in the characterization of more and more things. For example,structural variations, genotype-phenotype associations, epigenetics and metagenomics. This work enabled the development of a new analytical method for rapid genome-wide data through its global vision ratherthan through two by two comparisons. This method is for large and complex genomes such as those of plants, but also to massivedata sets. Pan-Génome Génomique Génomique comparative Bioinformatique Riz africain Pan-Genome Genomic Comparative genomic Bioinformatic African rice
29	Etude génomique et métagénomique de la diversité génétique, la distribution écologique et l'évolution des picocyanobactéries marines / Genomic and metagenomic study of the genetic diversity, ecological distribution and evolution of marine picocyanobacteria Farrant, Gregory 27 April 2015 (has links) Les picocyanobactéries marines des genres Prochlorococcus et Synechococcus sont les organismes photosynthétiques les plus abondants de la planète et ils contribuent de façon substantielle à la production primaire mondiale. Alors que le genre Prochlorococcus se caractérise par sa forte abondance dans les régions oligotrophes et son génome réduit, le genre Synechococcus se distingue par sa grande diversité génétique et pigmentaire ainsi qu'une aire de distribution plus étendue.Le principal objectif de ce travail a été de mettre en relation la diversité génétique de ces organismes avec leur niche écologique par des approches de génomique comparative et de métagénomique. Tout d'abord, le développement d'une méthode de scaffolding (WiseScaffolder) a permis de clore 32 nouveaux génomes de Synechococcus, lesquels ont été intégrés au système d'information Cyanorak, dédié à l'annotation de gènes orthologues. Ces nouveaux génomes, complétant les 65 génomes disponibles pour ces deux genres, ont fait l'objet d'analyses comparatives afin de mieux comprendre la diversité et l'évolution de ce phylum et de définir les gènes spécifiques de différents groupes phylogénétiques, potentiellement liés à leur adaptation à des niches écologiques distinctes.Ces génomes ont ensuite été utilisés comme référence, en conjonction avec le gène marqueur petB, pour analyser les données de métagénomique issues de l'expédition TARA-Océans. Ces analyses ont notamment mis en lumière la diversité génétique, la distribution et l'importance écologique de certains clades phylogénétiques. Ce travail soulève de nouvelles hypothèses quant au rôle des picocyanobactéries dans le fonctionnement global des océans. / Marine picocyanobacteria Prochlorococcus and Synechococcus genera are the most abundant photosynthetic organisms and contribute substantially to global primary production. While the genus Prochlorococcus is characterized by its high abundance in oligotrophic regions and its reduced genome, Synechococcus is characterized by a larger genetic and pigment diversity and a wider area of distribution.The main objective of this PhD thesis was to link the genetic diversity of these organisms to the environmental conditions of their ecological niche by comparative genomics and metagenomics approaches. Firstly, the development of a scaffolding method (WiseScaffolder) has allowed us to close 32 new genomes of Synechococcus which were integrated into the Cyanorak information system dedicated to the annotation of orthologous genes. These new genomes, supplementing the 65 genomes previously available for these two genera, allowed us to perform comparative analyses which led to a better understanding of the diversity and evolution of this phylum and to the definition of genes sets specific to different phylogenetic groups and thus potentially related to their adaptation to different ecological niches.These genomes were then used as reference, in conjunction with the marker gene petB gene, to analyze metagenomic data produced in the frame of the Tara-Oceans Expedition. In particular, these analyzes highlighted the genetic diversity, distribution and ecological importance of some phylogenetic clades. This work raises new hypotheses about the role of picocyanobacteria in the overall functioning of the oceans. Prochlorococcus Synechococcus Génomique comparative Métagénomique Tara-Océans Assemblage Comparative genomics Metagenomic 639.9
30	Etude de l'histoire évolutive des gènes dans les génomes de vertébrés / Study of the evolutionary history of genes in vertebrate genomes Peres, Amélie 25 September 2015 (has links) Cette thèse porte sur l'histoire évolutive des gènes de vertébrés. Deux types de phénomènes évolutifs peuvent perturber l’organisation des gènes dans les génomes eucaryotes : les modifications du contenu en gènes des génomes par duplications ou délétions de gènes, et les changements dans l’ordre des gènes par réarrangements. L’impact fonctionnel et sélectif de ces processus sur les génomes est encore mal connu.Ce travail de thèse s’articule autour de trois projets portant sur les événements de duplication et de délétion qui modifient le nombre de copies d'un gène. Nous nous sommes intéressés à ces événements à partir d’arbres phylogénétiques reconstruits à l’échelle de génomes entiers. Dans une première partie nous avons examiné le cas où ces événements seraient sous sélection négative, en étudiant les arbres de gènes ou aucune duplication ou délétion ne s'est fixée. Nous avons observé que ces gènes avaient des propriétés particulières et nous proposons des hypothèses pour les expliquer. Dans une deuxième partie nous nous sommes intéressés aux duplications de gènes et aux corrélations que l'on observe avec l'évolution des fonctions biologiques. Enfin en dernière partie nous avons étudié en détail la famille de gènes ROBO dont une des copies aurait acquis une fonction différente dans le développement du système nerveux des mammifères sous l’influence de la sélection positive. Dans leur ensemble ces résultats apportent de nouveaux éléments pour mesurer et comprendre l’impact global des contraintes ou des avantages que les duplications de gènes en particulier, et le changement du nombre de copies des gènes en général, peuvent exercer sur un génome de vertébré. / This thesis is about the evolutionary history of vertebrates genes. Two categories of evolutionary processes can disrupt the gene organization in eukaryotic genomes: changes in the content of genomes by gene duplications or gene deletions, and changes in the order of the genes by rearrangements. Functional and selective impacts of these processes on genomes are poorly understood.This thesis covers three different projects about duplication and deletion events that change the number of gene copies. We were interested in these events from phylogenetic trees reconstructed at the scale of whole genomes. In the first part we examined the case where these events would be under negative selection, by studying phylogenetic gene trees where no duplication or deletion was fixed. We found that these genes have special properties and propose hypotheses to explain them. In the second part we looked at gene duplications and correlated these events with the evolution of biological functions. Finally in the last part we have studied in detail the ROBO genes family in which one copy has acquired a different function in the developing nervous system of mammals under the influence of positive selection.Taken together these results provide new elements to measure and understand the global impact of constraints or advantages that gene duplications in particular, and the change of genes copy number in general, can have on a vertebrate genome. Duplications de gènes Délétions de gènes Sélection positive Arbres de gènes Génomique comparative Phylogénie Gene duplications Gene deletions 576.5

Search results