• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 143
  • 80
  • 12
  • 1
  • 1
  • Tagged with
  • 227
  • 152
  • 41
  • 39
  • 35
  • 34
  • 30
  • 30
  • 28
  • 27
  • 26
  • 26
  • 23
  • 22
  • 22
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
61

Organisation de la chromatine et son lien avec la réplication de l'ADN

Moindrot, Benoît 11 July 2012 (has links) (PDF)
L'organisation de la chromatine a une importance fonctionnelle pour contrôler le programme d'expression des gènes. Par contre, les liens qui l'unissent au déroulement de la réplication de l'ADN sont beaucoup moins connus. Grâce à des approches basées sur la capture d'interactions chromosomiques et sur l'imagerie cellulaire, nous avons étudié les liens entre le repliement à grande échelle de la chromatine et le timing de réplication. Cette analyse, effectuée dans des cellules humaines lymphoblastoïdes, des cellules mononucléées du sang (PBMC) et des cellules issues d'une leucémie myéloïde à caractère érythrocytaire, a permis l'identification de domaines structuraux du noyau. Ces domaines sont relativement isolés les uns des autres et leurs frontières coïncident avec les zones d'initiation précoce. De plus, notre étude montre que ces zones d'initiation précoce interagissent préférentiellement, aussi bien entre voisins immédiats (séparation génomique de l'ordre de la mégabase) que le long du chromosome entier. Les loci répliqués tardivement interagissent eux-aussi avec leurs homologues, conduisant, dans l'espace nucléaire, à une ségrégation des loci en fonction de leur timing de réplication. Ces résultats sont soutenus par des mesures de distances sur des hybridations in-situ qui montrent que les loci répliqués en début de phase S sont plus proches qu'attendus. Nos travaux révèlent enfin que l'organisation de la chromatine est similaire dans des cellules en phase G0 (PBMC dormantes), démontrant qu'elle n'est pas spécifique des cellules en phase S. Pris ensemble, ces résultats apportent des preuves directes d'une organisation robuste de la chromatine, partagée par les cellules en cycle et dormantes, et corrélée au timing de réplication à différentes échelles.
62

Analyses 'genome entier' de la cohorte griv de patients à profil extrême du sida

Le Clerc, Sigrid 17 December 2010 (has links) (PDF)
Après 25 ans de recherche intensive, aucun vaccin ou traitement définitif contre le SIDA n'existe, et les mécanismes moléculaires de pathogenèse de l'infection VIH-1 ne sont pas clairement élucidés. Les avancées technologiques permettent de comparer des sujets malades avec des sujets contrôles sur tout le génome. Il est ainsi possible d'identifier sans a priori des gènes potentiellement impliqués dans le développement de la maladie avec pour conséquence le développement rationnel de nouvelles stratégies diagnostiques ou thérapeutiques. Durant ma thèse, j'ai réalisé deux études d'association 'génome entier' dans le SIDA, en comparant les 275 non-progresseurs à long terme ou les 85 progresseurs rapides de la cohorte GRIV avec une cohorte de contrôles séronégatifs. J'ai réalisé une troisième analyse en exploitant les données issues de trois études 'génome entier' internationales dont la nôtre (France, Pays-Bas, USA), ciblant plus particulièrement les SNPs de fréquence faible (fréquence de l'allèle mineur, MAF<5%). Ces approches 'génome entier' ont réaffirmé le rôle central du HLA dans la progression vers le SIDA, mais aussi dévoilé de nouveaux gènes candidats très pertinents donnant une nouvelle lumière sur les mécanismes moléculaires de la maladie.
63

Génomique comparative d'isolats phylogénétiquement proches appartenant au genre Thermococcus, une archée hyperthermophile / Comparative genomics of closely related Thermococcus isolates, a genus of hyperthermophilic Archaea

Courtine, Damien 19 December 2017 (has links)
L'immense diversité génomique des microorganismes leur permet de vivre partout, même dans les environnements extrêmes tels que Ies sources hydrothermales profondes. Ces dernières, disséminées sur l’ensemble des fonds océaniques, sont un bon modèle pour étudier la biogéographie et la diversification des génomes. Une approche de génomique comparative a été employée sur des isolats du genre Thermococcus proches d'un point de vue évolutif. Ce travail visait à identifier des mécanismes ayant un rôle dans Ia diversification de ces génomes, et également d'identifier des gènes impliqués dans cette différenciation. A cette fin, deux groupes d'une vingtaine d'isolats ayant des origines géographiques diverses ont été sélectionnés et séquencés. L'éloignement géographique résultant de la colonisation de nouveaux systèmes hydrothermaux semble être un facteur de diversification et de spéciation pour certains isolats. Cependant, lorsque les sites hydrothermaux sont relativement proches, il semblerait qu'un transfert de gènes entre les isolats soit toujours possible. Dans ce cas, l’adaptation à de nouvelles niches écologiques serait un facteur de la diversification des génomes. L'approche de génomique comparative a permis d'identifier des gènes spécifiques à certains sous-groupes, apparentés à des espèces. Ces gènes sont notamment impliqués dans les métabolismes des acides aminés, de production d'énergie et de transport d'ions inorganiques. Ceci reflète les pressions de sélections que peuvent subir ces organismes dans ces environnements hostiles à de nombreuses formes de vie. / The immense genomic diversity of microorganisms allows them to live everywhere, even in extreme environments such as deep hydrothermal vents. Scattered over the seabed, these are a good model for studying the biogeography and genomes diversification. A comparative genomics approach has been used on closely related isolates, of the genus Thermococcus. This work aimed at identifying mechanisms that have a role in the diversification of these genomes, and also to identify genes involved in this differentiation. For this purpose, two groups of about 20 isolates with different geographical origins were selected and sequenced.The geographical isolation resulting from colonization of new hydrothermal systems is likely to be a diversification and speciation factor for some isolates. But when hydrothermal sites are relatively close, it would seem that gene transfer between isolates is still possible. In this case, adaptation to new ecological niches would be a factor contributing to the genomes diversification. The comparative genomics approach allowed highlighting genes specific to certain subgroups, related to species. These genes are involved in amino acid metabolism, energy production and the transport of inorganic ions. This reflects selection pressures that these organisms may experience in these environments, otherwise hostile to many forms of life.
64

Régulation de la programmationpost-méiotique du génomemâle par NUT / Regulation of post-meitic male gernome programming by NUT

Shiota, Hitoshi 18 October 2016 (has links)
Pendant les derniers stades de la spermatogenèse, les cellules germinales mâles post-méiotiques subissent une réorganisation dramatique de l'architecture de leur chromatine, impliquant notamment le remplacement presque total des histones par les protamines, créant des noyaux fortement condensés que l'on trouve dans le sperme mature. Au cours de ce processus, un événement précoce clé est la vague d'hyperacetylation des histones, qui précède leur remplacement. Notre équipe a précédemment identifié le facteur d'expression testiculaire de la famille BET, Brdt (BRomoDomain Testis), qui se lie aux histones acétylées via ses deux bromodomaines, comme essentiel au cours de ce processus. Cependant, les mécanismes aboutissant à l'hyperacétylation des histones à l'échelle génomique sont encore inconnus, ce qui reste l'une des questions majeures dans le domaine. La protéine NUclear in Testis (NUT) est un facteur spécifique testiculaire dont la fonction physiologique dans les cellules germinales mâles était inconnue. Cette protéine se trouve exprimée de manière ectopique dans un cancer rare mais très agressif, le carcinome de la ligne médiane (NUT Midline Carcinoma), en fusion avec BRD4, produisant ainsi une protéine de fusion hautement oncogène. Dans les cellules cancéreuses NUT est capable de recruter et d'activer l'histone acétyltransférase p300, contribuant ainsi à l'activité oncogénique de la protéine de fusion BRD4-NUT. Mon projet de doctorat est d'explorer la fonction physiologique de NUT, en étudiant des souris knock-out pour NUT qui ont été générées par notre équipe en collaboration avec Mathieu Gérard (Saclay). L'absence de NUT provoque une stérilité mâle associée à un arrêt de la spermatogenèse lors de l'allongement et de la condensation des spermatides, au stade où normalement les histones sont remplacées. D'autres expériences suggèrent que NUT pourrait agir sur la régulation de marques épigénétiques, y compris l'hyperacétylation des histones. Les mécanismes par lesquels NUT interfère avec la vague d'acétylation et les facteurs en interaction, y compris Brdt, sont explorées. Au total, cette étude démontre la contribution essentielle du NUT à la régulation épigénétique et au remplacement des histones au cours de la maturation post-méiotique des cellules germinales mâles. / During the late stages of spermatogenesis, post-meiotic male germ cells undergo a dramatic reorganization of their chromatin architecture involving the almost genome wide replacement of histones by protamines, creating highly condensed nuclei that are found in the mature sperm. During this process a key early event is known to be the wave of histone hyperacetylation, which precedes their replacement. Our team previously reported that the testis specific BET factor BRDT (BRomoDomain Testis specific), which binds acetylated histones, is essential during this process. However, how this genome wide hyperacetylation occurs has remained one of the major questions in the field. NUclear protein in Testis (NUT) is a testis specific factor whose physiological function in male germ cells was unknown. It has been found ectopically expressed in NUT Midline Carcinoma, a rare but highly aggressive cancer, in fusion with BRD4, resulting in a highly oncogenic fusion protein. In cancer cells, NUT is able to recruit and activate the histone acetyltransferase p300, hence contributing to the oncogenic activity of the BRD4-NUT fusion protein. My Ph.D. project investigates the original function of NUT by using NUT knockout mice that were generated by our team in collaboration with Mathieu Gerard (Saclay). The absence of NUT causes male sterility associated with a spermatogenic arrest during spermatids elongation/condensation, at a stage when histone replacement normally takes place. Additional experiments suggest that NUT could act through the regulation of epigenetic marks, including histone hyperacetylation. The mechanisms by which NUT interferes with the hyperacetylation wave and interacting factors, including Brdt, are explored. Altogether this study demonstrates the essential contribution of NUT to the epigenetic regulation and histone replacement during the post-meiotic maturation of male germ cells.
65

Analyses structurales et fonctionnelles de l'espace génique du chromosome 3B du blé tendre (Triticum aestivum L.) / Structural and functional analysis of the bread wheat chromosome 3B gene space (Triticum aestivum L.)

Pingault, Lise 30 October 2014 (has links)
De par sa taille (17 Gb), la complexité de son génome (allohexaploïde) ainsi que la forte proportion d’éléments répétés (>80%), l’étude du génome de blé tendre est une tâche particulièrement complexe et s’est souvent retrouvée confrontée aux limites technologies. Grâce une approche de tri de chromosomes, le chromosome 3B (995 Mb) a pu être isolé et séquencé. Ces données ont permis la construction d’une pseudomolécule. Mes travaux de thèse se sont basés sur des données de transcriptomique produites avec une approche RNA-Seq, afin d’investiguer l’impact de la taille de ce chromosome sur l’organisation de l’espace génique. L’annotation du chromosome 3B a permis de mettre en évidence : 5 326 gènes et 1 938 pseudogènes. L’analyse des librairies RNA-Seq pour 15 conditions de développement a permis de mettre en évidence l’expression de 71 % des gènes annotés, ainsi que 3 692 régions nouvellement transcrites (NTR). Nous avons aussi pu détecter des transcrits alternatifs pour 61% des gènes exprimés (en moyenne 6 isoformes). Nous avons donc pu mettre en évidence une structuration de l’espace génique pour le chromosome 3B. En effet, la transcription est répartie sur tout le chromosome, cependant les gènes sont organisés selon un gradient de densité croissant sur l’axe centromère-télomère. En nous basant sur le profil des données de recombinaison, nous avons divisé le chromosome en 3 régions : R1, R2 et R3. La région R2 correspondant à la région centrale du chromosome (647 Mb) où le taux de recombinaison est très faible voir absent. Les régions R1 (58 Mb) et R3 (69 Mb) correspondent respectivement aux parties distales du bras court et du bras long du chromosome, où le taux de recombinaison est le plus fort. Ces trois régions diffèrent par leur niveau et leur spécificité d'expression, ainsi que par leur structure génique (nombre d'exons, taille des introns …). En effet, les gènes ayant une expression tissu-spécifique, ainsi qu’un faible nombre de transcrits alternatifs sont retrouvés dans les régions R1 et R3. Deux modèles peuvent expliquer le lien observé entre la structure des gènes et leur niveau/spécificité d’expression : le modèle de la sélection pour l’économie et le modèle dessin génomique. En conclusion, ce travail a montré et ce, pour la première fois à l’échelle d’un chromosome entier de blé, l’impact de la taille du chromosome sur l’organisation ; mettant en relation la structure des gènes, leur niveau d’expression, leur spécificité d’expression, ainsi que leur nature évolutive. L’assemblage ainsi que l’annotation de pseudomolécules des autres chromosomes permettra de mettre en évidence si cette structure est conservée. Afin de mieux comprendre les mécanismes cellulaires impliqués dans la régulation de l’expression des gènes, une étude du paysage épigénomique a été engagée. / Genome-wide studies of the bread wheat are a complicated task due to its large size (17 Gb), its allohexaploidy and its high content in repeat sequences (>80%). Using a chromosome-specific approach, the chromosome 3B (995 Mb) was successfully isolated and sequenced leading to the assembly of one pseudomolecule. The work presented in this thesis investigated the impact of the 3B chromosome size on the gene space organization. Production of transcriptomic data was achieved using RNA-Seq approach. The chromosome 3B was annotated and we predicted 7 264 features, including 5 326 full genes and 1 938 pseudogenes. We constructed RNA-Seq libraries for 15 developmental wheat conditions. Using this data we detected expression of 71.4% of the predictions, and 3 692 novel transcribed regions (NTR). We also detected alternative transcripts for 61% of the expressed genes, with 5.8 isoforms on average for one gene. Using these transcriptional data, we highlighted a partitioning of the chromosome 3B gene space. Indeed, transcription was found all along the chromosome, but genes were organized according to an increasing density gradient along the centromere-telomere axis. Based on recombination profile, we segmented the chromosome in 3 major regions: R1, R2 and R3. The region R2 was identified with low or no recombination rate corresponding to the centromeric and peri-centromeric regions (647 Mb). The regions R1 and R3 were associated with a higher recombination rate, both localized on the distal part of the short arm (58 Mb) and the long arm (69 Mb) respectively, where the recombination rate is higher. All three regions showed distinct level and specificity of gene expression as well as unique gene structure (variation size, exon number, intron size). Indeed, genes expressed in a specific condition and with a small number of alternatives transcripts were localized on regions R1 and R3. We showed that two evolutionary model could explain the link between gene structure and the level/specificity of expression : “selection for economy” and “genome design”. In conclusion, a transcriptomic studies was achieved along the 3B chromosome for the first time. This study demonstrated a relationship between gene characteristics (structure, expression level, expression specificity and evolution) and the chromosome 3B organization. Future pseudomolecule assemblies will help us to assess the structural organization of these chromosomes. In order to better understand the cellular mechanisms of gene expression, an epigenomic study of the 3B chromosome was started.
66

Understanding the establishment of the DNA replication program / Identification des mécanismes impliqués dans la sélection des origines de réplication

Perrot, Anthony 22 November 2016 (has links)
La réplication de l’ADN est un processus essentiel qui doit avoir lieu une seule fois par cycle cellulaire. Ce processus hautement régulé et très conservé chez les eucaryotes, assure une complète duplication et donc une totale transmission de l’information génétique. Des changements dans le programme de réplication, qui est définit par le moment d’activation et la fréquence d’utilisation de l’ensemble des origines, ont été observés lors du développement, après induction de la différenciation chez des cellules souches embryonnaires de souris, ainsi que dans un grand nombre de cancers. La régulation de la réplication de l’ADN est donc un processus essentiel pour le maintien de l’intégrité du génome et le programme de réplication pourrait y contribuer de manière importante. Cependant, en dépit d’un grand nombre de travaux sur les différentes protéines et modifications impliquées dans la sélection des origines, les principaux déterminants ainsi que leur interdépendance restent étonnement méconnus. Mon projet de thèse se focalise sur l’identification des paramètres clés qui régulent le programme de réplication, en utilisant comme modèle la levure de fission, Schizosaccharomyces pombe. Premièrement, je me suis intéressé au rôle de la dynamique de l’activité des CDKs lors de la phase G1 ainsi que de leur niveau d’activité à la frontière G1/S dans la sélection des origines. J’ai démontré que changer la longueur de la phase G1 à travers la modulation de l’activité des CDKs se traduit par une modification du profil de réplication tout au long du génome. Plus précisément, les origines inefficaces sont utilisées plus fréquemment alors que les origines efficaces ont une activité réduite. D’un autre coté, nous avons également montré que le nombre d’origines actives pour une phase S donnée, dépend du niveau d’activité des CDKs lors de l’entrée en phase S, suggérant ainsi que cette activité est un facteur limitant dans la régulation de l’initiation de la réplication. Dans un second temps, j’ai utilisé une approche dans laquelle les cellules établissent un programme de réplication de novo après la sortie de quiescence, afin d’étudier les premières étapes de la sélection des origines de réplication, en se focalisant sur l’importance du recrutement de ORC (Origin Recognition Complex) aux origines. L’analyse du profil de liaison de ORC révèle une forte corrélation entre le niveau de liaison de ORC aux origines et l’efficacité de ces dernières, démontrant pour la première fois que ORC n’est pas simplement un marqueur des sites d’initiation potentiels mais plutôt un déterminant crucial dans l’établissement du programme de réplication. Finalement, j’ai observé que les origines efficaces ont tendance à être organisées en groupes tout au long du génome, suggérant que l’organisation chromosomique pourrait être importante dans la sélection des origines de réplication. Afin d’étudier cela, j’ai généré des souches contenant différents réarrangements chromosomiques. Nos résultats indiquent que la position relative d’une origines par rapport à son contexte chromosomique, joue un rôle important dans la régulation de son efficacité et que des régions distinctes peuvent avoir des effets opposés sur la sélection des origines en étant soit activatrices ou inhibitrices. / DNA replication is an essential process that occurs only once in a cell cycle before cell division. Replication is highly regulated through conserved mechanisms to ensure the faithful duplication and transmission of genetic information. Interestingly, changes in the replication program, defined by the temporal and spatial pattern of replication origin activation, have been observed during development in distinct cell types, after induction of differentiation in mouse embryonic stem cells, and in various cancers. The regulation of DNA replication is therefore essential for ensuring the integrity of the genome, and the program of origin activation may be an important contributor to this process. However, despite a large body of work on the many enzymes and modifications involved in origin selection, the critical determinants as well as their interdependence remain surprisingly unknown. My thesis project focuses on identifying the key parameters that regulate the replication program, taking advantage of unique approaches using the fission yeast Schizosaccharomyces pombe as a model system. First, we investigated the qualitative and quantitative aspects of the role of CDK activity in determining the program of DNA replication. We demonstrated that changing the length of G1 phase through modulation of CDK activity has an impact on the profile of replication initiation along the chromosome. More specifically, inefficient origins show increases in their usage, while efficient origins have reduced activities. Moreover, we have shown that cells are highly sensitive to differences in CDK activity levels at the G1/S transition, which result in genome-wide changes in replication initiation across the entire spectrum of efficiencies. This suggests that CDK activity is a dose-dependent, limiting factor in the regulation of origin usage. Thus, our study establishes the integration of both temporal and quantitative regulation of CDK activity as a key determinant in defining the program of genome duplication. Second, using an approach in which cells establish a replication program de novo after exit from quiescence, we investigated the critical first steps of origin selection. We focused on the importance of the essential Origin Recognition Complex, whose recruitment to origins is required for the subsequent assembly of replication complexes. Our analysis reveals a strong correspondence between the level of ORC binding at origins and the efficiency of these origins in both cells exiting quiescence as well as those in vegetative growth conditions. Therefore, we demonstrate for the first time that ORC is not simply a marker of potential initiation sites but rather a crucial determinant in the program of origin usage.Finally, our observation that efficient origins are organized in distinct clusters in the de novo replication program suggested that chromosomal organization may be important for origin selection. To address this question, we have generated strains containing a series of distinct chromosomal rearrangements and assessed their origin efficiency profiles. Our findings indicate that the localization of an origin with respect to its chromosomal context plays an important role in regulating its efficiency. Moreover, distinct regions may have different effects on origin selection by being permissive or inhibitory for origin activity. Those observations could indicate a role for the spatial organization of the genome in origin selection and thus led us to study chromosome and nuclear organization in conditions where the replication program is different.
67

Analyse des voies de régulation de la cardiogenèse et de la différenciation cardiomyocytaire / Analysis of the cardiogenenis pathways and the cardiac differentiation

Jeziorowska, Dorota 13 December 2016 (has links)
L'objectif général de ce travail de doctorat a été centré sur l'utilisation des cellules pluripotentes induites humaines dans la modélisation et l'évaluation thérapeutique des pathologies cardiaques. Depuis leur découverte en 2006, les iPSC offrent une opportunité pour le développement de modèles cellulaires humains et spécifiques de patients pour l'étude des mécanismes physiopathologiques, l'évaluation de réponses pharmacologiques et le génération de cellules redifférenciées (ici en cardiomyocytes) pour des applications thérapeutiques cellulaires. Dans ce travail nous avons démontré que la quantité mais aussi la qualité finale des cardiomyocytes dérivés d'iPSC dépend des conditions spatiales et pharmacologiques utilisées durant les différentes étapes de différenciation. L'utilisation d'un protocole de différentiation en monocouche avec blocage simultané et transitoire de l'ensemble des voies Wnt (canoniques et non canoniques) permet d'obtenir une maturation plus importante du sarcomère, étape essentielle pour la modélisation des sarcomèropathies La différenciation des iPSC en cardiomyocytes peut aussi être obtenue par une approche moléculaire ciblée visant à activer spécifiquement un programme cardiogénique. Celle-ci est obtenue via l'utilisation d'une protéine Cas9 mutée et couplée à un système transactivateur et permettant le ciblage simultané de 3 facteurs de transcription clés de la cardiogénèse (Gata4, Mef2c et Tbx5). Cette approche moléculaire est renforcée par la combinaison avec une stimulation pharmacologique ciblant la voie Wnt. / The general objective of this work was centered on the use of human induced pluripotent cells in modeling and therapeutic evaluation of cardiac pathologies. Since their discovery in 2006, the iPSC provide an opportunity for the development of human cellular models and specific patients for the study of pathophysiological mechanisms, evaluation of pharmacological responses and the generation redifférenciées cells (cardiomyocytes here) for applications cellular therapeutic. In this work we demonstrated that the quantity but also the final quality of cardiomyocytes derived from iPSC depends on the spatial and pharmacological conditions used during the various stages of differentiation. The use of a monolayer differentiation protocol with simultaneous and transient blocking of all Wnt pathways (canonical and noncanonical) allows to obtain a higher maturation of the sarcomere, an essential step for modeling sarcomeropathies IPSC differentiation into cardiomyocytes can also be obtained by targeted molecular approach to specifically activate cardiogenic program. This is achieved through the use of a mutated Cas9 protein and coupled with transactivator system. This allows simultaneous targeting of 3 key cardiogenesis transcription factors (Gata4, MEF2C and Tbx5). This molecular approach is enhanced by the combination with a pharmacological stimulation targeting the Wnt pathway. Beyond modeling of monogenic cardiac disease, cardiomyocytes derived from iPSC can reproduce more complex and multigenic diseases
68

Séquençage du génome du parasite intestinal Blastocystis sp. (ST7) : vers une meilleure compréhension des capacités métaboliques d'organites apparentés aux mitochondries chez ce microorganisme anaérobie / Genome sequencing of the intestinal parasite Blastocystis sp. (ST7) : towards a better understanding of the metabolic capacities of mitochondria-related organelles in this anaerobic microorganism

Roussel, Michaël 27 September 2011 (has links)
Blastocystis sp., est un straménopile parasite anaérobie fréquemment rencontré dans le tractus gastro-intestinal de l’homme et de divers animaux. Ce microorganisme, parfois responsable de désordres digestifs aigus, pourrait conduire à des troubles fonctionnels intestinaux tels que le syndrome de l’intestin irritable (IBS). Le génome de Blastocystis sp., qui a fait l'objet d'un projet de séquençage en collaboration avec le Génoscope d’Evry, nous a permis de caractériser le plus petit génome de straménopile séquencé à ce jour (18,8 Mpb), avec une capacité codante de 6020 gènes. L’acquisition de nombreux gènes par transferts horizontaux est une caractéristique majeure de ce génome, qui montre d’abondants réarrangements génomiques. Bien qu’évoluant en anaérobiose, Blastocystis sp. possède des organites morphologiquement proches des mitochondries, appelés mitochondrion-like organelles (MLOs). Nous avons montré que ces organites comportaient un génome circulaire de type mitochondrial de 29,27 kpb, mais dépourvu des gènes codant pour les cytochromes. Des analyses in silico nous ont permis de caractériser le protéome des MLOs (365 protéines), conduisant à l’établissement d’un modèle prédictif des voies métaboliques associées à ces organites, avec notamment une chaine respiratoire limitée aux complexes I et II. Nous avons ainsi montré que les MLOs présentent des caractères communs aux mitochondries anaérobies et aux hydrogénosomes (présence d’une PFOR et d’une hydrogénase à fer), suggérant que Blastocystis sp. comporte des mitochondries anaérobies modifiées, qui résulteraient d’une adaptation du parasite à son environnement. Par ailleurs, la prédiction du sécrétome de Blastocystis sp. révèle la présence de facteurs de virulence potentiels, pouvant être impliqués dans l’altération de l’épithélium intestinal et le contournement du système immunitaire de l’hôte. / Blastocystis sp. is a highly prevalent anaerobic eukaryotic stramenopile parasite found in the intestinal tract of humans and various animals. This microorganism, sometimes associated with acute intestinal disorders, could be responsible for functional intestinal disorders such as the irritable bowel syndrom (IBS). As part of a collaborative sequencing project with the Genoscope (CEA Evry, France), we were able to caracterize the smallest stramenopile genome sequenced to date (18.8 Mbp) with a 6020 genes coding capacity. The gain of many genes through horizontal gene transfer is amajor characteristic of this genome, which shows extensive genomic rearrangements. Despite the anaerobic nature of Blastocytists sp., this eukaryote harbours nevertheless mitochondrion-like organelles (MLOs). We have shown that these organelles have a 29.27 kbp mitochondrial-type circular genome that lacks cytochrome coding genes. In silico analysis allowed us to predict the MLOs proteome (365 proteins), with the subsequent predictive model of the metabolic pathways associated with these organelles, including an electron transport chain (ETC) restricted to complex I and II. We have shown that MLOs shared common characteristics with anaerobic mitochondrion and hydrogenosomes (presence of a PFOR and an iron-hydrogenase), which could mean that Blastocystis sp. harbours modified anaerobic mitochondrion that resulted from the parasite adaptation to its anaerobic environment. In addition, Blastocytis sp. secretome prediction reveals the presence of potential virulence factors, which could be involved in the degradation of the intestinal epithelium as well as the host immune system bypass.
69

Pan-génome du riz africain cultivé Oryza glaberrima et son ancêtre sauvage Oryza barthii / Pan-genome of cultivated african rice Oryza glaberrima and his wild ancestor Oryza barthii

Monat, Cécile 10 November 2016 (has links)
La diversité d’une espèce est représentée par la somme de la diversité de chacun des individus qui la compose. Elle peut être observée à différentes échelles : individuelle, organique, tissulaire, cellulaire, génomique, génique, ou bien à l’échelle de la base nucléotidique. L’étude de la diversité d’une espèce est importante pour mieux la comprendre et nous permettre de retracer son histoire évolutive, de la comparer avec d’autres espèces notamment entre espèces sauvages et cultivées. Nous nous intéressons aux processus de domestication, et particulièrement à leurs impacts sur la structure du pan-génome. Le pan-génome est divisé en trois compartiments : (i) le core-génome qui contient tous les gènes présents chez tous les individus de l’espèce ; (ii) le génome dispensable qui contient l’ensemble des gènes qui sont absents chez au moins un individu ; (iii) et enfin le génome individu-spécifique qui contient les gènes présents uniquement chez un individu.L’objectif de ce travail de thèse était de mettre au point une nouvelle méthode d’analyse pan-génomique applicable sur un grand nombre d’individus. Pour cela, nous avons travaillé sur un jeu de données de reséquençage massif du riz Africain cultivé O. glaberrima et de son ancêtre sauvage O. barthii. Dans un premier temps nous avons vérifié l’existence d’une structure pan-génomique sur notre modèle. Pour cela nous avons travaillé à petite échelle avec trois accessions de l’espèce cultivée. Elles ont d’abord été séquencées, assemblées, annotées puis nous avons cherché à détecter des séquences spécifiques à chacune de ces accessions.Dans un second temps nous avons mis au point notre méthode en travaillant avec près de 200 génomes des deux espèces.Ces génomes ont été séquencés grâce aux technologies NGS puis directement mappés sur un génome de référence externe, celui du riz Asiatique. Nous avons alors appliqué notre méthode d’analyse pan-génomique basée sur la déviation de la profondeur deséquençage pour chaque gène. Nous avons ensuite comparé les enrichissement d’ontologies par compartiments et par espèce dans le but d’identifier des différences liées aux processus de domestication. Enfin, nous avons étudié plus précisément les appartenances pan-génomiques des membres de famille de gènes.Parce que le pan-génome de l’espèce cultivé est plus petit que le core-génome de l’espèce sauvage nous avons confirmé la perte de diversité en terme de présence/ absence de gènes chez le riz Africain au cours du processus de domestication. Curieusement nous avons aussi mis en avant l’augmentation du nombre de gènes dispensable chez l’espèce cultivée par rapport à son relatif sauvage.Ainsi, malgré une forte réduction du pan-génome de l’espèce cultivé lors de la « première » sélection, les 1000 générations de processus de domestication ont suffit à réintroduire une forme de diversité à travers l’augmentation du nombre de gènes dispensables.Afin d’automatiser une grande partie des manipulations d’analyses de données NGS nous avons aussi développé un outil de génération de pipelines d’analyses. De part sa généricité et sa robustesse il pourra être utilisé dans différents domaines, pour plu-sieurs types de données. Grâce aux nombreux logiciels qui y sont intégrés et de par le suivi que l’équipe de développement entend poursuivre, il pourra être utilisé dans la caractérisation de plus en plus de choses. Par exemple les variations structurales, les associations génotypes-phénotypes, l’épigénétique et pourquoi pas la métagénomique.Ce travail a permis la mise au point d’une nouvelle méthode d’analyse des données pan-génomiques rapide de par sa vision globale plutôt que via des comparaisons deux-à-deux. Cette méthode s’adresse aux génomes grands et complexes comme ceux des plantes, mais aussi aux jeux de données massifs. / Species diversity is represented by the sum of the diversity of each of the individuals composing it. It can be seen at differents cales: individual, organic, tissular, cellular, genomic, gene, and even nucleotic. The study of the diversity of species is important to better understand and allow tracking its evolutionary history, comparing it to other species, in particular wild to cultivated. We focused on the domestication, and particularly its impact on the pan-genome structure.The pan-genome is divided into three compartments: (i) the core-genome containing all the genes present in all individuals of the species; (ii) the dispensable genome containing all genes absent in at least one individual; (iii) and finally the individual-specific genome containing genes present only in one individual.The objective of this thesis was to develop a new method for pan-genomic analysis that can apply to a large number of indi-viduals. For this, we worked on a massive resequencing data set of cultivated African rice O. glaberrima and of its wild ancestor O. barthii. At first we checked the existence of a pan-genomic structure on our model. For this we worked on a small scale, with three accessions of cultivated species. They were sequenced, assembled, annotated then analyzed to detect specific sequences for each accession.Secondly we developed our approach working with nearly 200 genomes of both species. These genomes were sequenced using Illumina technology and mapped to the external reference genome, of the Asian rice. We applied our pan-genomic method analysis based on the deviation of the depth of sequencing for each gene. We then compared the ontology enrichment compartments and species in order to identify differences related to the domestication process. Finally, we looked specifically to pan-genomic genes belonging to gene family. Because the pan-genome of the cultivated species is smaller than the core-genome of the wild one, we confirmed the loss ofdiversity in terms of presence/ absence of genes in African rice during the domestication process. Curiously we have also high lighted the increase in the number of dispensable genes in the crop from its wild relative. Thus, despite a sharp reduction of the pan-genomeof the species cultivated in the “first” selection, the 1,000 generations of domestication process were enough to reintroduce a formof diversity through increasing the number of dispensable genes.To automate much of the data analysis of NGS manipulations we have also developed a tool to generate analysis pipelines.Due to its generic and robustness it can be used in different areas, for several types of data. With many softwares integrated and by monitoring that the development team will continue, it may be used in the characterization of more and more things. For example,structural variations, genotype-phenotype associations, epigenetics and metagenomics. This work enabled the development of a new analytical method for rapid genome-wide data through its global vision ratherthan through two by two comparisons. This method is for large and complex genomes such as those of plants, but also to massivedata sets.
70

Inférence de la structure tri-dimensionnelle du génome / Inferring the 3D architecture of the genome

Varoquaux, Nelle 03 December 2015 (has links)
La structure de l'ADN, des chromosomes et l'organisation du génome sont des sujets fascinants du monde de la biologie. La plupart de la recherche s'est concentrée sur la structure unidimensionnelle du génome, étudiant comment les gènes et les chromosomes sont organisés, et le lien entre l'organisation unidimensionnelle et la régulation des gènes, l'épissage, la méthylation… Cependant, le génome est avant tout organisé dans un espace euclidien tridimensionnel, et cette structure 3D, bien que moins étudiée, joue elle aussi un rôle important dans la fonction génomique de la cellule. La capture de la conformation des chromosomes (3C) et les méthodes qui en sont dérivées, associées au séquençage à haut débit (NGS) mesurent désormais en une seule expérience des interactions physiques entre paire de loci sur tout le génome, permettant ainsi aux chercheurs de découvrir les secrets de l'organisation des génomes. Ces nouvelles technologies ouvrent la voie à des études systématiques et globales sur le repliement de l'ADN dans le noyau. Cependant, ces nouvelles méthodes 3C, comme toute nouvelle technologie, sont accompagnées de nombreux défis computationnels et théoriques. Le premier chapitre est dédié au développement d'une méthode robuste et précise pour inférer un modèle tridimensionnel à partir de données Hi-C. Notre méthode modélise les fréquences d'interaction comme une distribution de Poisson dont l'intensité est une fonction de la distance euclidienne entre paires de loci : nous formulons ainsi l'inférence de la structure 3D comme un problème de maximum de vraisemblance. Nous montrons que notre méthode infère des modèles plus robustes et plus stables selon les données et les résolutions de celles-ci. Le deuxième chapitre est consacré à l'étude de l'architecture du P. falciparum, un petit parasite responsable de la forme la plus virulente et mortelle de la malaria. Ce projet, dont l'objectif était avant tout de répondre à une question biologique, cherchait à comprendre comment l'architecture 3D du génome du P. falciparum est liée à l'expression et la régulation des gènes à différent moments du cycle cellulaire du parasite. En collaboration avec les équipes de K. Le Roch et de W. Noble, spécialisées respectivement dans l'étude du P. falciparum, et dans le développement de méthode computationnelle pour étudier, entre autre, la structure 3D du génome, nous avons construit des modèles de l'organisation du génome à trois moments du cycle cellulaire du parasite. Ceux-ci révèlent que le génome est replié dans le noyau dans une structure complexe, où de nombreux éléments génomiques colocalisent : centromères, télomères… Cette architecture indique une forte association entre l'organisation spatiale du génome et l'expression des gènes. Le dernier chapitre répond à une question très différente, mais aussi liée à l'étude des données 3C. Celles-ci, initialement développées pour étudier la structure tridimensionnelle du génome, ont été récemment utilisées pour des applications très diverses : l'assemblage de génomes de novo, la déconvolution d'échantillons métagénomiques et l'annotation de génomes. Nous décrivons dans ce chapitre une nouvelle méthode, Centurion, qui infère conjointement la position de tous les centromères d'un organisme, en utilisant la propriété qu'ont les centromères à colocaliser dans le noyau. Cette méthode est donc une alternative aux méthodes de détection de centromères classiques, qui, malgré des années de recherche et un enjeu économique certain, n'ont pu identifier la position des centromères dans un certain nombre d'espèces de levure. / The structure of DNA, chromosomes and genome organization is a topic that has fascinated the field of biology for many years. Most research focused on the one-dimensional structure of the genome, studying the linear organizations of genes and genomes and their link with gene expression and regulation, splicing, DNA methylation… Yet, spatial and temporal three-dimensional genome architecture is also thought to play an important role in many genomic functions. Chromosome conformation capture (3C) based methods, coupled with next generation sequencing (NGS), allow the measurement, in a single experiment, of genome wide physical interactions between pairs of loci, thus enabling to unravel the secrets behind 3D organization of genomes. These new technologies have paved the way towards a systematic and genome wide analysis of how DNA folds into the nucleus and opened new avenues to understanding many biological processes, such as gene regulation, DNA replication and repair, somatic copy number alterations and epigenetic changes. Yet, 3C technologies, as any new biotechnology, now poses important computational and theoretical challenges for which mathematically well grounded methods need to be developped. The first chapter is dedicated to developping a robust and accurate method to infer a 3D model of the genome from Hi-C data. Previous methods often formulated the inference as an optimization problem akin to multidimensional scaling (MDS) based on an ad hoc conversion of contact counts into euclidean wish distances. Chromosomes are modeled with a beads-on-a-string model, and the methods attempt to place the beads in a 3D euclidean space to fullfill a number of, often non convex, constraints and such that the pairwise distances between beads are as close as possible to the corresponding wish distances. These approaches rely on dubious hypotheses to convert contact counts into wish distances, challenging the accuracy of the final 3D model. Another limitation is the MDS formulation which is only intuitively motivated, and not grounded on a clear statistical model. To alleviate these problems, our method models contact counts as a Poisson distribution where the intensity is a decreasing function of the spatial distance between elements interacting. We then formulate the 3D structure inference as a maximum likelihood problem. We demonstrate that our method infers robust and stable models across resolutions and datasets. The second chapter focuses on the genome architecture of the P. falciparum, a small parasite responsible for the deadliest and most virulent form of human malaria. This project was biologically driven and aimed at understanding whether and how the 3D structure of the genome related to gene expression and regulation at different time points in the complex life cycle of the parasite. In collaboration with the Le Roch lab and the Noble lab, we built 3D models of the genome at three time points which resulted in a complex genome architecture indicative of a strong association between the spatial genome and gene expression. The last chapter tackles a very different question, also based on 3C-based data. Initially developped to probe the 3D architecture of the chromosomes, Hi-C and related techniques have recently been re-purposed for diverse applications: de novo genome assembly, deconvolution of metagenomic samples and genome annotations. We describe in this chapter a novel method, Centurion, that jointly infers the locations of all centromeres in a single yeast genome from Hi-C data, using the centromeres' tendency to strongly colocalize in the nucleus. Indeed, centromeres are essential for proper chromosome segregation, yet, despite extensive research, centromere locations are unknown for many yeast species. We demonstrate the robustness of our approach on datasets with low and high coverage on well annotated organisms. We then predict centromere coordinates for 6 yeast species that currently lack those annotations.

Page generated in 0.0511 seconds