• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 225
  • 120
  • 32
  • 1
  • Tagged with
  • 362
  • 294
  • 117
  • 114
  • 96
  • 81
  • 77
  • 70
  • 67
  • 61
  • 58
  • 54
  • 53
  • 51
  • 50
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
31

Étude de la régulation pré-traductionnelle de l’inclusion de motifs d’import et d’export nucléaires chez l’humain / Study of the pre-translational regulation for the inclusion of nuclear import and export motifs in human

Akpawu, Akuvi Kafui Anna January 2016 (has links)
Résumé : INTRODUCTION : Les protéines doivent se retrouver dans le bon compartiment cellulaire afin de pouvoir exercer leurs fonctions. Une fois synthétisées dans le cytoplasme, les protéines se déplacent à travers les différents compartiments cellulaires, guidés par des signaux de ciblage protéique. Des modifications post-traductionnelles jouent un rôle dans la régulation et le contrôle dynamique de la localisation des protéines. Des exemples dans la littérature indiquent que cette régulation existe également au niveau pré-traductionnel. Ce projet cherche à investiguer cette régulation pré-traductionnelle sur les motifs d’import et d’export nucléaires choisi comme signaux modèles. A l’aide de la bio-informatique, nous caractérisons cette régulation pré-traductionnelle, pour ensuite analyser de façon quantitative le niveau du contrôle de l’inclusion de ces motifs dans les transcrits en considérant des données de RNA-seq. MÉTHODE : Des données du transcriptome humain ont été regroupées dans une base de données locale MySQL. Une curation extensive de bases de données publiques a permis d’identifier les motifs d’import et d’export nucléaires, validés expérimentalement. Des scripts dans les langages Python et PHP ont été créés afin d’interroger la base de données et d’implémenter les algorithmes. Par la suite des ensembles de données de RNA-seq ont été analysés pour quantifier le niveau d’inclusion de ces motifs. RÉSULTATS : La majorité de ces motifs varie pour les gènes dont seulement certaines isoformes contiennent ce motif. Nous avons pu déterminer la distribution de la position des motifs chez l’humain, et caractériser quatre différents types de régulation pré-traductionnelles pour ces motifs. Ces catégories sont : les sites d’initiation et de terminaison différentiels de transcription /traduction, l’épissage (d’introns/d’exons) et le décalage du cadre de lecture. L’index d’inclusion du motif (MII) varie pour les gènes à travers différents tissus d’un même ensemble de données et varie également dans des tissus cancéreux. Certains gènes produisent des isoformes dont le MII est tissu-spécifique. CONCLUSION : La régulation pré-traductionnelle de l’inclusion de motifs de ciblage d’import et d’export nucléaires joue un rôle important sur la localisation de la protéine résultante. Les données de RNA-seq ont abouti à une analyse quantitative sur ces motifs dans différents tissus normaux et cancéreux. / Abstract : INTRODUCTION: Proteins have to be in the right compartment in order to perform their functions. Once synthesized in the cytosol, proteins are guided by sorting signals as they move through different subcellular compartments. Post-translational modifications play a role in the regulation and dynamic control of protein localization. Some examples in the literature show that this regulation also exist at the pre-translational level. The purpose of this research is to investigate this regulation on nuclear import and export motifs, chosen as model signals. Using bioinformatics, we characterize this pre-translational regulation then using RNA-seq data, perform a quantitative analysis on the level of motif inclusion among transcripts. METHODS: Data of the human transcriptome was put in MySQL in house. For this study, we used experimental data. Extensive manual curation was performed on nuclear import and export motifs that were experimentally validated and obtained from public databases. In order to interrogate the database and implement the algorithms, scripts in Python and PHP were used. RNA-seq data were used and analyzed in order to quantify the level of inclusion of these motifs. RESULTS: The majority of these motifs are only present in a subset of the coding isoforms of the genes. The position distribution of these motifs in the human proteome was determined. We characterized four different types of pre-translational regulation for alternative motifs. The categories a re: differential initiation and termination sites of transcription/translation, splicing (of introns/exons) and frameshift mutation. Genes have a motif inclusion index (MII) that varies among different types of tissues within the same dataset and varies as well in cancer tissues. Some genes produce isoforms with MII that are tissue-specific. CONCLUSION: Pre-translational regulation plays an important role in the inclusion of nuclear import and export motifs and the localization of proteins containing them. Quantitative analyses showing the behaviour of the motifs in different types of normal and cancer tissues were performed with RNA-seq data.
32

Structure et activité des Archaea planctoniques dans les écosystèmes aquatiques / Structure and activity of planktonic Archaea in aquatic ecosystems

Hugoni, Mylène 31 October 2013 (has links)
Les Archaea planctoniques contribuent de façon significative aux grands cycles biogéochimiques dans les écosystèmes aquatiques, néanmoins la structure des communautés actives ainsi que leurs variations saisonnières sont encore largement méconnues. En outre, la découverte de l’implication des Archaea dans le cycle de l’azote (Ammonia Oxidizing Archaea ou AOA), plus particulièrement dans le processus de nitrification a considérablement modifié la perception d’un processus autotrophe réalisé uniquement par des bactéries (Ammonia Oxidizing Bacteria ou AOB). Dans les écosystèmes marins, la large distribution des AOA suggère que ces microorganismes joueraient un rôle prépondérant dans le cycle de l’azote néanmoins, ces observations ne sont pas généralisables à l’ensemble des écosystèmes aquatiques en raison de leur grande diversité et/ou d'un manque d'informations et d’études sur certains d'entre eux. Ainsi, les objectifs de ce projet étaient i) d’étudier la structure spatiale et temporelle des communautés d’Archaea actives dans des écosystèmes aquatiques contrastés en termes d’apports anthropiques et/ou de gradients de salinité (lac, estuaire, milieu côtier) ; ii) de déterminer la contribution relative des Archaea au processus d’oxydation de l’ammonium, en comparaison avec celle des bactéries ; et iii) de mieux comprendre les paramètres environnementaux qui pourraient déterminer l’établissement des communautés d’AOA ou d’AOB. / Aquatic Archaea are important players among microbial plankton and significantly contribute to biogeochemical cycles, especially nitrogen, but details regarding their community structure and seasonal activity and dynamics remain largely unexplored. In marine ecosystems, the widespread distribution of Ammonia Oxidizing Archaea (AOA) suggests that they probably play a major role in nutrients cycling. However, we cannot generalize these observations to all aquatic ecosystems because of their high diversity and/or a lack of information and studies on these organisms for some of these ecosystems. More precisely, lacustrine and coastal ecosystems were less studied while they are potentially subjected to strong anthropogenic impacts. Moreover, notable differences in terms of diversity and activity between marine and freshwater communities can be expected, considering the specific environmental parameters of each ecosystem. The objectives of this thesis were: i) to study the archaeal community structure across a temporal scale and assess the diversity of archaeal communities and AOA in diverse aquatic ecosystems along anthropogenic and/or salinity gradient (lacustrine, estuarine and coastal ecosystems); ii) to determine their relative contribution in ammonia oxidation, compared to Ammonia Oxidizing Bacteria (AOB) by looking at their spatial and temporal distribution and activity, and iii) to explore more precisely the environmental parameters that could drive AOA and/or AOB establishment.
33

Hétérogénéité spatio-temporelle du microbiote de la grotte de Lascaux / Spatio temporal heterogeneity of microbiota of Lascaux Cave

Alonso, Lise 30 August 2018 (has links)
L’anthropisation est la principale source de perturbations dans les grottes, et dans la grotte de Lascaux cela a entrainé la prolifération de microorganismes et des altérations de paroi menaçant sa conservation. L’objectif de cette thèse était de mieux comprendre l’écologie des microorganismes colonisant la grotte de Lascaux, en identifiant sa communauté microbienne à différentes échelles spatio-temporelles, de caractériser les facteurs qui structurent cette communauté et d’en étudier la dynamique fonctionnelle en utilisant le séquençage à haut débit d’acides nucléiques, une nouvelle approche à Lascaux. Une comparaison à l’échelle régionale de différentes grottes de Dordogne, plus ou moins anthropisées a été réalisée, puis à une échelle locale avec l’étude de salles de Lascaux, le Passage pour évaluer le rôle des substrats minéraux, et l’Abside qui présente deux types d’altérations (taches noires et zones sombres). Nos résultats montrent que les grottes anthropisées (dont Lascaux) ont des communautés microbiennes particulières. Le substrat minéral structure davantage la communauté du Passage que la présence de taches. Dans l’Abside, bien que les zones sombres soient visuellement différentes des taches noires, les communautés microbiennes présentent des similarités fortes, et notamment le rôle des interactions entre les collemboles, les champignons noirs et des bactéries. Enfin, les profils métatranscriptomiques diffèrent en fonction des salles et de la présence de taches. Ce projet a permis de caractériser l’écologie de la communauté microbienne de Lascaux et permet de mieux comprendre le fonctionnement microbien de la grotte / Anthropisation is the main source of disturbance in the caves, and in the cave of Lascaux it has led to the proliferation of microorganisms and alterations of the wall threatening its conservation.The objective of this thesis was to better understand the ecology of microorganisms colonizing the cave of Lascaux, by identifying its microbial community at different spatio-temporal scales, to characterize the factors that structure this community and to study its functional dynamics in using high throughput sequencing of nucleic acids, a new approach to Lascaux.A regional comparison of different Dordogne caves, more or less anthropised was carried out, then at a local scale with the study of Lascaux rooms, the Passage to evaluate the role of mineral substrates, and the Apse which presents two types of alterations (black spots and dark areas).Our results show that anthropogenic caves (including Lascaux) have particular microbial communities. The mineral substrate structures the Passage community more than the presence of spots. In the Apse, although dark areas are visually different from black spots, microbial communities show strong similarities, including the role of interactions between collembolans, black fungi, and bacteria. Finally, the metatranscriptomic profiles differ according to the rooms and the presence of spots.This project has made it possible to characterize the ecology of the Lascaux microbial community and to better understand the microbial functioning of the cave
34

Convergent antibody signatures for the measles virus in transgenic rats expressing a human B cell IG repertoire / Signatures spécifiques au virus de la rougeole identifiées dans le répertoire des immunoglobulines dans un modèle de rats transgéniques produisant des anticorps humains

Dubois, Axel 17 December 2015 (has links)
L’énorme diversité des immunoglobulines (IG) permet la reconnaissance spécifique d’un nombre presqu’infini d’antigènes, et assure à l’organisme une protection à long-terme envers les pathogènes déjà rencontrés. La région déterminant de la complémentarité 3 (CDR3) de la chaine lourde des IG est le principal déterminant de la spécificité de l’IG. A l’aide des technologies de séquençage à haut débit, nous avons évalué si une vaccination peut conduire à la production d’IG antigène-spécifiques et partagées entre individus (réponse humorale publique), en nous intéressant particulièrement à la région CDR3. Ces «signatures» antigène-spécifiques peuvent potentiellement être utilisées pour reconstruire a posteriori l’histoire immunitaire d’un individu. Pour tester cette hypothèse, des rats transgéniques produisant des anticorps humains (OmniRatTM) ont été vaccinés avec divers antigènes, en particulier du virus de la rougeole (souche vaccinale et sauvage). Une forte réponse immunitaire publique a été observée au sein de différents groupes de rats, caractérisée par des séquences CDR3 partagées entre les animaux ayant reçu le même vaccin. Ces groupes de CDR3s constituent des signatures complexes antigène-spécifiques. De futures études de suivi vaccinal et d’infection devraient nous permettre de déterminer si les signatures identifiées se retrouvent également chez l’humain. Ces outils pourront se révéler précieux dans le cadre de la campagne de l'Organisation mondiale de la Santé en vue de l’éradication de la rougeole, en permettant de distinguer entre les individus vaccinés et infectés / The enormous diversity of immunoglobulins (IG) allows the specific recognition of an almost infinite number of antigens, and ensure a long-term protection against pathogens previously encountered by the organism. The complementarity-determining region 3 (CDR3) of the immunoglobulin heavy chain (IGH) is the major antigen binding domain and determinant of antigen-specificity of the antibody molecule. Using next-generation sequencing, we tested whether immunization resulted in the generation and accumulation of similar IGH CDR3 sequences that are antigen-specific and shared across individuals, i.e. public IGH CDR3s. Such public "antigen-specific signatures" can potentially be used to retrospectively reconstruct past antigenic challenges. To test this hypothesis, transgenic rats with fully functional human Ig heavy and light chain loci (OmniRatTM) have been immunized with diverse antigens, and particularly measles virus (MV)-derived antigen. We demonstrated a strong public immune response within the different groups of rats characterized by convergent IGH CDR3 amino acid sequences in the animals that received the same vaccine. These clusters of CDR3s represent complex antigen-specific IGH CDR3 signatures. We are now transposing this concept to human studies by performing infection and vaccination follow ups to test whether similar CDR3 signatures can also be found in peripheral blood B cells. In the context of the MV eradication campaign of the World Health Organization, new epidemiological tools that enable to distinguish between immunized and infected individuals would be valuable assets
35

Analyse de la méthylation de l'ADN par séquençage haut-débit chez la Poule

Mersch, Marjorie 30 October 2018 (has links) (PDF)
Anticiper l’impact de fluctuations environnementales de nature climatique ou alimentaire est un enjeu crucial dans les systèmes de productions animales, et plus particulièrement sur la volaille. Cette influence de l’environnement sur les phénotypes passe en partie par des phénomènes épigénétiques, notamment la méthylation de l’ADN, et qui peuvent intervenir dans la régulation de l'expression des gènes. Ce sont des mécanismes qui n'affectent pas la séquence d'ADN mais qui peuvent être transmis par la mitose ou la méiose. Ces interactions entre épigénomes et expression des gènes sont de plus en plus étudiées dans les modèles animaux et chez les plantes. Cependant, les mécanismes de régulation de l'expression du génome par la méthylation de l’ADN sont assez peu connus chez les oiseaux. Ce travail de thèse repose sur deux dispositifs expérimentaux réalisés chez la poule, le but étant de caractériser le méthylome par séquençage haut-débit. Les profils de méthylation le long du génome, et le lien avec l’expression, sont établis d’abord par un séquençage tout-génome (WGBS) au sein d’embryons entiers, puis par un séquençage d'une sous-représentation du génome (RRBS) au sein d’hypothalamus d’individus adultes. À ce jour, aucune étude d'analyses de méthylome par RRBS chez la poule n'a été publiée. Ces deux analyses sont réalisées grâce au développement d'un pipeline bioinformatique, optimisé, disponible à la communauté scientifique. Globalement, le profil de méthylation chez la poule est similaire à ce qui est connu chez les mammifères : les îlots CpG - régions riches en dinucléotides CG, souvent peu méthylées, qui ponctuent le génome principalement dans les régions promotrices des gènes - sont globalement peu méthylés dans les promoteurs sur les données WGBS et RRBS. Les analyses du méthylome des embryons ont confirmé l'absence d'un phénomène de compensation de dose sur les chromosomes sexuels, ou la présence sur le chromosome Z d'une région hyperméthylée. Les analyses des données RRBS révèlent une hyperméthylation globale des CG sur le génome, suggérant une réponse de la méthylation à un stress environnemental. Sur les données WGBS, le niveau de méthylation dans le promoteur est négativement corrélé à l'expression du gène associé. Une méthylation allèle spécifique est également détectée entre les lignées, phénomène mis en évidence pour la première fois chez la poule et dont la fréquence est comparable à ce qui a été observé chez l'Homme. Sur les données RRBS, des résultats préliminaires de la réponse du méthylome aux stress environnementaux montrent le caractère complexe de cette relation. L’utilisation d’aliments moins énergétiques entraînerait une plus grande mobilisation des réserves lipidiques, tandis que les individus soumis à un stress à la chaleur ont un poids corporel plus léger. Une intégration de ces données à des mesures phénotypiques permettrait de faire le lien entre méthylation et environnement. Au-delà de l'aspect fondamental de cette thèse, l'application plus concrète de ces connaissances peut s'appliquer aux systèmes d'élevage pour obtenir des animaux mieux adaptés à l’environnement, en améliorant les caractères de production
36

Nouvelle technique de détection simultanée des variant ponctuels et des copy number variants dans l’obésité monogénique / New method for the simultaneous detection of punctual variations and copy number variants in monogenic obesity

Derhourhi, Mehdi 19 December 2018 (has links)
La génétique, et par extension le séquençage de l’ADN, sont des outils qui ont transformé la compréhension des mécanismes impliqués dans la survenue de nombreuses pathologies, dont l’obésité. Les technologies aujourd’hui à notre disposition nous permettent de déterminer rapidement si un patient est ou non porteur d’un évènement génétique pouvant expliquer sa pathologie. L’une des techniques les plus utilisées en diagnostic aujourd’hui est le séquençage d’exome, ou WES, qui permet une excellente détection des mutations ponctuelles dans les régions codantes du génome. Mais d’autres évènements comme les copy number variants, ou CNV, peuvent également expliquer certaines pathologies, dont l’obésité, via entre autres les CNV de la région 16p11.2. Actuellement, la technique de référence pour la détection de ces copy number variants est l’analyse de puces CGH (Comparative Genomic Hybridization), mais celles-ci ne permettent pas de détecter des mutations non répertoriées au préalable lors de la création de la puce. Sur le principe, le séquençage d’exome peut lui aussi être utilisé pour détecter les CNV, mais son absence de couverture des régions non codantes du génome ne permet pas une détection efficace de ces CNV, car ceux-ci peuvent survenir sur l’ensemble du génome, en englobant des régions codantes et non codantes au sein d’un seul évènement. Le séquençage génome complet peut détecter ces deux types d’évènement, mais son cout est encore élevé ce qui freine sa démocratisation, et l’analyse de données associées nécessite d’importantes ressources informatiques, et le rend difficilement utilisable en diagnostic de routine en l’état actuel des choses. Il est donc pour l’instant nécessaire d’avoir recours à deux techniques différentes pour couvrir ces deux types d’évènements génétiques. Cela implique d’utiliser des échantillons parfois très précieux à deux reprises, de supporter les couts liés à deux techniques diagnostiques (d’environ 450 euros pour le séquençage d’exome au laboratoire et un cout un peu plus élevé pour une puce à ADN dans un laboratoire clinique), et d’allonger les temps de rendu de résultats et donc la durée d’établissement du diagnostic du patient. Cet état de fait nous a conduit à développer une technique de séquençage, que nous avons nommé CoDE-seq (Copy number variation Detection and Exome sequencing), et qui permettra la détection simultanée de ces deux types d’évènements, pour diminuer les temps d’établissement de diagnostics, leurs couts, et la quantité d’échantillon nécessaire. Ce travail a nécessité deux aspects : la mise au point technique et la mise au point analytique. La mise au point technique est passée par la création d’une nouvelle « capture », permettant une détection correcte des mutations ponctuelles de l’exome et des CNV de tout le génome. La mise au point analytique a consisté à définir la méthode à employer, et à permettre d’arriver à une détection fiable, à la fois sensible et spécifique, des CNV sur l’ensemble du génome. Une fois ces CNV identifiés, la question de leur signification fonctionnelle se pose également, et une seconde partie de ma thèse porte sur l’étude de cette signification fonctionnelle, via l’étude de la conformation spaciale de la chromatine et de l’influence des CNV sur celle-ci. / Genetics, and by extention DNA sequencing, are tools that have modified the understanding of the mechanisms involved in genetic diseases, like obesity. Today’s technology has allowed us to rapidly find if a patient carries a genetic event that may explain his/her pathology. One of the most used technology for diagnostic is exome sequencing, or WES, which enables an excellent detection of point mutations in coding regions of the genome. However other events, such as copy number variations, or CNV, can also explain some pathologies, like a severe form of obesity due to CNV in the chr16p11.2 region. Actually, the gold standard method for an accurate detection of CNV is array CGH, but this technology cannot detect new point mutations. Exome sequencing can be used to detect CNV, but the lack of coverage in non-coding regions limits CNV detection sensitivity. Of note, whole genome sequencing can detect both CNVs and point mutations, but it is still very expensive and needs huge informatics capacities, which is an obvious limitation for a routine diagnostic use.For now, we have had to use two different methods in order to accurately detect both CNVs and point mutations. In other words, we have had to use precious samples two times, to assume the cost of two different methods (which is nearly 450 euros in the laboratory for exome sequencing, and a bit more for array CGH in a clinical laboratory), and to consider the time of the realization of two different methods in order to achieve a complete diagnostic.In this context, we aimed to develop an innovative sequencing method, named CoDE-seq (Copy number variation Detection and Exome sequencing), which would allow us to simultaneously detect both CNVs and point mutations, in order to reduce the time of diagnostic, the cost, and the needed quantity of sample.This work included the method conception, and the data analysis steps. The method conception has been done through the creation of a new capture enabling the detection of point mutations in the exome, and CNVs all along the genome. Furthermore, the data analysis step included the choice of the bioinformatics methods to be used, in order to get a specific and sensitive CNV detection, all along the genome.We were also interested in the fonctional significance of identified CNV, and tried to decipher it by the study of chromatine spacial conformation and the influence of these CNV.
37

Approches gène candidat et par séquençage d'exome dans les obésités syndromiques précoces / Candidate gene approach and by whole-exome sequencing in early syndromic obesities

Huvenne, Hélène 15 December 2015 (has links)
Les obésités monogéniques et syndromiques sont des formes rares d'obésité, dont tous les facteurs génétiques ne sont pas connus. Quelle est l'implication des mutations du gène LEPR dans l'obésité sévère? Un séquençage de LEPR a été réalisé chez 535 sujets obèses Français.En France, les mutations homozygotes de LEPR ne sont pas rares (2,24%) et se caractérisent par une obésité extrême à début très précoce, troubles du comportement alimentaire et anomalies endocriniennes. En particulier, une nouvelle mutation ?exon6- 8 a été identifiée chez 6 sujets originaires de l'île de La Réunion, suggérant un effet isolat. La perte de poids après chirurgie bariatrique était très variable. Enfin, les sujets hétérozygotes ne présentaient pas de phénotype intermédiaire, avec une obésité inconstante sans anomalies endocriniennes. Quels sont les autres gènes impliqués dans les obésités syndromiques? Un séquençage d'exome a été réalisé chez 8 sujets avec obésité sévère et précoce et retard mental. Puis un variant a été génotypé chez 43 sujets atteints d'obésité syndromique, 178 ayant une obésité commune et 195 non obèses. Onze variants géniques ont été identifiés et étaient impliqués dans 4 voies physiopathologiques: neurogénèse, excitabilité neuronale/neurotransmission, remodelage de la chromatine, fonction ciliaire. Au vu de son potentiel effet délétère, un variant de MYT1L a été sélectionné et détecté chez 11,76% des patients ayant une obésité syndromique, 19,66% des enfants ayant une obésité commune et 6,67% des témoins suggérant un polymorphisme fréquent. Les sujets non porteurs avaient plus de probabilité d'avoir un IMC normal, suggérant le rôle de MYT1L dans le développement de l'obésité. / Monogenic and syndromic obesities are rare forms of obesity, which all genetic factors are not yet known.What is the implication of LEPR gene mutations in severe obesity?A direct sequencing of the LEPR gene was performed in 535 obese French subjects.In France, homozygous LEPR mutations are not rare (2.24%) and are characterized by extreme early-onset obesity, food impulsivity and endocrine disorders. Especially, we identified a new LEPR mutation Δexon6- 8 in 6 subjects originated from Reunion Island, suggesting a founder effect. Results concerning weight loss surgery were inconsistent in homozygous LEPR mutation carriers. Heterozygous LEPR mutation carriers exhibited no intermediate phenotype, with inconstant obesity and without endocrine abnormality. What are the other genes involved in syndromic obesities?A whole-exome sequencing was performed in 8 subjects with severe early-onset obesity and mental delay. Then a variant was genotyped in 43 subjects with syndromic obesity, 178 with common obesity and 195 nonobese controls.Eleven genic variants were identified and are implicated in 4 physiopathological pathways: neurogenesis, neuronal excitability/neurotransmission, chromatin remodelling, ciliary function. Because of its potential deleterious effect, a MYT1L variant was selected and detected in 11.76% of patients with syndromic obesity, 19.66% of children with common obesity, and 6.67% of controls, suggesting a common polymorphism. Non-carriers subjects had more probability to have a normal BMI, suggesting the role of MYT1L in obesity development.
38

Caractérisation des erreurs de séquençage non aléatoires : application aux mosaïques et tumeurs hétérogènes / Characterization of non-random sequencing errors : application to mosaicism and heterogeneous tumors

Saad, Chadi 26 September 2018 (has links)
L'arrivée des technologies de séquençage d’ADN à haut-débit a représenté une révolution dans le domaine de la génomique personnalisée, en raison de leur résolution et leur faible coût. Toutefois, ces nouvelles technologies présentent un taux d’erreur élevé, qui varie entre 0,1% et 1% pour les séquenceurs de seconde génération. Cette valeur est problématique dans le cadre de la recherche de variants de faible ratio allélique, comme ce qui est observé dans le cas des tumeurs hétérogènes. En effet, un tel taux d’erreur peut mener à des milliers de faux positifs. Chaque région de l’ADN étudié doit donc être séquencée plusieurs fois, et les variants sont alors filtrés en fonction de critères basés sur leur profondeur. Malgré ces filtres, le nombre d’artefacts reste important, montrant la limite des approches conventionnelles et indiquant que certains artefacts de séquençage ne sont pas aléatoires.Dans le cadre de cette thèse, nous avons développé un algorithme exact de recherche des motifs d’ADN dégénérés sur-représentés en amont des erreurs de séquençage non aléatoires et donc potentiellement liés à leur apparition. Cet algorithme a été mis en oeuvre dans un logiciel appelé DiNAMO, qui a été testé sur des données de séquençage issues des technologies IonTorrent et Illumina.Les résultats expérimentaux ont mis en évidence plusieurs motifs, spécifiques à chacune de ces deux technologies. Nous avons ensuite montré que la prise en compte de ces motifs dans l’analyse, réduisait considérablement le taux de faux positifs. DiNAMO peut donc être utilisé en aval de chaque analyse, comme un filtre supplémentaire permettant d’améliorer l’identification des variants, en particulier des variants à faible ratio allélique. / The advent of Next Generation DNA Sequencing technologies has revolutionized the field of personalized genomics through their resolution and low cost. However, these new technologies are associated with a relatively high error rate, which varies between 0.1% and 1% for second-generation sequencers. This value is problematic when searching for low allelic ratio variants, as observed in the case of heterogeneous tumors. Indeed, such error rate can lead to thousands of false positives. Each region of the studied DNA must therefore be sequenced several times, and the variants are then filtered according to criteria based on their depth. Despite these filters, the number of errors remains significant, showing the limit of conventional approaches and indicating that some sequencing errors are not random.In the context of this thesis, we have developed an exact algorithm for over-represented degenerate DNA motifs discovery on the upstream of non-random sequencing errors and thus potentially linked to their appearance. This algorithm was implemented in a software called DiNAMO, which was tested on sequencing data from IonTorrent and Illumina technologies.The experimental results revealed several motifs, specific to each of these two technologies. We then showed that taking these motifs into account in the analysis reduced significantly the false-positive rate. DiNAMO can therefore be used downstream of each analysis, as an additional filter to improve the identification of variants, especially, variants with low allelic ratio.
39

Caractérisation d'aptamères par électrophorèse capillaire couplée au séquençage haut-débit Illumina / Characterization of aptamers by capillary electrophoresis coupled to the hight throughput sequencing Illumina

Ric, Audrey Marie Amélie 29 September 2017 (has links)
Les aptamères sont des oligomères d'ADN ou d'ARN simple brin qui, en se repliant sous forme de structures tridimensionnelles peuvent avoir des interactions fortes et spécifiques envers un certain nombre de cibles. L'objectif de cette thèse a été de compléter les études existantes sur l'utilisation de l'électrophorèse capillaire (CE) et les aptamères afin de mettre au point une méthode de sélection d'aptamères par CE couplée à la fluorescence induite par laser et le séquençage haut-débit Illumina. Dans un premier temps, nous avons mis au point une méthode de détection et de séparation par électrophorèse capillaire couplée à la double détection UV-LEDIF d'une banque d'ADN en interaction avec une cible : la thrombine. C'est un modèle déjà étudié pour lequel deux aptamères ont fait l'objet de publications. Nous avons utilisé l'aptamère T29 dans le cadre de notre étude car c'est celui qui présente la meilleure affinité. L'électrophorèse capillaire est un puissant outil analytique qui facilite l'efficacité de sélection des aptamères et précise la détermination des paramètres d'interactions. Nous avons ainsi pu déterminer la constante d'affinité KD par CE-UV-LEDIF sur le modèle de base : la thrombine. Par ailleurs, nous montrons également comment l'utilisation du tampon Tris peut dégrader un ADN simple brin en électrophorèse capillaire et nous proposons comme alternative l'utilisation d'un tampon sodium phosphate dibasique qui évite ce phénomène de dégradation. Enfin, nous expliquons la difficulté d'amplification par qPCR et PCR d'un aptamère comme le T29 ayant une structure en G-quadruplex. Nous avons montré que le séquençage haut-débit Illumina nous a permis de trouver une corrélation entre le nombre de molécules séquencées et le nombre de séquences obtenues. L'analyse des séquences obtenues montre une quantité importante (20%) de séquences de T29 qui ne correspondent pas à la séquence de cet aptamère. Cela prouve que les étapes de PCR et de séquençage haut débit pour la détection de G-quadruplex peuvent induire un biais dans l'identification de ces molécules. / Aptamers are oligomers of small single-stranded DNA or RNA which can have strong and specific interactions with some targets when they fold into three-dimensional structures. The objective of this thesis was to complete existing studies on the use of capillary electrophoresis in order to develop a method for the selection of aptamers by CE coupled to laser induced fluorescence and Illumina high-throughput sequencing. In a first step, we developed a method of detection and separation by capillary electrophoresis coupled with the double detection UV-LEDIF of a DNA library interacting with a target: thrombin. It is a model already studied and for which two aptamers have been published. We used aptamer T29 as part of our study because it has the best affinity. Capillary Electrophoresis is a powerful analytical tool that facilitates the selection efficiency of aptamers and specifies the determination of the interaction parameters. We thus were able to determine the affinity constant KD by CE-UV-LEDIF on the basic model: thrombin. Moreover, we also show how the use of Tris buffer can degrade single-stranded DNA during capillary electrophoresis and we propose as an alternative the use of a dibasic sodium phosphate buffer which avoids the phenomenon of degradation. Finally, we explain the difficulty of amplification by qPCR and PCR of an aptamer such as T29 with a G-quadruplex structure. We showed that the Illumina high-throughput sequencing allowed us to find a correlation between the number of sequenced molecules and the number of sequences obtained. Analysis of the sequences obtained shows a significant amount (20%) of T29 sequences which do not correspond to the sequence of this aptamer. This shows that the PCR and high-throughput sequencing steps for the detection of G-quadruplex can induce bias in the identification of these molecules.
40

Implication des factures de remodelage de chromatine de la famille CHD dans les réseaux de régulation transcriptionnelle des cellules souches embryonnaires

De Dieuleveult, Maud 17 September 2010 (has links) (PDF)
Les cellules souches embryonnaires (cellules ES) ont la capacité unique de se diviser indéfiniment et de pouvoir se différencier en de multiples types cellulaires. Elles apparaissent donc très prometteuses comme agents thérapeutiques dans les traitements médicaux du futur. Un enjeu majeur de la recherche actuelle consiste à comprendre la contribution des protéines régulatrices de la chromatine à la plasticité et au contrôle de l'expression du génome des cellules. La famille des remodeleurs Chd, qui fait partie de la super famille SNF2, comprend neuf membres, soit le tiers des remodeleurs exprimés dans les cellules ES murines. L'objectif principal de ce projet de thèse a consisté à identifier de manière exhaustive les gènes cibles de chaque facteur pour comprendre comment ils participent à la régulation du génome et se partagent le remodelage de la chromatine. Nous avons entrepris un projet à grande échelle dans lequel chaque gène codant chaque Chd a été fusionné, à son extrémité carboxy-terminale, à une séquence codant une étiquette, par recombinaison homologue en cellules ES. Les cellules ES étiquetées ont ensuite été utilisées pour des expériences d'immunoprécipitation de chromatine (ChIP-seq). La présence de l'étiquette a permis de standardiser et d'optimiser les méthodes d'immunoprécipitation des protéines. Les fragments d'ADN isolés ont ensuite été séquencés dans le laboratoire d'Ivo Gut (CEA/CNG -Evry- et CNAG -Barcelone-). Nous avons également analysé les transcriptomes des cellules ES où la déplétion de chaque protéine Chd a été réalisée, par hybridation sur puce et RNA-seq. Ces données ont permis de montrer le rôle de NuRD (Chd4, Hdac2) au sein des réseaux de la régulation transcriptionnelle des ES. Les données obtenues pour les facteurs Chd1, Chd8 et Chd4 montrent des rôles différents mais interconnectés pour chaque protéine. Enfin, ces données nous ont permis de proposer des hypothèses pour expliquer comment ces protéines contribuent à la régulation du génome.

Page generated in 0.0442 seconds