Spelling suggestions: "subject:"haut début"" "subject:"faut début""
91 |
Caractérisation de la diversité du répertoire TCR par modélisation de données de séquençage haut-débit / Deciphering TCR repertoire diversity by RepSeq data modelinigChaara, Wahiba 27 September 2016 (has links)
Les lymphocytes T (LT) sont des acteurs-clés du système immunitaire, un système complexe et dynamique évoluant au cours de la vie de l'organisme. On appelle " répertoire lymphocytaire ", une collection de lymphocytes partageant un même phénotype, une même fonction ou tout autres critères, chacun caractérisé par un récepteur membranaire unique, appelé TCR, lui permettant de reconnaitre de manière spécifique les antigènes. Les TCR sont caractérisés par des régions variables, produites par une série de réarrangements somatiques ayant lieu pendant la différenciation thymique, et qui assurent la diversité de reconnaissance des LT. On parle de répertoire TCR lorsque l'on s'attache à définir les caractéristiques clonales des populations lymphocytaires T sur la base de la diversité des TCR exprimés à l'échelle de la population. Le séquençage à haut débit des chaînes TCR permet désormais de décrire cette diversité avec une précision sans précédent. Cette approche requiert néanmoins des outils adaptés pour permettre une caractérisation pertinente de la structure des répertoires analysés. Un axe de recherche de L'unité I3 est l'analyse du répertoire TR de plusieurs populations lymphocytaires T en situation d'auto-immunité ou d'inflammation. Dans ce contexte, les objectifs de ma thèse ont été de : i) approfondir le concept de diversité du répertoire lymphocytaire, ii) mettre au point une méthodologie adaptée permettant d'exploiter les données de séquençage de manière optimale en prenant en compte les limites de cette technologie, et iii) développer un outil permettant aux immunologistes une caractérisation approfondie et facilement interprétable des répertoires qu'ils étudient. / T lymphocytes (LT) are key players in the immune system, a complex and dynamic system evolving over the organism’s life. The concept of "lymphocyte repertoire" designates a collection of lymphocytes sharing the same phenotype, the same function or any other criteria. Each LT is characterized by a unique membrane receptor, called TCR, allowing it to recognize specifically antigens. TCRs are characterized by variable regions produced by a series of somatic rearrangements that occur during the thymic differentiation; these regions engage LT recognition diversity. The “TCR repertoire” approach focuses the clonal characterisation of LT populations on the diversity of the TCR expressed on the scale of the population. The high-throughput sequencing of TCR chains (RepSeq) describes this diversity with unprecedented precision. However, this approach requires adapted tools to enable a relevant deciphering of the analysed TCR repertoire diversity. My thesis aimed to: i) deepen the concept of diversity of the lymphocyte repertoire, ii) develop an appropriate methodology to exploit optimally RepSeq data while taking into account the limits of this technology, and iii) develop a tool providing immunologists a thorough characterisation of their TCR repertoires of interest.
|
92 |
Functional metagenomics of the bovine rumen microbiota to boost enzyme discovery for complex polymer breakdown / Métagénomique fonctionnelle du microbiote du rumen bovin pour la découverte d’enzymes de dégradation de polymères naturels et synthétiquesUfarté, Lisa 25 February 2016 (has links)
Le microbiote du rumen bovin est un écosystème très diversifié et efficace pour la dégradation de substrats complexes, notamment issus de la biomasse végétale. Composé majoritairement de microorganismes non cultivés, il constitue un réservoir très riche de nouvelles enzymes d’intérêt potentiel pour les biotechnologies industrielles, en particulier les bioraffineries et la bioremédiation. Dans le cadre de cette thèse, nous avons mis en œuvre une approche de criblage fonctionnel du métagenome ruminal pour accélérer la découverte d’enzymes de dégradation des lignocelluloses, mais aussi de divers polluants synthétiques. En particulier, de nouvelles estérases capables de dégrader un insecticide de la famille des carbamates, le fenobucarb, ainsi qu’un polyuréthane commercial, l’Impranil DLN, ont pu être identifiées. De plus, le développement d’une nouvelle stratégie de criblage d’oxydoréductases nous a permis d’isoler trois enzymes bactériennes originales, très polyspécifiques, ne requérant ni cuivre ni manganèse pour dégrader différents substrats polycycliques tels que des polluants majeurs de l’industrie textile, mais aussi des dérivés de lignine. Enfin, le criblage de deux banques issues d’enrichissements in vivo et in vitro du microbiome du rumen sur paille de blé a permis d’isoler des cocktails d’enzymes lignocellulolytiques au profil fonctionnel et d’origine taxonomique différents, constitués de glycoside-hydrolases, estérases et oxydoréductases. Quinze nouveaux modules CAZy, correspondant à des familles enzymatiques jamais caractérisées, ont été identifiés. L’ensemble de ces résultats met en lumière l’immense potentiel d’innovation biotechnologique contenu dans les écosystèmes microbiens, en particulier dans le microbiote du rumen bovin / Bovine rumen microbiota is a highly diverse and efficient ecosystem for the degradation of complex substrates, especially those issued from plant biomass. Predominantly composed of uncultivated microorganisms, it constitutes a rich reservoir of new enzymes of potential interest for industrial biotechnologies, especially biorefineries and bioremediation. As part of this thesis, we used the functional screening of the ruminal metagenome to increase the discovery of enzymes able to degrade lignocelluloses, as well as different synthetic pollutants. In particular, new esterases able to degrade a carbamate insecticide, fenoucarb, and a commercial polyurethane, Impranil DLN, have been identified. Moreover, the development of a new screening strategy for oxidoreductases allowed the isolation of three original bacterial enzymes that are very polyspecific, and do not need copper nor manganese to degrade different polycyclic substrates, like major pollutants of the textile industry, as well as lignin derivatives. Finally, the screening of two libraries from in vivo and in vitro enrichments of the ruminal microbiome on wheat straw allowed the isolation of lignocellulolytic enzymatic cocktails, with different functional profiles and taxonomical origins, comprising glycoside-hydrolases, esterases and oxidoreductases. Fifteen novel CAZy modules, related to enzymatic families never characterized, were identified. All these results highlight the vast potential of microbial ecosystems, in particular the bovine rumen microbiota, for biotechnological innovation
|
93 |
Identification des bases moléculaires et physiopathologiques des syndromes oro-facio-digitaux / Identification of molecular and physiopathologic basis in oral-facial-digital syndromesBruel, Ange-Line 21 September 2016 (has links)
Les syndromes oro-facio-digitaux (OFD) sont caractérisés par la présence d'une atteinte orale, faciale et digitale et classés en 13 sous-types. Pendant longtemps seul le gène OFD1, responsable du type I et codant pour une protéine centrosomale et du corps basal, était principalement connu, faisant suspecter l’implication du cil primaire dans les syndromes OFD. Des mutations ont été rapportées plus récemment dans les gènes TMEM216, DDX59, SCLT1, TBC1D32 et TCTN3 chez un ou deux patients. Dans le but d’identifier de nouveaux gènes impliqués dans ces syndromes, nous avons réalisé une stratégie de séquençage haut débit d’exome chez 24 patients. Cette stratégie a permis d’identifier 5 nouveaux gènes (C2CD3, TMEM107, INTU, KIAA0753, IFT57), d'étendre aux syndromes OFD le spectre clinique de 3 gènes déjà connus dans d'autres ciliopathies (C5orf42, TMEM138, TMEM231) et de confirmer l'implication de 3 gènes déjà connus comme responsable de syndrome OFD (OFD1, DDX59, WDPCP). Les analyses fonctionnelles ont montré l’implication de la croissance centriolaire, de la zone de transition et du transport intraflagellaire, avec notamment la caractérisation de 3 complexes protéiques principaux : le complexe ternaire KIAA0753/OFD1/FOPNL, régulant la croissance centriolaire, le complexe MKS (TMEM107, TMEM231, TMEM216) constituant majeur de la zone de transition et le complexe CPLANE (INTU/FUZ/WDPCP), favorisant l’assemblage des protéines périphériques du complexe de transport intraflagellaire IFT-A. En conclusion, cette étude, la plus importante consacrée aux syndromes OFD, démontre la très grande hétérogénéité clinique et génétique de ces syndromes, de même que de nombreux allélismes avec d’autres ciliopathies. Elle étend à 15 le nombre de gènes causaux, rendant la classification clinique initiale totalement obsolète et permettant de considérer les syndromes OFD comme un nouveau sous-groupe de ciliopathies à part entière. / Oral-facial-digital syndromes (OFDS) are characterized by the association of oral, facial and digital anomalies. The different modes of inheritance and additional features lead to clinically delineate 13 subtypes. For a long time, only the OFD1 gene, responsible for OFDI subtype and coding for a centrosomal protein, has been known, suggesting the involvement of the primary cilium in OFDS. Mutations have recently been reported in the TMEM216, DDX59, SCLT1, TBC1D32 and TCTN3 genes in anecdotic cases. To identify new genes involved in OFDS, we performed whole-exome sequencing in 24 patients. In 14/24 cases, we identified 5 novel genes (C2CD3, TMEM107, INTU, KIAA0753, IFT57), enlarged the clinical spectrum of OFDS of 3 known genes responsible for other ciliopathies (C5orf42, TMEM138, TMEM231) and confirmed the involvement of 3 known genes in OFDS (OFD1, DDX59, WDPCP). Functional studies demonstrated the involvement of the centriolar growth, the transition zone and the intraflagellar transport, through the characterization of 3 major protein complexes: the KIAA0753/OFD1/FOPNL complex controlling the centriole elongation, the MKS module (TMEM107/TMEM231/TMEM216), an essential component of the transition zone, and the CPLANE complex (INTU/FUZ/WDPCP) enabling in the IFT-A assembly. We demonstrated the large clinical and genetic heterogeneity of OFDS, yielding the initial classification in 13 subtypes obsolete, extending the number of 15 causal genes, and confirming OFDS as a new full subgroup of ciliopathies.
|
94 |
Improving memory consumption and performance scalability of HPC applications with multi-threaded network communications / Amélioration de la consommation mémoire et de l'extensibilité des performances des applications HPC par le multi-threading des communications réseauxDidelot, Sylvain 12 June 2014 (has links)
La tendance en HPC est à l'accroissement du nombre de coeurs par noeud de calcul pour une quantité totale de mémoire par noeud constante. A large échelle, l'un des principaux défis pour les applications parallèles est de garder une faible consommation mémoire. Cette thèse présente une couche de communication multi-threadée sur Infiniband, laquelle fournie de bonnes performances et une faible consommation mémoire. Nous ciblons les applications scientifiques parallélisées grâce à la bibliothèque MPI ou bien combinées avec un modèle de programmation en mémoire partagée. En partant du constat que le nombre de connexions réseau et de buffers de communication est critique pour la mise à l'échelle des bibliothèques MPI, la première contribution propose trois approches afin de contrôler leur utilisation. Nous présentons une topologie virtuelle extensible et entièrement connectée pour réseaux rapides orientés connexion. Dans un contexte agrégeant plusieurs cartes permettant d'ajuster dynamiquement la configuration des buffers réseau utilisant la technologie RDMA. La seconde contribution propose une optimisation qui renforce le potentiel d'asynchronisme des applications MPI, laquelle montre une accélération de deux des communications. La troisième contribution évalue les performances de plusieurs bibliothèques MPI exécutant une application de modélisation sismique en contexte hybride. Les expériences sur des noeuds de calcul jusqu'à 128 coeurs montrent une économie de 17 % sur la mémoire. De plus, notre couche de communication multi-threadée réduit le temps d'exécution dans le cas où plusieurs threads OpenMP participent simultanément aux communications MPI. / A recent trend in high performance computing shows a rising number of cores per compute node, while the total amount of memory per compute node remains constant. To scale parallel applications on such large machines, one of the major challenges is to keep a low memory consumption. This thesis develops a multi-threaded communication layer over Infiniband which provides both good performance of communications and a low memory consumption. We target scientific applications parallelized using the MPI standard in pure mode or combined with a shared memory programming model. Starting with the observation that network endpoints and communication buffers are critical for the scalability of MPI runtimes, the first contribution proposes three approaches to control their usage. We introduce a scalable and fully-connected virtual topology for connection-oriented high-speed networks. In the context of multirail configurations, we then detail a runtime technique which reduces the number of network connections. We finally present a protocol for dynamically resizing network buffers over the RDMA technology. The second contribution proposes a runtime optimization to enforce the overlap potential of MPI communications, showing a 2x improvement factor on communications. The third contribution evaluates the performance of several MPI runtimes running a seismic modeling application in a hybrid context. On large compute nodes up to 128 cores, the introduction of OpenMP in the MPI application saves up to 17 % of memory. Moreover, we show a performance improvement with our multi-threaded communication layer where the OpenMP threads concurrently participate to the MPI communications
|
95 |
Long non-coding RNAs in cancer : the role of HOTAIR in Epithelial-to-Mesenchymal Transition / Longs ARN non-codants et cancer : le rôle de HOTAIR dans la transition épithélio-mésenchymateuseBertrand, Claire 27 October 2014 (has links)
Le génome humain est largement transcrit en milliers d’ARN non traduits en protéines. Les longs ARN non-codants (ARNlnc) ont un rôle majeur dans la régulation du génome, au cours du développement et lors de la progression de nombreuses maladies, dont les cancers. La transition épithélio-mésenchymateuse (TEM), donnant à une cellule la capacité de former des métastases, semble être un processus crucial transformant une tumeur bénigne en maladie mortelle. Certains ARNlnc ont été associés à ce phénomène, mais leur fonction reste à définir.Un modèle in vitro de TEM et des approches de séquençage d’ARN à très haut débit, nous ont permis de définir un catalogue d’ARNlnc dérégulés entre cellules épithéliales et mésenchymateuses. Parmi eux, nous avons identifié HOTAIR, étudié pour son expression aberrante dans les tumeurs métastasées et son interaction avec les complexes PRC2 et LSD1/CoREST/REST. Par des approches de perte et de gain de fonction, nous avons montré que HOTAIR n’est pas impliqué dans l’initiation de la TEM mais est un régulateur majeur de la prolifération cellulaire ainsi que des capacités de migration et d’invasion des cellules. Nous avons généré des lignées cellulaires sur-exprimant HOTAIR privé de son domaine d’interaction avec PRC2 ou LSD1. L’étude de leur phénotype et l’établissement de leur transcriptome ont permis de montrer que le domaine d’interaction avec le complexe LSD1/CoREST/REST est crucial pour la régulation de nombreux gènes par HOTAIR. Ces résultats permettent une meilleure compréhension du rôle des ARNlnc dans la TEM, et de la fonction cruciale de HOTAIR dans l’acquisition d’un phénotype métastatique par des cellules cancéreuses épithéliales. / The human genome is pervasively transcribed into thousands of non-coding transcripts. Numerous studies underline the diversity and importance of long non-coding RNAs (lncRNAs) in genome regulation and their impact on development and diseases. Processes of cancer progression are extensively studied, in particular the Epithelial-to-Mesenchymal Transition (EMT) that enables epithelial cancer cells to invade other tissues to form metastases. If several lncRNAs have been associated with EMT, their molecular function is not clearly defined. Using a well-established in vitro cell model of EMT and high-throughput RNA sequencing approaches, we defined a catalogue of annotated and novel lncRNAs significantly deregulated between epithelial and mesenchymal states of HEK cells. Among them, we identified HOTAIR, linked to cancer metastasis and described as a scaffold RNA guiding chromatin-modifying complexes PRC2 and LSD1/CoREST/REST. Using loss- and gain-of-function approaches, we showed that HOTAIR is not an inducer of the EMT per se but a major regulator of cell proliferation rate, migratory and invasive capacities. We generated stable cell-lines over expressing HOTAIR transcripts lacking PRC2- or LSD1-interacting domains. Transcriptome analysis and phenotypic studies showed that LSD1-binding domain is crucial for HOTAIR-mediated gene regulation. Altogether, our results give new insights into lncRNAs role in EMT, with a better understanding of HOTAIR-mediated gene regulation mechanism and its role in the acquisition of a metastatic phenotype by cancer cells. Further studies will be performed to deeper investigate lncRNAs role in EMT, particularly for previously unannotated lncRNAs.
|
96 |
Développement de méthodes et d'algorithmes pour la caractérisation et l'annotation des transcriptomes avec les séquenceurs haut débit. / Development of methods and tools for the characterization and annotation of the transcriptomes with Next-Generation Sequencing technologies.Philippe, Nicolas 29 September 2011 (has links)
Depuis leur apparition, les séquenceurs haut débit ont révolutionné l'étude des transcriptomes à l'échelle du génome. En effet, ils offrent la possibilité de générer des millions, voire des milliards de séquences, appelées reads. Des nouvelles approches transcriptomiques, telles que la Digital Gene Expression (DGE) et le RNA-Sequencing (RNA-Seq), permettent aujourd'hui de répertorier, de quantifier, voire reconstruire tous les transcrits d'une cellule, même les plus rares. Parmi ce type de transcrits se trouvent des ARN non-codants régulateurs ; des variants d'épissages créateurs de protéines ; et aussi des chimères (par fusion de gènes ou trans-épissage). La caractérisation de l'ensemble de ces transcrits représente un réel défi algorithmique, mais suscite aussi un défi biologique car certains peuvent être impliqués dans de nombreux processus cellulaires physiologiques et pathologiques et sont fréquemment décrits dans les cancers.Dans ce travail, nous proposons des algorithmes et des méthodes pour la caractérisation et l'annotation des transcriptomes. Tout d'abord, nous proposons une étude statistique sur la DGE afin d'évaluer l'impact des erreurs de séquences lors de l'analyse des reads. À partir de cette analyse, nous avons développé un pipeline d'annotation pour la DGE. Par le biais de ce premier travail, nous avons pu démontrer que de nombreuses informations étaient partagées entre les reads. Cela nous a amené à concevoir la structure d'indexation Gk arrays qui permet d'organiser une quantité massive de reads de façon à pouvoir interroger rapidement la structure sous forme de requêtes. Enfin, en s'appuyant sur les Gk arrays, nous avons développé CRAC qui est un logiciel spécialisé dans le traitement du RNA-Seq. En intégrant sa propre phase de mapping, CRAC est capable de distinguer les phénomènes biologiques des erreurs de séquences. Ilpermet notamment l'identification de chimères qui sont souvent très faiblement exprimées dans un transcriptome et sont par nature complexe à détecter avec des parties localisées à différents endroits sur le génome. / Since their introduction, high-throughput sequencers have revolutionized transcriptomic studies at genome scale. Indeed, they have the ability to generate millions, or even billions of short sequences, called reads. New transcriptomic approaches, such as Digital Gene Expression (DGE) and RNA-sequencing (RNA-Seq), enable the identification, quantification, and reconstitution of all transcripts of the cell, even rare ones. Among these transcripts are regulatory non-coding RNAs, alternative splice variants, which code for novel proteins, but also non colinear transcripts termed chimeras (generated by either gene fusion or trans-splicing). The characterization of these transcripts constitutes a sheer algorithmic,but also a biological challenge due to their differences in nature, their diverse implications in physiological and cellular processes, and for some their role in cancer development.In this work, we focus on algorithms and methods for the characterization and annotation of transcriptomes. First, we proposed a statistical study on DGE to assess the impact of sequence errors on the analysis. Therefrom, we developed a pipeline for the DGE annotation. Through this initial work,we demonstrated that a lot of information is shared between the reads. This property led us to design, the Gk arrays, an indexing data structure for organizing huge amounts of reads in memory and algorithms to quickly query this structure. Finally, based on the Gk arrays we have conceived, CRAC,a software specialised in the RNA-Seq processing. By integrating its own mapping process, CRAC is able to distinguish the biological phenomena from sequence errors. Moreover, it allows to identify chimeric RNAs, which may be weakly expressed in a transcriptome and are inherently complex to detect since their fragments originate from different places on the genome.
|
97 |
Systématique, phylogénie et évolution moléculaires des Phyllostomidae (Mammalia, Chiroptera) : une approche mitogénomique comparative / Molecular systematics, phylogenetics and evolution of Phyllostomid bats (Mammalia, Chiroptera) : a mitogenomic approach using high-throughput sequencing technologiesBotero-Castro, Fidel 12 December 2014 (has links)
L'acquisition des données moléculaires a été bouleversée par le développement des techniques de séquençage haut-débit. Celles-ci ont augmenté la quantité des données et ont fait diminuer le coût de manière considérable. Ces nouvelles approches ont également redonné accès à des sources de matériel biologique qui étaient auparavant inutilisables en raison de la faible quantité et la forte dégradation de l'ADN qu'elles fournissent, notamment des tissus anciens, des échantillons de musée voire du matériel fossile. Un avantage supplémentaire c'est la possibilité de multiplexer les échantillons, c'est-à-dire, les mélanger et les séquencer simultanément grâce à l'utilisation de « tags » ou étiquettes permettant de les séparer après avec des outils bioinformatiques. Un marqueur qui a grandement bénéficié de ces technologies est le génome mitochondrial. En effet, nous montrons que grâce au ratio élevé entre l'ADN mitochondrial et l'ADN nucléaire par cellule, il est possible l'obtention de mitogénomes entiers, avec de couvertures adéquates, sans qu'un enrichissement préalable de l'échantillon soit nécessaire. Ceci permet d'envisager la réalisation de projets de mitogénomique comparative pour de groupes riches en espèces, requérant un échantillonnage taxonomique exhaustif et dont les divergences génétiques rendrait difficile l'usage du séquençage classique. C'est dans ce contexte que cette thèse aborde la systématique, la phylogénie et l'évolution moléculaires d'une famille de chauves-souris néotropicales : les Phyllostomidae. Cette famille est riche en espèces, avec plus de 160 taxons mais aussi en traits d'histoire de vie contrastés notamment le régime alimentaire. Cette diversité résulte en des morphologies convergentes dont les caractères sont en conséquence peu appropriés pour reconstruire l'histoire évolutive de ce groupe. La mitogénomique a prouvé être un outil efficace dans ce dessein, mais à présent aucune étude de ce type a été conduite pour cette famille. Nous avons d'abord réussi à séquencer les mitogénomes de représentants de toutes les lignées majeures couvrant également la diversité de traits d'histoire de vie. Nous montrons ensuite que l'utilisation de ces mitogénomes permet de résoudre les relations de parenté au niveau intrafamilial avec une résolution similaire à celle d'une concaténation de marqueurs mitochondriaux et nucléaires avec un soutien statistique robuste pour la plupart des nœuds de la phylogénie. Ceci nous a permis de clarifier plusieurs relations qui restaient controversées dans des études précédentes et confirmer plusieurs des clades proposés par celles-ci. Ensuite, nous abordons l'évolution du mitogénome en relation avec les traits d'histoire de vie en utilisant comme exemple le clade des vampires, les seules Mammifères hématophages, dont le génome mitochondrial semble avoir été touché par une accélération du taux d'évolution comme conséquence de l'action combinée de forces neutres et sélectives pour répondre aux contraintes imposées par ce régime alimentaire. Finalement, le cadre phylogénétique robuste proportionné par les 100 mitogénomes que nous avons séquencés pourra être utilisé comme référence pour étudier la diversification des Phyllostomidae. / New sequencing technologies have revolutionized the acquisition of molecular data by increasing the amount of sequences at a considerably lower cost. These new technologies have also given access to samples previously neglected because they resulted in low-quantity and degraded DNA yields, as for example, old tissues, museum specimens and even fossil rests. An additional advantage comes from the possibility of multiplexing; this is, mixing several taxa in a single sample thanks to the use of tags or labels allowing late separating the sequences using bioinformatic tools. A molecular marker that has greatly benefited from these technologies is the mitochondrial genome. Indeed, we show that, thanks to the high per-cell ratio of mitochondrial to nuclear DNA, it's possible to obtain whole well-covered mitochondrial genomes without previous sample enrichment. This allows the accomplishment of projects of comparative mitogenomics for species-rich groups needing exhaustive taxon sampling and for which strong genetic divergences would difficult the use of classical sequencing.It is in this context that this thesis tackles the molecular systematics, phylogenetics and evolution of a Neotropical family of bats: the Phyllostomidae. This species-rich family, accounting for more than 160 species, is also the family of Mammals with the highest diversity of life history traits, for example, feeding on almost every possible source of food. This diversity results in convergent morphologies that make this kind of characters inadequate for reconstructing the evolutionary history of this group. Mitogenomics has proven useful in similar cases but no study of this kind has been conducted for this family. We got to sequence whole mitogenomes for representatives of all major lineages and covering the diversity of life history traits. We then show that using these mitogenomes allows solving intrafamilial relationships with a resolution similar to that resulting from a concatenation of mitochondrial and nuclear markers and with solid statistical support for most of the nodes of the phylogeny. This allowed clarifying several controversial relationships and confirming several clades proposed in previous studies. Next, we illustrate the evolution of mitogenomes and the influence of life history traits using the clade of vampire bats, the only hematophagous Mammals, whose mitogenome seem to have undergone an acceleration of evolutionary rate as a consequence of the combined action of neutral and selective forces in order to counter the constraints imposed by this feeding habit. Finally, the robust phylogenetic frame provided by the 100 mitogenomes that we sequenced, will be used for future studies about, for exemple, the diversification process of Phyllostomids.
|
98 |
Simulation numérique et approche orientée connaissance pour la découverte de nouvelles molécules thérapeutiques / Numeric simulation and knowledge-oriented approach for the discovery of new therapeutic moleculesGhemtio Wafo, Léo Aymar 07 May 2010 (has links)
L’innovation thérapeutique progresse traditionnellement par la combinaison du criblage expérimental et de la modélisation moléculaire. En pratique, cette dernière approche est souvent limitée par la pénurie de données expérimentales, particulièrement les informations structurales et biologiques. Aujourd'hui, la situation a complètement changé avec le séquençage à haut débit du génome humain et les avancées réalisées dans la détermination des structures tridimensionnelles des protéines. Cette détermination permet d’avoir accès à une grande quantité de données pouvant servir à la recherche de nouveaux traitements pour un grand nombre de maladies. À cet égard, les approches informatiques permettant de développer des programmes de criblage virtuel à haut débit offrent une alternative ou un complément aux méthodes expérimentales qui font gagner du temps et de l’argent dans la découverte de nouveaux traitements.Cependant, la plupart de ces approches souffrent des mêmes limitations. Le coût et la durée des temps de calcul pour évaluer la fixation d'une collection de molécules à une cible, qui est considérable dans le contexte du haut débit, ainsi que la précision des résultats obtenus sont les défis les plus évidents dans le domaine. Le besoin de gérer une grande quantité de données hétérogènes est aussi particulièrement crucial.Pour surmonter les limitations actuelles du criblage virtuel à haut débit et ainsi optimiser les premières étapes du processus de découverte de nouveaux médicaments, j’ai mis en place une méthodologie innovante permettant, d’une part, de gérer une masse importante de données hétérogènes et d’en extraire des connaissances et, d’autre part, de distribuer les calculs nécessaires sur les grilles de calcul comportant plusieurs milliers de processeurs, le tout intégré à un protocole de criblage virtuel en plusieurs étapes. L’objectif est la prise en compte, sous forme de contraintes, des connaissances sur le problème posé afin d’optimiser la précision des résultats et les coûts en termes de temps et d’argent du criblage virtuel / Therapeutic innovation has traditionally benefited from the combination of experimental screening and molecular modelling. In practice, however, the latter is often limited by the shortage of structural and biological information. Today, the situation has completely changed with the high-throughput sequencing of the human genome, and the advances realized in the three-dimensional determination of the structures of proteins. This gives access to an enormous amount of data which can be used to search for new treatments for a large number of diseases. In this respect, computational approaches have been used for high-throughput virtual screening (HTVS) and offer an alternative or a complement to the experimental methods, which allow more time for the discovery of new treatments.However, most of these approaches suffer the same limitations. One of these is the cost and the computing time required for estimating the binding of all the molecules from a large data bank to a target, which can be considerable in the context of the high-throughput. Also, the accuracy of the results obtained is another very evident challenge in the domain. The need to manage a large amount of heterogeneous data is also particularly crucial.To try to surmount the current limitations of HTVS and to optimize the first stages of the drug discovery process, I set up an innovative methodology presenting two advantages. Firstly, it allows to manage an important mass of heterogeneous data and to extract knowledge from it. Secondly, it allows distributing the necessary calculations on a grid computing platform that contains several thousand of processors. The whole methodology is integrated into a multiple-step virtual screening funnel. The purpose is the consideration, in the form of constraints, of the knowledge available about the problem posed in order to optimize the accuracy of the results and the costs in terms of time and money at various stages of high-throughput virtual screening
|
99 |
Communication térahertz sans fil à haut débit avec un transistor à haute mobilité électronique comme détecteur / High data-rate wireless terahertz communication using a High-electron-mobility transistor as detectorJuery, Lucie 17 December 2014 (has links)
Un des objectifs majeurs des systèmes de communication est de pouvoir transmettre des données aux plus hauts débits possibles. La demande croissante des utilisateurs pour la communication sans fil à haut débit excède déjà les possibilités des réseaux actuels. Afin de répondre à cette problématique, nous présentons des systèmes de communication basés sur des fréquences porteuses térahertz (THz), fréquences suffisamment élevées pour supporter des débits supérieurs à la centaine de gigahertz. En particulier, nous nous intéressons au développement et à l'intégration d'un détecteur haut débit destiné à la communication THz sans fil. Nous utilisons comme détecteur un transistor GaAs à haute mobilité électronique (HEMT). Contrairement aux détecteurs existants tels que les diodes Schottky, le transistor étudié offre des avantages en ce qui concerne le coût, la compacité et les performances. En particulier, l'impédance de sortie est mieux adaptée aux circuits intégrés hauts débits d'impédance d'entrée de 50 Ohm. Nous présentons une caractérisation de ce détecteur en sensibilité et en bande passante de modulation, démontrant pour la première fois sa capacité à être utilisé pour des communications à haut débit. L'intégration du transistor, indispensable à la réalisation de communications réelles, est détaillée. Une communication THz sans fil est démontrée à des fréquences de 0,200 THz et 0,309 THz. Pour la première fois, une transmission de données sans erreur a été démontrée jusqu'à un débit de 8,2 Gbps avec un transistor GaAs HEMT à une fréquence porteuse de 0,309 THz. Enfin, nous présentons de nouveaux transistors avec antenne intégrée permettant des communications à plus haut débit et de plus grande portée, grâce à une meilleure sensibilité. / One of the major objectives of communication systems is the ability to transmit data at the highest possible rates. The ever-growing user demand for wireless communication already exceeds capacities of present networks.In order to solve this problem, we introduce communication systems based on terahertz (THz) high-frequency carriers, whose frequencies are high enough to support data-rates higher than a hundred of gigahertz. In particular, we are interested in the development and the integration of a high data-rate detector intended for THz wireless communication.We use a GaAs High-electron-mobility transistor (HEMT) as detector. Unlike existing detectors such as Schottky diodes, the transistor studied in this thesis offers advantages in terms of cost, compactness and performances. In particular, the output impedance is more suitable for high data-rate integrated circuits whose input impedance is 50 Ohm. We present the characterization of the detector in terms of sensitivity and modulation bandwidth, demonstrating for the first time its ability to be used for high data-rate communications. The transistor's integration, essential for real communications, is detailed.A wireless THz communication is demonstrated around 0.200 THz and 0.309 THz. For the first time, an error-free transmission at data-rates up to 8.2 Gbps is demonstrated, using a GaAs plasma wave HEMT and a 0.309 THz carrier frequency. Finally, we present new transistors with integrated antenna, allowing communications at higher data-rates and with a longer range, thanks to a better sensitivity.
|
100 |
Utilisation du séquençage à haut débit pour la sélection et l'ingénierie des aptamères / Selection and engineering of aptamers using high-throughput sequencingNguyen Quang, Nam 15 September 2017 (has links)
Le SELEX est une technique d’évolution moléculaire dirigée qui permet, après plusieurs tours de sélection, d’enrichir une banque d’acides nucléiques en séquences capable de se lier de manière spécifique à une cible. Le séquençage est utilisé pour identifier ces séquences que l’on nomme « aptamères ». Depuis l’arrivée récente du séquençage à haut débit (HD), il est possible d’analyser des millions de séquences. L’objectif de la thèse était de développer des méthodes pour traiter et analyser les données de séquençage HD afin de faciliter l’identification des meilleurs aptamères d’un SELEX. Au cours de cette thèse, un test robotisé de liaison sur cellules adhérentes vivantes a été mis au point pour mesurer l’affinité d’aptamères issus de SELEX ciblant des cellules (cell-SELEX). Puis, l’évolution de l’abondance des séquences d’un cell-SELEX a été analysée par séquençage HD. Ceci nous a permis de concevoir une nouvelle approche phylogénétique baptisée FREDROGRAM. Cette approche évolutive a permis d’identifier des mutants avec une meilleure affinité au sein d’une famille d’aptamères issu de ce cell-SELEX. Enfin, le séquençage HD de deux SELEX dirigés contre des protéines a contribué à mieux comprendre l’impact des paramètres de sélection sur la population de séquences et à identifier de nouveaux aptamères, notamment en réduisant le nombre de tours de SELEX. En conclusion, ces travaux montrent l’utilité du séquençage HD pour l’identification des meilleurs aptamères et suggèrent de nouvelles pratiques pour la conduite des SELEX futurs. / SELEX is a directed molecular evolution technic which allows, after several rounds of selection, enriching a library from random nucleic acids to sequences able to bind specifically a target. Sequencing technics are then used to identify these sequences called « aptamers ». Since the arrival of High-Throughput Sequencing (HTS), it is now possible to analyse millions of sequences. The aim of the thesis was to develop methods for the treatment and the analysis of HTS data, in order to facilitate the identification of the best aptamers inside a SELEX. During this thesis, a semi-automatic binding test on adherent living cells has been developed to measure the affinity of aptamers identified in SELEX directed against specific cells (cell-SELEX). Then, the evolution of the sequence enrichment during a cell-SELEX has been analysed by HTS. This analysis gave us the possibility to design a new phylogenetic approch named FREDROGRAM. This evolutive approch allowed to identify variants of an aptamer’s family with a better affinity. Finally, HTS of two SELEX directed against proteins has contributed to a better understanding of the impact of selection parameters on the library and to identified new aptamers, notably by reducing the number of SELEX rounds. To conclude, this work shows the importance of HTS in the identification of the best aptamers and suggests new protocols to monitor the next SELEX in a different manner.
|
Page generated in 0.0707 seconds