La compréhension des mécanismes qui contrôlent l'expression des gènes est un enjeu majeur pour la recherche médicale. Elle nécessite un ensemble d'approches pangénomiques telles que les puces à ADN et plus récemment le séquençage à très haut débit qui génèrent une masse toujours plus grande de données numériques à traiter. Au cours de ma thèse, j'ai développé plusieurs outils informatiques innovants pour faciliter leur exploitation. Ainsi, j'ai créé une librairie R (AgiND) qui vérifie la qualité des données de puces à ADN Agilent et permet de les normaliser. Le nombre croissant d'expériences stockées dans Gene Expression Omnibus a motivé la mise en place du projet TBrowser. Une méthode originale DBF-MCL a été créée pour extraire des signatures transcriptionnelles annotées par l'intégration de diverses sources d'information. Stockées dans une base de données, elles sont accessibles à travers une interface Java, un service web SOAP et une librairie R/Bioconductor (RTools4TB). Enfin, un pipeline d'analyse dédié au ChIP-seq a été implémenté. Tous ces outils ont servi pour l'étude de diverses maladies dans le cadre de collaborations. / Understanding the mechanisms that control gene expression is a major challenge for medical research. This requires using a large set of pangenomic approaches such as those using DNA microarrays and high-throughput sequencing that generate an ever growing mass of digital data. During my thesis, I have developed several computer-based tools to facilitate their processing and analysis. I have created a R library (AgiND) that controls the quality of Agilent DNA microarray data and allows their statistical normalization. The growing number of experiences stored in Gene Expression Omnibus has motivated the development of the TBrowser project. An original method, DBF-MCL, was created to extract annotated transcriptional signatures by integrating various sources of information. Stored in a database, these signatures are accessible using a Java interface, a SOAP web service and a R/Bioconductor library (RTools4TB). Finally, a pipeline dedicated to the ChIP-seq analyses has been implemented. All these tools were used to study various diseases in collaborations.
Identifer | oai:union.ndltd.org:theses.fr/2012AIXM4004 |
Date | 06 February 2012 |
Creators | Bergon, Aurelie |
Contributors | Aix-Marseille, Imbert, Jean, Puthier, Denis |
Source Sets | Dépôt national des thèses électroniques françaises |
Language | French, English |
Detected Language | French |
Type | Electronic Thesis or Dissertation, Text |
Page generated in 0.0026 seconds