L'objectif de ce travail est de développer et d'évaluer des approches méthodologiques pour la
prédiction de séquences cis-régulatrices. Ces approches ont été intégrées dans la suite logicielle
RSAT (Regulatory Sequences Analysis Tools). Ces séquences jouent un rôle important dans la
régulation de l'expression des gènes. Cette régulation, au niveau transcriptionnel, s'effectue à
travers la reconnaissance spécifique entre les facteurs de transcription et leurs sites de fixation
(TFBS) au niveau de l'ADN.
Nous avons développé et évalué une série d'outils bioinformatiques qui utilisent les matrices
position-poids pour prédire les TFBS ainsi que les modules cis-régulateurs (CRM). Nos outils
présentent l'avantage d'intégrer les différentes approches déjà proposées par d'autres auteurs tout
en proposant des fonctionnalités innovantes.
Nous proposons notamment une nouvelle approche pour la prédiction de CRM basé sur la
détection de régions significativement enrichies en TFBS. Nous les avons appelés les CRER (pour
Cis-Regulatory Elements Enriched Regions). Un autre aspect essentiel de toute notre approche
réside dans le fait que nous proposons des mesures statistiques rigoureuses pour estimer
théoriquement et empiriquement le risque associé aux différentes prédictions. Les méthodes de
prédictions de séquences cis-regulatrices prédisent en effet un taux de fausses prédictions
généralement élevé. Nous intégrons un calcul des P-valeurs associées à toutes les prédictions.
Nous proposons ainsi une mesure fiable de la probabilité de faux positifs.
Nous avons appliqué nos outils pour une évaluation systématique de l'effet du modèle de
background sur la précision des prédictions à partir de la base de données de TRANSFAC. Nos
résultats suggèrent une grande variabilité pour les modèles qui optimisent la précision des
prédictions. Il faut choisir le modèle de background au cas par cas selon la matrice considérée.
Nous avons ensuite évalué la qualité des matrices de tous les facteurs de transcription de
drosophile de la base de données ORegAnno, c'est à dire leur pouvoir de discrimination entre les
TFBS et les séquences génomiques. Nous avons ainsi collecté des matrices des facteurs de
transcription de drosophile de bonne qualité.
A partir des matrices de drosophile que nous avons collectées, nous avons entamé une analyse
préliminaire multi-genome de prédictions de TFBS et de CRM dans la région de lʼenhancer dorsocentral
(DCE) du complexe achaete-scute de drosophile. Les gènes de ce complexe jouent un
rôle important dans la détermination des cellules système nerveux périphérique de drosophile. Il a
été prouvé expérimentalement qu'il existe un lien direct entre le phénotype du système nerveux
périphérique et les séquences cis-régulateurs des gènes de ce complexe.
Les outils que nous avons développés durant ce projet peuvent s'appliquer à la prédiction des
séquences de régulation dans les génomes de tous les organismes.
Identifer | oai:union.ndltd.org:BICfB/oai:ulb.ac.be:ETDULB:ULBetd-11192010-011841 |
Date | 23 November 2009 |
Creators | Turatsinze, Jean Valery |
Contributors | Bellefroid, Eric, Thieffry, Denis, Eizirik, Decio, van Helden, Jacques, Bontempi, Gianluca, Marini, Anne-Marie, Pays, Etienne |
Publisher | Universite Libre de Bruxelles |
Source Sets | Bibliothèque interuniversitaire de la Communauté française de Belgique |
Language | French |
Detected Language | French |
Type | text |
Format | application/pdf |
Source | http://theses.ulb.ac.be/ETD-db/collection/available/ULBetd-11192010-011841/ |
Rights | mixed, J'accepte que le texte de la thèse (ci-après l'oeuvre), sous réserve des parties couvertes par la confidentialité, soit publié dans le recueil électronique des thèses ULB. A cette fin, je donne licence à ULB : - le droit de fixer et de reproduire l'oeuvre sur support électronique : logiciel ETD/db - le droit de communiquer l'oeuvre au public Cette licence, gratuite et non exclusive, est valable pour toute la durée de la propriété littéraire et artistique, y compris ses éventuelles prolongations, et pour le monde entier. Je conserve tous les autres droits pour la reproduction et la communication de la thèse, ainsi que le droit de l'utiliser dans de futurs travaux. Je certifie avoir obtenu, conformément à la législation sur le droit d'auteur et aux exigences du droit à l'image, toutes les autorisations nécessaires à la reproduction dans ma thèse d'images, de textes, et/ou de toute oeuvre protégés par le droit d'auteur, et avoir obtenu les autorisations nécessaires à leur communication à des tiers. Au cas où un tiers est titulaire d'un droit de propriété intellectuelle sur tout ou partie de ma thèse, je certifie avoir obtenu son autorisation écrite pour l'exercice des droits mentionnés ci-dessus. |
Page generated in 0.0024 seconds