41 |
Etude des régulations post-transcriptionnelles de l'expression génétique: modèle de la dégradation de l'ARN messager CecA1 porteur d'éléments riches en adénine et uridine chez Drosophila melanogasterVindry, Caroline 13 September 2013 (has links)
L’expression des gènes chez les organismes eucaryotes est un processus hautement régulé dans l’espace et dans le temps. Les ARN messagers, premièrement décrits comme simples intermédiaires entre l’ADN et les protéines, s’avèrent être des éléments centraux de la régulation de l’expression génique :les régulations post-transcriptionnelles vont influencer la stabilité, la traductibilité et la localisation des ARN messagers (ARNm). Le contrôle de la dégradation des ARNm est un moyen efficace d’adapter rapidement la production des protéines en fonction des besoins de la cellule. La dégradation des ARNm est un processus actif qui nécessite soit l’élimination de la coiffe en 5’ ou de la queue polyA en 3’, soit un clivage endonucléolytique. Dans la plupart des cas, le messager est premièrement déadénylé, puis décoiffé avant d’être dégradé dans le sens 5’-3’ ou dans le sens 3’-5’. De plus, les ARNm en cours de dégradation sont relocalisés dans des granules cytoplasmiques appelés Processing Bodies où les facteurs de la dégradation sont concentrés. On trouve dans les messagers codant pour des protéines dont la production doit être finement régulée, une variété importante d’éléments régulateurs (éléments cis) le plus souvent au sein de leur région 3’ non traduite. La régulation de la stabilité d’ARNm porteurs d’éléments riches en adénine et uridine (ARE) dans leur région 3’ non traduite (3’UTR) par les protéines capables de reconnaitre et lier ces éléments (ARE-BP) constitue un des exemples les plus documentés de régulations post-transcriptionnelles de l’expression des gène, mais le mécanisme moléculaire de cette régulation est encore mal compris.<p>Nous avons utilisé le messager codant pour le peptide antimicrobien CécropineA1 lié par l’ARE-BP dTIS11 comme modèle pour étudier les régulations post-transcriptionnelles dépendantes des ARE chez la drosophile. Au cours de ce travail, nous avons démontré que le messager CecA1 subit une déadénylation biphasique. En effet, une déadénylation initiale racourcie la queue polyA sans diminuer la quantité de messager, puis une seconde déadénylation, prise en charge par le complexe de déadénylation CCR-NOT nécessite la présence de la protéine dTIS11 et conduit à la dégradation totale du transcrit. L’observation des intermédiaires de la dégradation nous montre que, après sa déadénylation totale, le messager est décoiffé, puis dégradé dans les deux directions: 3’-5’ et 5’-3’. Contrairement à ce qui a été montré pour ces homologues mammifères, la protéine dTIS11 n’induit pas l’accumulation du messager CecA1 dans les Processing Bodies mais favorise la deuxième phase de déadénylation alors que le messager CecA1 est associé à la machinerie de traduction afin d’induire une dégradation rapide et efficace du transcrit.<p> / Doctorat en Sciences / info:eu-repo/semantics/nonPublished
|
42 |
Approches biotechnologiques de l'expression et de la diversité du génome mitochondrial des plantes / Biotechnological approaches of the expression and diversity of the plant mitochondrial genomeIqbal, Rana khalid 07 July 2017 (has links)
L'ADN mitochondrial des plantes est dynamique et son expression est complexe. Par la voie naturelle d'import d'ARN de transfert codés par le noyau, nous avons adressé dans les mitochondries d'Arabidopsis l'ARN orf77 caractéristique de la S-CMS du maïs et nous avons analysé les effets sur le transcriptome mitochondrial. Celui-ci s'est avéré strictement régulé durant le développement et fortement tamponné aux stades précoces. L'adressage mitochondrial de l'orf77 a aussi promu un cross-talk avec le noyau. D'autre part, la réplication et la réparation de l'ADN dans les mitochondries de plante impliquent une recombinaison active contrôlée par des facteurs codés par le noyau. Nous avons identifié l'exonucléase 5'-3' potentiellement responsable de la résection des extrémités de l'ADN dans la réparation par recombinaison des cassures double-brin. Nos résultats ouvrent des perspectives pour la génération de diversité génétique mitochondriale et la création de lignées CMS d'intérêt agronomique. / The mitochondrial DNA of plants is dynamic and its expression is complex. Using a strategy based on the natural import of nuclear-encoded transfer RNAs from the cytosol, we targeted to mitochondria in Arabidopsis thaliana the orf77 RNA characteristic for S-CMS in maize and we analyzed the effects on the transcriptome. The results showed that the mitochondrial transcriptome is tighly regulated during plant development and is strongly buffered at early stages. Mitochondrial targeting of orf77 also triggered a cross-talk with the nucleus. On the other hand, DNA replication and repair in plant mitochondria involve active recombination controled by nuclear-encoded factors. We identified a new member of this set of factors, the 5'-3' exonuclease potentially responsible for the resection of DNA ends in recombination-mediated repair of double-strand breaks. As a whole, the results open prospects for generating mitochondrial genetic diversity and creating CMS lines with agronomical interest.
|
43 |
Caractérisation fonctionnelle et évolutive de régulateurs génétiques de croissance HD-Zip de classe III, chez le peuplierCôté, Caroline 16 April 2018 (has links)
Le bois, ou le xylème secondaire, est le produit de la différenciation des cellules cambiales en cellules vasculaires spécialisées lignifiées telles que les fibres et les éléments de faisceaux. Chez les herbacées de nombreuses évidences ont été rapportées quant à l'implication de facteurs de transcription de type Homéodomaine Leucine Zipper de classe III (HD-Zip III) dans la régulation du développement du xylème primaire. À la lumière de évidences rapportées chez les herbacées l'hypothèse que nous avons voulu tester est que les HD-Zip III de peupliers auraient acquis des fonctions liées au développement du xylème secondaire. Pour tester cette hypothèse, nous avons choisit deux objectifs généraux : Tout d'abord 1) celui de caractériser l'abondance des transcrits de HD-Zip III dans le cambium par rapport à d'autres tissues. Et 2) caractériser de l'effet de la surexpression de HD-Zip DI chez des peupliers transgéniques, PtHB-1 et PtHB-5 respectivement homologues de REVOLUTA et AtHB-8. Ceci est une façon indirecte de lier leur fonction dans le développement vasculaire, s'ils altèrent la differentiation de fibres ou le développement général des tissus vasculaires. À la lumière des résultats, l'analyses d'expression des transcrits de HD-Zip III nous avons conclue qu'ils sont tous présent dans le xylème secondaire en formation (cambium). Néanmoins, un gène se distingue des autres : PtHB-5, qui présente le patron d'expression le plus spécifique au cambium. Finalement, la surexpression du gène PtHB-1 chez des peupliers transgéniques a mit en évidence son implication dans la formation du xylème primaire, par contre cette expérience ne nous a pas permis de conclure à propos de son implication potentielle dans le xylème secondaire.
|
44 |
Analyse computationnelle des éléments cis-régulateurs dans les génomes des drosophiles et des mammifèresSantolini, Marc 19 September 2013 (has links) (PDF)
La différenciation cellulaire et la spécification des tissus biologiques dépendent en partie de l'établissement de programmes d'expression génétique caractéristiques. Ces programmes sont le résultat de l'interprétation de l'information génomique par des Facteurs de Transcription (TFs) se fixant à des séquences d'ADN spécifiques. Décoder cette information dans les génomes séquencés est donc un enjeu majeur. Dans une première partie, nous étudions l'interaction entre les TFs et leurs sites de fixation sur l'ADN. L'utilisation d'un modèle de Potts inspiré de la physique des verres de spin et de données de fixation à grande échelle pour plusieurs TFs de la drosophile et des mammifères permet de montrer que les sites de fixation exhibent des corrélations entre nucléotides. Leur prise en compte permet d'améliorer significativement la prédiction des sites de fixations sur le génome. Nous présentons ensuite Imogene, l'extension au cas des mammifères d'un algorithme bayésien utilisant la phylogénie afin d'identifier les motifs et modules de cis-régulation (CRMs) contrôlant l'expression d'un ensemble de gènes co-régulés, qui a précédemment été appliqué au cas de la régulation chez les drosophiles. Partant d'un ensemble d'apprentissage constitué d'un petit nombre de CRMs chez une espèce de référence, et sans connaissance a priori des TFs s'y fixant, l'algorithme utilise la sur-représentation et la conservation des sites de fixation chez des espèces proches pour prédire des régulateurs putatifs ainsi que les CRMs génomiques sous-tendant la co-régulation. Nous montrons en particulier qu'Imogene peut distinguer des modules de régulation conduisant à différents motifs d'expression génétique sur la seule base de leur séquence ADN. Enfin, nous présentons des applications de ces outils de modélisation à des cas biologiques réels : la différenciation des trichomes chez la drosophile, et la différenciation musculaire chez la souris. Dans les deux cas, les prédictions ont été validées expérimentalement en collaboration avec des équipes de biologistes, et pointent vers une grande flexibilité des processus de cis-régulation.
|
45 |
Mécanismes de conception de modèles discrets fondés sur la théorie des jeux pour l'étude des réseaux d'interactions biologiques : application à la migration métastasique.Chettaoui, Chafika 26 October 2007 (has links) (PDF)
La théorie des jeux permet de décrire des systèmes d'interactions complexes entre agents. Dans le cadre de la modélisation des interactions moléculaires, nous avons appliqué cette théorie afin d'étudier la dynamique des réseaux d'interactions à partir d'observations. L'objet est de calculer les équilibres correspondant à des phénotypes cellulaires. Le modèle permet de valider la cohérence des réseaux étudiés impliqués dans la migration métastasique via une molécule PAI-1 et permet également de proposer des prédictions sur la structure de ces réseaux. Afin d'accélérer le calcul des équilibres, nous avons établi des méthodes de prédiction à partir de la simple donnée de la structure du réseau. Elle conduit à la formulation d'un problème k-SAT qui se réduit fréquemment à un problème 2-SAT résolvable en un temps polynomial.
|
46 |
Réseaux bayésiens et apprentissage ensembliste pour l'étude différentielle de réseaux de régulation génétiqueNguyen, Hoai-Tuong 27 January 2012 (has links) (PDF)
Dans les dernières années, les réseaux Bayésiens (RB) sont devenus l'une des méthodes d'apprentissage automatique les plus puissantes permettant de modéliser graphiquement et de manière probabiliste différentes types de systèmes complexes. Un des problèmes communs dans l'apprentissage de la structure des RB est le problème des données de petites tailles. En effet, le résultat de l'apprentissage est sensible au nombre d'échantillons de données. En apprentissage automatique, les méthodes d'apprentissage ensemblistes telles que le bootstrap ou les algorithmes génétiques sont des méthodes souvent utilisées pour traiter le problème de la pauvreté de données. Toutefois, les méthodes existantes se limitent généralement à la fusion d'un ensemble de modèles, mais ne permettent pas de comparer deux ensembles de modèles. Inspiré par les résultats obtenus par les méthodes ensemblistes, nous proposons une nouvelle méthode basée sur le graphe quasi-essentiel (QEG - Quasi-Essential Graph) et l'utilisation d'un test multiple afin de comparer deux ensembles de RB. Le QEG permet de résumer et de visualiser graphiquement un ensemble de RB. Le test multiple permet de vérifier si les différences entre les deux ensembles de RB sont statistiquement significatives et de déterminer la position de ces différences. L'application sur des données synthétiques et expérimentales a démontré les différents intérêts de la méthode proposée dans la reconstruction des réseaux de régulation génétique et perspectivement dans les autres applications avec les données de petites tailles.
|
47 |
Exploration de l'origine de la robustesse de la dynamique d'expression d'AGAMOUS pendant le développement de la fleur en utilisant une approche pluridisciplinaire / Exploring the basis of robust AGAMOUS expression dynamics during flower development using a pluridisciplinary approachCollaudin, Samuel 02 December 2016 (has links)
L'identité des organes floraux est définie par l’expression de gènes homéotiques appartenant à la famille des MADS-box au début du développement floral. Un de ces gènes, AGAMOUS (AG), est responsable de l’identité des étamines et des carpelles chez Arabidopsis thaliana. Dans ce manuscrit, je tente de comprendre les propriétés spatiales et temporelles de l’expression d’AG en cherchant à connaître les mécanismes impliqués dans le bon établissement de la dynamique d’expression d’AG pendant les jeunes stades du développement floral.Je débute par développer un modèle de réaction-diffusion qui prend en compte la croissance de la fleur pendant les stades d’intérêt, ainsi que quelques facteurs de transcriptions clefs impliqués dans la régulation d’AG. Ensuite j’ai imagé en direct et en 4D la croissance des fleurs pour quantifier l’activation de l’expression d’AG de son initiation à son patron d’expression stable. Je montre que son expression se déroule en deux phases: une phase de faible expression, et une phase de forte expression. Bien que toutes les cellules du dôme central de la fleur présentent un profil d’activation d’AG similaire, le temps précis au cours du développement où AG est activé est différent pour chacunes d’entre elles et est à l’origine de la stochasticité du patron d’expression. Avec l’aide du modèle, je propose quatres nouvelles hypothèses relatives à la régulation d’AG :AG est capable de maintenir sa propre activation en se liant directement à son second intron au travers d’un complexe protéique contenant au moins deux molécule d'AG, créant ainsi un seuil d'auto-activation.AP2 influence la valeur de ce seuil, restreint l’expression d’AG dans le dôme central de la fleur et produit un retard dans l’activation complète d’AG.LFY et WUS sont nécessaire à l’accumulation des protéines d’AG dans les cellules pour pouvoir atteindre le seuil d’auto-activation et obtenir une expression complète d’AG.Le mouvement d’AG est nécessaire pour obtenir l’expression d’AG dans toutes les cellules du dôme central. Pour prouver ces hypothèses, j’ai réalisé différentes expériences. En premier, utilisant une expérience de FRET-FLIM dans les protoplastes, nous proposons qu’AG est capable de s’associer en homodimer dans les cellules végétales. Néanmoins, sur-exprimer AG pour aider les cellules à atteindre le seuil d’auto-activation plus tôt que dans la plante sauvage ne semble pas modifier la dynamique d’expression de l’AG endogène. En deuxième, j’ai testé le rôle précis de LFY au cours des différentes phases et transitions de la dynamique d’expression d’AG en mutant les sites d'interactions spécifiques pour LFY au sein des séquences de régulation d’AG. Ces mutations retardent l’expression l’expression d’AG et modifient légèrement son patron d’expression. Je montre que seulement d’important retards dans l’activation d’AG induit des modifications phénotypiques. Ensuite, pour tester le rôle de la répression par AP2 dans la dynamique d’expression d’AG, j’analyse le rapporteur d’AG dans le contexte d’un mutant fort d’ap2. Dans ce mutant, l’expression d’AG s’étend à une région plus large et le retard entre l’initiation de l’expression d’AG et la transition entre les phases de faible et forte expressions est diminué. Ces résultats correspondent aux simulations du modèle. Finalement, pour comprendre l’importance du mouvement d’AG d’une cellule à l’autre dans sa propre dynamique, je bloque cette capacité de bouger en utilisant un tag de localisation nucléaire. Bien que cela induit un retard dans l’activation de quelques cellules au stade 3 au moment où toutes les cellules du dôme centrale de la fleur expriment AG dans la plante sauvage, ce retard n’a pas d’effets visible sur le phénotype. / The identity of flower organs is defined by the expression of homeotic genes during early development that belongs to the MADS-box family. One of these genes, AGAMOUS (AG), is responsible for the identity of the stamens and the carpels in Arabidopsis thaliana. In this manuscript, I attempt to fully understand the spatial and temporal properties of AG expression by investigating the mechanisms underlying the proper establishment of AG expression dynamics during the early stages of flower development. I start by developing a reaction-diffusion model that takes into account the growth of the flower at the relevant stages, as well as the few key transcription factors involved in AG regulation. Next I used real-time 4D imaging on growing flowers to quantify the activation of AG expression from its onset to the stable pattern. I show that the AG expression occurs in two phases: a low-expression phase and a high-expression phase. Thus although all cells of the central dome of the flower present similar profiles of AG activation, the precise developmental time at which AG is activated is different in each case, and is the origin of the initial stochastic pattern. With the aid of the model, I also propose four new hypotheses to explain AG regulation: AG is able to maintain its own activation by directly binding its own second intron through a protein complex containing at least two molecules of AG leading to the creation of an auto-activation threshold.AP2 influences the value of this threshold, restraining AG expression to the central dome of the flower and producing a delay in complete AG activation.LFY and WUS are necessary to accumulate AG proteins in cells in order to reach the auto-activation threshold and obtain a full expression of AG.AG movement is necessary to obtain expression of AG in every cell of the central dome. To prove these hypotheses, I have carried out various experiments, using FRET-FLIM in protoplast cells, we suggest that AG is able to form homo-dimers in plant cells. However, overexpressing AG to help cells reach the auto-activation threshold earlier than in the wild-type does not appear to alter the endogenous AG dynamics of expression. Secondly, I test the precise role of LFY in the different phases and transitions in the AG expression dynamics by mutating specific interaction sites for LFY within AG regulatory sequences. These mutations appear to delay AG expression and slightly modify its pattern of expression. I show that only important delays in AG activation induce phenotypic differences. Then, to test the role of AP2 repression in AG expression dynamics, I analyse the AG reporter in the context of a strong ap2 mutant. In these mutants, AG expression spreads to a wider region and reduces the delay between the onset of AG expression and the transition from low- to high-expression. These results match with simulations of the model. Lastly, to understand the importance of AG cell-to-cell movement in AG dynamics, I block its ability to move using a nuclear localisation tag. Although this induces a delay in the activation of few cells at stage 3, when all cells of the central dome of the flower express AG in the WT. This delay has no visible effects on the phenotype.
|
48 |
Emergence de structures modulaires dans les régulations des systèmes biologiques : théorie et applications à Bacillus subtilisGoelzer, Anne 04 November 2010 (has links)
Cette thèse consiste à étudier l'organisation du système de contrôle des voies métaboliques des bactéries afin de dégager des propriétés systémiques révélant son fonctionnement. Dans un premier temps, nous montrons que le contrôle des voies métaboliques est hautement structuré et peut se décomposer en modules fortement découplés en régime stationnaire. Ces modules possèdent des propriétés mathématiques remarquables ayant des conséquences importantes en biologie. Cette décomposition, basée intrinsèquement sur la vision système de l'Automatique, offre un cadre théorique formel général d'analyse du contrôle des voies métaboliques qui s'est révélé effectif pour analyser des données expérimentales. dans un deuxième temps, nous nous intéressons aux raisons possibles de l'émergence de cette structure de contrôle similaire. Nous identifions un ensemble de contraintes structurelles agissant au niveau de la répartition d'une ressource commune, les protéines, entre les processus cellulaires. Respecter ces contraintes pour un taux de croissance donné conduit à formaliser et résoudre un problème d'optimisation convexe non différentiable, que nous appelons Resource balance Analysis. Ce problème d'optimisation se résout numériquement à l'échelle de la bactérie grâce à un problème de Programmation Linéaire équivalent. plusieurs propriétés sont déduites de l'analyse théorique du critère obtenu. Tout d'abord, le taux de croissance est structurellement limité par la répartition d'une quantité finie de protéines entre les voies métaboliques et les ribosomes. Ensuite, l'émergence des modules dans les voies métaboliques provient d'une politique générale d'économie en protéines chez la bactérie pour gagner du taux de croissance. Certaines stratégies de transport bien connues comme la répression catabolique ou la substitution de transporteurs haute/basse affinités sont prédites par notre méthode et peuvent alors être interprétées comme le moyen de maximiser la croissance tout en minimisant l'investissement en protéines. / This thesis consist in studying the organization of the control system of metabolic pathways of bacteria to identify systemic properties revealing its operation. At first, we show that control of metabolic pathways is highly structured and can be decomposed into modules strongly decoupled in steady-state. These modules are defined by their singular mathematical properties having important implications in biology. This decomposition, based inherently on the system outlook of automatic control, offers a formal theoretical analysis of general control of metabolic pathways, which has been effective in analysing experimental data. In a second step, we consider the possible reasons for the emergence of this modular control structure. We identify a set of structural constraints acting at the distribution of a common resourc, the proteins between cellular processes. Satisfying these constraints for a given growth rate leads to formalize and to solve a non-differentiable convex optimization problem, that we call Resource Balance Analysis. This optimization problem is solved numerically at the scale of the bacteria through an equivalent linear programming problem. Several properties are derived from theoretical analysis of the obtained criterion. Firts, the growth rate is structurally limited by the distribution of a finite amount of proteines between the metabolic pathways and the ribosomes. Second, the emergence of modules in metabolic pathways arises from a policy of economy in proteins in the bacterium to increase the growth rate. Some well known transport strategies such as catabolite repression of the substitution between low/highaffinity transporters are predicted by our methods and could consequently be interpretd as ways to maximize growth while minimizing investment in proteins.
|
49 |
Modélisation de l'évolution temporelle de l'expression des gènes sur la base de données de puces à ADN: application à la drosophileHaye, Alexandre 24 June 2011 (has links)
Cette thèse de doctorat s’inscrit dans le développement et l’utilisation de méthodes mathématiques et informatiques qui exploitent les données temporelles d’expression des gènes issues de puces à ADN afin de rationaliser et de modéliser les réseaux de régulation génique. Dans cette optique, nous nous sommes principalement intéressés aux données d’expression des gènes de la drosophile (Drosophila melanogaster) pendant son développement, du stade embryonnaire au stade adulte. Nous avons également étudié des données concernant le développement d’autres eucaryotes supérieurs, la réponse d’une bactérie soumises à différents stress et le cycle cellulaire d’une levure. Ce travail a été réalisé selon trois volets principaux :la détection des stades de développement et des perturbations, les classifications de profils d’expression et la modélisation de réseaux de régulation.<p><p>Premièrement, l’observation des données d’expression utilisées nous a conduits à approfondir l’étude des phénomènes survenant lors des changements de stades de développement de la drosophile. Dans ce but, deux méthodes de détection automatique de ces changements ont été développées et appliquées aux données temporelles disponibles sur le développement d’eucaryotes supérieurs. Elles ont également été appliquées à des données temporelles relatives à des perturbations externes de bactéries. Cette étude à montré qu’une formulation mathématique simple permettait de retrouver les instants expérimentaux où une perturbation ou un changement de stade de développement est observé, à partir uniquement des profils d’expression. Par ailleurs, la réponse à une perturbation externe s’avère non distinguable d’une succession de stades de développement, sur la base des seuls profils temporels d’expression.<p><p>Deuxièmement, en raison des dimensions du problème constitué par les données d’expression de plusieurs milliers de gènes et de l’impossibilité de distinguer le rôle dans la régulation des gènes qui présentent des profils d’expression similaires, il s’est avéré nécessaire de classifier les gènes selon leurs profils d’expression. En nous basant sur les résultats obtenus lors de la détection des stades de développement, la démarche suivie est de regrouper les gènes qui présentent des profils temporels d’expression aux comportements similaires non seulement au cours de la série temporelle complète, mais également dans chacun des stades de développement. Dans cette optique, trois distances ont été proposées et utilisées dans une classification hiérarchique des données d’expression de la drosophile.<p><p>Troisièmement, des structures de modèles linéaires et non linéaires ainsi que des méthodes d’estimation et de réduction paramétriques ont été développées et utilisées pour reproduire les données d’expression du développement de la drosophile. Les résultats de ce travail ont montré qu’avec une structure de modèle linéaire simple, la reproduction des profils expérimentaux était excellente et que, dans ce cas, le réseau de régulation génique de la drosophile pouvait se contenter d’une faible connectivité (en moyenne 3 connexions par classe de gènes) et ce, sans hypothèse a priori. Toutefois, les modèles linéaires ont ensuite sérieusement été remis en question par des analyses de robustesse aux perturbations paramétriques et de stabilité des profils après extrapolation dans le temps. Dès lors, quatre structures de modèles non linéaires et cinq méthodes de réduction paramétrique ont été proposées et utilisées pour concilier les critères de reproduction des données, de robustesse et de stabilité des réseaux identifiés. En outre, ces méthodes de modélisation ont été appliquées à un sous-ensemble de 20 gènes impliqués dans le développement musculaire de la drosophile et pour lesquels 36 interactions ont été validées expérimentalement, ainsi qu’à des profils synthétiques bruités. Nous avons pu constater que plus de la moitié des connexions et non-connexions sont retrouvées par trois modèles non linéaires. Les résultats de cette étude ont permis d’éliminer certaines structures de modèle et méthodes de réduction et ont mis en lumière plusieurs directions futures à suivre dans la démarche de modélisation des réseaux de régulation génique. / Doctorat en Sciences de l'ingénieur / info:eu-repo/semantics/nonPublished
|
50 |
Développement et évaluation de méthodes bioinformatiques pour la détection de séquences cis-régulatrices impliquées dans le développement de la drosophileTuratsinze, Jean Valéry 23 November 2009 (has links)
L'objectif de ce travail est de développer et d'évaluer des approches méthodologiques pour la<p>prédiction de séquences cis-régulatrices. Ces approches ont été intégrées dans la suite logicielle<p>RSAT (Regulatory Sequences Analysis Tools). Ces séquences jouent un rôle important dans la<p>régulation de l'expression des gènes. Cette régulation, au niveau transcriptionnel, s'effectue à<p>travers la reconnaissance spécifique entre les facteurs de transcription et leurs sites de fixation<p>(TFBS) au niveau de l'ADN.<p>Nous avons développé et évalué une série d'outils bioinformatiques qui utilisent les matrices<p>position-poids pour prédire les TFBS ainsi que les modules cis-régulateurs (CRM). Nos outils<p>présentent l'avantage d'intégrer les différentes approches déjà proposées par d'autres auteurs tout<p>en proposant des fonctionnalités innovantes.<p>Nous proposons notamment une nouvelle approche pour la prédiction de CRM basé sur la<p>détection de régions significativement enrichies en TFBS. Nous les avons appelés les CRER (pour<p>Cis-Regulatory Elements Enriched Regions). Un autre aspect essentiel de toute notre approche<p>réside dans le fait que nous proposons des mesures statistiques rigoureuses pour estimer<p>théoriquement et empiriquement le risque associé aux différentes prédictions. Les méthodes de<p>prédictions de séquences cis-regulatrices prédisent en effet un taux de fausses prédictions<p>généralement élevé. Nous intégrons un calcul des P-valeurs associées à toutes les prédictions.<p>Nous proposons ainsi une mesure fiable de la probabilité de faux positifs.<p>Nous avons appliqué nos outils pour une évaluation systématique de l'effet du modèle de<p>background sur la précision des prédictions à partir de la base de données de TRANSFAC. Nos<p>résultats suggèrent une grande variabilité pour les modèles qui optimisent la précision des<p>prédictions. Il faut choisir le modèle de background au cas par cas selon la matrice considérée.<p>Nous avons ensuite évalué la qualité des matrices de tous les facteurs de transcription de<p>drosophile de la base de données ORegAnno, c'est à dire leur pouvoir de discrimination entre les<p>TFBS et les séquences génomiques. Nous avons ainsi collecté des matrices des facteurs de<p>transcription de drosophile de bonne qualité.<p>A partir des matrices de drosophile que nous avons collectées, nous avons entamé une analyse<p>préliminaire multi-genome de prédictions de TFBS et de CRM dans la région de lʼenhancer dorsocentral<p>(DCE) du complexe achaete-scute de drosophile. Les gènes de ce complexe jouent un<p>rôle important dans la détermination des cellules système nerveux périphérique de drosophile. Il a<p>été prouvé expérimentalement qu'il existe un lien direct entre le phénotype du système nerveux<p>périphérique et les séquences cis-régulateurs des gènes de ce complexe.<p>Les outils que nous avons développés durant ce projet peuvent s'appliquer à la prédiction des<p>séquences de régulation dans les génomes de tous les organismes. / Doctorat en Sciences / info:eu-repo/semantics/nonPublished
|
Page generated in 0.0979 seconds