Spelling suggestions: "subject:"7molecular networks"" "subject:"bimolecular networks""
1 |
Multi-omics data integration for the detection and characterization of smoking related lung diseasesPavel, Ana Brandusa 31 July 2017 (has links)
Lung cancer is the leading cause of death from cancer in the world. First, we hypothesized that microRNA expression is altered in the bronchial epithelium of patients with lung cancer and that incorporating microRNA expression into an existing mRNA biomarker may improve its performance.
Using bronchial brushings collected from current and former smokers, we profiled microRNA expression via small RNA sequencing for 347 patients with available mRNA data. We found that four microRNAs were under-expressed in cancer patients compared to controls (p<0.002, FDR<0.2). We explored the role of these microRNAs and their gene targets in cancer. In addition, we found that adding a microRNA feature to an existing 23-gene biomarker significantly improves its performance (AUC) in a test set (p<0.05).
Next, we generalized the biomarker discovery process, and developed a visualization tool for biomarker selection. We built upon an existing biomarker discovery pipeline and created a web-based interface to visualize the performance of multiple predictors. The “visualization” component is the key to sorting through a thousand potential biomarkers, and developing clinically useful molecular predictors.
Finally, we explored the molecular events leading to the development of COPD and ILD, two heterogeneous diseases with high mortality. We hypothesized that integrative genetic and expression networks can help identify drivers and elucidate mechanisms of genetic susceptibility.
We utilized 262 lung tissue specimens profiled with microRNA sequencing, microarray gene expression and SNP chip genotyping. Next, we built condition specific integrative networks using a causality inference test for predicting SNP-microRNA-mRNA associations, where the microRNA is a predicted mediator of the SNP’s effect on gene expression. We identified the microRNAs predicted to affect the most genes within each network. Members of miR-34/449 family, known to promote airway differentiation by repressing the Notch pathway, were among the top ranked microRNAs in COPD and ILD networks, but not in the non-disease network. In addition, the miR-34/449 gene module was enriched among genes that increase in expression over time when airway basal cells are differentiated at an air-liquid interface and among genes that increase in expression with the airway wall thickening in patients with emphysema. / 2019-07-31T00:00:00Z
|
2 |
Méthodes qualitatives pour la construction et l'analyse des réseaux moléculaires SBGN / Qualitative methods for the construction and the analysis of SBGN molecular networksRougny, Adrien 04 October 2016 (has links)
La construction des réseaux moléculaires à partir de résultats expérimentaux, ainsi que leur analyse en vue d'en exhiber des propriétés émergentes, sont deux tâches fondamentales de la biologie des systèmes. Avec l'augmentation du nombre de données expérimentales, elles ne peuvent plus être réalisées manuellement. Partant de ce constat, un certain nombre de méthodes bioinformatiques visant à les automatiser ont été développées.En parallèle du développement des méthodes, un certain nombre de standards ont vu le jour. Parmi ceux-ci, la Standard Biology Graphical Notation (SBGN) se compose de trois langages permettant la représentation des réseaux moléculaires.Les deux langages SBGN les plus couramment utilisés sont SBGN-PD pour la représentation des réseaux de réactions, et SBGN-AF pour celle des graphes d'influences. La notation SBGN, en plus de standardiser la représentation des réseaux, donne l'ensemble des concepts de la biologie des systèmes qui sont le plus souvent utilisés pour exprimer les connaissances du domaine.C'est dans ce cadre général que se placent l'ensemble de nos travaux. Nous avons développé un ensemble de méthodes pour la construction des réseaux moléculaires et l'analyse de leur dynamique. L'ensemble des méthodes que nous proposons reposent sur des formalismes qualitatifs, tels que la logique ou les réseaux d'automates. Ces formalismes on non seulement des bases théoriques solides, mais peuvent aussi être utilisés par de nombreux logiciels.L'ensemble de nos méthodes reposent également sur les concepts biologiques fournis par le standard SBGN, et peuvent ainsi être intégrées dans un même cadre théorique.Nous introduisons d'abord deux ensembles de prédicats qui permettent de traduire n'importe quel réseau SBGN-PD ou SBGN-AF sous la forme d'atomes instanciés. Nous montrons ensuite comment ces deux ensembles peuvent être utilisés pour raisonner automatiquement sur des réseaux moléculaires, en proposant une méthode de transformation automatique des réseaux de signalisation SBGN-PD en graphes d'influences SBGN-AF.Nous présentons ensuite une méthode de construction des réseaux de signalisation à partir de résultats expérimentaux, basée sur la logique du premier ordre. Cette méthode formalise et automatise le raisonnement réalisé par les biologistes à l'aide de règles de raisonnement explicites. Contrairement aux méthodes développées jusqu'à maintenant, celle que nous présentons prend en compte un grand nombre de types d'expériences, tout en permettant la reconstruction de mécanismes moléculaires précis.Puis nous montrons une nouvelle méthode pour le calcul des traces finies et des points attracteurs de réseaux Booléens modélisant des réseaux SBGN-AF et paramétrés à l'aide de principes généraux. Notre méthode repose sur l'utilisation de programmes logiques normaux du premier ordre, qui formalisent ces principes généraux.Enfin, nous proposons deux nouvelles sémantiques qualitatives pour le calcul de la dynamique des réseaux de réactions SBGN-PD, exprimées à l'aide de réseaux d'automates. La première de ces sémantiques étend la sémantique Booléenne des réseaux de réactions en prenant en compte les inhibitions. Quant à la deuxième, elle introduit le concept d'histoire (story) qui offre un nouveau point de vue sur les réseaux de réactions, en permettant de modéliser différents états physiques d'une même entité moléculaire par une seule variable.L'ensemble des méthodes que nous avons développées montrent comment les formalismes qualitatifs, et en particulier la logique, peuvent être utilisés pour raisonner à partir des relations représentées par les réseaux moléculaires, afin de découvrir de nouvelles connaissances en biologie des systèmes. / Two fundamental tasks of Systems Biology are the construction of molecular networks from experimental data, and their analysis with a view to discovering their emergent properties. With the increase of available experimental data, these two tasks can no longer be realized by hand. Based on this observation, numerous bioinformatics methods aiming at the automation of these two task have been developped.In parallel, standards aiming at defining and organizing terms of systems biology, or representing networks and mathematical models, have been developped. Among these standards, the Standard Biology Graphical Notation is composed of three languages that allow the representation of molecular networks. The two main SBGN languages are SBGN-PD for the representation of reaction networks, and SBGN-AF for the representation of influence graphs. The SBGN notation not only standardizes the representation of networks, but also gives the concepts of systems biology that are most often used to express knowledge of the field.Our work takes its root in this general background. We have developped a number of methods to construct molecular networks and analyze their dynamics. All the methods that we propose are based on qualitative formalisms, such as logics or automata networks. These formalisms have solid theoretical bases and can be used by numerous pieces of software. All our methods also rely on the biological concepts given by the SBGN standard, and can therefore be blended in the same theoretical framework.First, we introduce two sets of predicates that allow to translate any SBGN-PD or SBGN-AF network into a set of ground atoms. Then, we show how these sets of predicates can be used to reason on networks, by proposing a transformation method of SBGN-PD signaling networks into SBGN-AF influence graphs.Second, we present a first-order logic based method to construct signaling networks from experimental results. This method formalizes and automatizes biologists' reasoning using explicit reasoning rules.On the contrary to existing methods, it allows to take into account numerous types of experimental results while reconstructing precise molecular mecanisms.Third, we show a new method to compute the finite traces and attractor points of Boolean networks that model SBGN-AF networks and that are parameterized using general principles.Finally, we introduce two new qualitative semantics for the computation of the dynamics of SBGN-PD reaction networks. These semantics are expressed using automata networks. The first semantics extends the classical Boolean semantics by taking into account inhibitions. As to the second one, it relies on the concept of story which introduces a new point of view on reaction networks. Indeed, it allows to model different physical states of the same molecular entity using a unique variable.All the methods that we have developped show how qualitative formalisms can be used to reason on the relations represented by molecular networks in order to discorver new knowledge in systems biology.
|
3 |
Computational Tools for Molecular Networks in Biological SystemsZwolak, Jason W. 07 January 2005 (has links)
Theoretical molecular biologists try to understand the workings of cells through mathematics. Some theoreticians use systems of ordinary differential equations (ODEs) as the basis for mathematical modelling of molecular networks. This thesis develops algorithms for estimating molecular reaction rate constants within those mathematical models by fitting the models to experimental data. An additional step is taken to fit non-timecourse experimental data (e.g., transformations must be performed on the ODE solutions before the experimental and simulation data are similar, and therefore, comparable). VTDIRECT is used to perform (a deterministic direct search) global estimation and ODRPACK is used to perform (a trust region Levenberg-Marquardt based) local estimation of rate constants. One such transformation performed on the ODE solutions determines the value of the steady state of the ODE solutions. A new algorithm was developed that finds all steady state solutions of the ODE system given that the system has a special structure (e.g., the right hand sides of the ODEs are rational functions). Also, since the rate constants in the models cannot be negative and may have other restrictions on the values, ODRPACK was modified to address this problem of bound constraints. The new Fortran 95 version of ODRPACK is named ODRPACK95. / Ph. D.
|
4 |
Electrical properties of self-assembled metal-molecular networks: modelling, experiment and applicationsAmadi, Eberechukwu Victoria 01 October 2021 (has links)
Complementing electronic components with molecular analogs is a promising alternative to further miniaturization of conventional silicon electronic devices in the quest to achieve functional molecular nanoscale circuit elements. To this end, molecular units have been widely investigated to evaluate their suitability for future nanoelectronic circuit applications. Previous work has typically either focused on tightly packed layers of dithiol molecule-encapsulated gold nanoparticles or small oligomeric structures comprised of nanoparticles linked by a few dithiol molecules. In this thesis, we study the electrical and electronic properties of metal-molecular networks having an intermediate number of dithiol molecules both theoretically and experimentally.
Electronic transport through self-assembled networks with tunable thiol molecule: gold nanoparticle ratios (ranging from 1:1 to 50:1) is studied using two-terminal electrical characterization techniques. The tunability of the electrical properties (e.g., resistance, current etc.) of the molecular networks on modifying the thiol molecule: gold nanoparticle ratios and/or type of molecule used was observed. Specifically, the current in the molecular networks studied typically decreased with increasing molecule: AuNP. For example, in gold-benzenedithiol molecular networks with approximately the same length-to-width ratios, current at low bias, 0.3 V, was found to decrease from the μA range in 1:1 ratio samples to the nA range in 50:1 samples. Additionally, many gold-benzenedithiol molecular networks which had linear I-V characteristics at low biases displayed nonlinearities in their I-Vs at higher biases. In such cases, the nonlinearities in the I-Vs at higher biases became more pronounced with increasing molecule: AuNP ratio. For example, in a control sample, consisting of only gold nanoparticles, linear I-V behaviour was observed, while the 50:1 gold-benzenedithiol molecular network displayed NDR with a measured peak-to-valley ratio of approximately 1.52. A linear resistor circuit model provided accurate approximations of the low bias I-V behaviour of the molecular networks.
Experimental studies were complemented with first principles density functional theory-based simulations of the molecular networks. Linear chains and branched networks of interconnected benzenedithiol molecules and Au6 clusters were the systems of interest in this study. Calculated current-voltage characteristics of the metal-molecular networks exhibited nonlinearities and rectification with negative differential resistance (NDR) peaks that became more pronounced with increasing chain length of the linear chains. Peak-to-valley current NDR ratios as large as ~ 500 and rectification ratios of ~ 10 (0.25 V) were shown for linear and branched circuit elements, respectively, illustrating how charge transport through molecular-scale devices could be controlled with precision by modifying the structure and geometry of molecule-nanoparticle networks. Observed nonlinearities (e.g., NDR, hysteresis, and rectification) in the I-Vs of the self-assembled metal-molecular networks studied highlight their potential for application as circuit elements in future nanoelectronic devices and circuits, including memory, logic, switching and sensing. Additionally, the device level physical randomness and imperfections induced during fabrication of the metal-molecular networks, as well as the variability of the resistance of the networks on modifying the molecule: gold nanoparticle ratios can be applied for generating random binary sequences. / Graduate
|
5 |
Conception de dynamiques spatio-temporelles avec des circuits d'ADNPadirac, Adrien 28 November 2012 (has links) (PDF)
L'ADN est reconnu depuis longtemps comme une des molécules fondamentales des organismes vivants. Support de l'information génétique, la molécule d'ADN possède aussi des propriétés qui en font un matériel de choix pour construire à l'échelle nanométrique. Deux simples brins d'ADN complémentaires et antiparallèles (c.à.d. de directivité opposée) peuvent, par exemple, s'hybrider s'ils se rencontrent en solution, c'est à dire s'associer l'un à l'autre. La cohésion de la molécule " double-brin " ainsi formée est maintenue par une série de liaisons faibles entre les bases complémentaires de chaque brin. Cette réaction d'hybridation de l'ADN est réversible : un double-brin stable à basse température retrouvera l'état simple-brin à plus haute température. Notre capacité à lire (séquencer) et écrire (synthétiser) l'ADN est à l'origine de l'émergence du domaine des nanotechnologies ADN. Cette capacité à prévoir quantitativement les interactions (cinétiques et thermodynamiques) entre deux partenaires moléculaires quels qu'ils soient est propre à l'ADN : on peut facilement synthétiser deux molécules de même taille et nature, de manière à ce qu'elles interagissent - ou non - selon la séquence qui leur est propre. Il existe aussi toute une batterie d'enzymes capables de catalyser différentes réactions au sein d'un brin d'ADN ou entre deux brins d'ADN, par exemple : une polymérase catalyse la synthèse d'un brin d'ADN à partir de son complémentaire ; une nickase coupe un seul des deux brins d'une molécule double-brin à un emplacement spécifique ; une exonucléase hydrolyse un brin d'ADN en fragments plus courts, tandis qu'une ligase lie deux brins courts en un brin unique, plus long. En utilisant ces simples réactions (hybridation, polymérisation, coupe spécifique et hydrolyse), il est possible de construire des réactions qui associent des brins d'ADN " input " à des brins d'ADN " output " selon le modèle " input -> input + output ". Si l'output est de la même nature que l'input, il peut servir d'input à une autre réaction. On définit alors qu'à chaque réaction est associé un " module " : par exemple, le module AtoB encode la réaction A -> A + B. Lorsque A s'hybride à AtoB, il est allongé par une polymérase suivant la séquence du module AtoB, formant ainsi un brin constitué de la séquence de A suivie de la séquence de B. Ce produit est alors coupé entre A et B par une nickase : A et B peuvent alors se détacher du module AtoB. Montagne et al. (MSB, 2011) ont démontré qu'en associant trois modules encodant les trois types de réaction " activation " (A -> A+ B), " autocatalyse " (A -> 2A) et " inhibition " (B -> inhibiteur de A), complétées d'une exonucléase hydrolysant inputs et outputs (mais pas les modules), il est possible d'obtenir un oscillateur qui fonctionne dans un tube à essai, mais qui est entièrement constitué de matériel biologique : l'oligator. Dans cette thèse, nous commençons par vérifier que les trois modules de l'oligator (activation, autocatalyse et inhibition) peuvent être réarrangés de manière arbitraire, afin de créer différents circuits de réactions dynamiques. Nous appellerons cette collection de réactions catalysées par trois enzymes (polymérase, nickase et exonucléase) la boite à outils ADN. La construction et le contrôle de circuits complexes nécessitent de pouvoir observer les modules désirés de manière spécifique et en temps réel. A cette fin, nous mettons au point une nouvelle technique de fluorescence utilisant une interaction - souvent négligée - entre les bases d'ADN et un fluorophore qui y est attaché : celui-ci émet une fluorescence dont l'intensité dépend de l'état (simple ou double brin) et de la séquence à proximité du fluorophore. Cette méthode, nommée N-quenching (pour nucleobase-quenching), a fait l'objet d'une publication dans Nucleic Acids Research. A l'origine, les oscillations de l'oligator étaient observées au moyen d'un agent intercalant de l'ADN dont la fluorescence dépend de la quantité totale d'ADN présente en solution. En utilisant N-quenching, il est possible d'observer de manière spécifique les différents composants de l'oligator, et d'en apprécier les oscillations déphasées : il suffit d'attacher un fluorophore à un module afin d'observer la présence ou l'absence de l'input associé. Ces outils en main, nous abordons l'assemblage de circuits de réactions plus complexes, en nous intéressant plus particulièrement à la bistabilité. Le phénomène de bistabilité est extrêmement courant au sein des systèmes de régulation de l'expression génétique, ainsi que dans divers systèmes chimiques. Une fois déterminées les caractéristiques requises pour obtenir un système bistable avec notre boîte à outils, nous construisons un circuit dont les deux états de stabilité correspondent à deux modules autocatalytiques qui s'inhibent mutuellement par le biais de deux modules d'inhibition. N-quenching s'avère être un outil indispensable pour discerner sans ambiguïté les deux états stables du bistable. Nous avons ensuite montré qu'il est possible de donner de nouvelles fonctions au bistable en le connec- tant à d'autres modules ou sous-circuits : c'est ainsi que nous avons assemblé un circuit " mémoire " pouvant être mis à jour au moyen de deux " inputs " externes, puis une mémoire flip-flop capable de switcher entre ses deux états stables au moyen d'un unique input externe. Les résultats de ce travail ont été publiés dans Proceedings of the National Academy of Sciences. Les connections entre différents modules de nos circuits de réactions sont basées sur un système d'adressage chimique: c'est la reconnaissance entre deux brins d'ADN qui structure le réseau et nous travaillons donc dans l'espace des séquences. Il est aussi envisageable d'utiliser l'espace réel, c'est à dire de passer d'un système en zéro dimension à un système - par exemple - en deux dimensions ou chaque molécule possède désormais des coordonnées spatiales (en plus d'une adresse chimique). On s'intéresse alors à l'évolution spatiale de nos réactions. Nous avons mis au point un dispositif fluidique permettant d'enfermer hermétiquement nos circuits de réactions sous la forme d'une fine couche de liquide de la forme désirée. Le système est alors observé au moyen d'un microscope pour résoudre les composantes spatiales: nous y installons un oscillateur biochimique et montrons qu'en contrôlant réaction et diffusion, il est possible d'observer l'émergence de motifs spatio-temporels complexes. De par la nature du matériel les constituant (ADN et enzymes), nos systèmes se situent à l'interface directe entre le vivant et le non-vivant. Notre boîte à outils s'inspire (quoique de manière très sché- matique) de la régulation de l'expression génétique : elle forme par conséquent une sorte de modèle expérimental permettant l'étude des relations entre la structure du circuit d'une part et sa fonction, d'autre part, telles qu'elles pourraient être au sein du vivant. Ces circuits pourraient aussi être utilisés pour diriger des nanorobots ADN in situ, supprimant ainsi le besoin de stimulus externe commandant leurs mouvements. D'autres applications potentielles incluent le transfert de ces systèmes in vivo, à des fins thérapeutiques par exemple (médicament intelligent). Cela reste cependant un défi, dont la première étape sera d'améliorer la robustesse de ces circuits afin qu'ils puissent fonctionner dans des milieux plus hostiles qu'un tube à essai.
|
6 |
Etude physico-chimique et valorisation de composés bioactifs de Parinari macrophylla Sabine (Chrysobalanaceae) / Physicochemical study and valorization of bioactive compounds of Parinari macrophylla Sabine (Chrysobalanaceae)Balde, Mamadou 31 August 2018 (has links)
Le diabète de type 2 est souvent associé à un stress oxydant pouvant entrainer plusieurs complications métaboliques. Au Sénégal, en plus du traitement médicamenteux, les plantes médicinales restent encore très utilisées dans la prise en charge de cette pathologie. Le but de ce travail a été de contribuer à la valorisation de la biodiversité sénégalaise et plus particulièrement d’approfondir les connaissances phytochimiques de Parinari macrophylla Sabine, utilisée traditionnellement pour le traitement du diabète. Pour cela, l’activité anti-radicalaire totale et au niveau moléculaire des feuilles et écorces a été déterminée par les méthodes TEAC, ORAC et HPLC - ABTS•+ online. De plus un screening phytochimique (réactions de précipitation, CCM) a été réalisé et a permis de mettre en évidence plusieurs groupes chimiques de composés tels que des flavonoïdes, des tanins, des terpènes, des anthracènes, des saponosides, des hétérosides cardiotoniques et des alcaloïdes. Pour l’identification des composés actifs, la RMN et l’approche par réseau moléculaire (UHPLC-MS), ont permis d’identifier l’acide chlorogénique, l’hyperoside, la procyanidine B2 et d’autres procyanidines. L’étude in vitro réalisée sur un modèle cellulaire RINm5F a montré une faible activité anti-radicalaire des extraits de plante vis-à-vis d’un stress induit à l’HX-XO. Toutefois les composés identifiés dans cette étude sont connus pour leurs effets antioxydants et inhibiteurs sur les enzymes digestives responsables du métabolisme du glucose. Cela pourrait justifier l’utilisation de cette plante dans le traitement du diabète de type 2 par les tradithérapeutes Sénégalais. / Type 2 diabetes is often associated with oxidative stress that can lead to several metabolic complications. In Senegal, in addition to drug treatment, medicinal plants are still widely used in the treatment of this pathology. The aim of this work was to contribute to the enhancement of Senegalese biodiversity and more particularly to improve the phytochemical properties of Parinari macrophylla Sabine, traditionally used for the treatment of diabetes. For this, the total antiradical activity and at the molecular level of leaves and bark has been determined by the TEAC, ORAC and HPLC - ABTS-+ online methods. In addition, a phytochemical screening (precipitation reactions, CCM) was carried out and revealed several chemical groups of compounds such as flavonoids, tannins, terpenes, anthracenes, saponosides, cardiotonic heterosides and alkaloids. For the identification of active compounds, NMR and the molecular network approach (UHPLC-MS), identified chlorogenic acid, hyperoside, procyanidin B2 and other procyanidins. The in vitro study carried out on a RINm5F cellular model showed a low anti-radical activity of plant extracts against HX-XO-induced stress. However, the compounds identified in this study are known for their antioxidant and inhibitory effects on digestive enzymes responsible for glucose metabolism. This could justify the use of this plant in the treatment of type 2 diabetes by Senegalese traditional therapists.
|
7 |
Probabilistic and constraint based modelling to determine regulation events from heterogeneous biological dataAravena, Andrés 13 December 2013 (has links) (PDF)
Cette thèse propose une méthode pour construire des réseaux de régulation causales réalistes, qui a une taux de faux positifs inférieur aux méthodes traditionnelles. Cette approche consiste à intégrer des informa- tions hétérogènes à partir de deux types de prédictions de réseau pour déterminer une explication causale du gène observé co-expression. Ce processus d'intégration se modélise comme un problème d'optimisation combinatoire, de complexité NP-difficile. Nous introduisons une approche heuristique pour déterminer une solution approchée en un temps d'exécution pratique. Notre évaluation montre que, pour l'espèce modèle E. coli, le réseau de régulation résultant de l'application de cette méthode a une précision supérieure à celle construite avec des outils traditionnels. La bactérie Acidithiobacillus ferrooxidans présente des défis particu- liers pour la détermination expérimentale de son réseau de régulation. En utilisant les outils que nous avons développés, nous proposons un réseau de régulation putatif et analysons la pertinence de ces régulateurs centraux. Il s'agit de la quatrième contribution de cette thèse. Dans une deuxième partie de cette thèse, nous explorons la façon dont ces relations réglementaires se manifestent, en développant une méthode pour compléter un réseau de signalisation lié à la maladie d'Alzheimer. Enfin, nous abordons le problème ma- thématique de la conception de la sonde de puces à ADN. Nous concluons que, pour prévoir pleinement les dynamiques d'hybridation, nous avons besoin d' une fonction de l'énergie modifiée pour les structures secondaires des molécules d'ADN attaché surface et proposons un schéma pour la détermination de cette fonction.
|
8 |
Approaches to analyse and interpret biological profile dataScholz, Matthias January 2006 (has links)
Advances in biotechnologies rapidly increase the number of molecules of a cell which can be observed simultaneously. This includes expression levels of thousands or ten-thousands of genes as well as concentration levels of metabolites or proteins.
<br><br>
Such Profile data, observed at different times or at different experimental conditions (e.g., heat or dry stress), show how the biological experiment is reflected on the molecular level. This information is helpful to understand the molecular behaviour and to identify molecules or combination of molecules that characterise specific biological condition (e.g., disease).
<br><br>
This work shows the potentials of component extraction algorithms to identify the major factors which influenced the observed data. This can be the expected experimental factors such as the time or temperature as well as unexpected factors such as technical artefacts or even unknown biological behaviour.
<br><br>
Extracting components means to reduce the very high-dimensional data to a small set of new variables termed components. Each component is a combination of all original variables. The classical approach for that purpose is the principal component analysis (PCA).
<br><br>
It is shown that, in contrast to PCA which maximises the variance only, modern approaches such as independent component analysis (ICA) are more suitable for analysing molecular data. The condition of independence between components of ICA fits more naturally our assumption of individual (independent) factors which influence the data. This higher potential of ICA is demonstrated by a crossing experiment of the model plant <i>Arabidopsis thaliana</i> (Thale Cress). The experimental factors could be well identified and, in addition, ICA could even detect a technical artefact.
<br><br>
However, in continuously observations such as in time experiments, the data show, in general, a nonlinear distribution. To analyse such nonlinear data, a nonlinear extension of PCA is used. This nonlinear PCA (NLPCA) is based on a neural network algorithm. The algorithm is adapted to be applicable to incomplete molecular data sets. Thus, it provides also the ability to estimate the missing data. The potential of nonlinear PCA to identify nonlinear factors is demonstrated by a cold stress experiment of <i>Arabidopsis thaliana</i>.
<br><br>
The results of component analysis can be used to build a molecular network model. Since it includes functional dependencies it is termed functional network. Applied to the cold stress data, it is shown that functional networks are appropriate to visualise biological processes and thereby reveals molecular dynamics. / Fortschritte in der Biotechnologie ermöglichen es, eine immer größere Anzahl von Molekülen in einer Zelle gleichzeitig zu erfassen. Das betrifft sowohl die Expressionswerte tausender oder zehntausender Gene als auch die Konzentrationswerte von Metaboliten oder Proteinen.
<br><br>
Diese Profildaten verschiedener Zeitpunkte oder unterschiedlicher experimenteller Bedingungen (z.B. unter Stressbedingungen wie Hitze oder Trockenheit) zeigen, wie sich das biologische Experiment auf molekularer Ebene widerspiegelt. Diese Information kann genutzt werden, um molekulare Abläufe besser zu verstehen und um Moleküle oder Molekül-Kombinationen zu bestimmen, die für bestimmte biologische Zustände (z.B.: Krankheit) charakteristisch sind.
<br><br>
Die Arbeit zeigt die Möglichkeiten von Komponenten-Extraktions-Algorithmen zur Bestimmung der wesentlichen Faktoren, die einen Einfluss auf die beobachteten Daten ausübten. Das können sowohl die erwarteten experimentellen Faktoren wie Zeit oder Temperatur sein als auch unerwartete Faktoren wie technische Einflüsse oder sogar unerwartete biologische Vorgänge.
<br><br>
Unter der Extraktion von Komponenten versteht man die Reduzierung dieser stark hoch-dimensionalen Daten auf wenige neue Variablen, die eine Kombination aus allen ursprünglichen Variablen darstellen und als Komponenten bezeichnet werden. Die Standard-Methode für diesen Zweck ist die Hauptkomponentenanalyse (PCA).
<br><br>
Es wird gezeigt, dass - im Vergleich zur nur die Varianz maximierenden PCA - moderne Methoden wie die Unabhängige Komponentenanalyse (ICA) für die Analyse molekularer Datensätze besser geeignet sind. Die Unabhängigkeit von Komponenten in der ICA entspricht viel besser unserer Annahme individueller (unabhängiger) Faktoren, die einen Einfluss auf die Daten ausüben. Dieser Vorteil der ICA wird anhand eines Kreuzungsexperiments mit der Modell-Pflanze <i>Arabidopsis thaliana</i> (Ackerschmalwand) demonstriert. Die experimentellen Faktoren konnten dabei gut identifiziert werden und ICA erkannte sogar zusätzlich einen technischen Störfaktor.
<br><br>
Bei kontinuierlichen Beobachtungen wie in Zeitexperimenten zeigen die Daten jedoch häufig eine nichtlineare Verteilung. Für die Analyse dieser nichtlinearen Daten wird eine nichtlinear erweiterte Methode der PCA angewandt. Diese nichtlineare PCA (NLPCA) basiert auf einem neuronalen Netzwerk-Algorithmus. Der Algorithmus wurde für die Anwendung auf unvollständigen molekularen Daten erweitert. Dies ermöglicht es, die fehlenden Werte zu schätzen. Die Fähigkeit der nichtlinearen PCA zur Bestimmung nichtlinearer Faktoren wird anhand eines Kältestress-Experiments mit <i>Arabidopsis thaliana</i> demonstriert.
<br><br>
Die Ergebnisse aus der Komponentenanalyse können zur Erstellung molekularer Netzwerk-Modelle genutzt werden. Da sie funktionelle Abhängigkeiten berücksichtigen, werden sie als Funktionale Netzwerke bezeichnet. Anhand der Kältestress-Daten wird demonstriert, dass solche funktionalen Netzwerke geeignet sind, biologische Prozesse zu visualisieren und dadurch die molekularen Dynamiken aufzuzeigen.
|
9 |
Réseaux de régulation chez Escherichia coliBaptist, Guillaume 29 August 2012 (has links) (PDF)
L'adaptation d'une bactérie aux changements de son environnement est contrôlée par un réseau de régulation large et complexe, faisant intervenir de nombreux acteurs et modules différents. Dans ce travail, nous avons étudiés un module de régulation spécifique, contrôlant l'adaptation de la bactérie Escherichia coli à un changement de sources de carbone. Dans un milieu contenant du glucose et de l'acétate, la croissance est divisée en deux phases : les bactéries utilisent préférentiellement le glucose et commencent à métaboliser l'acétate qu'après l'épuisement du glucose. En effet, la présence du glucose réprime la transcription d'un gène nécessaire à la croissance sur acétate, le gène acs (codant pour l'acétyl-CoA synthétase). Le mécanisme régulateur fait intervenir le facteur de transcription Crp-AMPc et le système de transfert de phosphate (PTS), qui permet l'import du glucose. Plusieurs modèles décrivent en détail la cascade de réactions moléculaires à l'origine de cette " répression catabolique ". Cependant, certaines de nos observations expérimentales ne sont pas correctement prédites par les modèles actuels. Ces modèles doivent être révisés ou complétés. L'outil majeur que nous employons pour les expériences est la fusion transcriptionnelle : une région promotrice fusionnée en amont d'un gène rapporteur (GFP, luciferase). Avec ces constructions, nous mesurons la dynamique de l'expression génique dans différentes souches (mutants) et différentes conditions environnementales. Les observations à l'échelle de la population sont corroborées par des mesures similaires à l'échelle de la cellule unique. Nous utilisons cette même technologie pour construire de petits systèmes synthétiques qui sondent davantage le phénomène de répression catabolique. Nous avons ainsi créé un interrupteur génétique dont le fonctionnement est contrôlé par le flux glycolytique et nous avons construit un petit système de communication intercellulaire basé sur la molécule AMPc. Enfin, nous proposons une manière originale de mesurer l'état métabolique des cellules en utilisant la dépendance énergétique de la luciferase.
|
10 |
Caractérisation du complexe de fusion des rhabdovirus.Roche, Stéphane 30 November 2004 (has links) (PDF)
La fusion membranaire est un processus biologique courant que l'on retrouve notamment lors de l'exocytose, du trafic intracellulaire ou de l'entrée des virus dans les cellules. Dans le cas des rhabdovirus, une famille où l'on retrouve notamment le virus de la rage (RV) et le virus de la stomatite vésiculaire (VSV),cette fonction est assurée à pH légèrement acide par la glycoprotéine G. Cette protéine existe sous au moins trois conformations distinctes : à pH neutre, elle est présente sous une conformation native (N). Après une brève incubation à pH acide, elle est présente sous une conformation activée (A), sous laquelle elle est capable d'interagir avec une membrane cible par l'intermédiaire d'un peptide hydrophobe. Enfin, après une incubation prolongée à pH acide, elle apparaît sous une conformation inactivée (I) et est alors incapable d'induire la fusion membranaire. Contrairement à toutes les autres familles virales étudiées à ce jour, il existe un équilibre dépendant du pH entre ces conformations. De nombreuses données dans divers systèmes suggèrent qu'une protéine unique ne serait pas suffisante pour catalyser les processus de fusion membranaire, mais qu'au contraire une machinerie constituée d'un nombre plus ou moins important de protéines fusogènes serait nécessaire. Au cours de ce travail, nous avons étudié certaines propriétés du complexe de fusion des rhabdovirus. Nous avons ainsi montré qu'il était de grande taille et qu il était probablement plus grand que ce qui avait été proposé pour d autres familles virales. De plus, il est apparu que le complexe de fusion du virus rabique n avait pas une unique architecture possible, mais qu il existait au contraire divers types de complexe. Ensuite, l'observation par microscopie électronique de particules virales en train de fusionner avec des liposomes nous a montré que le processus de fusion induit par VSV se produisait toujours par la base et qu il s accompagnait d une redisposition complète des glycoprotéines à la surface du virus suivant un réseau hélicoïdal. Enfin, nous sommes parvenu à isoler l ectodomaine de G et à en obtenir des cristaux diffractant à 3,5 Å, ce qui permet d envisager à terme une résolution de la structure de G. L étude de l interaction entre l ectodomaine de G et des liposomes nous a permis de reproduire les réseaux hélicoïdaux observés à la surface du virus et d étudier leurs propriétés. L ensemble de ces données nous a permis de proposer un nouveau modèle pour le processus de fusion chez les rhabdovirus, mais il pourrait également être pertinent pour d autres familles virales.
|
Page generated in 0.0795 seconds