Global ETD Search

1	Filters on disjunctive boolean networks Plana Perillán, Francisco Antonio January 2014 (has links) Magíster en Ciencias, Mención Computación / Ingeniero Civil Matemático / Una red Booleana es un modelo de redes en el cual, cada nodo o elemento de la red tiene asociado una función Booleana que determina el estado del nodo respectivo, y de esta forma la evolución de la red en el tiempo. Los puntos fijos de una red Booleana, esto es, estados particulares de la red que permanecen constantes en el tiempo, han ganado importancia, por ejemplo, en el contexto de redes de regulación génica, donde los puntos fijos tienen un correlato biológico. Para cada red finita y estado inicial posible, dentro de una cantidad finita de actualizaciones de la red, los estados de la red alcanzarán un punto fijo o un ciclo límite, la cual es una secuencia de estados de la red que se repiten a lo largo del tiempo. Puntos fijos y ciclos límites son denominados atractores de la red. En este trabajo nos concentramos en estudiar ciertos aspectos de los atractores de redes Booleanas, incluyendo aspectos computacionales, caracterizaciones, entre otros, utilizando la noción de "filtro'' de una red. Un filtro es un procedimiento consistente en aplicar de forma iterativa transformaciones a una red, cada una de las cuales simula con dinámica paralela cierto modo de actualización, produciendo una nueva red cuyas propiedades y dinámica pueden ser relacionadas con la red inicial. Se ha mostrado que estos filtros pueden ser muy útiles, dado que filtros asociados a actualizaciones secuenciales pueden entregar información eficientemente sobre los puntos fijos de una red (Goles y Salinas 2010). Nuestro análisis se restringe a redes Booleanas disyuntivas, lo cual permite concentrarse solo en la topología de la red. Nos concentramos además en esquemas de actualización bloque-secuencial, los cuales son una generalización de los esquemas paralelo y secuencial. Los principales resultados de este trabajo establecen cotas polinomiales para la complejidad de tiempo de un filtro, así como condiciones sobre la red y esquema de entrada que aseguran ciertas propiedades en la red de salida, incluyendo la remoción de ciclos límites. Los resultados obtenidos hacen uso de teoría de matrices positivas, y fueron formulados con la ayuda de simulaciones computacionales ejecutadas con una aplicación desarrollada para este fin. Algoritmos computacionales Redes booleanas Biología de sistemas
2	Development of bioinformatics resources for the integrative analysis of Next Generation omics data Hernández de Diego, Rafael 20 November 2017 (has links) The advances in high-throughput sequencing techniques and the technological development accompanying them have favoured the development and popularisation of a new range of genomic research disciplines, collectively known as the omics. These technologies are capable of simultaneously measuring thousands of molecules which are essential for life, including DNA, RNA, proteins, and metabolites. Historically, classical genomic research has followed a reductionist approach by studying the structure, regulation, and function of these biological units independently. However, despite being a powerful analytical tool, the reductionist method cannot explain many of the biological phenomena that take place in living systems. This is because these biological events are not represented by the sum of their components, rather, only the interacting dynamics of the different omics elements can explain their complexity. In recent years Systems Biology has established itself as a multidisciplinary area of research which tries to model the dynamic behaviour of biological systems by holistically studying the interactions between the different omics disciplines; it combines simultaneous measurements of different types of molecules and integrates multiple sources of information in order to identify changing components in a coordinated way and under controlled study conditions. Thus, Systems Biology is an interdisciplinary area that requires biologists, mathematicians, biochemists, and other researchers to work closely together, and in which computer sciences plays a fundamental role because of the volume and complexity of the data handled. This thesis addresses the problem of data management, integration, and analysis in multi-omics studies. More specifically, this research focused on two of the most characteristic computational challenges in Systems Biology: the development of integrated databases and the problem of integrative visualisation. Therefore, the first part of this work was devoted to designing and creating a bioinformatics resource for managing multi-omics experiments. The resulting platform, known as STATegra EMS, offers a complete set of tools that facilitate the storage and organisation of the large datasets generated during omics experiments, and also provides tools for data annotation in the later stages of processing and analysis of the information. The development of this platform required overcoming problems created by the heterogeneity, volume, and high variability of the data. Thus, as part of the solution to these problems, detailed metadata can be recorded within STATegra EMS, allowing dataset discrimination and successful data integration. To aid this process, the platform also offers a collaborative and easy-to-use web interface that combines modern web technologies and well-known community standards to represent the different components of the integrated experiments. The second part of this thesis examines the current situation and challenges in integrative data visualisation in multi-omic experiments, and presents the PaintOmics 3 web tool which was developed to address these issues. Since the capacity of the human brain for visual processing is highly evolved, integrative visualisation combined with data analysis techniques is probably one of the most powerful tools for interpreting and validating results in Systems Biology. PaintOmics 3 provides a comprehensive framework for performing biological function enrichment analyses in experiments with multiple conditions and data types; it combines powerful tools for integrative data visualisation on KEGG molecular-interaction diagrams, biological-process interaction-networks, and statistical analyses. Moreover, unlike similar tools, PaintOmics 3 is interactive and easy to use, and stands out for its flexibility and the variety of omics data types it accepts, which include epigenomics data based on genomic regions, proteomics data, and miRNA-study data. / Los avances en las técnicas de secuenciación y el abaratamiento tecnológico han favorecido el desarrollo y la popularización de una nueva gama de disciplinas de investigación genómica, conocidas como "ómicas". Estas tecnologías son capaces de realizar mediciones simultáneas de miles de moléculas esenciales para la vida, tales como el ADN, el ARN, las proteínas y los metabolitos. Históricamente, la investigación genómica clásica ha seguido un enfoque reduccionista al estudiar la estructura, regulación y función de estas moléculas de manera independiente. Sin embargo, el método reduccionista es incapaz de explicar muchos de los fenómenos biológicos que tienen lugar en un sistema vivo, sugiriendo que la esencia del sistema no puede explicarse simplemente mediante la enumeración de elementos que lo componen, sino que radica en la dinámica de los procesos biológicos que entre ellos acontecen. La Biología de Sistemas se ha establecido en los últimos años como el área de investigación multidisciplinaria que trata de modelar el comportamiento dinámico de los sistemas biológicos a través del estudio holístico de las interacciones entre sus partes, combinando mediciones simultáneas de diferentes tipos de moléculas e integrando múltiples fuentes de información para identificar aquellos componentes que cambian de manera coordinada en las condiciones estudiadas. La BS es un área interdisciplinar que requiere que biólogos, matemáticos, bioquímicos y otros investigadores trabajen en estrecha colaboración, y en la que la informática tiene un papel fundamental dado el volumen y la complejidad de los datos. Esta tesis aborda el problema de la gestión, integración y análisis de los datos en estudios multi-ómicos. Más específicamente, la investigación se ha centrado en dos de los retos computacionales más característicos de la BS: el desarrollo de bases de datos integrativas y el problema de la visualización integrativa. Así, la primera parte de este trabajo se ha dedicado al diseño y creación de un recurso bioinformático para la gestión de experimentos multi-ómicos. La plataforma desarrollada (STATegra EMS) ofrece un conjunto de herramientas que facilitan el almacenamiento y la organización de los grandes conjuntos de datos que son generados durante los experimentos, así como la anotación de las posteriores etapas de procesamiento y análisis de la información. La heterogeneidad, el volumen y la variabilidad de los datos son algunos de los obstáculos que han sido abordados durante el desarrollo del STATegra EMS, con el fin de alcanzar un registro detallado de la meta-información que permita discriminar cada conjunto de datos y lograr así una integración exitosa de la información. Para ello, la plataforma desarrollada ofrece una interfaz web colaborativa y de fácil manejo en la que se combinan modernas tecnologías web y conocidos estándares comunitarios para la representación de los diferentes componentes del experimento. En la segunda parte de esta tesis se discuten la situación actual y las dificultades de la visualización integrativa de datos multi-ómicos, y se presenta la herramienta desarrollada, PaintOmics 3. La visualización integrativa combinada con técnicas de análisis de datos es probablemente una de las herramientas más poderosa para la interpretación y validación de los resultados en BS. PaintOmics 3 proporciona un completo marco de trabajo para realizar análisis de enriquecimiento de funciones biológicas en experimentos con múltiples condiciones y tipos de datos, en el que se combinan potentes herramientas de visualización integrativa sobre diagramas de interacción molecular y redes de reacción KEGG, redes de interacción de procesos biológicos, y estudios estadísticos de los datos. Además, a diferencia de otras herramientas, PaintOmics 3 destaca por su facilidad de uso e interactividad, así como por su flexibilidad y variedad de los datos / Els avenços en les tècniques de seqüenciació d'alt rendiment i l'abaratiment tecnològic posterior han afavorit el desenvolupament i la popularització d'una nova gamma de disciplines d'investigació genòmica, conegudes col¿lectivament com a "òmiques". Aquestes tecnologies permeten realitzar mesuraments simultanis de milers de molècules essencials per a la vida, com ara l'ADN, l'ARN, les proteïnes i els metabòlits. Històricament, la investigació genòmica clàssica ha seguit un enfocament reduccionista a l'hora d'estudiar l'estructura, la regulació i la funció d'aquestes unitats biològiques de manera independent. No obstant això, el mètode reduccionista és incapaç d'explicar molts dels fenòmens biològics que tenen lloc en un sistema viu, suggerint que l'essència del sistema no es pot explicar simplement mitjançant l'enumeració d'elements que el componen, sinó que radica en la dinàmica dels processos biològics que tenen lloc entre ells. La Biologia de Sistemes (BS) ha esdevingut els darrers anys l'àrea d'investigació multidisciplinària que tracta de modelar el comportament dinàmic dels sistemes biològics a través de l'estudi holístic de les interaccions entre les seues parts, combinant mesuraments simultanis de diferents tipus de molècules i integrant múltiples fonts d'informació per a identificar aquells components que canvien de manera coordinada en les condicions objecte d'estudi. La BS és una àrea interdisciplinar que requereix que biòlegs, matemàtics, bioquímics i altres investigadors treballen plegats i en la qual la informàtica té un paper fonamental, atès el volum i la complexitat de les dades emprades. Aquesta tesi aborda el problema de la gestió, la integració i l'anàlisi de les dades en estudis multi-òmics. Més concretament, la investigació s'ha centrat en dos dels reptes computacionals més característics de la BS: el desenvolupament de bases de dades integratives i el problema de la visualització integrativa. Així, la primera part d'aquest treball s'ha dedicat al disseny i creació d'un recurs bioinformàtic per a la gestió d'experiments multi-òmics. La plataforma desenvolupada (STATegra EMS) ofereix un conjunt d'eines que faciliten l'emmagatzematge i l'organització dels grans conjunts de dades que són generats durant aquests experiments, així com l'anotació de les etapes posteriors de processament i anàlisi de la informació. L'heterogeneïtat, el volum i l'alta variabilitat de les dades òmiques són alguns dels obstacles que han estat abordats durant el desenvolupament de l'STATegra EMS, amb la finalitat d'assolir un registre detallat de la meta-informació que permeta discriminar cada conjunt de dades i aconseguir així una integració reeixida de la informació. Per a aconseguir-ho, la plataforma desenvolupada ofereix una interfície web collaborativa i fàcil de fer servir que conjumina modernes tecnologies web i coneguts estàndards comunitaris per a la representació dels diferents components de l'experiment. En la segona part d'aquesta tesi s'hi estudia la situació actual i les dificultats de la visualització integrativa de dades en experiments multi-òmics i s'hi presenta l'eina web desenvolupada: PaintOmics 3. La visualització integrativa en combinació amb tècniques d'anàlisi de dades és probablement una de les eines més poderosa per a la interpretació i validació dels resultats en BS. PaintOmics 3 proporciona un marc complet de treball per a fer anàlisis d'enriquiment de funcions biològiques en experiments amb múltiples condicions i tipus de dades; s'hi combinen eines potents de visualització integrativa de dades sobre diagrames d'interacció molecular i xarxes de reacció KEGG, xarxes d'interacció de processos biològics i estudis estadístics de les dades. A més, a diferència d'altres eines desenvolupades, PaintOmics 3 és molt interactiva i fàcil d'usar, i destaca per la flexibilitat i varietat de dades que accepta, co / Hernández De Diego, R. (2017). Development of bioinformatics resources for the integrative analysis of Next Generation omics data [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/91227 bioinformática biología de sistemas ingeniería del software genética
3	Systems biology and chemoinformatics methods for biomining and systems metabolic engineering applications Campodonico Alt, Miguel Ángel January 2014 (has links) Doctor en Ciencias de la Ingeniería, Mención Química / In the first chapter, this thesis aims to demonstrate the great potential of Constraint-Based Reconstruction and Analysis (COBRA) methods for studying and predicting specific phenotypes in the bacterium Acidithiobacillus ferrooxidans. A genome-scale metabolic reconstruction of Acidithiobacillus ferrooxidans ATCC 23270 (iMC507) is presented and characterized. iMC507 is validated for aerobic chemolithoautotrophic conditions by fixating carbon dioxide and using three different electron donors: ferrous ion, tetrathionate and thiosulfate. Furthermore, the model is utilized for (i) quantitatively studying and analyzing key reactions and pathways involved in the electron transfer metabolism, (ii) describing the central carbon metabolism and (iii) for evaluating the potential to couple the production of extracellular polymeric substances through knock-outs. The second chapter work outlines the effort towards advancing the field of systems metabolic engineering by using COBRA methods in conjunction with chemoinformatic approaches to metabolically engineer the bacterium Escherichia coli. A complete strain design workflow integrating synthetic pathway prediction with growth-coupled designs for the production of non-native compounds in a target organism of interest is outlined. The generated enabling technology is a computational pipeline including chemoinformatics, bioinformatics, constraint-based modeling, and GEMs to aid in the process of metabolic engineering of microbes for industrial bioprocessing purposes. A retrosynthetic based pathway predictor algorithm containing a novel integration with GEMs and reaction promiscuity analysis is developed and demonstrated. Specifically, the production potential of 20 industrially-relevant chemicals in E. coli and feasible designs for production strains generation is outlined. A comprehensive mapping from E. coli s native metabolome to commodity chemicals that are 4 reactions or less away from a natural metabolite is performed. Sets of metabolic interventions, specifically knock-outs and knock-ins that coupled the target chemical production to growth rate were determined. In the third chapter, in order to aid the field of cancer metabolism, potential biomarkers were determined through gain of function oncometabolites predictions. Based on a chemoinformatic approach in conjunction with the global human metabolic network Recon 2, a workflow for predicting potential oncometabolites is constructed. Starting from a list of mutated enzymes genes, described as GoF mutations, a range of promiscuous catalytic activities are inferred. In total 24 chemical substructures of oncometabolites resulting from the GoF analysis are predicted. Escherichia coli Biotecnología Biología de sistemas Ingeniería metabólica Acidithiobacillus ferrooxidans
4	Quantitative modelling of mouse limb morphogenesis Böhm, Bernd R. 18 May 2011 (has links) In this thesis we combine quantitative measurements of mouse limb morphogenesis and computer modelling to test a well established theory about the cellular mechanisms promoting limb elongation. A distally directed gradient of cellular proliferation was believed to be the driving mechanism for limb outgrowth. We find that the empirically measured spatial proliferation pattern fails to promote normal development - a reverse engineering algorithm was applied and revealed a proliferation pattern that could indeed carry out normal development. The differences between those patterns is dramatic and suggests that isotopic cellular proliferation alone has very little impact on limb morphogenesis and other – non isotropic - mechanisms need to be involved. / En esta tesis tratamos de testar una bien establecida teor´ıa sobre los mecanismos celulares que promueven de la elongaci´on de las extremidades. Para eso combinamos mediciones cuantitativas del proceso morfogen ´etico de la extremidad del rat´on con modelos computacionales. Se cre´ıa que la fuerza conductora del crecimiento de las extremidades era un gradiente en sentido distal del incremento de la proliferaci´on celular. Descubrimos que el patr´on de proliferaci´on celular basado en medidas emp´ıricas no consegu´ıa promover un desarrollo normal, mientras que un algoritmo de ingenier´ıa inversa aplicado al proceso revel´o un patr´on que si podr´ıa. La diferencia entre estos dos patrones es inmensa y sugiere que la proliferaci´on celular isotropica por si sola tiene muy poco impacto sobre la morfog´enesis de las extremidades, indicando as´ı la necesidad de que otros procesos no isotr´opicos se hallen involucrados. Limb development Systems Biology modelling parameter optimization morphometrics Deasarrollo de las extremidades Biología de sistemas construcción de modelos cuantificación 57
5	Modeling Functional Modules Using Statistical and Machine Learning Methods Cubuk, Cankut 30 November 2020 (has links) [ES] La comprensión de los aspectos de la funcionalidad de las células que cuentan para los mecanismos de las enfermedades es el mayor reto de la medicina personalizada. A pesar de la disponibilidad creciente de los datos de genómica y transcriptómica, sigue existiendo una notable brecha entre la detección de las perturbaciones en la expresión de genes y la comprensión de su contribución en los mecanismos moleculares que últimamente tienen relación importante con el fenotipo estudiado. A lo largo de la última década, distintos modelos computacionales y matemáticos se han propuesto para el análisis de las rutas. Sin embargo, estos modelos no toman en cuenta los mecanismos dinámicos de las rutas como la estructura y las interacciones entre genes y proteínas. En esta tesis doctoral, presento dos modelos matemáticos ligeramente distintos, para integrar los datos transcriptómicos masivos de humano con un conocimiento previo de de las rutas de señalización y metabólicas para estimar las actividades mecánicas que están detrás de esas rutas (MPAs). Las MPAs son variables continuas con valores de nivel individual que pueden ser usadas con los modelos de aprendizaje de máquinas y métodos estadísticos para determinar los biomarcadores que podemos usar para los diagnósticos tempranos y la clasificación de subtipos de enfermedades, además de poder sugerir las dianas terapéuticas potenciales para las intervenciones individualizadas. El objetivo global es desarrollar nuevos y avanzados enfoques de la biología de sistemas para proponer unas hipótesis funcionales que nos ayuden a entender e interpretar los mecanismos complejos de las enfermedades. Estos mecanismos son cruciales para mejorar los tratamientos personalizados y predecir los resultados clínicos. En primer lugar, contribuí al desarrollo de un método que está diseñado para extraer las subrutas elementales desde la ruta de señalización con sus actividades estimadas. Posteriormente, este algoritmo se ha adaptado a los módulos metabólicos y se ha implementado como una herramienta web. Finalmente , el método ha revelado un panorama metabólico para una lista completa de diferentes tipos de cánceres. En este estudio, analicé el perfil metabólico de 25 tipos de cáncer distintos y se validó el método usando varios enfoques computacionales y experimentales. Cada método desarrollado en esta tesis ha sido enfrentado a otros métodos similares existentes, evaluados por sus sensibilidades y especificidades, experimentalmente validados cuando fue posible y usados para predecir resultados clínicos de varios tipos de cánceres. La investigación descrita en esta tesis y los resultados obtenidos fueron publicados en distintas revistas arbitradas que están relacionadas con el cáncer y biología de sistemas, y también en los periódicos nacionales. / [CA] La comprensió dels aspectes de la funcionalitat de les cèl·lules que compten per als mecanismes de les malalties és el major repte de la medicina personalitzada. Malgrat la disponibilitat creixent de les dades de genòmica i transcriptómica, continua existint una notable bretxa entre la detecció de les pertorbacions en l'expressió de gens i la comprensió de la seua contribució en els mecanismes moleculars que últimament tenen relació important amb el fenotip estudiat. Al llarg de l'última dècada, diferents models computacionals i matemàtics s'han proposat per a l'anàlisi de les rutes. No obstant això, aquests models no tenen en compte els mecanismes dinàmics de les rutes com l'estructura i les interaccions entre gens i proteïnes. En aquesta tesi doctoral, presente dos models matemàtics lleugerament diferents, per a integrar les dades transcriptómicos massius d'humà amb un coneixement previ de de les rutes de senyalització i metabòliques per a estimar les activitats mecàniques que estan darrere d'aqueixes rutes (MPAs). Les MPAs són variables contínues amb valors de nivell individual que poden ser usades amb els models d'aprenentatge de màquines i mètodes estadístics per a determinar els biomarcadores que podem usar per als diagnòstics primerencs i la classificació de subtipus de malalties, a més de poder suggerir les dianes terapèutiques potencials per a les intervencions individualitzades. L'objectiu global és desenvolupar nous i avançats enfocaments de la biologia de sistemes per a proposar unes hipòtesis funcionals que ens ajuden a entendre i interpretar els mecanismes complexos de les malalties. Aquests mecanismes són crucials per a millorar els tractaments personalitzats i predir els resultats clínics. En primer lloc, vaig contribuir al desenvolupament d'un mètode que està dissenyat per a extraure les subrutas elementals des de la ruta de senyalització amb les seues activitats estimades. Posteriorment, aquest algorisme s'ha adaptat als mòduls metabòlics i s'ha implementat com una eina web. Finalment, el mètode ha revelat un panorama metabòlic per a una llista completa de diferents tipus de càncers. En aquest estudi, vaig analitzar el perfil metabòlic de 25 tipus de càncer diferents i es va validar el mètode usant diversos enfocaments computacionals i experimentals. Cada mètode desenvolupat en aquesta tesi ha sigut enfrontat a altres mètodes similars existents, avaluats per les seues sensibilitats i especificitats, experimentalment validats quan va ser possible i usats per a predir resultats clínics de diversos tipus de càncers. La investigació descrita en aquesta tesi i els resultats obtinguts van ser publicats en diferents revistes arbitrades que estan relacionades amb el càncer i biologia de sistemes, i també en els periòdics nacionals. / [EN] Understanding the aspects of the cell functionality that account for disease or drug action mechanisms is the main challenge for precision medicine. In spite of the increasing availability of genomic and transcriptomic data, there is still a gap between the detection of perturbations in gene expression and the understanding of their contribution to the molecular mechanisms that ultimately account for the phenotype studied. Over the last decade, different computational and mathematical models have been proposed for pathway analysis. However, they are not taking into account the dynamic mechanisms contained by pathways as represented in their layout and the interactions between genes and proteins. In this thesis, I present two slightly different mathematical models to integrate human transcriptomic data with prior knowledge of signalling and metabolic pathways to estimate the Mechanistic Pathway Activities (MPAs). MPAs are continuous and individual level values that can be used with machine learning and statistical methods to determine biomarkers for the early diagnosis and subtype classification of the diseases, and also to suggest potential therapeutic targets for individualized therapeutic interventions. The overall objective is, developing new and advanced systems biology approaches to propose functional hypotheses that help us to understand and interpret the complex mechanism of the diseases. These mechanisms are crucial for robust personalized drug treatments and predict clinical outcomes. First, I contributed to the development of a method which is designed to extract elementary sub-pathways from a signalling pathway and to estimate their activity. Second, this algorithm adapted to metabolic modules and it is implemented as a webtool. Third, the method used to reveal a pan-cancer metabolic landscape. In this study, I analyzed the metabolic module profile of 25 different cancer types and the method is also validated using different computational and experimental approaches. Each method developed in this thesis was benchmarked against the existing similar methods, evaluated for their sensitivity and specificity, experimentally validated when it is possible and used to predict clinical outcomes of different cancer types. The research described in this thesis and the results obtained were published in different systems biology and cancer-related peer-reviewed journals and also in national newspapers. / Cubuk, C. (2020). Modeling Functional Modules Using Statistical and Machine Learning Methods [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/156175 Biología de sistemas Modelos matemáticos Bioinformática Pathway analysis Cell signaling Cell metabolism Functional genomics Systems biology Bioinformatics Mathematical modeling
6	Statistical Methods Development for the Multiomic Systems Biology Ugidos Guerrero, Manuel 28 April 2023 (has links) [ES] La investigación en Biología de Sistemas se ha expandido en los últimos años. El análisis simultáneo de diferentes tipos de datos ómicos permite el estudio de las conexiones y relaciones entre los diferentes niveles de organización celular. La presente tesis doctoral tiene como objetivo desarrollar y aplicar estrategias de integración multiómica al campo de la biología de sistemas. El elevado coste de las tecnologías ómicas, dificulta que los laboratorios puedan abordar un estudio multiómico completo. No obstante, la gran disponibilidad de datos ómicos en repositorios públicos, permite el uso de estos datos ya generados. Desafortunadamente, la combinación de datos ómicos provenientes de diferentes orígenes, da lugar a la aparición de un ruido no deseado en los datos, el efecto lote. El efecto lote impide el correcto análisis conjunto de los datos y es necesario el uso de los llamados Algoritmos de Corrección de Efecto Lote para eliminarlo. En la actualidad, existe un gran número de éstos algoritmos que se basan en diferentes modelos estadísticos. Sin embargo, los métodos existentes no están pensados para los diseños multiómicos ya que solo permiten la corrección de un mismo tipo de ómica que debe haber sido medida en todos los lotes. Por ello desarrollamos la herramienta MultiBaC basada en la regresión PLS y modelos ANOVA-SCA, que permite la corrección del efecto lote en diseños multiómicos, permitiendo la corrección de datos que no hayan sido medidos en todos los lotes. En este trabajo, MultiBaC fué validado y evaluado en diferentes conjuntos de datos, además presentamos MultiBaC como paquete de R para facilitar su uso. La mayoría de métodos existentes de integración multiómica son métodos multivariantes basados en el análisis del espacio latente. Estos métodos se conocen como ``dirigidos por datos'', y se basan en la búsqueda de correlaciones para determinar las relaciones entre las variables. Estos métodos necesitan de gran cantidad de observaciones o muestras para poder encontrar correlaciones significativas. Lamentablemente, en el mundo de la biología molecular, los conjuntos de datos con un gran número de muestras no son muy habituales, debido al elevado coste de generación de los datos. Como alternativa a los métodos dirigidos por datos, algunas estrategias de integración multiómicas se basan en métodos ``dirigidos por modelos''. Estos métodos pueden ajustarse con un menor número de observaciones y son muy útiles para encontrar relaciones mecanísticas entre los componentes celulares. Los métodos dirigidos por modelos necesitan de una información a priori, el modelo, que normalmente es un modelo metabólico del organismo estudiado. Actualmente, sólo transcriptómica y metabolómica cuantitativa, han sido los dos tipos de dato ómico que se han integrado con éxito usando métodos dirigidos por modelos.Sin embargo, la metabolómica cuantitativa no está muy extendida y la mayoría de laboratorios generan metabolómica no cuantitativa, la cuál no puede integrarse con los métodos actuales. Para contribuir en esta cuestión, desarrollamos MAMBA, una herramienta de integración multiómica dirigida por modelos y basada en métodología de optimización matemática, que es capaz de analizar conjuntamente metabolómica no cuantitativa con otro tipo de ómica asociada a genes, como por ejemplo la trascriptómica. MAMBA fue comparado con otros métodos existentes en cuanto a la capacidad de predcción de metabolitos y fué aplicado al conjunto interno de datos multiómicos. Este conjunto de datos multiómicos fue generado dentro del proyecto PROMETEO, en el cuál está enmarcada esta tesis. MAMBA demostró capturar la biología conocida sobre nuestro diseño experimental, además de ser útil para derivar nuevas observaciones e hipótesis biológicas. En conjunto, esta tesis presenta herramientas útiles para el campo de la biología de sistemas, y que cubren tanto el preprocesado de datos multiómicos como su posterior análisis estadístico integrativo. / [CA] La investigació en Biologia de Sistemes s'ha expandit els darrers. L'anàlisi simultània de diferents tipus de dades òmiques permet l'estudi de les connexions i les relacions entre els diferents nivells d'organització cel·lular. Aquesta tesi doctoral té com a objectiu desenvolupar i aplicar estratègies dintegració multiòmica al camp de la biologia de sistemes. L'elevat cost de les tecnologies òmiques dificulta que els laboratoris puguin abordar un estudi multiòmic complet. Això no obstant, la gran disponibilitat de dades òmiques en repositoris públics permet l'ús d'aquestes dades ja generades. Malauradament, la combinació de dades òmiques provinents de diferents orígens, dóna lloc a l'aparició d'un soroll no desitjat en les dades, l'efecte lot. L'efecte lot impedeix la correcta anàlisi conjunta de les dades i cal utilitzar els anomenats algorismes de correcció d'Efecte lot per eliminar-lo. Actualment hi ha un gran nombre d'aquests algorismes que corregeixen l'efecte lot que es basen en diferents models estadístics. Tot i això, els mètodes existents no estan pensats per als dissenys multiòmics ja que només permeten la correcció d'un mateix tipus de dada òmica que ha d'haver estat mesurada en tots els lots. Per això desenvolupem la nostra eina MultiBaC basada en la regressió PLS i models ANOVA-SCA, que pot corregir l'efecte lot en dissenys multiòmics, permetent la correcció de dades que no hagin estat mesurades a tots els lots. En aquest treball, MultiBaC ha sigut validat i avaluat en diferents conjunts de dades, a més a més, presentem MultiBaC com a paquet de R per facilitar l'ús de la nostra eina. La majoria de mètodes d'integració multiòmica existents són mètodes multivariants basats en l'anàlisi de l'espai latent. Aquests mètodes es coneixen com a "dirigits per dades", i es basen en la cerca de correlacions per determinar les relacions entre les diferents variables. Els mètodes dirigits per dades necessiten gran quantitat d'observacions o mostres per poder trobar correlacions significatives entre les variables. Lamentablement, al món de la biologia molecular, els conjunts de dades amb un gran nombre de mostres no són molt habituals, degut a l'elevat cost de generació de les dades òmiques. Com a alternativa als mètodes dirigits per dades, algunes estratègies d'integració multiòmiques es basen en mètodes "dirigits per models". Aquests mètodes poden ajustar-se amb un nombre menor d'observacions i són molt útils per trobar relacions mecanístiques entre els components cel·lulars. Tot i això, els mètodes dirigits per models necessiten una informació a priori, el model, que normalment és un model metabòlic de l'organisme estudiat. Actualment, únicament transcriptòmica i metabolòmica quantitativa, han estat els dos tipus de dada òmica que s'han integrat amb èxit usant mètodes dirigits per models. No obstant això, la metabolòmica quantitativa no està gaire estesa i la majoria de laboratoris generen metabolòmica no quantitativa, les quals no es poden integrar amb els mètodes actuals. Per contribuir en aquesta qüestió, hem desenvolupat MAMBA, una eina d'integració multiòmica dirigida per models i basada en la metodologia d'optimització matemàtica, que és capaç d'analitzar conjuntament metabolòmica no quantitativa amb un altre tipus d'òmica associada a gens, com per exemple la trascriptòmica. MAMBA va ser comparat amb altres mètodes existents quant a la capacitat de predcció de metabòlits i va ser aplicat al conjunt intern de dades multiòmiques. Aquest conjunt de dades multiòmiques va ser generat dins del projecte PROMETEO, en el qual està emmarcada aquesta tesi. Es demostra que MAMBA capturar la biologia coneguda sobre el nostre disseny experimental, a més de ser útil per derivar noves observacions i hipòtesis biològiques. En conjunt, aquesta tesi presenta eines útils per al camp de la biologia de sistemes, i que cobreixen tant el preprocessament de dades multiòmiques com la seua posterior anàlisi estadística integrativa. / [EN] Systems Biology research has expanded over the last years together with the development of omic technologies. The combination and simultaneous analysis of different kind of omic data allows the study of the connections and relationships between different cellular layers. Indeed, multiomic integration strategies provides a key source of knowledge about the cell as a system. The present Ph.D. thesis aims to study, develop and apply multiomic integration approaches to the field of systems biology. The still high cost of omics technologies makes it difficult for most laboratories to afford a complete multiomic study. However, the wide availability of omic data in public repositories allows the use of these already generated data. Unfortunately, the combination of omic data from different sources provokes the appearance of unwanted noise in data, known as batch effect. Batch effect impairs the correct integrative analysis of the data. Therefore, the use of so-called Batch Effect Correction Algorithms is necessary. As of today, there is a large number of such algorithms based on different statistical models and methods that correct batch effect and are part of the data pre-processing steps. However, the existing methods are not intended for multi-omics designs as they only allow the correction of the same type of omic data that must be measured across all batches. For this reason, we developed MultiBaC algorithm, which removes batch effect in multiomic designs, allowing the correction of data that are not measured across all batches. MultiBaC is based on PLS regression and ANOVA-SCA models and was validated and evaluated on different datasets. We also present MultiBaC as an R package to facilitate the use of this tool. Most existing multiomic integration approaches are multivariate methods based on latent space analysis. These methods are known as data-driven as they are based on the search for correlations to determine the relationships between the different variables. Data-driven methods require a large number of observations or samples to find robust and/or significant correlations among features. Unfortunately, in the molecular biology field, data sets with a large number of samples are not very common, again due to the high cost of generating omic data. As an alternative to data-driven methods, some multiomic integration strategies are based on model-driven approaches. These methods can be fitted with a smaller number of observations and are very useful for finding mechanistic relationships between different cellular components. However, model-driven methods require a priori information, which is usually a metabolic model of the organism under study. Currently, only transcriptomics and quantitative metabolomics have been successfully integrated using model-driven methods. Nonetheless, quantitative metabolomics is not very widespread and most laboratories generate non-quantitative or semi-quantitative metabolomics, which cannot be integrated with current methods. To address this issue, we developed MAMBA, a model-driven multiomic integration method that relies on mathematical optimization problems and is able to jointly analyze non-quantitative or semi-quantitative metabolomics with other types of gene-centric omic data, such as transcriptomics. MAMBA was compared to other existing methods in terms of metabolite prediction accuracy and was applied to a multiomic dataset generated within the PROMETEO project, in which this thesis is framed. MAMBA proved to capture the known biology of our experimental design and was useful for deriving new findings and biological hypotheses. Altogether, this thesis presents useful tools for the field of systems biology, covering both the pre-processing of multiomic datasets and their subsequent statistical integrative analysis. / Ugidos Guerrero, M. (2023). Statistical Methods Development for the Multiomic Systems Biology [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/193031 Biostatistics Computational biology Systems biology Molecular biology Biología computacional Bioestadística Biología de sistemas Biología molecular ESTADISTICA E INVESTIGACION OPERATIVA
7	Comparative study of the proteome of S. coelicolor M145 and S. lividans TK24, two phylogenetically closely related strains with very different abilities to accumulate TAG and produce antibiotics / Étude comparative du protéome de S. coelicolor M145 et S. lividans TK24, deux souches phylogénétiquement proches ayant des capacités très différentes à accumuler des TAG et à produire des antibiotiques / Estudio comparativo del proteoma de S. coelicolor M145 y S. lividans TK24, dos cepas filogenéticamente próximas con diferentes capacidades para acumular TAG y producir antibióticos Millán Oropeza, Aarón 23 June 2017 (has links) Les Streptomyces sont des bactéries filamenteuses du sol à Gram +. Elles sont connues pour leur capacité à produire des métabolites secondaires utiles en médecine et en agriculture. S. coelicolor et S. lividans sont des souches modèles phylogénétiquement proches. Elles ont cependant des capacités contrastées à accumuler des lipides de réserve de la famille des triacylglycérol (TAG) et produire des métabolites secondaires alors qu’elles possèdent des voies de biosynthèse similaires pour ces deux types de molécules. En présence de glucose, S. coelicolor produit des niveaux élevés de métabolites secondaires spécifiques et son contenu en TAG est faible alors que c'est le contraire chez S. lividans. En revanche, en présence de glycérol, les deux souches accumulent une quantité de TAG similaire mais S. coelicolor produit aussi des métabolites secondaires. Le but de la présente thèse était de déterminer les caractéristiques métaboliques différentielles qui sous-tendent les différentes capacités biosynthétiques de ces deux souches modèles. Pour ce faire, une analyse protéomique comparative sans marquage des souches cultivées en milieu R2YE liquide ou solide en présence de glucose ou de glycérol comme principales sources de carbone a été réalisée en utilisant la technique de chromatographie liquide couplée à de la Spectrométrie de Masse en tandem (LC-MS / MS). Au total, 2024 et 4372 protéines ont été identifiées à partir des cultures liquides et solides, représentant 24% et 50% du protéome théorique. Les études en liquide ont révélé que le métabolisme de S. lividans était principalement glycolytique alors que le métabolisme de S. coelicolor était principalement oxydatif. Elles ont également indiqué que ces caractéristiques pourraient être liées au catabolisme préférentiel des acides aminés par rapport au glucose chez S. coelicolor par rapport à S. lividans. De plus, cette thèse constitue la première analyse protéomique du métabolisme de ces deux souches modèles en présence de glycérol. / Streptomyces are filamentous Gram+ soil bacteria well known for their ability to produce secondary metabolites useful in medicine and agriculture. S. coelicolor and S. lividans are phylogenetically closely-related model strains but they have contrasted abilities to accumulate storage lipids of the TriAcylGlycerol (TAG) family and to produce secondary metabolites whereas they possess similar pathways for the biosynthesis of these molecules. In the presence of glucose, S. coelicolor produces high levels of specific secondary metabolites and its TAG content is low whereas it is the opposite for S. lividans. In contrast, in the presence of glycerol, the two strains accumulated similar amount of TAG but S. coelicolor still produces secondary metabolites. The aim of the present thesis was to determine the differential metabolic features supporting such different biosynthetic abilities. To do so, a comparative label-free shotgun proteomic analysis of the strains grown in liquid or solid R2YE media with glucose or glycerol as main carbon sources was carried out using Liquid chromatography−tandem mass spectrometry (LC−MS/MS). A total of 2024 and 4372 proteins were identified in liquid and solid cultures, representing 24% and 50% of the theoretical proteome, respectively. These studies revealed that S. lividans metabolism was mainly glycolytic whereas S. coelicolor metabolism was mainly oxidative. They also suggested that these features might be related to the preferential catabolism of amino acids over glucose of S. coelicolor compared to S. lividans. Furthermore, this thesis constituted the first proteomic analysis of the metabolism of these two model strains in the presence of glycerol. / Streptomyces es un género de bacterias filamentosas Gram+ provenientes del suelo que son conocidas por su capacidad para producir metabolitos secundarios útiles en la medicina y agricultura. S. coelicolor y S. lividans son cepas modelo filogenéticamente próximas que presentan capacidades opuestas para acumular lípidos de reserva de la familia de los triglicéridos (TAG) y para producir metabolitos secundarios en tanto que ambas cepas poseen rutas metabólicas idénticas para la biosíntesis de éstas moléculas. En presencia de glucosa, S. coelicolor produce altos niveles de metabolitos secundarios específicos y su contenido de TAG es bajo mientras que en S. lividans el comportamiento es opuesto. Sin embargo, en presencia de glicerol, ambas cepas acumulan cantidades similares de TAG y S. coelicolor produce metabolitos secundarios. El objetivo de ésta tesis fue de determinar las características metabólicas que distinguen las diferentes capacidades biosintéticas mencionadas previamente. Por esto, un análisis protéomico comparativo sin marcaje de tipo “shotgun” fue realizado con las dos cepas cultivadas en medio R2YE líquido y sólido usando glucosa o glicerol como fuentes principales de carbono mediante Cromatografía Líquida en “tándem” acoplada a Espectrometría de Masas (LC-MS/MS). Un total de 2024 y 4372 proteínas fueron identificadas en cultivos en medio líquido y sólido, representando 24% y 50% del proteoma teórico, respectivamente. El presente estudio demostró que el metabolismo de S. lividans fue principalmente glicolítico mientras que el metabolismo de S. coelicolor fue principalmente oxidativo. También se sugiere que éstas características pueden estar relacionadas con la preferencia catabólica de aminoácidos sobre el catabolismo de glucosa de S. coelicolor comparada con S. lividans. Además, la presente tesis constituye el primer análisis proteómico del metabolismo de éstas dos cepas modelo en presencia de glicerol. Streptomyces Antibiotiques Triacylglycérol (TAG) Métabolisme primaire et secondaire Protéomique Biologie de systèmes Streptomyces Antibiotics Triacylglycerol (TAG) Primary and secondary metabolism Proteomics Systems biology Streptomyces Antibióticos Triglicéridos (TAG) Metabolismo primario y secundario Proteómica Biología de sistemas
8	Integrative approaches to investigate the molecular basis of diseases and adverse drug reactions: from multivariate statistical analysis to systems biology Bauer-Mehren, Anna 08 November 2010 (has links) Despite some great success, many human diseases cannot be effectively treated, prevented or cured, yet. Moreover, prescribed drugs are often not very efficient and cause undesired side effects. Hence, there is a need to investigate the molecular basis of diseases and adverse drug reactions in more detail. For this purpose, relevant biomedical data needs to be gathered, integrated and analysed in a meaningful way. In this regard, we have developed novel integrative analysis approaches based on both perspectives, classical multivariate statistics and systems biology. A novel multilevel statistical method has been developed for exploiting molecular and pharmacological information for a set of drugs in order to investigate undesired side effects. Systems biology approaches have been used to study the genetic basis of human diseases at a global scale. For this purpose, we have developed an integrated gene-disease association database and tools for user-friendly access and analysis. We showed that modularity applies for mendelian, complex and environmental diseases and identified disease-related core biological processes. We have constructed a workflow to investigate adverse drug reactions using our gene-disease association database. A detailed study of currently available pathway data has been performed to evaluate its applicability to build network models. Finally, a strategy to integrate information about sequence variations with biological pathways has been implemented to study the effect of the sequence variations onto biological processes. In summary, the developed methods are of immense practical value for other biomedical researchers and can aid to improve the understanding of the molecular basis of diseases and adverse drug reactions.A pesar de que existen tratamientos eficaces para las enfermedades, no hay todavía una cura o un tratamiento efectivo para muchas de ellas. Asimismo los medicamentos pueden ser ineficaces o causar efectos secundarios indeseables. Por lo tanto, es necesario investigar en profundidad las bases moleculares de las enfermedades y de los efectos secundarios de los medicamentos. Para ello, es necesario identificar y analizar de forma integrada los datos biomédicos relevantes. En este sentido, hemos desarrollado nuevos métodos de análisis e integración de datos biomédicos que van desde el análisis estadístico multivariante a la biología de sistemas. En primer lugar, hemos desarrollado un nuevo método estadístico multinivel para la explotación de la información molecular y farmacológica de un conjunto de drogas a fin de investigar efectos secundarios no deseados. Luego, hemos usado métodos de biología de sistemas para estudiar las bases genéticas de enfermedades humanas a escala global. Para ello, hemos integrado en una base de datos asociaciones entre genes y enfermedades y hemos desarrollado herramientas para el fácil acceso y análisis de los datos. Mostramos que las enfermedades mendelianas, complejas y ambientales presentan modularidad e identificamos los procesos biológicos relacionados con dichas enfermedades. Hemos construido una herramienta para investigar las reacciones adversas a los medicamentos basada en nuestra base de datos de asociaciones entre genes y enfermedades. Realizamos un estudio detallado de los datos disponibles sobre los procesos biológicos para evaluar su aplicabilidad en la construcción de modelos dinámicos. Por último, desarrollamos una estrategia para integrar la información sobre las variaciones de secuencia de genes con los procesos biológicos para estudiar el efecto de dichas variaciones en los procesos biológicos. En resumen, los métodos presentados en esta tesis constituyen una herramienta valiosa para otros investigadores y pueden ayudar a mejorar la comprensión de las bases moleculares de las enfermedades y de las reacciones adversas a los medicamentos. redes biológicas procesos biológicos análisis de redes asociaciones entre genes y enfermedades efectos adversos a medicamentos análisis estadístico multivariante investigación biomédica biología de enfermedades biología de sistemas integración de datos biología computacional bioinformática drug safety signal genetic origin of disease network biology biological pathway gene-disease associations multivariate statistical analysis adverse drug reactions disease biology biomedical research systems biology data integration computational biology bioinformatics 57
9	Engineering post-transcriptional regulation of gene expression with RNA-binding proteins Dolcemascolo, Roswitha 23 January 2024 (has links) [ES] La biología sintética tiene como objetivo diseñar y construir nuevos sistemas biológicos con funciones deseadas. Los circuitos basados en el control transcripcional han tenido preponderancia en este campo tras el trabajo pionero del toggle switch y del repressilator. Sin embargo, para avanzar en la creación de tecnologías transformadoras que utilicen circuitos genéticos sintéticos, es esencial una combinación de mecanismos de control confiables en todo el flujo de la información genética. Esta combinación es necesaria para alcanzar el nivel de integrabilidad y complejidad funcional observado en la naturaleza. En tal sentido, recientemente han ganado atención los circuitos basados en regulación postranscripcional. En particular, se ha aprovechado la gran programabilidad de ARN para crear circuitos reguladores para la biodetección de señales ambientales o para controlar la vía metabólica en la bioproducción. En esta tesis, por el contrario, proponemos explotar las proteínas de unión a ARN para diseñar circuitos sintéticos que operen a nivel de traducción en la bacteria Escherichia coli. Esta tesis pretende estudiar como surge y se propaga el ruido cuando la expresión genética está regulada por un factor de traducción, y la ampliación de la caja de herramientas de la biología sintética con una nueva caracterización de proteínas de unión a ARN adecuadas. Por un lado, hemos diseñado un circuito de control postrancripcional utilizando la proteína de cápside del fago MS2. Mediante una meticulosa monitorización a nivel unicelular tanto del regulador como del gen regulado, hemos cuantificado el comportamiento dinámico del sistema, así como su estocasticidad. Si bien los esfuerzos anteriores se centraron en comprender la propagación del ruido en las regulaciones transcripcionales, el comportamiento estocástico de los genes regulados a nivel de la traducción sigue siendo en gran medida desconocido. Nuestros datos han revelado que un factor de traducción de proteínas ha permitido una fuerte represión a nivel unicelular, ha amortiguado la propagación del ruido de un gen a otro y ha conducido a una sensibilidad no lineal a las perturbaciones globales en la traducción. Estos descubrimientos han mejorado significativamente nuestra comprensión de la expresión genética estocástica y han proporcionado principios de diseño fundamentales para aplicaciones de biología sintéticas. Por otro lado, aprovechamos el motivo de reconocimiento de ARN (RRM), el dominio proteico de unión a ARN mas prevalente en la naturaleza, a pesar de su predominio en los filos eucariotas, para diseñar un sistema de control postranscripcional ortogonal en Escherichia coli. Aprovechando la proteína de unión a ARN de mamífero Musashi-1, que contiene dos RRM canónicos, desarrollamos un circuito sofisticado. Musashi-1 ha funcionado como represor de la traducción alostérico a través de su interacción especifica con la región codificante N-terminal del ARN mensajero, mostrando capacidad de respuesta a los ácidos grasos. La caracterización integral tanto a nivel poblacional como unicelular ha destacado un cambio significativo en la expresión del reportero. Se obtuvieron conocimientos moleculares a través de la cinética de unión in vitro y evaluaciones de funcionalidad in vivo de una serie de mutantes de ARN. Este trabajo ha mostrado la adaptabilidad de la regulación basada en RRM a organismos mas simples, introduciendo una nueva capa regulatoria para el control de la traducción en procariotas y, en ultima instancia, ampliando los horizontes de la manipulación genética. / [CA] La biologia sintètica té per objectiu dissenyar i construir nous sistemes biològics amb funcions desitjades. Els circuits basats en el control transcripcional han tingut preponderancia en aquest camp després del treball pioner del toggle switch i del repressilator. Tot i això, per avançar en la creació de tecnologies transformadres que utilitzin circuits genètics sintètics, és esencial una combinació de mecanismes de control fiables en tot el flux de la información genètica. Aquesta combinació és necessària per assolir el nivel d'integrabilitat i complexitat funcional observat a la natura. En aquest sentit, recentement han guanyat atenció els circuits basats en regulació posttranscripcional. En particular, s'ha aprofitat la gran programabilitat d'ARN per crear circuits reguladors per a la biodetecció de senyals ambientals o per controlar la via metabólica a la bioproducció. En aquesta tesi, per contra, proposem exlotar les proteïnes d'unió a ARN per dissenyar circuits sintètics que operin a nivel de traducció al bacteri Escherichia coli. Aquesta tesi pretén estudiar com sorgeix i es propaga el soroll quan l'expressió genètica està regulada per un factor de traducció, il'ampliació de la caixa d'eines de la biología sintètica amb una nova caracteriació de proteïnes d'unió a ARN adequades. D'una banda, hem dissenyat un circuit de control postranscripcional utilitzant la proteína de càpsid del fag MS2. Mitjançant una meticulosa monitorització a nivel inucel·lular tant del regulador com del gen regulat, hem quantificat el comportament dinàmic del sistema, així com la seva estocasticitat. Tot i que els esforços anteriors es van centrar a comprendre la propagació del soroll en les regulacions transcripcionals, el comportament estocàstic dels gens regulats a nivell de la traducció continua sent en gran mesura desonegut. Les nostres dades han revelat que un factor de traducció de proteïnes ha permès una forta repressió a nivell unicel·lular, ha esmorteït la propagació del soroll d'un gen a un altre i ha conduït a una sensibilitat no lineal a les pertorbacions globals a la traducció. Aquest descobriments han millorat significativament la nostra comprensió de l'expressió genètica estocástica i han proporcionat principis de sisseny fonamentals per a aplicacions de biología sintètiques. D'altra banda, aprofitem el motiu de reconeixement d'ARN (RRM), el domini proteic d'unió a ARN més prevalent a la natura, malgrat el seu predomini als talls eucariotes, per dissenyar un sistema de control posttranscripcional ortogonal a Escherichia coli. Aprofitant la proteína d'unió a ARN de mamífers Musashi-1, que conté dos RRM canònics, hem desenvolupat un circuit sofisticat. Musashi-1 va funcionar com un repressor de la traducció al·lostèric a través de la seva interacció específica amb la regió codificant N-terminal de l'ARN missatger, mostrant capacitat de resposta als àcids grassos. La caracterització integral tant a nivel poblacional com unicèl·lular va destacar un canvi significatiu a l'expressió de l'informador. S'obtingueren coneixements moleculars a través de la cinètica d'unió in vitro i avaluacions de funcionalitat in vivo d'una sèrie de mutants d'ARN. Aquest treball va mostrar l'adaptabilitat de la regulació basada en RRM a organismos més simples, introduint una nova capa regulatòria per al control de la traducció en procariotes i, en darrer terme, ampliant els horitzons de la manipulació genètica. / [EN] Synthetic biology seeks to design and construct new biological systems with desired functions. Circuits based on transcriptional control have been preponderant in the field following the pioneering work of the toggle switch and repressilator. However, to advance the creation of transformative technologies using synthetic genetic circuits, a blend of dependable control mechanisms throughout the genetic information flow is essential. This combination is necessary to attain the level of integrability and functional complexity observed in nature. In this regard, circuits based on post-transcriptional regulation have recently gained attention. In particular, the great programmability of RNA has been exploited to create regulatory circuits for biosensing of environmental signals or for controlling metabolic pathway in bioproduction. In this thesis, in contrast, we propose to exploit RNA-binding proteins to engineer synthetic circuits that operate at the level of translation in the bacterium Escherichia coli. This thesis intends to study how noise emerges and propagates when gene expression is regulated by a translation factor, and the expansion of the synthetic biology toolbox with new characterization of suitable RNA-binding proteins. On the one hand, we engineered a post-transcriptional control circuit using the phage MS2 coat protein. Through meticulous single-cell level monitoring of both the regulator and the regulated gene, we quantified the dynamic behavior of the system, as well as their stochasticity. While previous efforts focused on understanding noise propagation in transcriptional regulations, the stochastic behavior of genes regulated at the translation level remain largely unknown. Our data revealed that a protein translation factor enabled strong repression at the single-cell level, buffered noise propagation from gene to gene, and led to a nonlinear sensitivity to global perturbations in translation. These findings significantly enhanced our understanding of stochastic gene expression and provided foundational design principles for synthetic biology applications. On the other hand, we harnessed the RNA recognition motif (RRM), the most prevalent RNA-binding domain in nature, despite its predominance in eukaryotic phyla, to engineer an orthogonal post-transcriptional control system in Escherichia coli. Leveraging the mammalian RNA-binding protein Musashi-1, which contains two canonical RRMs, we developed a sophisticated circuit. Musashi-1 functioned as an allosteric translation repressor through its specific interactions with the N-terminal coding region of messenger RNA, exhibiting responsiveness to fatty acids. Comprehensive characterization at both population and single-cell levels highlighted a significant fold change in reporter expression. Molecular insights were gleaned through in vitro binding kinetics and in vivo functionality assessments of a series of RNA mutants. This work showcased the adaptability of RRM-based regulation to simpler organisms, introducing a novel regulatory layer for translation control in prokaryotes, ultimately expanding the horizons of genetic manipulation. / Dolcemascolo, R. (2023). Engineering post-transcriptional regulation of gene expression with RNA-binding proteins [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/202194 Systems biology Genetic circuits Mathematical modeling Protein-RNA interaction Post-transcriptional regulation Binding kinetics Dynamic systems RNA recognition motif Synthetic biology Biología de sistemas Biología sintética Sistemas dinámicos Cinética de unión Regulación postranscripcional Interacción proteína-ARN Modelización matemática Circuitos genéticos Motivo de reconocimiento de ARN

Search results