Global ETD Search

1	Big complexity in a minimal bacterium Güell Cargol, Marc 16 April 2010 (has links) With only 689 genes Mycoplasma pneumoniae (M. pneumoniae) is among the simplest known organisms. Because of this simplicity, mycoplasma represents an attractive organism for systems-wide analyses. Such approaches aiming at the whole quantitative understanding of an entire organism are expected to illustrate the basic principles of life. Strand-specific tiling arrays complemented by transcriptome sequencing, were combined with more than 252 spotted arrays to study M. pneumoniae transcriptional organization. An important presence of alternative transcripts (42%) within operons and a high frequency of antisense RNA (89) were detected. Metabolism was also studied in detail. A manually curated metabolic network allowed the definition of a minimal medium with 19 essential nutrients. This has been complemented with measurements of biomass indicators, metabolites and fluxes. Integration with transcriptional profiling has provided keys in the metabolic regulation. Protein organization and interactions have been addressed systematically by Tandem affinity purification-mass spectrometry (TAP-MS) in a proteome-wide screen. The biochemical analysis revealed 178 protein complexes which have been complemented by structural models, single-article electron microscopy and electron tomography. By integrating the datasets from these different approaches, we show that this small bacterium harbors an unexpected complexity with features such as the frequent occurrence of alternative transcripts and antisense RNA, a small but tightly controlled metabolic network and a high level of proteome organization. / Amb només 689 gens Mycoplasma pneumoniae es troba entre els organismes més simples que es coneixen. Degut a aquesta simplicitat, mycoplasma representa un organisme atractiu per dur a terme estudis a nivell genòmic. S'espera d'aquests treballs que pretenen descriure de manera quantitativa l'organisme sencer que ajudin a entendre els principis bàsics de la vida. Per tal l'estudiar amb profunditat del transcriptoma, s'ha fet ús d'una combinació de dades de "tiling arrays" amb especificitat de cadena, ultraseqüenciació i més de 252 microarrays. Després d'analitzar els resultats s'ha detectat una alta presència de transcrits alternatius (42%) dintre operons i una alt contingut de ARN de tipus "antisense" (89). També s'ha realitzat un estudi detallat del metabolisme. S'ha revisat i completat manualment el mapa metabòlic de M. pneumoniae, fet que ha permès el disseny d'un medi mínim amb l'ús de 19 ingredients essencials. El mapa s'ha completat amb diferents mesures d'indicadors de biomassa, metabòlits i fluxos. També s'ha estudiat la regulació de metabolisme mitjançant microarrays. Per altra banda, s'han mesurat sistemàticament les interaccions proteïna-proteïna mitjançant "Tandem affinity purification-mass spectrometry (TAP-MS)". Aquest anàlisis ha detectat 178 complexes diferents, els quals han estat complementats amb models estructurals, microscòpia electrònica i tomografia electrònica. Mitjançant la integració d'aquestes col·leccions de dades, es pot mostrar que aquest petit bacteri amaga un inesperada complexitat amb característiques com la freqüència de transcrits alternatius i ARN "antisense", una xarxa metabòlica petita però fortament controlada i una alta organització del proteoma. microbiologia biologia de sistemes ultraseqüènciació cèl.lula mínima metabolòmica proteòmica transcriptòmica mycoplasma microbiology systems biology ultrasequencing minimal cell proteomics metabolomics transcriptomics mycoplasma 57
2	Pathway-centric approaches to the analysis of high-throughput genomics data Hänzelmann, Sonja, 1981- 11 October 2012 (has links) In the last decade, molecular biology has expanded from a reductionist view to a systems-wide view that tries to unravel the complex interactions of cellular components. Owing to the emergence of high-throughput technology it is now possible to interrogate entire genomes at an unprecedented resolution. The dimension and unstructured nature of these data made it evident that new methodologies and tools are needed to turn data into biological knowledge. To contribute to this challenge we exploited the wealth of publicly available high-throughput genomics data and developed bioinformatics methodologies focused on extracting information at the pathway rather than the single gene level. First, we developed Gene Set Variation Analysis (GSVA), a method that facilitates the organization and condensation of gene expression proﬁles into gene sets. GSVA enables pathway-centric downstream analyses of microarray and RNA-seq gene expression data. The method estimates sample-wise pathway variation over a population and allows for the integration of heterogeneous biological data sources with pathway-level expression measurements. To illustrate the features of GSVA, we applied it to several use-cases employing diﬀerent data types and addressing biological questions. GSVA is made available as an R package within the Bioconductor project. Secondly, we developed a pathway-centric genome-based strategy to reposition drugs in type 2 diabetes (T2D). This strategy consists of two steps, ﬁrst a regulatory network is constructed that is used to identify disease driving modules and then these modules are searched for compounds that might target them. Our strategy is motivated by the observation that disease genes tend to group together in the same neighborhood forming disease modules and that multiple genes might have to be targeted simultaneously to attain an eﬀect on the pathophenotype. To ﬁnd potential compounds, we used compound exposed genomics data deposited in public databases. We collected about 20,000 samples that have been exposed to about 1,800 compounds. Gene expression can be seen as an intermediate phenotype reﬂecting underlying dysregulatory pathways in a disease. Hence, genes contained in the disease modules that elicit similar transcriptional responses upon compound exposure are assumed to have a potential therapeutic eﬀect. We applied the strategy to gene expression data of human islets from diabetic and healthy individuals and identiﬁed four potential compounds, methimazole, pantoprazole, bitter orange extract and torcetrapib that might have a positive eﬀect on insulin secretion. This is the ﬁrst time a regulatory network of human islets has been used to reposition compounds for T2D. In conclusion, this thesis contributes with two pathway-centric approaches to important bioinformatic problems, such as the assessment of biological function and in silico drug repositioning. These contributions demonstrate the central role of pathway-based analyses in interpreting high-throughput genomics data. / En l'última dècada, la biologia molecular ha evolucionat des d'una perspectiva reduccionista cap a una perspectiva a nivell de sistemes que intenta desxifrar les complexes interaccions entre els components cel•lulars. Amb l'aparició de les tecnologies d'alt rendiment actualment és possible interrogar genomes sencers amb una resolució sense precedents. La dimensió i la naturalesa desestructurada d'aquestes dades ha posat de manifest la necessitat de desenvolupar noves eines i metodologies per a convertir aquestes dades en coneixement biològic. Per contribuir a aquest repte hem explotat l'abundància de dades genòmiques procedents d'instruments d'alt rendiment i disponibles públicament, i hem desenvolupat mètodes bioinformàtics focalitzats en l'extracció d'informació a nivell de via molecular en comptes de fer-ho al nivell individual de cada gen. En primer lloc, hem desenvolupat GSVA (Gene Set Variation Analysis), un mètode que facilita l'organització i la condensació de perfils d'expressió dels gens en conjunts. GSVA possibilita anàlisis posteriors en termes de vies moleculars amb dades d'expressió gènica provinents de microarrays i RNA-seq. Aquest mètode estima la variació de les vies moleculars a través d'una població de mostres i permet la integració de fonts heterogènies de dades biològiques amb mesures d'expressió a nivell de via molecular. Per il•lustrar les característiques de GSVA, l'hem aplicat a diversos casos usant diferents tipus de dades i adreçant qüestions biològiques. GSVA està disponible com a paquet de programari lliure per R dins el projecte Bioconductor. En segon lloc, hem desenvolupat una estratègia centrada en vies moleculars basada en el genoma per reposicionar fàrmacs per la diabetis tipus 2 (T2D). Aquesta estratègia consisteix en dues fases: primer es construeix una xarxa reguladora que s'utilitza per identificar mòduls de regulació gènica que condueixen a la malaltia; després, a partir d'aquests mòduls es busquen compostos que els podrien afectar. La nostra estratègia ve motivada per l'observació que els gens que provoquen una malaltia tendeixen a agrupar-se, formant mòduls patogènics, i pel fet que podria caldre una actuació simultània sobre múltiples gens per assolir un efecte en el fenotipus de la malaltia. Per trobar compostos potencials, hem usat dades genòmiques exposades a compostos dipositades en bases de dades públiques. Hem recollit unes 20.000 mostres que han estat exposades a uns 1.800 compostos. L'expressió gènica es pot interpretar com un fenotip intermedi que reflecteix les vies moleculars desregulades subjacents a una malaltia. Per tant, considerem que els gens d'un mòdul patològic que responen, a nivell transcripcional, d'una manera similar a l'exposició del medicament tenen potencialment un efecte terapèutic. Hem aplicat aquesta estratègia a dades d'expressió gènica en illots pancreàtics humans corresponents a individus sans i diabètics, i hem identificat quatre compostos potencials (methimazole, pantoprazole, extracte de taronja amarga i torcetrapib) que podrien tenir un efecte positiu sobre la secreció de la insulina. Aquest és el primer cop que una xarxa reguladora d'illots pancreàtics humans s'ha utilitzat per reposicionar compostos per a T2D. En conclusió, aquesta tesi aporta dos enfocaments diferents en termes de vies moleculars a problemes bioinformàtics importants, com ho son el contrast de la funció biològica i el reposicionament de fàrmacs "in silico". Aquestes contribucions demostren el paper central de les anàlisis basades en vies moleculars a l'hora d'interpretar dades genòmiques procedents d'instruments d'alt rendiment. Functional Genomics Systems Biology Network Biology Microarray analysis RNA-seq Drug repurposing Diabetes Gene Set Enrichment Analysis Reverse-engineering of networks Genòmica funcional Biologia de sistemes Biologia de xarxes Anàlisi de microarray Seqüenciació d'ARN Reutilització de medicaments Diabetis Inferència de xarxes 577

Search results

Big complexity in a minimal bacterium

Pathway-centric approaches to the analysis of high-throughput genomics data