Transcription factors (TFs) are key regulatory proteins that regulate transcriptionthrough precise, but highly variable binding events to cis-regulatory elements.The complexity of their regulatory patterns makes it difficult to determinethe roles of different TFs, a task which the field is still struggling with.Experimental procedures for this purpose, such as knock out experiments, arehowever costly and time consuming, and with the ever-increasing availabilityof sequencing data, computational methods for inferring the activity of TFsfrom such data have become of great interest. Current methods are howeverlacking in several regards, which necessitates further exploration of alternatives. A novel tool for estimating the activity of individual TFs over time fromlongitudinal mRNA expression data was in this project therefore put togetherand tested on data from Mus musculus liver and brain. The tool is based onprincipal component analysis, which is applied to data subsets containing theexpression data of genes likely regulated by a specific TF to acquire an estimationof its activity. Though initial tests on 17 selected TFs showed issues withunspecific trends in the estimations, further testing is required for a statementon the potential of the estimator. / Transcriptionsfaktorer (TFer) är viktiga regulatoriska protein som reglerar transkriptiongenom att binda till cis-regulatoriska element på precisa, menmycketvarierande vis. Komplexiteten i deras regulatoriska mönster gör det svårt attavgöra vilka roller olika TFer har, vilket är en uppgift som fältet fortfarandebrottas med. Experimentella procedurer i detta syfte, till exempel "knockout"experiment, är dock kostsamma och tidskrävande, och med den evigt ökandetillgången på sekvenseringsdata har metoder för att beräkna TFers aktivitetfrån sådan data fått stort intresse. De beräkningsmetoder som finns idag bristerdock på flera punker, vilket erfordrar ett fortsatt sökande efter alternativ. Ett nytt vektyg för att upskatta aktiviteten hos individuella TFer över tidmed hjälp av longitunell mRNA-uttrycksdata utvecklades därför i det här projektetoch testades på data från Mus musculus lever och hjärna. Verktyget ärbaserat på principalkomponentsanalys, som applicerades på set med uttrycksdatafrån gener sannolikt reglerade av en specifik TF för att erhålla en uppskattningav dess aktivitet. Trots att de första testerna för 17 utvalda TFer påvisadeproblem med ospecifika trender i upskattningarna krävs forsatta tester för attkunna ge ett tydligt svar på vilken potential estimatorn har.
Identifer | oai:union.ndltd.org:UPSALLA1/oai:DiVA.org:kth-278693 |
Date | January 2020 |
Creators | Jangerstad, August |
Publisher | KTH, Skolan för kemi, bioteknologi och hälsa (CBH) |
Source Sets | DiVA Archive at Upsalla University |
Language | English |
Detected Language | Swedish |
Type | Student thesis, info:eu-repo/semantics/bachelorThesis, text |
Format | application/pdf |
Rights | info:eu-repo/semantics/openAccess |
Relation | TRITA-CBH-GRU ; 2020:161 |
Page generated in 0.0026 seconds