• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 1
  • Tagged with
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

Exploratory Analysis of Isoelectric Point Prediction with Simple Feature Encoding / En explorativ analys av algoritmer för beräkning av peptiders isoelektriska punkter med enkel enkodering av molekylära komponenter

Söderhielm, Henrik January 2022 (has links)
Proteomics is the large scale study of proteins in biological systems such as those found in human cells. The understanding of proteomes, i.e. the complete set of proteins expressed by an organism, has especially useful applications in the medical field such as genetic research and drug discovery. Cells that undergo biochemical processes affect the state of the contained proteins, therefore producing an abundance of physical variations and permutations of single proteins. The main goal of proteomic studies is to identify the proteins related to such processes in order to study their purpose and function. Successful reduction of the so-called "search space" in which proteins are identified, is a large determining factor in the resulting number of correct protein identifications. Fractionation processes attempt to reduce this search space through electrophoretic experiments such as IEF in order to identify individual protein properties such as the isoelectric point. Protein sample preparation relies heavily on isoelectric point values, denoted $p$I, and hence accurate theoretical prediction of these values would provide a benchmark to aid in analytical processes such as LC-MS. This dissertation explores the efficacy of using simple feature encoding to improve upon conventional theoretical $p$I predictions, based on the Henderson-Hasselbalch equation, in order to more accurately reflect experimental values. Simple feature encoding was used for two different optimisation techniques. Encoding chargeable amino acid residues in peptide sequences into various $k$-mer combinations produced a considerable improvement in predicted $p$I values compared to prediction solely based on reference $p$K$_a$ values. The approaches taken in this project highlighted, arguably at a fundamental level, the useful nature of peptide feature encoding to improve theoretical $p$I predictions. However, future research endeavours should consider extending the models discussed using more developed and complex modelling techniques for peptide sequences and more importantly, $p$K$_a$ constants. / Proteomik är en gren av biologin som omfattar den storskaliga forskning av proteiner i biologiska system som till exempel de som befinner sig i mänskliga celler. Proteomet utgörs av samtliga former av proteinmolekyler som uttrycks av genomet av en organism. Förståelsen av proteomet har brukbar användning inom medicinsk forskning såsom genetik- och läkemedelsforskning. Celler som genomgår biokemiska processer påverkar molekylernas tillstånd och struktur som i sin följd producerar en mångfald av permutationer och variationer av enskilda proteiner. Målet med proteomiska studier är att identifiera olika proteiner och relatera dessa till biologiska processer för att förstå deras funktion och syfte. Minskning av den så kallade sökrymden för proteiner avgör till stor del antalet korrekta identiferingar som tas fram. Sökrymden kan minskas med hjälp av fraktioneringsprocesser som använder sig av elektroforetiska metoder för att preparera proteinprover inför analys. Sådana processer som exempelvis Isoelektrisk Fokusering (IEF) fysiskt separerar proteinmolekylerna för att identifiera egenskaper som deras Isoelektriska Punktvärde (pI). Preparation av proteinprov förlitar sig till stor del på precisionen av teoretiskt beräknade pI värden. Det är därmed önskvärt att kunna beräkna pI värden som motsvarar observerade resultat från fraktioneringsprocesser. Förbättring av de teoretiskt beräknade pI värden gör det möjligt att förenkla analytiska processer som LC-MS. Det här projektet undersöker effektiviteten av enkodering av peptidattribut för att förbättra de beräknade pI värden jämfört med de konventionella beräkningarna baserat på Henderson-Hasselbalch ekvationen och pKa referensvärden. Enkodering av peptidattribut användes i samband med två olika optimeringsmodeller. Aminosyrorna från peptidsekvenserna separerades och enkoderas till olika k-mer undersekvenser som användes för anpassning av pKa referensvärden. Optimering av pKa referensvärden skapade en avsevärd förbättring i de beräknade pI värden jämfört med estimering enbart baserat på pKa referensvärden. De valda tillvägagångssätten visade att enkodering av peptidernas beståndsdelar markant förbättrar de beräknade pI värden på en grundläggande nivå. Framtida projekt borde överväga utbyggnaden av de diskuterade modellerna för att kunna fånga mer attribut från peptidsekvenserna för anpassning av pKa referensvärden och därmed förbättra beräkningen av pI värden.

Page generated in 0.0282 seconds