I detta arbete studeras möjligheten att förbättra en metod för analys av biologiska sekvenser. En på senare tid populär metod för sekvensanalys är baserad på Hidden Markov models (HMM). HMM har haft stora framgångar i att modellera biologisk data, såsom proteinfamiljer, men används även inom bland annat taligenkänning. Existerande problem med HMM är bland annat långa träningstider och oförmåga att finna globala lösningsoptima. En metod för att försöka effektivisera träningsfasen hos en HMM presenteras och utvärderas. Denna är avsedd för att undersöka om modeller som på förhand kan initieras med hjälp av förkunskap i problemdomänen får lika bra klassificeringsförmåga som modeller som tränas på konventionellt sätt. Metoden tillämpas på två proteinfamiljer av relativt olika karaktär. Resultaten utvisar att prestandan hos de olika modellerna inte direkt kan kopplas till effekten av metoden utan är mycket beroende av proteinets karaktär.
Identifer | oai:union.ndltd.org:UPSALLA1/oai:DiVA.org:his-154 |
Date | January 1998 |
Creators | Fryer, Daniel |
Publisher | Högskolan i Skövde |
Source Sets | DiVA Archive at Upsalla University |
Language | Swedish |
Detected Language | Swedish |
Type | Student thesis, info:eu-repo/semantics/bachelorThesis, text |
Format | application/postscript, application/pdf |
Rights | info:eu-repo/semantics/openAccess, info:eu-repo/semantics/openAccess |
Page generated in 0.0017 seconds