Return to search

Improved Differential Diagnostics Using Methods in Machine Learning and Regression / Förbättrad differentialdiagnostik med metoder inom maskininlärning och regression

There is a desire both from the patient and the society to have efficient tools for differential diagnostics. Mathematical relationships between diseases and observable consequences are defined in the thesis. Specifically artificial neural networks are considered in the modeling of the doctor’s methodology. To suggest further lab tests or symptoms to look for the network is inverted by looking at a minimization problem where the objective function gradient can be analytically calculated. Due to difficulties in obtaining real life medical data a program was constructed to generate artificial patient data sets. These data sets will be used to establish proof of concepts. Some data set quality measures are defined and used to model the network accuracy and training time. It is then estimated that a problem with 4000 diagnoses and 20 000 observable consequences would require 200 000 patients to obtain a classification accuracy of 99% with a training time of 50 hours depending on the computational power. Overall the solution strategy seems promising but studies on real life data is required for definitive answers. / Det finns ett behov från både patienten och samhället att ha effektiva verktyg för differentialdiagnostik. Matematiska förhållanden mellan sjukdomar och ob-serverbara konsekvenser definieras i uppsatsen. Specifikt så används artificiella neuronnät i modelleringen av läkarens metodik. För att föreslå ytterligare labprover eller symptom att leta efter inverteras nätverket genom att studera ett minimeringsproblem där målfunktionens gradient kan beräknas analytiskt. På grund av svårigheter i att erhålla verklig medicinsk data konstruerades ett program för att generera artificiell patientdata. Denna patientdata kommer att användas för att etablera bevis på koncept. Några mått på kvalitén av patientdata definieras och används för att modellera nätverkets noggrannhet och träningstid. Det uppskattas sedan att ett problem med 4000 diagnoser och 20 000 observerbara konsekvenser skulle kräva 200 000 patienter för att uppnå en klassificeringsnoggrannhet på 99%med en träningstid på 50 timmar beroende på beräkningskraften. I helhet verkar lösningsstrategin lovande men studier på verklig data krävs för definitiva svar.

Identiferoai:union.ndltd.org:UPSALLA1/oai:DiVA.org:kth-240083
Date January 2018
CreatorsAndblom, Mikael
PublisherKTH, Optimeringslära och systemteori
Source SetsDiVA Archive at Upsalla University
LanguageEnglish
Detected LanguageSwedish
TypeStudent thesis, info:eu-repo/semantics/bachelorThesis, text
Formatapplication/pdf
Rightsinfo:eu-repo/semantics/openAccess
RelationTRITA-SCI-GRU ; 2018:433

Page generated in 0.002 seconds