Return to search

A Deep Learning Approach to Predicting Diagnosis Code from Electronic Health Records / Djupinlärning för prediktion av diagnoskod utifrån elektroniska patientjournaler

Electronic Health Record (EHR) is an umbrella term encompassing demographics and health information of a patient from many different sources in a digital format. Deep learning has been used on EHRs in many successful studies and there is great potential in future implementations. In this study, diagnosis classification of EHRs with Multi-layer Perceptron models are studied. Two MLPs with different architectures are constructed and run on both a modified version of the EHR dataset and the raw data. A Random Forest is used as baseline for comparison. The MLPs are not successful in beating the baseline, with the best-performing MLP having a classification accuracy of 48.1%, which is 13.7 percentage points lower than that of the baseline. The results indicate that when the dataset is small, this approach should not be chosen. However, the dataset is growing over time and thus there is potential for continued research in the future. / Elektronisk patientjournal (EHR) är ett paraplybegrepp som används för att beskriva en digital samling av demografisk och medicinsk data från olika källor för en patient. Det finns stor potential i användandet av djupinlärning på dessa journaler och många framgångsrika studier har redan gjorts på området. I denna studie undersöks diagnosklassificering av elektroniska patientjournaler med Multi-layer perceptronmodeller. Två MLP-modeller av olika arkitekturer presenteras. Dessa körs på både en anpassad version av EHR-datamängden och på den råa EHR-datan. En Random Forest-modell används som baslinje för jämförelse. MLP-modellerna lyckas inte överträffa baslinjen, då den bästa MLP-modellen ger en klassifikationsnoggrannhet på 48,1%, vilket är 13,7 procentenheter mindre än baslinjens. Resultaten visar att en liten datamängd indikerar att djupinlärning bör väljas bort för denna typ av problem. Datamängden växer dock över tid, vilket gör områdetattraktivt för framtida studier.

Identiferoai:union.ndltd.org:UPSALLA1/oai:DiVA.org:kth-240599
Date January 2018
CreatorsHåkansson, Ellinor
PublisherKTH, Skolan för elektroteknik och datavetenskap (EECS)
Source SetsDiVA Archive at Upsalla University
LanguageEnglish
Detected LanguageSwedish
TypeStudent thesis, info:eu-repo/semantics/bachelorThesis, text
Formatapplication/pdf
Rightsinfo:eu-repo/semantics/openAccess
RelationTRITA-EECS-EX ; 2018:634

Page generated in 0.0019 seconds