Return to search

Towards Causal Discovery on EHR data : Evaluation of current Causal Discovery methods on the MIMIC-IV data set / Mot Orsaksupptäckt på Elektroniska Patientjournaler : Utvärdering av befintliga metoder för orsaksupptäckt på MIMIC-IV databas

Causal discovery is the problem of learning causal relationships between variables from a set of data. One interesting area of use for causal discovery is the health care domain, where application could help facilitate a better understanding of disease and treatment mechanisms. The health care domain has recently undergone a major digitization, making available a large amount of data for use in learning algorithms, available in formats such as medical images or electronic health records. This thesis aims to explore the application of causal discovery on electronic health record data. We provide an overview of the field of causal discovery and identify 3 contemporary methods for causal discovery on time-series data which we apply on a preprocessed version of the MIMIC-IV data set. Each causal discovery method is run on time-series comprising of electronic health record data related to hospital stays for patients with sepsis. We provide an empiric report of the overlap between the learned graphs from different hospital stays as a heuristic evaluation measure. We find that it is possible to identify common themes in the learned graphs between different causal discovery methods, indicating potential practical value of causal discovery on electronic health record data. We also identify important considerations for future application and evaluation, such as incorporating extensive domain knowledge, and provide suggestions for future work. / Kausal upptäckt är problemet med att lära sig orsakssamband mellan variabler från en uppsättning data. Ett intressant användningsområde för kausal upptäckt är hälso- och sjukvårdsdomänen, där tillämpning kan bidra till en bättre förståelse av sjukdomar och behandlingsmekanismer. Sjukvårdsdomänen har nyligen genomgått en stor digitalisering vilket gör en stor mängd data tillgänglig för användning i inlärningsalgoritmer, tillgänglig i format som medicinska bilder eller elektroniska patientjournaler. Denna avhandling syftar till att utforska tillämpningen av kausal upptäckt på elektroniska patientjournaler. Vi ger en översikt över området för kausal upptäckt och identifierar 3 samtida metoder för kausal upptäckt på tidsseriedata som vi tillämpar på en förbearbetad version av MIMIC-IV-datauppsättningen. Varje identifierad metod för kausal upptäckt körs på tidsserier som består av elektroniska patientjournaler relaterade till sjukhusvistelser för patienter med sepsis. Vi tillhandahåller en empirisk rapport över överlappningen mellan de inlärda graferna från olika sjukhusvistelser som ett heuristiskt utvärderingsmått. Vi finner att det är möjligt att identifiera gemensamma teman i de inlärda graferna mellan olika kausala upptäcktsmetoder, vilket indikerar potentiellt praktiskt värde av kausal upptäckt på elektroniska patientjournaler. Vi identifierar också viktiga överväganden för framtida tillämpning och utvärdering, såsom att integrera omfattande domänkunskap, och ger förslag för framtida arbete.

Identiferoai:union.ndltd.org:UPSALLA1/oai:DiVA.org:kth-321995
Date January 2022
CreatorsOlausson, Pontus
PublisherKTH, Skolan för elektroteknik och datavetenskap (EECS)
Source SetsDiVA Archive at Upsalla University
LanguageEnglish
Detected LanguageSwedish
TypeStudent thesis, info:eu-repo/semantics/bachelorThesis, text
Formatapplication/pdf
Rightsinfo:eu-repo/semantics/openAccess
RelationTRITA-EECS-EX ; 2022:816

Page generated in 0.0019 seconds