Return to search

Data Mining for Description and Prediction of Antibiotic Treated Healthcare-Associated Infections / Data mining för beskrivning och förutsägelse av antibiotikabehandlade vårdrelaterade infektioner

Healthcare-associated infections is the most common healthcare related injury and affect almost every tenth patient. With the purpose of reducing these infections Infektionsverktyget, The Anti-Infection Tool, was developed for registration and feedback of infection data. The tool is now used in all Swedish county councils resulting in a wealth of data. The purpose of this thesis was thus to investigate how data mining can be applied to describe patterns in this data and predict patient outcomes regarding healthcare-associated infections that need to be treated with antibiotics. Data mining was performed with Microsoft SQL Server 2008 in which models based on six different data mining algorithms with different parameter settings were developed. They used the attributes gender, age and previous diagnoses and medical actions as inputs and antibiotic treated healthcare-associated infection outcome as output. The predictive performance of the models was evaluated using 5-fold cross validation and macro averaged measures of recall, precision and F-measure. Patterns generated by selected models were extracted. Models based on the Naive Bayes algorithm showed the highest predictive capabilities with respect to recall and models based on the Decision Trees algorithm with low pruning had the highest precision. Although, none were considered to perform sufficiently well and several areas of improvement were identified. The most important factor in the inadequate performance is believed to be the relatively rare occurrences of infections in the dataset. Extracted patterns based on the Association Rules algorithm were considered the easiest to interpret. Patterns included clinically valid and invalid as well as trivial relationships. Future studies should be focused on further model improvements and gathering of more patient data. The idea is that data mining in Infektionsverktyget in the future could be used both to provide ideas for further medical research and to identify risk patients and prevent healthcare-associated infections in daily clinical work. / Vårdrelaterade infektioner är den vanligaste vårdskadan och drabbar nästan var tionde patient. Med syfte att minska antalet vårdrelaterade infektioner utvecklades Infektionsverktyget för registrering och återkoppling av infektionsdata. Verktyget används nu i alla Sveriges landsting vilket resulterar i stora mängder data. Syftet med detta examensarbete var därför att undersöka hur data mining kan användas för att beskriva mönster i denna data och för att förutsäga om patienter kommer att drabbas av en vårdrelaterad infektion som behöver antibiotikabehandlas. Data mining genomfördes med Microsoft SQL Server 2008 där modeller baserade på sex olika data mining-algoritmer med olika parameterinställningar utvecklades. De hade inputattributen kön, ålder och tidigare diagnoser och medicinska åtgärder, och outputattributet utfall av antibiotikabehandlad vårdrelaterad infektion. Förutsägelseförmågan hos modellerna utvärderades med 5-delad korsvalidering och makrogenomsnitt av måtten recall, precision och F-measure. Fyra modeller användes även för att ta fram mönster ur datamängden. Modeller baserade på Naive Bayes-algoritmen hade den bästa förutsägelseförmågan med avseende på recall och modeller baserade på Decision Trees-algoritmen med en låg beskärningsnivå uppnådde bäst precision. Trots detta ansågs ingen av modellerna prestera tillräckligt bra och flera möjliga förbättringsområden hittades. Den viktigaste anledningen till den otillräckliga förutsägelseförmågan tros vara att infektioner är relativt ovanliga i datamängden. Mönster som tagits fram med Association Rules-algoritmen ansågs vara lättast att tolka. Mönstren innehöll både kliniskt relevanta och irrelevanta såväl som triviala samband. Framtida studier bör fokuseras på att förbättra modellerna ytterligare och att samla in mer patientdata. Idén är att data mining i Infektionsverktyget i framtiden skulle kunna användas för att ge uppslag till medicinsk forskning och för att identifiera riskpatienter och därmed förebygga vårdrelaterade infektioner i den dagliga kliniska verksamheten.

Identiferoai:union.ndltd.org:UPSALLA1/oai:DiVA.org:kth-154200
Date January 2014
CreatorsDamberg, Emmy
PublisherKTH, Skolan för teknik och hälsa (STH)
Source SetsDiVA Archive at Upsalla University
LanguageEnglish
Detected LanguageSwedish
TypeStudent thesis, info:eu-repo/semantics/bachelorThesis, text
Formatapplication/pdf
Rightsinfo:eu-repo/semantics/openAccess
RelationTRITA-STH ; 2014: 89

Page generated in 0.0023 seconds