Return to search

Predicting employee attrition with machine learning on an individual level, and the effects it could have on an organization / Predicera uppsägninar på en individuell nivå med machine learning, och effekterna det kan ha på en organisation

This paper is investigating the possibility to predict employee attrition on an individual level with machine learning. The study is divided into two parts, one qualitative part which were conducted by doing interviews with selected roles where the openness to which practitioners are willing to use machine learning models to predict employee attrition, and what effects such a model could have on an organization was investigated. The second part is a quantitative part where a random forest model, support vector machine model and a logistic regression model are compared in terms of accuracy in predicting employee attrition with the usage of large human resource data sets. Firstly, it was shown that people are willing to use machine learning models to predict employee attrition if the models were to be trusted, and if organizations that used such models were transparent in how the models were used, and to what purpose. The model comparison did not give any interesting results about the possibility to predict employee attrition with the chosen models. There were several reasons for that, where some of them were that the models were over fitted, the time of notice when a person quit was not accounted for enough and the choice of input data points. This resulted in that the accuracy could not be determined in a confident way. / Den här rapporten undersöker möjligheten att kunna förutse uppsägningar på en individuell nivå med hjälp av machine learning och vad utövare tycker om att använda sådana modeller. Den här avhandlingen är uppdelad i två delar. Den första är en kvalitativ del där intervjuer har gjorts för att undersöka öppenheten hos utövare som ska använda eller användas av en sådan modell, samt att undersöka vad folk tror att en sådan modell kan bidra med till organisationen. Den andra delen är en kvantitativ del där en random forest modell, en support vector machine modell och en logistisk regressionsmodell har ställts mot varandra för att titta vilken modell som kan predicera uppsägningar baserat på medarbetsundersökningar. För det första så visades det att utövare är öppna för att använda machine learning för att predicera uppsägningar så länge modellerna som används kan litas på. Dessutom visade det sig att transparens från organisationer som använder sig av sådana modeller är viktigt, där tydighet i hur modellen används och varför och vad den används till måste kommuniceras. Av den andra delen, där de tre modellerna ställdes mot varandra, visade det sig att det var svårt att predicera uppsägningar baserat på medarbetsundersökningar. Det gick inte med säkerhet att visa att den träffsäkerheten som uppnåddes faktiskt betyder något väsentligt utan istället så visade det sig att det fanns problem som gjorde att resultaten inte blev som förväntat. Dessa problem var bland annat över fitting, uppsägningstid togs inte med i beräkningarna tillräckligt mycket, och valet av input data visade sig inte vara bra nog.

Identiferoai:union.ndltd.org:UPSALLA1/oai:DiVA.org:kth-279652
Date January 2020
CreatorsNorrman, Fredrik
PublisherKTH, Skolan för industriell teknik och management (ITM)
Source SetsDiVA Archive at Upsalla University
LanguageEnglish
Detected LanguageSwedish
TypeStudent thesis, info:eu-repo/semantics/bachelorThesis, text
Formatapplication/pdf
Rightsinfo:eu-repo/semantics/openAccess
RelationTRITA-ITM-EX ; 2020:298

Page generated in 0.0019 seconds