The objective of this thesis is to forecast the number of people registered at the Swedish Public Employment Service (Arbetsförmedlingen) that will manage to get employment each month and examine how accurate the forecasts are. The Swedish Public Employment Service is a government-funded agency in Sweden working to keep the unemployment rate low. When someone is unemployed or looking for a new job, he or she can register at the Swedish Public Employment Service. Being able to forecast well how many are expected to get employment could be useful when planning and making decisions. It could also be used as an indicator of how well the Swedish Public Employment Service manages to perform and thus how well the tax money is used. The models employed for forecasting were the seasonal autoregressive integrated moving average (SARIMA) and the long short-term memory (LSTM). A persistence model is also used as a baseline. The persistence model is a very simple model and the other models are therefore expected to outperform it. For the LSTM model, the use of both univariate and multivariate approaches will be explored in order to examine if the model can be improved with more data. Results from the experiments performed showed that a multivariate LSTM performed the lowest root mean squared error (RMSE) and is therefore considered the best model. However, the robustness of the model over time needs further research. / Syftet med detta arbete är att göra prognoser på hur många av de registrerade på Arbetsförmedlingen som kommer att få arbete en viss månad och undersöka hur noggranna dessa prognoser blir. Arbetsförmedlingen är en skattefinansierad myndighet i Sverige som arbetar med att hålla arbetslösheten låg. När någon är arbetslös eller letar efter ett arbete kan man registrera sig hos Arbetsförmedlingen. Att kunna göra bra prognoser på hur många som kommer att få arbete skulle kunna vara användbart vid planering och beslutfattande. Det skulle också kunna användas som en indikator på hur väl Arbetsförmedlingen använder skattepengarna. De modeller som har använts är seasonal autoregressive integrated moving average (SARIMA) och long short-term memory (LSTM). En persistensmodell används också som baslinje. Persistensmodellen är en enkel modell och därför förväntas de andra modellerna prestera bättre. För LSTM-modellen kommer användningen av både envariabla och flervariabla tillvägagångssätt att undersökas för att testa om mer data kan förbättra modellen. Resultat från experimenten visar att det var en LSTM-modell med flera variabler som presterade lägst root mean squared error (RMSE) och anses därför vara den bästa modellen. Det behövs dock ytterligare studier för att undersöka modellens stabilitet över tid.
Identifer | oai:union.ndltd.org:UPSALLA1/oai:DiVA.org:kth-239174 |
Date | January 2018 |
Creators | Wikström, Johan |
Publisher | KTH, Skolan för elektroteknik och datavetenskap (EECS) |
Source Sets | DiVA Archive at Upsalla University |
Language | English |
Detected Language | Swedish |
Type | Student thesis, info:eu-repo/semantics/bachelorThesis, text |
Format | application/pdf |
Rights | info:eu-repo/semantics/openAccess |
Relation | TRITA-EECS-EX ; 2018:733 |
Page generated in 0.002 seconds