Global ETD Search

131	Datadriven Prognostisering : En Regressionsmodell för Bättre Beslutsfattande inom Kollektivtrafiken / Data-Driven Forecasting : A Regression Model for Better Decision Making in Public Transportation Stegare, Martin, Issa, Mohammed January 2019 (has links) Hur kommer det sig att antalet resenärer inom Stockholms kollektivtrafik skiljer sig kraftigt från dag till dag? Är skillnaden rent slumpmässig eller spelar faktorer som befolkningsmängd, lufttemperatur, nederbörd, månad eller veckodag en signifikant roll för att förklara variationen? Denna uppsats ämnar att utforska dessa externa variablers påverkan på kollektivtrafiken och hur denna typ av datadriven information kan leda till bättre understödda beslut. Den applicerade metoden var multipel linjär regression och data som användes mottogs från Trafikförvaltningen, SMHI och SCB. Slutsatsen från studien visar att variationerna i antal resenärer i Stockholms Lokaltrafik kan förklaras med cirka 84\% från befolkningsmängden, månad och veckodag. / Why is it that the number of travellers in Stockholm's public transportation differs from day to day? Is the difference arbitrary or do factors such as population, temperature, weather conditions, months, or even weekdays have a significant role in this variation? This thesis aims to explore these external variables and their effect on public transportation, as well as how this type of data driven information can result in well supported decisions. The method applied to the study was multiple linear regression and the data used was retrieved from Trafikförvaltningen, SMHI, and SCB. The study concluded that the variations in the number of travellers in Stockholm's public transportation is up to 84\% explained by population, as well as month and weekday. Statistics applied mathematics data analysis public transportation Statistik tillämpad matematik dataanalys kollektivtrafik Probability Theory and Statistics Sannolikhetsteori och statistik
132	Root cause analysis using Bayesian networks for a video streaming service / Grundorsaksanalys med hjälp av Bayesianska nätverk för en video strömningstjänst Riesel, Max January 2019 (has links) In this thesis, an approach for localizing culprits of degradation of quality measures in an IPTV streaming service using Bayesian net-work is presented. This task is referred to as Root Cause Analysis(RCA). The objective of this thesis is to develop a model that is able to provide useful information to technicians by generating a list of probable root causes in order to shorten the amount of time spent on trouble shooting. A performance comparison is presented in Section Experimental results with Bayesian models such as Naive Bayes (NB),Tree Augmented naive Bayes (TAN) and Hill Climbing (HC) and the non Bayesian methods K-Nearest Neighbors and Random Forest. The results of the RCA models indicated that the most frequent most prob-able cause of degradation of quality is the signal strength of the user’s Wi-Fi that is reported at the user’s TV box. / I detta examensarbete presenteras en metod för att lokalisera grundorsaken till nedgradering av kvalitet i en IPTV strömningstjänst. Denna uppgift refererar tillgrundorsaksanalys. Avsikten med denna tes är att utveckla en modell som kan tillförse tekniker med användarbar information genom att generera en lista med möjliga grundorsaker för att förkorta tiden som spenderas med felsökning. En prestandajämförelse är presenterad i Sektion Experimental results med de Bayesianska modellerna Naive Bayes (NB), Tree Augmented naive Bayes (TAN) och Hill Climbing (HC) samt de icke Bayesianska modellerna K-Nearest Neighbors och Random Forest. Resultatet av grundorsaksmodellerna indikerade att den mest frekventa mest sannolika grundorsaken till nedgradering av kvalitet är signal styrkan hos Wi-Fi nätverket vilket rapporteras i användarens TV-box. Bayesian networks Root cause analysis applied mathematics Bayesianska nätverk Grundorsaksanalys tillämpad matematik Probability Theory and Statistics Sannolikhetsteori och statistik
133	Clustering Based Outlier Detection for Improved Situation Awareness within Air Traffic Control / Förbättrad översiktsbild inom flygtrafikledning med hjälp av klusterbaserad anomalidetektering Gustavsson, Hanna January 2019 (has links) The aim of this thesis is to examine clustering based outlier detection algorithms on their ability to detect abnormal events in flight traffic. A nominal model is trained on a data-set containing only flights which are labeled as normal. A detection scoring function based on the nominal model is used to decide if a new and in forehand unseen data-point behaves like the nominal model or not. Due to the unknown structure of the data-set three different clustering algorithms are examined for training the nominal model, K-means, Gaussian Mixture Model and Spectral Clustering. Depending on the nominal model different methods to obtain a detection scoring is used, such as metric distance, probability and OneClass Support Vector Machine. This thesis concludes that a clustering based outlier detection algorithm is feasible for detecting abnormal events in flight traffic. The best performance was obtained by using Spectral Clustering combined with a Oneclass Support Vector Machine. The accuracy on the test data-set was 95.8%. The algorithm managed to correctly classify 89.4% of the datapoints labeled as abnormal and correctly classified 96.2% of the datapoints labeled as normal. / Syftet med detta arbete är att undersöka huruvida klusterbaserad anomalidetektering kan upptäcka onormala händelser inom flygtrafik. En normalmodell är anpassad till data som endast innehåller flygturer som är märkta som normala. Givet denna normalmodell så anpassas en anomalidetekteringsfunktion så att data-punkter som är lika normalmodellen klassificeras som normala och data-punkter som är avvikande som anomalier. På grund av att strukturen av nomraldatan är okänd så är tre olika klustermetoder testade, K-means, Gaussian Mixture Model och Spektralklustering. Beroende på hur normalmodellen är modellerad så har olika metoder för anpassa en detekteringsfunktion används, så som baserat på avstånd, sannolikhet och slutligen genom One-class Support Vector Machine. Detta arbete kan dra slutsatsen att det är möjligt att detektera anomalier med hjälp av en klusterbaserad anomalidetektering. Den algoritm som presterade bäst var den som kombinerade spektralklustring med One-class Support Vector Machine. På test-datan så klassificerade algoritmen $95.8\%$ av all data korrekt. Av alla data-punkter som var märka som anomalier så klassificerade denna algoritm 89.4% rätt, och på de data-punkter som var märka som normala så klassificerade algoritmen 96.2% rätt. Applied Mathematics Clustering Spectral Clustering Graph Theory GMM Outlier Detection Tillämpad matematik Klustering Spektralklustering grafteori GMM anomalidetektering Mathematics Matematik
134	An analysis of the underlying variables on the credit spread of the Swedish corporate bond market / Analys av kreditspreadens underliggande variabler på den svenska företagsobligationsmarknaden Olofsgård, Markus, Göransson, Philip January 2020 (has links) The purpose of this thesis is to define which variables affect the average credit spread on the Swedish bond market. The study is conducted via the help of Enter Fonder, who contributes with data and insight into the Swedish corporate bond market. Earlier research has put a lot of weight on the connection between default risk and credit spread. The exact effect is however still debated and it is unclear which variables best describe the default risk. A multilinear regression analysis is conducted, studying the effect on the average credit spread in the NOMX-index (NOMXCRSP) with the following predictor variables: Treasury rate, Predicted EPS amongst OMXS30-companies, Change in net asset under management (AUM) of Swedish corporate bonds, The average credit spread on two European and two American counterparts to NOMX, D/E-ratio and EBITDA-margin amongst OMXS30-companies and finally PMI-index from both the industry and service sector. The regression analysis is based on 89 data points which were aggregated into an equivalent interval on a monthly basis. The final results presents a model of seven variables consisting of all the four international indexes, treasury rate, predicted EPS and change in net AUM, and was able to explain around 87% of the variance in the data. / Syftet med denna avhandling är att identifiera och analysera den genomsnittliga kreditspreadens underliggande variabler på den svenska företagsobligationsmarknaden. Arbetsprocessen utförs tillsammans med fondbolaget Enter Fonder vilka bidrar med stöd i samband med datainsamlingen samt insikt om den svenska företagsobligationsmarknaden. Tidigare forskning inom ämnet har påpekat ett tydligt samband mellan ett företags likviditetsrisk och kreditspreaden på dess emitterade företagsobligationer. Likviditetsriskens exakta effekt på kreditspreaden samt hur denna risk lämpligast mäts, råder det dock oenighet om. En multipel linjär regressionsanalys genomförs där effekten på den genomsnittliga kreditspreaden i NOMX-indexet (NOMXCRSP) analyseras utifrån de underliggande variablerna: Statslåneränta, Estimerade EPS bland OMXS30-bolag, Förändringar i fondflöden på svenska företagsobligationer, Genomsnittlig kreditspread på två europeiska respektive amerikanska motsvarigheter till NOMX, D/E-ratio samt EBITDAmarginal bland OMXS30-bolag och slutligen PMI-siffror från både industri- samt tjänstesektorn. Regressionsanalysen baseras på totalt 89 datapunkter som aggregerats till likvärdig och månatlig basis. Den slutliga modellen består av totalt sju förklarande variabler där de fyra internationella indexen, Estimerad EPS, Statslåneräntan samt Förändringar i fondflöden utgör dessa och tycks förklara cirka 87 % av variansen i datasetet. Statistics applied mathematics credit spread regression analysis corporate bonds Statistik tillämpad matematik kreditspread regressionsanalys företagsobligationer Probability Theory and Statistics Sannolikhetsteori och statistik
135	A Spatially Explicit Agent-Based Model of Human-Resource Interaction on Easter Island / En rumsligt explicit agentbaserad modell av interaktionen mellan människor och resurser på Påskön Steiglechner, Peter January 2020 (has links) The history of Easter Island, with its cultural and ecological mysteries, has attracted the interests of archaeologists, anthropologists, ecologists, and economists alike. Despite the great scientific efforts, uncertainties in the available archaeological and palynological data leave a number of critical issues unsolved and open to debate. The maximum size reached by the human population before the arrival of Europeans and the temporal dynamics of deforestation are some of the aspects still fraught with controversies. By providing a quantitative workbench for testing hypotheses and scenarios, mathematical models are a valuable complement to the observational-based approaches generally used to reconstruct the history of the island. Previous modelling studies, however, have shown a number of shortcomings in the case of Easter Island, especially when they take no account of the stochastic nature of population growth in a temporally and spatially varying environment. Here, I present a new stochastic, Agent-Based Model characterised by (1) realistic physical geography of the island and other environmental constraints (2) individual agent decision-making processes, (3) non-ergodicity of agent behaviour and environment, and (4) randomised agent-environment interactions. I use the model and the best available data to determine plausible spatial and temporal patterns of deforestation and other socioecological features of Easter Island prior to the European contact. I further identify some non-trivial connections between microscopic decisions or constraints (like local confinement of agents' actions or their adaptation strategy to environmental degradation) and macroscopic behaviour of the system that can not easily be neglected in a discussion about the history of Easter Island before European contact. / Påsköns historia har, med dess kulturella och ekologiska mysterier, väckt intressen hos arkeologer, antropologer, ekologer och ekonomer. Trots de stora vetenskapliga ansträngningarna lämnar osäkerheten i de tillgängliga arkeologiska och palynologiska data ett antal kritiska frågor olösta och öppna för debatt. Den maximala storleken som den mänskliga befolkningen nådde före européernas ankomst, och avskogningens tidsmässiga dynamik, är några av de aspekter som fortfarande är fyllda med kontroverser. Genom att tillhandahålla en kvantitativ arbetsbänk för att testa hypoteser och scenarier är matematiska modeller ett värdefullt komplement till de observationsbaserade metoder som vanligtvis används för att rekonstruera öns historia. Tidigare modelleringsstudier har emellertid visat ett antal brister i fallet med Påskön, särskilt när de inte tar hänsyn till den stokastiska karaktären av befolkningsökningen i en tillfällig och rumsligt varierande miljö. Här presenters en ny stokastisk, agentbaserad modell som kännetecknas av (1) realistisk fysisk geografi av ön och andra miljömässiga begränsningar, (2) individuella beslutsprocesser av agenter, (3) icke-ergodicitet av agentens beteende och miljö och (4) randomiserade agent-miljöinteraktioner. Modellen används tillsammans med de bästa tillgängliga data för att bestämma rimliga rumsliga och temporära mönster av avskogning och andra socioekologiska egenskaper på Påskön före européers ankoms. Vidare identifieras några icke-triviala förbindelser mellan mikroskopiska beslut eller begränsningar (till exempel lokal inneslutning av agentens handlingar eller deras anpassningsstrategi till miljöförstöring) och makroskopiskt beteende hos systemet som inte lätt kan försummas i en diskussion om påsköns historia före europeisk kontakt. Agent-based modelling applied mathematics socio-economic modelling Agentbaserad modellering tillämpad matematik socioekonomisk modellering Computational Mathematics Beräkningsmatematik
136	Modeling Interest Rate Risk in the Banking Book / Modellering av räntekursrisk i bankboken Ulmgren, Måns January 2022 (has links) For a long time, being able to model and mitigate financial risk has been a key success factor for institutions. Apart from an internal incentive, legal and regulatory requirements continue to develop which increases the need for extensive internal risk control. Interest rate risk in the banking book ("IRRBB") alludes to the cur- rent or prospective risk to the bank’s earnings and capital emerging from adverse movements in interest rates that influence the bank’s banking book positions. When interest rates change, the value but also the timing of future cash flows are affected. Thus, the underlying value of a bank’s liabilities and assets and other off-balance sheet items change as a consequence, and therefore its economic value. In 2004, the Basel Committee on Banking Supervision published a paper Principles for the Management and Supervision of Interest Rate Risk which later lead the European Banking Authority ("EBA") to publish a renewed framework in 2016. In December 2021, the EBA published a draft of an updated version of this framework. This paper investigates how banks and risk managers should model IRRBB under these new guidelines. This is achieved by constructing an IRRBB model which is then evaluated to see whether the IRRBB framework provided by the EBA is adequate and comprehensive. The IRRBB model by the EBA is fundamentally constructed by creating six different shock scenarios where the yield curve is stressed (parallel- , short rate-, and long rate shifts). Thereafter, one measures risk by investigating how these shifts affect the bank’s or financial institutions’ economic value and net interest income. In this paper, additional stressed scenarios were produced through Principal Component Analysis and Monte Carlo Simulations. This paper found that the framework by the EBA is adequate and formulates good methods. However, the framework is not fully standardized and comprehensive, and some computations and methods are left for the institution to decide. This is most likely due to the uniqueness of each institution and that it is hard to formulate methods that are pertinent for all. A more complete, standardized framework would however be advantageous for, on the one hand, governing agencies which would benefit from decreasing the number of resources needed when supervising institutions’ internal models. On the other, institutions would benefit from decreasing the probability of potentially overlooking some risk. Furthermore, this would help companies de- crease their capital requirement, which is desirable. / Att modellera och minska finansiella risker har under lång tid varit en nyckelfaktor för företags framgång. Förutom interna incitament fortsätter regulatoriska krav att utvecklas vilket ökar behovet av omfattande intern riskkontroll. Ränterisk i bankbo- ken ("IRRBB") anspelar på den nuvarande eller framtida risken till bankens intäkter och kapital som kommer från ogynnsamma rörelser i räntor som påverka bankens positioner i bankboken. När räntorna förändras påverkas värdet men också tid- punkten för framtida kassaflöden. Således förändras det underliggande värdet av en banks skulder och tillgångar och andra poster utanför balansräkningen som en konsekvens, och därmed dess ekonomiska värde. 2004 publicerade Basel Commit- tee on Banking Supervision ("BCBS") ett dokument Principles for Management and Supervision of Interest Rate Risk som senare ledde till att European Banking Authority ("EBA") publicerade ett förnyat ramverk 2016. I december 2021 publicerade EBA ett utkast till en uppdaterad version av detta ramverk. Denna rapport undersöker hur banker och riskhanterare bör modellera IRRBB i enlighet med dessa nya riktlinjer. Detta uppnås genom att konstruera en IRRBB-modell som sedan utvärderas för att se om det IRRBB-ramverk som tillhandahålls av EBA är adekvat och heltäckande. IRRBB-modellen av EBA är i grunden konstruerad genom att skapa sex olika chockscenarier där avkastningskurvan är stressad (parallell-, kort- och långränteskiften). Därefter mäts risk genom att undersöka hur dessa förskjutningar påverkar bankens eller finansiella institutioners ekonomiska värde och ränteinkomstnetto. I detta dokument har ytterligare stressade scenarier tagits fram genom Principalkomponentanalys och Monte Carlo Simuleringar. Detta dokument fann att EBA:s ramverk är adekvat och formulerar bra metoder. Ramverket är dock inte helt standardiserat och heltäckande och vissa beräkningar och metoder lämnas åt företagen att bestämma. Detta beror med största sannolikhet på varje institutions unika karaktär och att det är svårt att formulera metoder som är relevanta för alla. Ett mer komplett, standardiserat ramverk skulle dock vara fördelaktigt för å ena sidan styrande myndigheter som skulle gynnas av att minska mängden resurser som behövs när de övervakar institutionernas interna modeller. Å andra sidan skulle företag dra fördel av att att minska sannolikheten för att eventuellt förbise vissa risker. Dessutom skulle detta hjälpa företag att minska sitt kapitalkrav, vilket är önskvärt. applied mathematics IRRBB Nelson Siegel yield curve tillämpad matematik IRRBB Nelson Siegel avkastningskurva Other Mathematics Annan matematik
137	Regressionsanalys av konsumentvärdens påverkan på bostadspriser / Regression analysis of consumer values effects on housing prices Bergene, Jakob, Rolff, Hugo January 2021 (has links) Syftet med denna studie var att undersöka hur konsumentvärdet och makroekonomiska faktorer påverkar en bostadsrätts försäljningspris. De variabler som användes för att beskriva konsumentvärdet var våning, månadsavgift, byggår, area och kvadratmeterpris. För att undvika generella prissvängningars inflytande på resultaten används även ett snittpriset inom det undersökta området som ett prisindex. Vidare studeras makroekonomiska faktorers påverkan på prisindexet i en separat analys. I den analysen undersöktes variablerna inflation, BNP-tillväxt, arbetslöshet och reporänta. I analysen av konsumentvärdet visade sig samtliga förklarande variabler ha signifikant relation till försäljningspriset. Analysen för makroekonomiska trender visade enbart ett signifikant förhållande för BNP-tillväxt och inflation i förhållande till prisindexet. Resultaten för prisindexet är osäkra på grund av ett begränsat dataset för de undersökta variablerna samt osäkerhet i reliabiliteten i det datasetet. / The purpose of this study is to investigate how a number of factors connected to the consumer value affects the final sales price of an apartment. More specifically the variables floor, area, cost per area unit and year of construction was examined. To avoid general price fluctuations over time the prices were weighted with a price index for mean prices of apartments in the studied area during the time of sale. Further the price index was studied to find macro economical factors with significant impact on the mean prices. The factors examined in that analysis were inflation, GDP-growth, unemployment rate and official bank-rate. The main method for this study was multiple linear regression. The result yielded by the study showed significant relation between regressors describing consumer value and the final price. The analysis of the macro economical factors showed significant relationship between only inflation and GDP-growth. The result of the regression analysis for the price index were more uncertain due to a smaller dataset and uncertainties in the reliability of that dataset. Regression analysis Applied Mathematics Housing prices Vasastaden Regressionsanalys Tillämpad matematik Huspriser Vasastaden Probability Theory and Statistics Sannolikhetsteori och statistik
138	Investigating the Spectral Bias in Neural Networks / Spektrala egenskaper i neurala nätverk Thor, Filip January 2021 (has links) Neural networks have been shown to have astounding performance on a variety of different machine learning tasks and data sets, both for synthetic and real-world data.However, in spite of their widespread usage and implementation, the convergence and the training dynamics of neural networks are neither trivial, nor completely understood. This project regards investigating what some researchers refer to as the Spectral Bias of neural networks. Neural networks have been seen during training to initially fit to data of lower complexity rather than high. That is, the network learns features of the target that in the Fourier domain corresponds to lower frequencies first, before it learns features that correspond to high frequencies. In this thesis, a quantitative way of measuring this bias is proposed, and empirical experiments are able to show the prevalence of the spectral bias with respect to this measure. The experiments compare how different network parameters, architectures, and optimizers affect the network's ability to find high frequency content during training. Both tailored experiments with synthetic target functions, and real-world data are considered. The machine learning problems investigated in this report are low dimensional regression problems. The real-world problem is natural image regression, and is performed on the DIV2K data set used in the NTIRE challenge on Single Image Super Resolution (SISR). The proposed measure shows that there exists a spectral bias in this task as well, indicating that it does not only occur in simulated data and controlled experiments, but also in data from real-world applications. / Neurala nätverk har påvisats prestera utomordentligt på flertalet olika sorters maskininlärningsproblem och dataset. Trots dess utbredda användning och implementation är likväl inte dess konvergens och träningsbeteende varken triviala, eller fullt förstådda. Den här uppsatsen undersöker vad vissa forskare benämner spectral bias hos neurala nätverk. Neurala nätverk har observerats att först anpassa sig till data med låg komplexitet, före hög. Med andra ord, nätverken lär sig de egenskaper hos målfunktionen som motsvarar låga frekvenser i Fourierdomänen först, innan de anpassar sig till de som motsvarar höga frekvenser. I den här rapporten föreslås ett kvantitativt sätt att mäta spectral bias, och empiriska experiment visar förekomsten av fenomenet med avseende på måttet. Experimenten jämför hur olika nätverksarkitekturer och träningsalgoritmer påverkar nätverkets förmåga att lära sig högfrekventa komponenter under träning. Både syntetiska experiment med konstgjorda målfunktioner, och problem med data från verkliga tillämpningar undersöks. Problemuppställningen som behandlas är lågdimensionell regression, och det verkliga problemet är bildregression applicerat data från datasetet DIV2K som används i NTIREs tävling för Single Image Super Resolution.Det föreslagna måttet påvisar spectral bias även för detta dataset, vilket indikerar att det inte bara uppkommer i konstruerade problem, utan även är något som bör tas hänsyn till i tillämpade problem. spectral bias frequency principle neural networks machine learning applied mathematics spectral bias neurala nätverk maskininlärning tillämpad matematik Computational Mathematics Beräkningsmatematik
139	Restricted Boltzmann Machine as Recommendation Model for Venture Capital / Restricted Boltzmann Machine som Rekommendationsmodell för Riskkapital Fredriksson, Gustav, Hellström, Anton January 2019 (has links) Denna studie introducerar restricted Boltzmann machines (RBMs) som rekommendationsmodell i kontexten av riskkapital. Ett nätverk av relationer används som proxy för att modellera investerares bolagspreferenser. Studiens huvudfokus är att undersöka hur RBMs kan implementeras för ett dataset bestående av relationer mellan personer och bolag, samt att undersöka om modellen går att förbättra genom att tillföra av ytterligare information. Nätverket skapas från styrelsesammansättningar för svenska bolag. För nätverket implementeras RBMs både med och utan den extra informationen om bolagens ursprungsort. Vardera RBM-modell undersöks genom att utvärdera dess inlärningsförmåga samt förmåga att återskapa manuellt gömda relationer. Resultatet påvisar att RBM-modellerna har en bristfällig förmåga att återskapa borttagna relationer, dock noteras god inlärningsförmåga. Genom att addera ursprungsort som extra information förbättras modellerna markant och god potential som rekommendationsmodell går att urskilja, både med avseende på inlärningsförmåga samt förmåga att återskapa gömda relationer. / In this thesis, we introduce restricted Boltzmann machines (RBMs) as a recommendation model in the context of venture capital. A network of connections is used as a proxy for investors’ preferences of companies. The main focus of the thesis is to investigate how RBMs can be implemented on a network of connections and investigate if conditional information can be used to boost RBMs. The network of connections is created by using board composition data of Swedish companies. For the network, RBMs are implemented with and without companies’ place of origin as conditional data, respectively. The RBMs are evaluated by their learning abilities and their ability to recreate withheld connections. The findings show that RBMs perform poorly when used to recreate withheld connections but can be tuned to acquire good learning abilities. Adding place of origin as conditional information improves the model significantly and show potential as a recommendation model, both with respect to learning abilities and the ability to recreate withheld connections. Machine learning statistics applied mathematics venture capital recommendation models Maskininlärning statistik tillämpad matematik riskkapital rekommendationsmodeller Probability Theory and Statistics Sannolikhetsteori och statistik
140	Providing reliable product size recommendations -- A Bayesian model for sparse, cross-merchant sales and return data in fashion e-commerce / Tillförlitliga storleksrekommendationer för produkter -- En Bayesiansk modell för gles försäljnings- och returdata för flertalet företag inom e-handeln för mode van de Kamp, Carsten Thomas January 2022 (has links) Fashion webshops face high return rates, which is both an unsustainable and very costly practice. A significant part of returns is made because of size and fit-related issues. We introduce four models for providing product size recommendations based on cross-merchant sales and return data. This data is typically highly sparse and noisy, making the development of a size recommendation system challenging. Moreover, we do not have access to fit feedback or the reason why a consumer made a return. We assess model performance on both a proprietary data set consisting of shoe purchases and a publicly available data set containing rentals of various categories of women's apparel. Our baseline model predicts the probability of fit for a specific consumer-article combination based on the average catalog size of all articles purchased and kept by that particular consumer. This model outperforms two more advanced models deriving true size variables for consumers and articles on both data sets. The fourth model we develop is a Bayesian size recommendation model, which is fitted with mean-field variational inference. It performs comparably to baseline on unseen data. However, it has the added benefit of being able to filter out low-confidence recommendations, such that higher performance can be achieved at the cost of a lower coverage level. All models show signs of overfitting to training data, and hence we recommend future research to focus on developing a variant of the Bayesian model with fewer degrees of freedom. Results suggest that such a model could be able to provide even better product size recommendations. / E-handlare inom modesegmentet lider av höga nivåer av returer, vilket är både ohållbart och mycket kostsamt. En signifikant del av returer görs på grund av problem relaterat till storlek och passform. Vi presenterar fyra modeller för att ge storleksrekommendationer baserat på försäljningar och returer från flera företag. Sådan data är typiskt mycket gles och brusig, vilket gör utvecklandet av system för storleksrekommendationer utmanande. Utöver detta så har vi inte tillgång till någon återkoppling från kunderna om storleken och passformen, eller anledningen till att produkten returnerats. Vi utvärderar modellernas kvalitet på både ett proprietärt dataset med skoköp, samt ett publikt dataset med hyrkläder av olika sorter. Vår grundläggande model förutsäger sannolikheten för att en artikel passar en viss kund baserat på medelvärdet av storleken för kundens tidigare köp. Denna modell presterar bättre än två av de mer avancerade modellerna som estimerar denna sanna storleken för kunder och artiklar. Den fjärde modellen vi utvecklar är en Bayesiansk modell som tränas med en uppskattningsmetod. Denna modell presterar likvärdigt med den enklaste modellen, men har den extra fördelen att bättre rekommendationer kan fås genom att filtrera baserat på säkerhetsmått. Samtliga modeller har svårt att generalisera på ett önskvärt sätt, och därmed rekommenderar vi framtida forskning som fokuserar på att utveckla den Bayesianska metoden med ett mindre antal frihetsgrader. Resultaten pekar på att en sådan modell skulle kunna bidra med ännu bättre rekommendationer. Bayesian modeling size recommendations recommender systems applied mathematics Bayesiansk modellering storleksrekommendationer rekommendationssystem tillämpad matematik Other Mathematics Annan matematik

Search results