Return to search

Providing reliable product size recommendations -- A Bayesian model for sparse, cross-merchant sales and return data in fashion e-commerce / Tillförlitliga storleksrekommendationer för produkter -- En Bayesiansk modell för gles försäljnings- och returdata för flertalet företag inom e-handeln för mode

Fashion webshops face high return rates, which is both an unsustainable and very costly practice. A significant part of returns is made because of size and fit-related issues. We introduce four models for providing product size recommendations based on cross-merchant sales and return data. This data is typically highly sparse and noisy, making the development of a size recommendation system challenging. Moreover, we do not have access to fit feedback or the reason why a consumer made a return. We assess model performance on both a proprietary data set consisting of shoe purchases and a publicly available data set containing rentals of various categories of women's apparel. Our baseline model predicts the probability of fit for a specific consumer-article combination based on the average catalog size of all articles purchased and kept by that particular consumer. This model outperforms two more advanced models deriving true size variables for consumers and articles on both data sets. The fourth model we develop is a Bayesian size recommendation model, which is fitted with mean-field variational inference. It performs comparably to baseline on unseen data. However, it has the added benefit of being able to filter out low-confidence recommendations, such that higher performance can be achieved at the cost of a lower coverage level. All models show signs of overfitting to training data, and hence we recommend future research to focus on developing a variant of the Bayesian model with fewer degrees of freedom. Results suggest that such a model could be able to provide even better product size recommendations. / E-handlare inom modesegmentet lider av höga nivåer av returer, vilket är både ohållbart och mycket kostsamt. En signifikant del av returer görs på grund av problem relaterat till storlek och passform. Vi presenterar fyra modeller för att ge storleksrekommendationer baserat på försäljningar och returer från flera företag. Sådan data är typiskt mycket gles och brusig, vilket gör utvecklandet av system för storleksrekommendationer utmanande. Utöver detta så har vi inte tillgång till någon återkoppling från kunderna om storleken och passformen, eller anledningen till att produkten returnerats. Vi utvärderar modellernas kvalitet på både ett proprietärt dataset med skoköp, samt ett publikt dataset med hyrkläder av olika sorter. Vår grundläggande model förutsäger sannolikheten för att en artikel passar en viss kund baserat på medelvärdet av storleken för kundens tidigare köp. Denna modell presterar bättre än två av de mer avancerade modellerna som estimerar denna sanna storleken för kunder och artiklar. Den fjärde modellen vi utvecklar är en Bayesiansk modell som tränas med en uppskattningsmetod. Denna modell presterar likvärdigt med den enklaste modellen, men har den extra fördelen att bättre rekommendationer kan fås genom att filtrera baserat på säkerhetsmått. Samtliga modeller har svårt att generalisera på ett önskvärt sätt, och därmed rekommenderar vi framtida forskning som fokuserar på att utveckla den Bayesianska metoden med ett mindre antal frihetsgrader. Resultaten pekar på att en sådan modell skulle kunna bidra med ännu bättre rekommendationer.

Identiferoai:union.ndltd.org:UPSALLA1/oai:DiVA.org:kth-345185
Date January 2022
Creatorsvan de Kamp, Carsten Thomas
PublisherKTH, Matematik (Avd.)
Source SetsDiVA Archive at Upsalla University
LanguageEnglish
Detected LanguageSwedish
TypeStudent thesis, info:eu-repo/semantics/bachelorThesis, text
Formatapplication/pdf
Rightsinfo:eu-repo/semantics/openAccess
RelationTRITA-SCI-GRU ; 2022:376

Page generated in 0.0033 seconds