• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 24
  • 19
  • Tagged with
  • 43
  • 27
  • 25
  • 24
  • 21
  • 19
  • 19
  • 19
  • 17
  • 15
  • 12
  • 10
  • 9
  • 8
  • 7
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
31

Text Content Features for Hybrid Recommendations : Pre-trained Language Models for Better Recommendations

Lazarova, Mariya January 2021 (has links)
Nowadays, with the ever growing availability of options in many areas of our lives, it is crucial to have good ways to navigate your choices. This is why recommendation engines’ role is growing more important. Recommenders are often based on user-item interaction. In many areas like news and podcasts, however, by the time there is enough interaction data for an item, the item has already become irrelevant. This is why incorporating content features is desirable, as the content does not depend on the popularity or novelty of an item. Very often, there is text describing an item, so text features are good candidates for features within recommender systems. Within Natural Language Processing (NLP), pre-trained language models based on the Transformer architecture have brought a revolution in recent years, achieving state-of-the-art performance on many language tasks. Because of this, it is natural to explore how such models can play a role within recommendation systems. The scope of this work is on the intersection between NLP and recommendation systems where we investigate what are the effects of adding BERT-based encodings of titles and descriptions of movies and books to a recommender system. The results show that even in off-the-shelf BERT-models there is a considerable amount of information on movie and book similarity. It also shows that BERT based representations could be used in a recommender system for user recommendation to combine the best of collaborative and content representations. In this thesis, it is shown that adding deep pre-trained language model representations could improve a recommender system’s capability to predict good items for users with up to 0.43 AUC-ROC score for a shallow model, and 0.017 AUC-ROC score for a deeper model. It is also shown that SBERT can be fine-tuned to encode item similarity with up to 0.03 nDCG and up to 0.05 nDCG@10 score improvement. / Med den ständigt växande tillgängligheten av val i många delar av våra liv har det blivit viktigt att enkelt kunna navigera kring olika alternativ. Det är därför rekommendationssystems har blivit viktigare. Rekommendationssystem baseras ofta på interaktion-historiken mellan användare och artikel. När tillräckligt mycket data inom nyheter och podcast har hunnits samlats in för att utföra en rekommendation så har artikeln hunnit bli irrelevant. Det är därför det är önskvärt att införa innehållsfunktioner till rekommenderaren, då innehållet inte är beroende av popularitet eller nymodigheten av artikeln. Väldigt ofta finns det text som beskriver en artikel vilket har lett till textfunktioner blivit bra kandidater som funktion för rekommendationssystem. Inom Naturlig Språkbehandling (NLP), har förtränande språkmodeller baserad på transformator arkitekturen revolutionerat området de senaste åren. Den nya arkitekturen har uppnått toppmoderna resultat på flertal språkuppgifter. Tack vare detta, har det blivit naturligt att utforska hur sådana modeller kan fungera inom rekommendationssystem. Det här arbetet är mellan två områden, NLP och rekommendationssystem. Arbetet utforskar effekten av att lägga till BERT-baserade kodningar av titel och beskrivning av filmer, samt böcker till ett rekommendationssystem. Resultaten visar att även i förpackade BERT modeller finns det mycket av information om likheter mellan film och böcker. Resultaten visar även att BERT representationer kan användas i rekommendationssystem för användarrekommendationer, i kombination med kollaborativa och artikel baserade representationer. Uppsatsen visar att lägga till förtränade djupspråkmodell representationer kan förbättra rekommendationssystemens förmåga att förutsäga bra artiklar för användare. Förbättringarna är upp till 0.43 AUC-ROC poäng för en grundmodell, samt 0.017 AUC-ROC poäng för en djupmodell. Uppsatsen visar även att SBERT kan bli finjusterad för att koda artikel likhet med upp till 0.03 nDCG och upp till 0.05 nDCG@10 poängs förbättring.
32

Identifying potential problem perceived by consumers within the recommendation system of streaming services

Arman, Laila, Ahmed, Tanveer January 2022 (has links)
Streaming services have had a significant gain in popularity over the last decade, with an increasing number of subscribers. Along with digitalization, more households seek accessible entertainment that allows them to choose the type of content they wish to watch. However, as streaming services have grown in popularity, the content library of those services has been increasing, leaving users overwhelmed when deciding what to watch next. A recommendation system is used by the majority of streaming providers to assist its customers find appropriate material to watch. This recommendation system suggests suitable material based on the user's collected data. However, the recommendation systems suggestions are not always perceived to be relevant. The purpose of this thesis is to identify potential perceived problems with the recommendation systems and their causes. This was accomplished by investigating how consumers of those services experience them by conducting a survey and interviews. The identified problems have then been compiled into a basis. The goal of this thesis is to provide a basis that may benefit streaming services, their consumers and be of use by academics to conduct further research within the field. The basis indicates that there are several perceived problems with the current recommendation systems. A total of nine problems have been documented and discussed. / Streamingtjänster har haft en betydande ökning i popularitet under det senaste årtiondet, med ett ökande antal användare. Tillsammans med digitaliseringen söker fler hushåll tillgänglig underhållning som gör att de kan välja vilken typ av innehåll de vill titta på. Men eftersom streamingtjänster har ökat i popularitet, har utbudet för dessa tjänster ökat, vilket gör användarna överväldigade när de bestämmer sig för vad de ska titta på härnäst. Rekommendationssystemen används av majoriteten av streamingtjänsterna för att hjälpa sina kunder att hitta lämpligt material att titta på. Rekommendations systemen föreslår lämpligt material baserat på användarens beteende mönster. Rekommendations systemets förslag uppfattas dock inte alltid vara relevanta. Syftet med denna uppsats är att identifiera potentiella problem som användare uppfattar av rekommendations systemen och vad som kan orsaka dessa problem. Detta åstadkoms genom att undersöka hur konsumenter av dessa tjänster upplever dem genom att genomföra en undersökning samt ett antal intervjuer. De identifierade problemen har sedan sammanställts till ett underlag. Målet med detta examensarbete är att ge ett underlag som kan gynna streamingtjänster, deras konsumenter och vara till nytta för akademiker för att genomföra ytterligare studier inom området. Underlaget tyder på att det finns flera problem med nuvarande rekommendationssystem som upplevs av användare. Totalt har nio problem dokumenterats och diskuterats.
33

Flight Sorting Algorithm Based on Users’ Behaviour

Ben, Qingyan January 2021 (has links)
The model predicts the best flight order and recommend best flight to users. The thesis could be divided into the following three parts: Feature choosing, data-preprocessing, and various algorithms experiment. For feature choosing, besides the original information of flight itself, we add the user’s selection status into our model, which the flight class is, together with children or not. In the data preprocessing stage, data cleaning is used to process incomplete and repeated data. Then a normalization method removes the noise in the data. After various balancing processing, the class-imbalance data is corrected best with SMOTE method. Based on our existing data, I choose the classification model and Sequential ranking algorithm. Use price, direct flight or not, travel time, etc. as features, and click or not as label. The classification algorithms I used includes Logistic Regression, Gradient Boosting, KNN, Decision Tree, Random Forest, Gaussian Process Classifier, Gaussian NB Bayesian and Quadratic Discriminant Analysis. In addition, we also adopted Sequential ranking algorithm. The results show that Random Forest-SMOTE performs best with AUC of ROC=0.94, accuracy=0.8998. / Modellen förutsäger den bästa flygordern och rekommenderar bästa flyg till användarna. Avhandlingen kan delas in i följande tre delar: Funktionsval, databehandling och olika algoritms experiment. För funktionsval, förutom den ursprungliga informationen om själva flygningen, lägger vi till användarens urvalsstatus i vår modell, vilken flygklassen är , tillsammans med barn eller inte. Datarengöring används för att hantera dubbletter och ofullständiga data. Därefter tar en normaliserings metod bort bruset i data. Efter olika balanserings behandlingar är SMOTE-metoden mest lämplig för att korrigera klassobalans flyg data. Baserat på våra befintliga data väljer jag klassificerings modell och sekventiell ranknings algoritm. Använd pris, direktflyg eller inte, restid etc. som funktioner, och klicka eller inte som etikett. Klassificerings algoritmerna som jag använde inkluderar Logistic Regression, Gradient Boost, KNN, Decision Tree, Random Forest, Gaussian Process Classifier, Gaussian NB Bayesian and Quadratic Discriminant Analysis. Dessutom antog vi också Sequential ranking algoritm. Resultaten visar att Random Forest-SMOTE presterar bäst med AUC för ROC = 0.94, noggrannhet = 0.8998.
34

Machine learning Based Energy Efficient Bandwidth Optimization / Maskininlärning Baserad energieffektiv bandbredd optimering

Mao, Jingxuan January 2024 (has links)
Long Term Evolution (LTE) is fourth generation broadband wireless access technology. As LTE networks continue to expand, their energy consumption has become a concern due to increased costs and environmental impact. To address this issue, we present a novel approach in this thesis that focuses on energy-efficient LTE network operation by optimizing cell bandwidth deployment. Only historical data extracted from a real-world LTE network is provided by Ericsson in the thesis, so the model has to learn the pattern by exploiting the data. The model formulates the task as an offline contextual bandits problem and implements offline learning and evaluation algorithms. In addition, the model incorporates two agents: an energy-driven agent and a teacher agent within the bandwidth recommendation engine. This enables energy savings while ensuring uninterrupted network service. Users have the flexibility to customize the desired percentage of energy savings by adjusting a hyper-parameter that determines the relative weight of the two agents in the final bandwidth decision. Through comprehensive offline evaluation, the model is assessed and demonstrates its ability to conserve energy without compromising network performance. / Long Term Evolution (LTE) är en fjärde generationens bredbandslösning för trådlös access. Medan LTE-nätverk fortsätter att expandera har energiförbrukningen blivit en oro på grund av ökade kostnader och miljöpåverkan. För att hantera denna fråga presenterar vi i denna avhandling en innovativ metod som fokuserar på energieffektiv drift av LTE-nätverk genom att optimera tilldelningen av cellbandbredd. Endast historiska data som utvunnits från ett verkligt LTE-nätverk tillhandahålls av Ericsson i avhandlingen, vilket innebär att modellen måste lära sig mönster genom att utnyttja dessa data. Modellen formulerar uppgiften som ett offline-contextual bandits-problem och implementerar algoritmer för offline-inlärning och utvärdering. Dessutom inkluderar modellen två agenter: en energistyrd agent och en läraragent i bandbreddrekommendationssystemet. Detta möjliggör energibesparingar samtidigt som kontinuerlig nätverkstjänst garanteras. Användare har flexibiliteten att anpassa den önskade procentandelen av energibesparingar genom att justera en hyperparameter som bestämmer den relativa vikten av de två agenterna vid beslutsfattandet om slutlig bandbredd. Genom omfattande utvärdering offline bedöms modellen och dess förmåga att spara energi utan att äventyra nätverksprestanda bekräftas.
35

Funds & Co : A digital platform for startups

Vikström, Filip, Olsson, William January 2024 (has links)
This thesis presents the design and development of a web-based platform intended to streamline the public sector funding process for startups by employing a matching algorithm. The platform was developed as part of a Bachelor's program in Computer Engineering and aims to address the inefficiencies and complexities currently impeding startup access to vital funding sources. Utilizing the MERN technology stack (MongoDB, Express.js, React, and Node.js), the project integrates web-based technologies to enhance user experience and ensure robust security measures aligning with GDPR standards. The methodology adopted includes agile development practices to facilitate iterative testing and improvements. The system's use of data from public funding webpages, combined with API integration and web scraping techniques, ensures a rich database of funding opportunities tailored to startups' diverse needs. This thesis serves as a practical solution for startups striving to navigate the complex landscape of public sector funding. / Den här uppsatsen presenterar designen och utvecklingen av en webbaserad plattform avsedd att effektivisera processen för offentlig finansiering till startups genom att använda en matchningsalgoritm. Plattformen, som utvecklats är en del av ett högskoleingenjörsprogram inom datateknik och syftar till att adressera de ineffektiviteter och komplexiteter som för närvarande hindrar startups från att få tillgång till nödvändiga finansieringskällor. Genom att använda MERN-teknikstacken (MongoDB, Express.js, React och Node.js) integrerar projektet webbteknologier för att förbättra användarupplevelsen och säkerställa robusta säkerhetsåtgärder i linje med GDPR-standarder. Den antagna metoden inkluderar agila utvecklingspraxis för att underlätta iterativ testning och förbättringar. Systemets användning av data från offentliga finansieringswebbplatser, kombinerat med API-integration och webbskrapningstekniker, säkerställer en rik databas med finansieringsmöjligheter anpassade till startups mångfaldiga behov. Denna avhandling fungerar som en praktisk lösning för startups som strävar efter att navigera i det komplexa landskapet för offentlig sektorfinansiering.
36

Effektiviteten av rekommendationssystems olika filtreringstekniker: En strukturerad litteraturstudie

Lundström, Fredrik, Sandberg, Sofia January 2018 (has links)
Mängden data som transporteras över Internet idag är stor. Vilket innebär att det finns ett överflöd av information och ett behov för att urskilja relevant innehåll mot irrelevant. För att uppnå detta används rekommendationssystem som i sin tur använder olika filtreringstekniker. Det finns tre huvudtyper av tekniker, innehållsbaserad kollaborativ filtrering och hybrid tekniker. Syftet med studien är att jämföra olika filtreringstekniker och undersöka hur teknikerna förhåller sig till träffsäkerhet mot testset, beräkningsbelasning och användarnöjdhet. För att genomföra detta på ett nyanserat sätt har en strukturerad litteraturstudie genomförts där sju olika steg för inhämtning och analys av dokument gjorts. En kvalitativ metanalys genomfördes på de 28 utvalda tidskriftsartiklarna. IFT rekommendationssystem var den rekommendationsteknik som anses minst effektiv utifrån den definition som studien utgått från. KFT och hybrid rekommendationssystem är de som är mest effektiva enligt denna studie. Hybrid system kan ta vara på fördelar från alla andra tekniker och kan synergiskt också motverka vissa av teknikernas förknippade brister, mot kostnaden av att implementations-komplexiteten ökar.
37

Fördelar med att applicera Collaborative Filtering på Steam : En utforskande studie / Benefits of Applying Collaborative Filtering on Steam : An explorative study

Bergqvist, Martin, Glansk, Jim January 2018 (has links)
Rekommendationssystem används överallt. På populära plattformar såsom Netflix och Amazon får du alltid rekommendationer på vad som är nästa lämpliga film eller inköp, baserat på din personliga profil. Detta sker genom korsreferering mellan användare och produkter för att finna sannolika mönster. Syftet med studien har varit att jämföra de två prevalenta tillvägagångssätten att skapa rekommendationer, på en annorlunda datamängd, där ”best practice” inte nödvändigtvis är tillämpbart. Som följd därav, har jämförelse gjorts på effektiviteten av Content-based Filtering kontra Collaborative Filtering, på Steams spelplattform, i syfte att etablera potential för en bättre lösning. Detta angreps genom att samla in data från Steam; Bygga en Content-based Filtering motor som baslinje för att representera Steams nuvarande rekommendationssystem, samt en motsvarande Collaborative Filtering motor, baserad på en standard-implementation, att jämföra mot. Under studiens gång visade det sig att Content-based Filtering prestanda initiellt växte linjärt medan spelarbasen på ett givet spel ökade. Collaborative Filtering däremot hade en exponentiell prestationskurva för spel med få spelare, för att sedan plana ut på en nivå som prestationsmässigt överträffade jämförelsmetoden. Den praktiska signifikansen av dessa resultat torde rättfärdiga en mer utbredd implementering av Collaborative Filtering även där man normalt avstår till förmån för Content-based Filtering då det är enklare att implementera och ger acceptabla resultat. Då våra resultat visar på såpass stor avvikelse redan vid basmodeller, är det här en attityd som mycket väl kan förändras. Collaborative Filtering har varit sparsamt använt på mer mångfacetterade datamängder, men våra resultat visar på potential att överträffa Content-based Filtering med relativt liten insats även på sådana datamängder. Detta kan gynna alla inköps- och community-kombinerade plattformar, då det finns möjlighet att övervaka användandet av inköpen i realtid, vilket möjliggör för justeringar av de faktorer som kan visa sig resultera i felrepresentation. / The use of recommender systems is everywhere. On popular platforms such as Netflix and Amazon, you are always given new recommendations on what to consume next, based on your specific profiling. This is done by cross-referencing users and products to find probable patterns. The aims of this study were to compare the two main ways of generating recommendations, in an unorthodox dataset where “best practice” might not apply. Subsequently, recommendation efficiency was compared between Content Based Filtering and Collaborative Filtering, on the gaming-platform of Steam, in order to establish if there was potential for a better solution. We approached this by gathering data from Steam, building a representational baseline Content-based Filtering recommendation-engine based on what is currently used by Steam, and a competing Collaborative Filtering engine based on a standard implementation. In the course of this study, we found that while Content-based Filtering performance initially grew linearly as the player base of a game increased, Collaborative Filtering’s performance grew exponentially from a small player base, to plateau at a performance-level exceeding the comparison. The practical consequence of these findings would be the justification to apply Collaborative Filtering even on smaller, more complex sets of data than is normally done; The justification being that Content-based Filtering is easier to implement and yields decent results. With our findings showing such a big discrepancy even at basic models, this attitude might well change. The usage of Collaborative Filtering has been used scarcely on the more multifaceted datasets, but our results show that the potential to exceed Content-based Filtering is rather easily obtainable on such sets as well. This potentially benefits all purchase/community-combined platforms, as the usage of the purchase is monitorable on-line, and allows for the adjustments of misrepresentational factors as they appear.
38

Improving Recommender Engines for Video Streaming Platforms with RNNs and Multivariate Data / Förbättring av Rekommendationsmotorer för Videoströmningsplattformar med RNN och Multivariata Data

Pérez Felipe, Daniel January 2022 (has links)
For over 4 years now, there has been a fierce fight for staying ahead in the so-called ”Streaming War”. The Covid-19 pandemic and its consequent confinement only worsened the situation. In such a market where the user is faced with too many streaming video services to choose from, retaining customers becomes a necessary must. Moreover, an extensive catalogue makes it even more difficult for the user to choose a movie from. Recommender Systems try to ease this task by analyzing the users’ interactions with the platform and predicting movies that, a priori, will be watched next. Neural Networks have started to be implemented as the underlying technology in the development of Recommender Systems. Yet, most streaming services fall victim to a highly uneven movies distribution, where a small fraction of their content is watched by most of their users, having the rest of their catalogue a limited number of views. This is the long-tail problem that makes for a difficult classification model. An RNN model was implemented to solve this problem. Following a multiple-experts classification strategy, where each classifier focuses only on a specific group of films, movies are clustered by popularity. These clusters were created following the Jenks natural breaks algorithm, clustering movies by minimizing the inner group variance and maximizing the outer group variance. This new implementation ended up outperforming other clustering methods, where the proposed Jenks’ movie clusters gave better results for the corresponding models. The model had, as input, an ordered stream of watched movies. An extra input variable, the date of the visualization, gave an increase in performance, being more noticeable in those clusters with a fewer amount of movies and more views, i.e., those clusters not corresponding to the least popular ones. The addition of an extra variable, the percent of movies watched, gave inconclusive results due to hardware limitations. / I över fyra år har det nu varit en hård kamp för att ligga i framkant i det så kallade ”Streaming kriget”. Covid-19-pandemin och den därpå följande karantänen förvärrade bara situationen. På en sådan marknad där användaren står inför alltför många streamingtjänster att välja mellan, blir kvarhållande av kunderna en nödvändighet. En omfattande katalog gör det dessutom ännu svårare för användaren att välja en film. Rekommendationssystem försöker underlätta denna uppgift genom att analysera användarnas interaktion med plattformen och förutsäga vilka filmer som kommer att ses härnäst. Neurala nätverk har börjat användas som underliggande teknik vid utvecklingen av rekommendationssystem. De flesta streamingtjänster har dock en mycket ojämn fördelning av filmerna, då en liten del av deras innehåll ses av de flesta av användarna, medan en stor del av deras katalog har ett begränsat antal visualiseringar. Detta så kallade ”Long Tail”-problem gör det svårt att skapa en klassificeringsmodell. En RNN-modell implementerades för att lösa detta problem. Genom att följa en klassificeringsstrategi med flera experter, där varje klassificerare endast fokuserar på en viss grupp av filmer, grupperas filmerna efter popularitet. Dessa kluster skapades enligt Jenks natural breaks-algoritm, som klustrar filmer genom att minimera variansen i den inre gruppen och maximera variansen i den yttre gruppen. Denna nya implementering överträffade till slut andra klustermetoder, där filmklustren föreslagna av Jenks gav bättre resultat för motsvarande modeller. Modellen hade som indata en ordnad ström av sedda filmer. En extra ingångsvariabel, datumet för visualiseringen, gav en ökning av prestandan, som var mer märkbar i de kluster med färre filmer och fler visualiseringar, dvs. de kluster som inte motsvarade de minst populära klustren. Tillägget av en extra variabel, procent av filmen som har setts, gav inte entydiga resultat på grund av hårdvarubegränsningar / Desde hace más de 4 años, se está librando una lucha encarnizada por mantenerse en cabeza en la llamada ”Guerra del Streaming”. La Covid-19 y su consiguiente confinamiento no han hecho más que empeorar la situación. En un mercado como éste, en el que el usuario se encuentra con demasiados servicios de vídeo en streaming entre los que elegir, retener a los clientes se convierte en una necesidad. Además, un catálogo extenso dificulta aún más la elección de una película por parte del usuario. Los sistemas de recomendación intentan facilitar esta tarea analizando las interacciones de los usuarios con la plataforma y predecir las películas que, a priori, se verán a continuación. Las Redes Neuronales han comenzado a implementarse como tecnología subyacente en el desarrollo de los sistemas de recomendación. Sin embargo, la mayoría de los servicios de streaming son víctimas de una distribución de películas muy desigual, en la que una pequeña fracción de sus contenidos es vista por la mayoría de sus usuarios, teniendo el resto de su catálogo un número muy inferior de visualizaciones. Este es el denominado problema de ”long-tail” que dificulta el modelo de clasificación. Para resolver este problema se implementó un modelo RNN. Siguiendo una estrategia de clasificación de expertos múltiples, en la que cada clasificador se centra en un único grupo específico de películas, agrupadas por popularidad. Estos clusters se crearon siguiendo el algoritmo de Jenks, agrupando las películas mediante minimización y maximización de la varianza entre grupos . Esta nueva implementación acabó superando a otros métodos de clustering, donde los clusters de películas de Jenks propuestos dieron mejores resultados para los modelos correspondientes. El modelo tenía como entrada un flujo ordenado de películas vistas. Una variable de entrada extra, la fecha de la visualización, dio un incremento en el rendimiento, siendo más notable en aquellos clusters con una menor cantidad de películas y más visualizaciones, es decir, aquellos clusters que no corresponden a los menos populares. La adición de una variable extra, el porcentaje de películas vistas, dio resultados no concluyentes debido a limitaciones hardware.
39

Shoppin’ in the Rain : An Evaluation of the Usefulness of Weather-Based Features for an ML Ranking Model in the Setting of Children’s Clothing Online Retailing / Handla i regnet : En utvärdering av användbarheten av väderbaserade variabler för en ML-rankningsmodell inom onlineförsäljning av barnkläder

Lorentz, Isac January 2023 (has links)
Online shopping offers numerous benefits, but large product catalogs make it difficult for shoppers to understand the existence and characteristics of every item for sale. To simplify the decision-making process, online retailers use ranking models to recommend products relevant to each individual user. Contextual user data, such as location, time, or local weather conditions, can serve as valuable features for ranking models, enabling personalized real-time recommendations. Little research has been published on the usefulness of weather-based features for ranking models in online clothing retailing, which makes additional research into this topic worthwhile. Using Swedish sales and customer data from Babyshop, an online retailer of children’s fashion, this study examined possible correlations between local weather data and sales. This was done by comparing differences in daily weather and differences in daily shares of sold items per clothing category for two cities: Stockholm and Göteborg. With Malmö as an additional city, historical observational weather data from one location each in the three cities Stockholm, Göteborg, and Malmö was then featurized and used along with the customers’ postal towns, sales features, and sales trend features to train and evaluate the ranking relevancy of a gradient boosted decision trees learning to rank LightGBM ranking model with weather features. The ranking relevancy was compared against a LightGBM baseline that omitted the weather features and a naive baseline: a popularity-based ranker. Several possible correlations between a clothing category such as shorts, rainwear, shell jackets, winter wear, and a weather variable such as feels-like temperature, solar energy, wind speed, precipitation, snow, and snow depth were found. Evaluation of the ranking relevancy was done using the mean reciprocal rank and the mean average precision @ 10 on a small dataset consisting only of customer data from the postal towns Stockholm, Göteborg, and Malmö and also on a larger dataset where customers in postal towns from larger geographical areas had their home locations approximated as Stockholm, Göteborg or Malmö. The LightGBM rankers beat the naive baseline in three out of four configurations, and the ranker with weather features outperformed the LightGBM baseline by 1.1 to 2.2 percent across all configurations. The findings can potentially help online clothing retailers create more relevant product recommendations. / Internethandel erbjuder flera fördelar, men stora produktsortiment gör det svårt för konsumenter att känna till existensen av och egenskaperna hos alla produkter som saluförs. För att förenkla beslutsprocessen så använder internethandlare rankningsmodeller för att rekommendera relevanta produkter till varje enskild användare. Kontextuell användardata såsom tid på dygnet, användarens plats eller lokalt väder kan vara värdefulla variabler för rankningsmodeller då det möjliggör personaliserade realtidsrekommendationer. Det finns inte mycket publicerad forskning inom nyttan av väderbaserade variabler för produktrekommendationssystem inom internethandel av kläder, vilket gör ytterligare studier inom detta område intressant. Med hjälp av svensk försäljnings- och kunddata från Babyshop, en internethandel för barnkläder så undersökte denna studie möjliga korrelationer mellan lokal väderdata och försäljning. Detta gjordes genom att jämföra skillnaderna i dagligt väder och skillnaderna i dagliga andelar av sålda artiklar per klädeskategori för två städer: Stockholm och Göteborg. Med Malmö som ytterligare en stad så gjordes historiska metereologiska observationer från en plats var i Stockholm, Göteborg och Malmö till variabler och användes tillsammans med kundernas postorter, försäljningsvariabler och variabler för försäljningstrender för att träna och utvärdera rankningsrelevansen hos en gradient-boosted decision trees learning to rank LightGBM rankningsmodell med vädervariabler. Rankningsrelevansen jämfördes mot en LightGBM baslinjesmodel som saknade vädervariabler samt en naiv baslinje: en popularitetsbaserad rankningsmodell. Flera möjliga korrelationer mellan en klädeskategori som shorts, regnkläder, skaljackor, vinterkläder och och en daglig vädervariabel som känns-som-temperatur, solenergi, vindhastighet, nederbörd, snö och snödjup upptäcktes. Utvärderingen av rankingsrelevansen utfördes med mean reciprocal rank och mean average precision @ 10 på ett mindre dataset som bestod endast av kunddata från postorterna Stockholm, Göteborg och Malmö och även på ett större dataset där kunder med postorter från större geografiska områden fick sina hemorter approximerade som Stockholm, Göteborg eller Malmö. LigthGBM-rankningsmodellerna slog den naiva baslinjen i tre av fyra konfigurationer och rankningsmodellen med vädervariabler slog LightGBM baslinjen med 1.1 till 2.2 procent i alla konfigurationer. Resultaten kan potentiellt hjälpa internethandlare inom mode att skapa bättre produktrekommendationssystem.
40

Attention-based Multi-Behavior Sequential Network for E-commerce Recommendation / Rekommendation för uppmärksamhetsbaserat multibeteende sekventiellt nätverk för e-handel

Li, Zilong January 2022 (has links)
The original intention of the recommender system is to solve the problem of information explosion, hoping to help users find the content they need more efficiently. In an e-commerce platform, users typically interact with items that they are interested in or need in a variety of ways. For example, buying, browsing details, etc. These interactions are recorded as time-series information. How to use this sequential information to predict user behaviors in the future and give an efficient and effective recommendation is a very important problem. For content providers, such as merchants in e-commerce platforms, more accurate recommendation means higher traffic, CTR (click-through rate), and revenue. Therefore, in the industry, the CTR model for recommendation systems is a research hotspot. However, in the fine ranking stage of the recommendation system, the existing models have some limitations. No researcher has attempted to predict multiple behaviors of one user simultaneously by processing sequential information. We define this problem as the multi-task sequential recommendation problem. In response to this problem, we study the CTR model, sequential recommendation, and multi-task learning. Based on these studies, this paper proposes AMBSN (Attention-based Multi-Behavior Sequential Network). Specifically, we added a transformer layer, the activation unit, and the multi-task tower to the traditional Embedding&MLP (multi-layer perceptron) model. The transformer layer enables our model to efficiently extract sequential behavior information, the activation unit can understand user interests, and the multi-task tower structure makes the model give the prediction of different user behaviors at the same time. We choose user behavior data from Taobao for recommendation published on TianChi as the dataset, and AUC as the evaluation criterion. We compare the performance of AMBSN and some other models on the test set after training. The final results of the experiment show that our model outperforms some existing models. / L’intenzione originale del sistema di raccomandazione è risolvere il problema dell’esplosione delle informazioni, sperando di aiutare gli utenti a trovare il contenuto di cui hanno bisogno in modo più efficiente. In una piattaforma di e-commerce, gli utenti in genere interagiscono con gli articoli a cui sono interessati o di cui hanno bisogno in vari modi. Ad esempio, acquisti, dettagli di navigazione, ecc. Queste interazioni vengono registrate come informazioni di serie temporali. Come utilizzare queste informazioni sequenziali per prevedere i comportamenti degli utenti in futuro e fornire una raccomandazione efficiente ed efficace è un problema molto importante. Per i fornitori di contenuti, come i commercianti nelle piattaforme di e-commerce, una raccomandazione più accurata significa traffico, CTR (percentuale di clic) ed entrate più elevati. Pertanto, nel settore, il modello CTR per i sistemi di raccomandazione è un hotspot di ricerca. Tuttavia, nella fase di classificazione fine del sistema di raccomandazione, i modelli esistenti presentano alcune limitazioni. Nessun ricercatore ha tentato di prevedere più comportamenti di un utente contemporaneamente elaborando informazioni sequenziali. Definiamo questo problema come il problema di raccomandazione sequenziale multi-task. In risposta a questo problema, studiamo il modello CTR, la raccomandazione sequenziale e l’apprendimento multi-task. Sulla base di questi studi, questo documento propone AMBSN (Attention-based Multi-Behavior Sequential Network). In particolare, abbiamo aggiunto uno strato trasformatore, l’unità di attivazione e la torre multi-task al tradizionale modello Embedding&MLP (multi-layer perceptron). Il livello del trasformatore consente al nostro modello di estrarre in modo efficiente le informazioni sul comportamento sequenziale, l’unità di attivazione può comprendere gli interessi degli utenti e la struttura della torre multi-task fa sì che il modello fornisca la previsione di diversi comportamenti degli utenti contemporaneamente. Scegliamo i dati sul comportamento degli utenti da Taobao per la raccomandazione pubblicata su TianChi come set di dati e l’AUC come criterio di valutazione. Confrontiamo le prestazioni di AMBSN e di alcuni altri modelli sul set di test dopo l’allenamento. I risultati finali dell’esperimento mostrano che il nostro modello supera alcuni modelli esistenti.

Page generated in 0.1064 seconds