Return to search

Modeling user behavior from e-commerce data with hidden Markov models and logistic regression

Mining online user data has become more and more popular in e-commerce. Businesses are using this data to do customization and user behavior prediction and one main applications of this information is advertisement. In this thesis, we address the problem of finding the influence of advertisements on a user's purchase behavior, by using machine learning methods to analyze purchase data obtained from real online retail systems. The hypothesis driving the model we propose is that different ads have different influences, but also the same ad can make the user behave differently if she is in different inner states. To capture this last aspect, we approached this problem using Hidden Markov Models for users. To consider the influence of ads and their properties, we replaced the traditional observation model of a Hidden Markov Model with Logistic Regression, which allows us to define an observation model depending not only on the HMM state, but also on external events such as advertising campaigns. We use a large online user data by an industry partner and our model is fit to predict if the user will make a purchase at a specific time interval or not. / L'éxploration des données utilisateurs en ligne est devenu de plus en plus populaire dans le commerce éléctronique. Les entreprises utilisent ces données pour la personnalisation et la prévision du comportement des utilisateurs, et une des applications principales de cette information est la publicité. Dans cette thèse, nous abordons le problème de trouver l'influence de la publicité sur le comportement d'achat d'un utilisateur, à l'aide de l'apprentissage automatique. Nous utilisons un jeu de données réelles provenant d'un détaillant en ligne. L'hypothèse de base du modèle que nous proposons est que les différentes annonces ont des influences différentes, mais aussi la meme annonce peut faire l'utilisateur se comporter différemment si lui ou elle se trouve dans différents états intérieurs. Pour capturer ce dernier aspect, nous avons abordé ce problème en utilisant des modèles Markov cachés pour modeller les utilisateurs. Pour étudier l'influence des annonces et leurs propriétés, nous avons remplacé le modèle d'observation traditionnelle par modèle Markov caché avec la régression logistique, ce qui nous permet de définir un modèle d'observation enfonction non seulement de l'état HMM, mais aussi sur des événements externes telsque les campagnes de publicité. Nous utilisons une grande quantité de données utilisateur en ligne provenant d'un partenaire industriel. Notre modèle est ajusté pourprédire si l'utilisateur fera un achat dans un intervalle de temps spécifié ou non

Identiferoai:union.ndltd.org:LACETR/oai:collectionscanada.gc.ca:QMM.117174
Date January 2013
CreatorsMohammadifard, Nakisa
ContributorsDoina Precup (Internal/Supervisor)
PublisherMcGill University
Source SetsLibrary and Archives Canada ETDs Repository / Centre d'archives des thèses électroniques de Bibliothèque et Archives Canada
LanguageEnglish
Detected LanguageFrench
TypeElectronic Thesis or Dissertation
Formatapplication/pdf
CoverageMaster of Science (School of Computer Science)
RightsAll items in eScholarship@McGill are protected by copyright with all rights reserved unless otherwise indicated.
RelationElectronically-submitted theses.

Page generated in 0.0019 seconds