The last decade has brought with it a wave of innovative technology, shifting the channels through which creative content is created, consumed, and categorized. And, as our interactions with creative multimedia content shift towards online platforms, the sheer quantity of content on these platforms has necessitated the integration of algorithmic guidance in the discovery of these spaces. In this way, the recommendation algorithms that guide users' interactions with various art forms have been cast into the role of gatekeepers and begun to play an increasingly influential role in shaping the creation of artistic content. The work laid out in the following chapters fuses three major areas of research: graph representation learning, music information retrieval, and fairness as applied to the task of music recommendation. In recent years, graph neural networks (GNNs), a powerful new architecture which enables deep learning approaches to be applied to graph or network structures, have proven incredibly influential in the music recommendation domain. In tandem with the striking performance gains that GNNs are able to achieve, many of these systems, have been shown to be strongly influenced by the degree, or number of outgoing edges, of individual nodes. More concretely, recent works have uncovered disparities in the qualities of representations learned by state of the art GNNs between nodes which are strongly and weakly connected. Translating these findings to the sphere of recommender systems, where nodes and edges are used to represent the interactions between users and various items, these disparities in representation that are contingent upon a node's connectivity can be seen as a form of popularity bias. And, indeed, within the broader recommendation community, popularity bias has long been considered an open problem, in which recommender systems begin to favor mainstream content over, potentially more relevant, but niche or novel items. If left unchecked these algorithmic nudged towards previously popular content can create, intensify, and enforce negative cycles that perpetuate disparities in representation on both the user and the creator ends of the content consumption pipeline. Particularly in the recommendation of creative (e.g. musical) content, the downstream effects in these disparities of visibility can have genuine economic consequences for artists from under-represented communities. Thus, the problem of popularity bias is something that must be addressed from both a technical and societal perspective. And, as the influence of recommender systems continues to spread, the effects of this phenomenon only become more spurious, as they begin to have critical downstream effects that shape the larger ecosystems in which art is created. Thus, the broad focus of thesis is the mitigation of popularity bias in music recommendation. In order to tailor our exploration of this issue to the graph domain, we begin by formalizing the relationship between degree fairness and popularity bias. In doing so, we concretely define the notion of popularity, grounding it in the structural principles of an interaction network, and enabling us to design objectives that can mitigate the effects of popularity on representation learning. In our first work, we focus on understanding the effects of sampling on degree fairness in uni-partite graphs. The purpose of this work is to lay the foundation for the graph neural network model which will underlie our music recommender system. We then build off this first work by extending the initial fairness framework to be compatible with bi-partite graphs and applying it to the music domain. The motivation of this work is rooted in the notion of discovery, or the idea that users engage with algorithmic curation in order to find content that is both novel and relevant to their artistic tastes. We present the intrinsic relationship between discovery objectives and the presence of popularity bias, explaining that the presence of popularity bias can blind a system to the musical qualities that underpin the underlying needs of music listening. As we will explain in later sections, one of the key elements of this work is our ability to ground our fairness notion in the musical domain. Thus, we propose a domain-aware, individual fairness-based approach which addresses popularity bias in graph neural network (GNNs) based recommender systems. In order to facilitate this domain awareness, we perform extensive dataset augmentation, taking two state of the art music recommendation datasets and augmenting them with rich multi-modal node-level features. Finally, we ground our evaluation in the cold start setting, showing the importance of inductive methodologies in the music space. / La dernière décennie a apporté avec elle une vague de technologies innovantes, modifiant
la manière dont le contenu créatif est créé, consommé et catégorisé. Et, à mesure que nos
interactions avec les contenus multimédias créatifs se déplacent vers les plateformes en ligne,
la quantité de contenu sur ces plateformes a nécessité l’intégration d’un guidage algorithmique
dans la découverte de ces espaces. De cette façon, les algorithmes de recommandation
qui guident les interactions des utilisateurs avec diverses formes d’art ont été jetés dans le
rôle de gardiens et ont commencé à jouer un rôle de plus en plus influent dans l’élaboration
de la création de contenu artistique.
Le travail présenté dans les chapitres suivants fusionne trois grands domaines de recherche
: l’apprentissage de la représentation graphique, la recherche d’informations musicales
et l’équité appliquée à la tâche de recommandation musicale. Alors que l’influence
des systèmes de recommandation continue de s’étendre et de s’intensifier, il est crucial de
prendre en compte les effets en aval que les choix de conception peuvent avoir sur l’écosystème
plus large de la création artistique. Ces dernières années, l’intégration des réseaux
sociaux dans la tâche de recommandation musicale a donné naissance aux réseaux neuronaux
de graphes (GNN), une nouvelle architecture capable de faire des prédictions sur les structures
de graphes. Parallèlement aux gains miraculeux que les GNN sont capables de réaliser,
bon nombre de ces systèmes peuvent également être la proie de biais de popularité, les
forçant à privilégier le contenu grand public par rapport à des éléments potentiellement plus
pertinents, mais de niche ou nouveaux. S’il n’est pas maîtrisé, ce cycle négatif peut perpétuer
les disparités de représentation entre la musique d’artistes, de genres ou de populations
minoritaires. Et, ce faisant, les disparités dans la visibilité des éléments peuvent entraîner
des problèmes à la fois du point de vue des performances et de la société.
L’objectif de la thèse est l’atténuation du biais de popularité. Premièrement, le travail
formalise les liens entre l’équité individuelle et la présence d’un biais de popularité parmi
les contenus créatifs. Ensuite, nous étendons un cadre d’équité individuelle, en l’appliquant
au domaine de la recommandation musicale. Le coeur de cette thèse s’articule autour de
la proposition d’une approche basée sur l’équité individuelle et sensible au domaine qui
traite le biais de popularité dans les systèmes de recommandation basés sur les réseaux de
5
neurones graphiques (GNN). L’un des éléments clés de ce travail est notre capacité à ancrer
notre notion d’équité dans le domaine musical. Afin de faciliter cette prise de conscience du
domaine, nous effectuons une augmentation étendue des ensembles de données, en prenant
deux ensembles de données de recommandation musicale à la pointe de la technologie et en
les augmentant avec de riches fonctionnalités multimodales au niveau des noeuds. Enfin, nous
fondons notre évaluation sur le démarrage à froid, montrant l’importance des méthodologies
inductives dans l’espace musical.
Identifer | oai:union.ndltd.org:umontreal.ca/oai:papyrus.bib.umontreal.ca:1866/32535 |
Date | 11 1900 |
Creators | Salganik, Rebecca |
Contributors | Farnadi, Golnoosh |
Source Sets | Université de Montréal |
Language | English |
Detected Language | English |
Type | thesis, thèse |
Format | application/pdf |
Page generated in 0.003 seconds