Nous sommes à l’aube d’une nouvelle ère du data mining, celle du stockage, traitement, analyse et exploitation des données massives que l’on appelle Big Data. Les données sont devenues une nouvelle matière première, très prisée par les entreprises de tout type et de toute taille à travers le monde ; elles permettent d’analyser, de comprendre, de modéliser et d’expliquer certains phénomènes comme le comportement et les préférences des utilisateurs ou clients d’une entreprise donnée. La compréhension des préférences des utilisateurs et des clients d’une entreprise permet de leur proposer de la publicité ciblée afin d’augmenter les ventes et la satisfaction des clients et ainsi pouvoir améliorer les revenues de l’entreprise, ce que les géants du Web comme Google, Facebook, LinkedIn et Twitter ont bien compris. Cette thèse de doctorat a été réalisée dans le cadre d’une convention CIFRE entre le laboratoire L2TI de l’université Paris 13 et la start-up franco-américaineWork4 qui développe des applications de recrutement sur Facebook. Son objectif principal était la mise au point d’un ensemble d’algorithmes et méthodes pour proposer aux utilisateurs des réseaux sociaux les offres d’emploi les plus pertinentes. Le développement de nos algorithmes de recommandation a nécessité de surmonter de nombreuses difficultés telles que le préservation de la vie privée des utilisateurs des réseaux sociaux, le traitement des données bruitées et incomplètes des utilisateurs et des offres d’emploi, la difficulté de traitement des données multi-langues et, plus généralement, la difficulté d’extraire automatiquement les offres d’emploi pertinentes pour un utilisateur donné parmi un ensemble d’offres d’emploi. Les systèmes développés durant cette thèse sont principalement basés sur les techniques de systèmes de recommandation, de recherche documentaire,de fouille de données et d’apprentissage artificiel ; ils ont été validés sur des jeux de données réels collectés par l’entreprise Work4. Dans le cadre de cette étude, les utilisateurs d’un réseau social sont liés à trois types entités : les offres d’emploi qui leur sont pertinentes, les autres utilisateurs du réseau social auxquels ils se sont liés d’amitié et les données personnelles qu’ils ont publiées sur leurs profils. Les profils des utilisateurs des réseaux sociaux et la description de nos offres d’emploi sont constitués de plusieurs champs contenant des informations textuelles. / We are entering a new era of data mining in which the main challenge is the storing andprocessing of massive data : this is leading to a new promising research and industry field called Big data. Data are currently a new raw material coveted by businesses of all sizes and all sectors. They allow organizations to analyze, understand, model and explain phenomen a such as the behavior of their users or customers. Some companies like Google, Facebook,LinkedIn and Twitter are using user data to determine their preferences in order to make targeted advertisements to increase their revenues.This thesis has been carried out in collaboration between the laboratory L2TI andWork4, a French-American startup that offers Facebook recruitment solutions. Its main objective was the development of systems recommending relevant jobs to social network users ; the developed systems have been used to advertise job positions on social networks. After studying the literature about recommender systems, information retrieval, data mining and machine learning, we modeled social users using data they posted on their profiles, those of their social relationships together with the bag-of-words and ontology-based models. We measure the interests of users for jobs using both heuristics and models based on machine learning. The development of efficient job recommender systems involved to tackle the problem of categorization and summarization of user profiles and job descriptions. After developing job recommender systems on social networks, we developed a set of systems called Work4 Oracle that predict the audience (number of clicks) of job advertisements posted on Facebook, LinkedIn or Twitter. The analysis of the results of Work4 Oracle allows us to find and quantify factors impacting the popularity of job ads posted on social networks, these results have been compared to those of the literature of Human Resource Management. All our proposed systems deal with privacy preservation by only using the data that social network users explicitly allowed to access to ; they also deal with noisy and missing data of social network users and have been validated on real-world data provided by Work4.
Identifer | oai:union.ndltd.org:theses.fr/2015USPCD012 |
Date | 04 June 2015 |
Creators | Diaby, Mamadou |
Contributors | Sorbonne Paris Cité, Viennet, Emmanuel |
Source Sets | Dépôt national des thèses électroniques françaises |
Language | English |
Detected Language | English |
Type | Electronic Thesis or Dissertation, Text |
Page generated in 0.0021 seconds