• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 24
  • 19
  • 1
  • Tagged with
  • 44
  • 44
  • 33
  • 26
  • 12
  • 12
  • 11
  • 10
  • 9
  • 9
  • 9
  • 8
  • 8
  • 8
  • 8
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
11

Passage à l’échelle des systèmes de recommandation avec respect de la vie privée / Privacy-enabled scalable recommender systems

Moreno Barbosa, Andrés Dario 10 December 2014 (has links)
L'objectif principal de la thèse est de proposer une méthode de recommandation prenant en compte la vie privée des utilisateurs ainsi que l'évolutivité du système. Pour atteindre cet objectif, une technique hybride basée sur le filtrage par contenu et le filtrage collaboratif est utilisée pour atteindre un modèle précis de recommandation, sous la pression des mécanismes visant à maintenir la vie privée des utilisateurs. Les contributions de la thèse sont trois : Tout d'abord, un modèle de filtrage collaboratif est défini en utilisant agent côté client qui interagit avec l'information sur les éléments, cette information est stockée du côté du système de recommandation. Ce modèle est augmenté d’un modèle hybride qui comprend une stratégie basée sur le filtrage par contenu. En utilisant un modèle de la connaissance basée sur des mots clés qui décrivent le domaine de l'article filtré, l'approche hybride augmente la performance de prédiction des modèles sans élever l’effort de calcul, dans un scenario du réglage de démarrage à froid. Finalement, certaines stratégies pour améliorer la protection de la vie privée du système de recommandation sont introduites : la génération de bruit aléatoire est utilisée pour limiter les conséquences éventuelles d'une attaque lorsque l'on observe en permanence l'interaction entre l'agent côté client et le serveur, et une stratégie basée sur la liste noire est utilisée pour s’abstenir de révéler au serveur des interactions avec des articles que l'utilisateur considère comme pouvant transgresser sa vie privée. L'utilisation du modèle hybride atténue l'impact négatif que ces stratégies provoquent sur la performance prédictive des recommandations. / The main objective of this thesis is to propose a recommendation method that keeps in mind the privacy of users as well as the scalability of the system. To achieve this goal, an hybrid technique using content-based and collaborative filtering paradigms is used in order to attain an accurate model for recommendation, under the strain of mechanisms designed to keep user privacy, particularly designed to reduce the user exposure risk. The thesis contributions are threefold : First, a Collaborative Filtering model is defined by using client-side agent that interacts with public information about items kept on the recommender system side. Later, this model is extended into an hybrid approach for recommendation that includes a content-based strategy for content recommendation. Using a knowledge model based on keywords that describe the item domain, the hybrid approach increases the predictive performance of the models without much computational effort on the cold-start setting. Finally, some strategies to improve the recommender system's provided privacy are introduced: Random noise generation is used to limit the possible inferences an attacker can make when continually observing the interaction between the client-side agent and the server, and a blacklisted strategy is used to refrain the server from learning interactions that the user considers violate her privacy. The use of the hybrid model mitigates the negative impact these strategies cause on the predictive performance of the recommendations.
12

Context-aware recommender systems for real-world applications / Systèmes de recommandation contextuels pour les applications du monde réel

Al-Ghossein, Marie 11 February 2019 (has links)
Les systèmes de recommandation se sont révélés être des outils efficaces pour aider les utilisateurs à faire face à la surcharge informationnelle. D’importants progrès ont été réalisés dans le domaine durant les deux dernières décennies, menant en particulier à l’exploitation de l’information contextuelle pour modéliser l’aspect dynamique des utilisateurs et des articles. La définition traditionnelle du contexte, adoptée dans la plupart des systèmes de recommandation contextuels, ne répond pas à plusieurs contraintes rencontrées dans les applications du monde réel. Dans cette thèse, nous abordons les problèmes de recommandation en présence d’informations contextuelles partiellement observables et d’informations contextuelles non observables dans deux applications particulières, la recommandation d’hôtels et la recommandation en ligne, remettant en question plusieurs aspects de la définition traditionnelle du contexte, notamment l'accessibilité, la pertinence, l'acquisition et la modélisation.La première partie de la thèse étudie le problème de recommandation d’hôtels qui souffre du démarrage à froid continu, limitant la performance des approches classiques de recommandation. Le voyage n’est pas une activité fréquente et les utilisateurs ont tendance à adopter des comportements diversifiés en fonction de leurs situations spécifiques. Après une analyse du comportement des utilisateurs dans ce domaine, nous proposons de nouvelles approches de recommandation intégrant des informations contextuelles partiellement observables affectant les utilisateurs. Nous montrons comment cela contribue à améliorer la qualité des recommandations.La deuxième partie de la thèse aborde le problème de recommandation en ligne en présence de flux de données où les observations apparaissent continûment à haute fréquence. Nous considérons que les utilisateurs et les articles reposent sur des informations contextuelles non observables par le système et évoluent de façons différentes à des rythmes différents. Nous proposons alors d’effectuer de la détection active de changements et d’assurer la mise à jour des modèles en temps réel. Nous concevons de nouvelles méthodes qui s’adaptent aux changements qui apparaissent au niveau des préférences des utilisateurs et des perceptions et descriptions des articles, et montrons l’importance de la recommandation adaptative en ligne pour garantir de bonnes performances au cours du temps. / Recommender systems have proven to be valuable tools to help users overcome the information overload, and significant advances have been made in the field over the last two decades. In particular, contextual information has been leveraged to model the dynamics occurring within users and items. Context is a complex notion and its traditional definition, which is adopted in most recommender systems, fails to cope with several issues occurring in real-world applications. In this thesis, we address the problems of partially observable and unobservable contexts in two particular applications, hotel recommendation and online recommendation, challenging several aspects of the traditional definition of context, including accessibility, relevance, acquisition, and modeling.The first part of the thesis investigates the problem of hotel recommendation which suffers from the continuous cold-start issue, limiting the performance of classical approaches for recommendation. Traveling is not a frequent activity and users tend to have multifaceted behaviors depending on their specific situation. Following an analysis of the user behavior in this domain, we propose novel recommendation approaches integrating partially observable context affecting users and we show how it contributes in improving the recommendation quality.The second part of the thesis addresses the problem of online adaptive recommendation in streaming environments where data is continuously generated. Users and items may depend on some unobservable context and can evolve in different ways and at different rates. We propose to perform online recommendation by actively detecting drifts and updating models accordingly in real-time. We design novel methods adapting to changes occurring in user preferences, item perceptions, and item descriptions, and show the importance of online adaptive recommendation to ensure a good performance over time.
13

Approche renouvelée de l'acte de consommation numérique : étude sur l'application du droit de la consommation aux mécanismes de recommandation présents sur les plateformes sociales

Osmond, Théo 13 December 2023 (has links)
Maîtrise en droit avec Mémoire - Bidiplôme en droit de la propriété intellectuelle fondamentale et technologies numériques / À une époque où la majorité de l'offre informationnelle et culturelle est accessible par le biais des plateformes numériques, le contrôle de ces canaux de diffusion est une activité éminemment politique aux conséquences souvent liberticides. Les systèmes de recommandation massivement déployés par ces acteurs contribuent alors à l'organisation de cette masse de contenus aux dépends des internautes utilisateurs de ces services qui se trouvent manipulés et lésés dans l'exercice de nombre de leurs droits fondamentaux. Malgré ce constat alarmant, le droit actuel ne présente qu'un intérêt mineur pour ces systèmes de recommandation. Cette étude franco-québécoise vise ainsi à présenter une adaptation possible du dispositif consumériste actuel pour proposer un encadrement novateur de ces mécanismes de recommandation. Le droit de la consommation porte en lui l'ensemble des éléments propres à son évolution en faveur d'une protection grandissante des internautes, notamment aux regards des atteintes aux droits et libertés liées aux nouveaux modes de consommation numériques. Proposant une vision renouvelée de l'acte de consommation pour l'adapter à nos sociétés numériques, l'étude entend ainsi détailler une des possibilités offerte aux organes judiciaires et législatifs pour renforcer la protection des individus face aux dangers technologiques propres aux plateformes numériques.
14

Mures : Un système de recommandation de musique

Arnautu, Octavian Rolland 11 1900 (has links)
Pendant la dernière décennie nous avons vu une transformation incroyable du monde de la musique qui est passé des cassettes et disques compacts à la musique numérique en ligne. Avec l'explosion de la musique numérique, nous avons besoin de systèmes de recommandation de musique pour choisir les chansons susceptibles d’être appréciés à partir de ces énormes bases de données en ligne ou personnelles. Actuellement, la plupart des systèmes de recommandation de musique utilisent l’algorithme de filtrage collaboratif ou celui du filtrage à base de contenu. Dans ce mémoire, nous proposons un algorithme hybride et original qui combine le filtrage collaboratif avec le filtrage basé sur étiquetage, amélioré par la technique de filtrage basée sur le contexte d’utilisation afin de produire de meilleures recommandations. Notre approche suppose que les préférences de l'utilisateur changent selon le contexte d'utilisation. Par exemple, un utilisateur écoute un genre de musique en conduisant vers son travail, un autre type en voyageant avec la famille en vacances, un autre pendant une soirée romantique ou aux fêtes. De plus, si la sélection a été générée pour plus d'un utilisateur (voyage en famille, fête) le système proposera des chansons en fonction des préférences de tous ces utilisateurs. L'objectif principal de notre système est de recommander à l'utilisateur de la musique à partir de sa collection personnelle ou à partir de la collection du système, les nouveautés et les prochains concerts. Un autre objectif de notre système sera de collecter des données provenant de sources extérieures, en s'appuyant sur des techniques de crawling et sur les flux RSS pour offrir des informations reliées à la musique tels que: les nouveautés, les prochains concerts, les paroles et les artistes similaires. Nous essayerons d’unifier des ensembles de données disponibles gratuitement sur le Web tels que les habitudes d’écoute de Last.fm, la base de données de la musique de MusicBrainz et les étiquettes des MusicStrands afin d'obtenir des identificateurs uniques pour les chansons, les albums et les artistes. / In the last decade we have seen an incredible transformation of the world of music, from cassette tapes and compact discs to online digital music. With the explosion of the digital music we need music recommender systems to select those probably preferred songs from these huge online or personal databases. Currently, most music recommender systems use either collaborative (social) filtering or content-based algorithms. In this work we propose an original hybrid collaborative and tag-based algorithm improved by the context-of-use filtering technique in order to generate better playlists. Our approach assumes that user preferences change depending on the context of use. For example, a user listen one kind of music while driving to work, another type while traveling with the family on vacation, another one in a romantic evening or at parties. Additionally, if the playlist was generated for more than one user (family trip, party) the system will propose songs depending on the preferences of all these users. The main goal of our system is to recommend music to the user from the personal music collection or new music from system music collection, new releases and incoming concerts. Another goal of our system it will be to gather data from external sources based on crawling techniques and RSS Feeds to provide music related content like: new releases, incoming concerts, lyrics, similar artists. We’ll try to interlink some free available datasets on the web like listening habits from Last.fm, music database from MusicBrainz and tags from MusicStrands in order to obtain unique identifiers for songs, albums and artists.
15

Mures : Un système de recommandation de musique

Arnautu, Octavian Rolland 11 1900 (has links)
Pendant la dernière décennie nous avons vu une transformation incroyable du monde de la musique qui est passé des cassettes et disques compacts à la musique numérique en ligne. Avec l'explosion de la musique numérique, nous avons besoin de systèmes de recommandation de musique pour choisir les chansons susceptibles d’être appréciés à partir de ces énormes bases de données en ligne ou personnelles. Actuellement, la plupart des systèmes de recommandation de musique utilisent l’algorithme de filtrage collaboratif ou celui du filtrage à base de contenu. Dans ce mémoire, nous proposons un algorithme hybride et original qui combine le filtrage collaboratif avec le filtrage basé sur étiquetage, amélioré par la technique de filtrage basée sur le contexte d’utilisation afin de produire de meilleures recommandations. Notre approche suppose que les préférences de l'utilisateur changent selon le contexte d'utilisation. Par exemple, un utilisateur écoute un genre de musique en conduisant vers son travail, un autre type en voyageant avec la famille en vacances, un autre pendant une soirée romantique ou aux fêtes. De plus, si la sélection a été générée pour plus d'un utilisateur (voyage en famille, fête) le système proposera des chansons en fonction des préférences de tous ces utilisateurs. L'objectif principal de notre système est de recommander à l'utilisateur de la musique à partir de sa collection personnelle ou à partir de la collection du système, les nouveautés et les prochains concerts. Un autre objectif de notre système sera de collecter des données provenant de sources extérieures, en s'appuyant sur des techniques de crawling et sur les flux RSS pour offrir des informations reliées à la musique tels que: les nouveautés, les prochains concerts, les paroles et les artistes similaires. Nous essayerons d’unifier des ensembles de données disponibles gratuitement sur le Web tels que les habitudes d’écoute de Last.fm, la base de données de la musique de MusicBrainz et les étiquettes des MusicStrands afin d'obtenir des identificateurs uniques pour les chansons, les albums et les artistes. / In the last decade we have seen an incredible transformation of the world of music, from cassette tapes and compact discs to online digital music. With the explosion of the digital music we need music recommender systems to select those probably preferred songs from these huge online or personal databases. Currently, most music recommender systems use either collaborative (social) filtering or content-based algorithms. In this work we propose an original hybrid collaborative and tag-based algorithm improved by the context-of-use filtering technique in order to generate better playlists. Our approach assumes that user preferences change depending on the context of use. For example, a user listen one kind of music while driving to work, another type while traveling with the family on vacation, another one in a romantic evening or at parties. Additionally, if the playlist was generated for more than one user (family trip, party) the system will propose songs depending on the preferences of all these users. The main goal of our system is to recommend music to the user from the personal music collection or new music from system music collection, new releases and incoming concerts. Another goal of our system it will be to gather data from external sources based on crawling techniques and RSS Feeds to provide music related content like: new releases, incoming concerts, lyrics, similar artists. We’ll try to interlink some free available datasets on the web like listening habits from Last.fm, music database from MusicBrainz and tags from MusicStrands in order to obtain unique identifiers for songs, albums and artists.
16

Towards Semantic-Social Recommender Systems / Systèmes de recommandation sociaux et sémantiques

Sulieman, Dalia 30 January 2014 (has links)
Dans cette thèse, nous proposons des algorithmes de recommandation sémantique et sociale, qui recommandent un produit pour les utilisateurs qui sont connectés par un réseau de collaboration sociale. Ces algorithmes utilisent deux types d'informations : information sémantique et information sociale .L' information sémantique est basée sur la pertinence sémantique entre les utilisateurs et le produit à recommandé, tandis que l' information sociale est basée sur la position de l'utilisateur et de leur type et de la qualité des connexions entre eux dans le réseau de collaboration . Enfin, nous utilisons l'algorithme de parcoure profondeur (DFS) et l'algorithme de parcoure en largeur (BFS), pour explorer le réseau social.Utilisation de l' information sémantique et l'information sociale , dans le système de recommandation , nous aide à explorer partiellement le réseau social , ce qui nous conduit à réduire la taille des données explorées et de minimiser le temps de recherche dans le réseau.Nous appliquons nos algorithmes sur des données réelles : MovieLens et Amazon , et nous comparons la précision de la performance de nos algorithmes avec les algorithmes de recommandation classiques , comme l'algorithme de filtrage collaborative et l'algorithme hybrideNos résultats montrent un taux de précision satisfaisants , et une performance très significative du temps d'exécution et de la taille des données explorées , par rapport aux autres algorithmes de recommandation classiques .En fait , l'importance de nos algorithmes repose sur le fait que ces algorithmes explorent une très petite partie du graphe , au lieu d'explorer tout le graphe que les méthodes de recherche classiques , et encore donnent une bonne précision par rapport aux autres algorithmes de recommandation classiques . Donc , en minimisant la taille des données recherchées n'influence pas mal la précision des résultats . / In this thesis we propose semantic-social recommendation algorithms, that recommend an input item to users connected by a collaboration social network. These algorithms use two types of information: semantic information and social information.The semantic information is based on the semantic relevancy between users and the input item; while the social information is based on the users position and their type and quality of connections in the collaboration social network. Finally, we use depth-first search and breath-first search strategies to explore the graph.Using the semantic information and the social information, in the recommender system, helps us to partially explore the social network, which leads us to reduce the size of the explored data and to minimize the graph searching time.We apply our algorithms on real datasets: MovieLens and Amazon, and we compare the accuracy an the performance of our algorithms with the classical recommendation algorithms, mainly item-based collaborative filtering and hybrid recommendation.Our results show a satisfying accuracy values, and a very significant performance in execution time and in the size of explored data, compared to the classical recommendation algorithms.In fact, the importance of our algorithms relies on the fact that these algorithms explore a very small part of the graph, instead of exploring all the graph as the classical searching methods, and still give a good accuracy compared to the other classical recommendation algorithms. So, minimizing the size of searched data does not badly influence the accuracy of the results.
17

How fuzzy set theory can help make database systems more cooperative / Rendre les systèmes de bases de données plus coopératifs à l'aide de la théorie des ensembles flous

Moreau, Aurélien 26 June 2018 (has links)
Dans ces travaux de thèse nous proposons de tirer parti de la théorie des ensembles flous afin d'améliorer les interactions entre les systèmes de bases de données et les utilisateurs. Les mécanismes coopératifs visent à aider les utilisateurs à mieux interagir avec les SGBD. Ces mécanismes doivent faire preuve de robustesse : ils doivent toujours pouvoir proposer des réponses à l'utilisateur. Empty set (0,00 sec) est un exemple typique de réponse qu'il serait désirable d'éradiquer. Le caractère informatif des explications de réponses est parfois plus important que les réponses elles-mêmes : ce peut être le cas avec les réponses vides et pléthoriques par exemple, d'où l'intérêt de mécanismes coopératifs robustes, capables à la fois de contribuer à l'explication ainsi qu'à l'amélioration des résultats. Par ailleurs, l'utilisation de termes de la langue naturelle pour décrire les données permet de garantir l'interprétabilité des explications fournies. Permettre à l'utilisateur d'utiliser des mots de son propre vocabulaire contribue à la personnalisation des explications et améliore l'interprétabilité. Nous proposons de nous intéresser aux explications dans le contexte des réponses coopératives sous trois angles : 1) dans le cas d'un ensemble pléthorique de résultats ; 2) dans le contexte des systèmes de recommandation ; 3) dans le cas d'une recherche à partir d'exemples. Ces axes définissent des approches coopératives où l'intérêt des explications est de permettre à l'utilisateur de comprendre comment sont calculés les résultats proposés dans un effort de transparence. Le caractère informatif des explications apporte une valeur ajoutée aux résultats bruts, et forme une réponse coopérative. / In this thesis, we are interested in how we can leverage fuzzy logic to improve the interactions between relational database systems and humans. Cooperative answering techniques aim to help users harness the potential of DBMSs. These techniques are expected to be robust and always provide answer to users. Empty set (0,00 sec) is a typical example of answer that one may wish to never obtain. The informative nature of explanations is higher than that of actual answers in several cases, e.g. empty answer sets and plethoric answer sets, hence the interest of robust cooperative answering techniques capable of both explaining and improving an answer set. Using terms from natural language to describe data --- with labels from fuzzy vocabularies --- contributes to the interpretability of explanations. Offering to define and refine vocabulary terms increases the personalization experience and improves the interpretability by using the user's own words. We propose to investigate the use of explanations in a cooperative answering setting using three research axes: 1) in the presence of a plethoric set of answers; 2) in the context of recommendations; 3) in the context of a query/answering problem. These axes define cooperative techniques where the interest of explanations is to enable users to understand how results are computed in an effort of transparency. The informativeness of the explanations brings an added value to the direct results, and that in itself represents a cooperative answer.
18

Indexation et recommandation d'informations : vers une qualification précise des items par une approche ontologique, fondée sur une modélisation métier du domaine : application à la recommandation d'articles économiques / Information indexing and recommendation : toward a precise description if items by an ontological approach based on business domain modeling : application to recommander system of economic news

Werner, David 08 July 2015 (has links)
La gestion efficace de grandes quantités d’informations est devenue un défi de plus en plus importantpour les systèmes d’information. Tous les jours, de nouvelles sources d’informations émergent surle web. Un humain peut assez facilement retrouver ce qu’il cherche, lorsqu’il s’agit d’un article,d’une vidéo, d’un artiste précis. En revanche, il devient assez difficile, voire impossible, d’avoir unedémarche exploratoire pour découvrir de nouveaux contenus. Les systèmes de recommandationsont des outils logiciels ayant pour objectif d’assister l’humain afin de répondre au problème desurcharge d’informations. Les travaux présentés dans ce document proposent une architecturepour la recommandation efficace d’articles d’actualité. L’approche ontologique utilisée repose surun modèle permettant une qualification précise des items sur la base d’un vocabulaire contrôlé.Contenu dans une ontologie, ce vocabulaire constitue une modélisation formelle de la vue métier surle domaine traité. Réalisés en collaboration avec la société Actualis SARL, ces travaux ont permis lacommercialisation d’un nouveau produit hautement compétitif, FristECO Pro’fil. / Effective management of large amounts of information has become a challenge increasinglyimportant for information systems. Everyday, new information sources emerge on the web. Someonecan easily find what he wants if (s)he seeks an article, a video or a specific artist. However,it becomes quite difficult, even impossible, to have an exploratory approach to discover newcontent. Recommender systems are software tools that aim to assist humans to deal withinformation overload. The work presented in this Phd thesis proposes an architecture for efficientrecommendation of news. In this document, we propose an architecture for efficient recommendationof news articles. Our ontological approach relies on a model for precise characterization of itemsbased on a controlled vocabulary. The ontology contains a formal vocabulary modeling a view on thedomain knowledge. Carried out in collaboration with the company Actualis SARL, this work has ledto the marketing of a new highly competitive product, FristECO Pro’fil.
19

Inférence de liens signés dans les réseaux sociaux, par apprentissage à partir d'interactions utilisateur / Signed link prediction in social networks, by learning from user interactions

Gauthier, Luc-Aurélien 02 December 2015 (has links)
Dans cette thèse, nous étudions la sémantique des relations entre les utilisateurs et des forces antagonistes que nous observons naturellement dans diverses relations sociales, comme hostilité ou méfiance. L'étude de ces relations soulève de nombreux problèmes à la fois techniques, puisque l'arsenal mathématique n'est souvent pas adapté aux liens négatifs, mais aussi pratiques à cause de la difficulté rencontrée pour collecter de telles données (expliciter une relation négative est perçu comme malvenu pour de nombreux utilisateurs). Nous nous intéressons alors aux solutions alternatives de collecte afin d'inférer ces relations négatives à partir d'autres contenus. En particulier, nous allons utiliser les jugements communs que les utilisateurs partagent à propos d'items (données des systèmes de recommandation). Nous apportons trois contributions. Dans la première, nous allons aborder le cas des accords sur les items qui peuvent ne pas avoir la même sémantique selon qu'ils concernent des items appréciés ou non par les utilisateurs. Nous verrons que le fait de ne pas aimer un même produit n'est pas synonyme de similarité. Ensuite, nous allons prendre en compte dans notre seconde contribution les distributions de notes des utilisateurs et des items afin de mesurer si les accords ou les désaccords arrivent par hasard ou non, afin notamment d'éviter les conséquences des différents biais utilisateurs et items présents dans ce type de données. Enfin, notre troisième contribution consistera à exploiter ces différents résultats afin de prédire le signe des liens entre utilisateurs à partir des seuls jugements communs à propos des items et sans aucune information sociale négative. / In this thesis, we study the semantic of relations between users and, in particular, the antagonistic forces we naturally observe in various social relationships, such as hostility or suspicion. The study of these relationships raises many problems both techniques - because the mathematical arsenal is not really adapted to the negative ties - and practical, due to the difficulty of collecting such data (explaining a negative relationship is perceived as intrusive and inappropriate for many users). That’s why we focus on the alternative solutions consisting in inferring these negative relationships from more widespread content. We use the common judgments about items the users share, which are the data used in recommender systems. We provide three contributions, described in three distinct chapters. In the first one, we discuss the case of agreements about items that may not have the same semantics if they involve appreciated items or not by two users. We will see that disliking the same product does not mean similarity. Afterward, we consider in our second contribution the distributions of user ratings and items ratings in order to measure whether the agreements or disagreements may happen by chance or not, in particular to avoid the user and item biases observed in this type of data. Our third contribution consists in using these results to predict the sign of the links between users from the only positive ties and the common judgments about items, and then without any negative social information.
20

Fouille de données textuelles et systèmes de recommandation appliqués aux offres d'emploi diffusées sur le web / Text mining and recommender systems applied to job postings

Séguéla, Julie 03 May 2012 (has links)
L'expansion du média Internet pour le recrutement a entraîné ces dernières années la multiplication des canaux dédiés à la diffusion des offres d'emploi. Dans un contexte économique où le contrôle des coûts est primordial, évaluer et comparer les performances des différents canaux de recrutement est devenu un besoin pour les entreprises. Cette thèse a pour objectif le développement d'un outil d'aide à la décision destiné à accompagner les recruteurs durant le processus de diffusion d'une annonce. Il fournit au recruteur la performance attendue sur les sites d'emploi pour un poste à pourvoir donné. Après avoir identifié les facteurs explicatifs potentiels de la performance d'une campagne de recrutement, nous appliquons aux annonces des techniques de fouille de textes afin de les structurer et d'en extraire de l'information pertinente pour enrichir leur description au sein d'un modèle explicatif. Nous proposons dans un second temps un algorithme prédictif de la performance des offres d'emploi, basé sur un système hybride de recommandation, adapté à la problématique de démarrage à froid. Ce système, basé sur une mesure de similarité supervisée, montre des résultats supérieurs à ceux obtenus avec des approches classiques de modélisation multivariée. Nos expérimentations sont menées sur un jeu de données réelles, issues d'une base de données d'annonces publiées sur des sites d'emploi. / Last years, e-recruitment expansion has led to the multiplication of web channels dedicated to job postings. In an economic context where cost control is fundamental, assessment and comparison of recruitment channel performances have become necessary. The purpose of this work is to develop a decision-making tool intended to guide recruiters while they are posting a job on the Internet. This tool provides to recruiters the expected performance on job boards for a given job offer. First, we identify the potential predictors of a recruiting campaign performance. Then, we apply text mining techniques to the job offer texts in order to structure postings and to extract information relevant to improve their description in a predictive model. The job offer performance predictive algorithm is based on a hybrid recommender system, suitable to the cold-start problem. The hybrid system, based on a supervised similarity measure, outperforms standard multivariate models. Our experiments are led on a real dataset, coming from a job posting database.

Page generated in 0.1234 seconds