1 |
Identification du profil des utilisateurs d’un hypermédia encyclopédique à l’aide de classifieurs basés sur des dissimilarités : création d’un composant d’un système expert pour Hypergéo / Identification of hypermedia encyclopedic user's profile using classifiers based on dissimilarities : creating a component of an expert system for HypergeoAbou Latif, Firas 08 July 2011 (has links)
L’objectif de cette thèse est d’identifier le profil d’utilisateur d’un hypermédia afin de l’adapter. Ceprofil est déterminé en utilisant des algorithmes d’apprentissage supervisé comme le SVM.Le modèle d’utilisateur est l’un des composants essentiels des hypermédias adaptatifs. Une des façons de caractériser ce modèle est d’associer l’utilisateur à un profil. Le Web Usage Mining (WUM)identifie ce profil à l’aide des traces de navigation. Toutefois, ces techniques ne fonctionnent généralement que sur de gros volumes de données. Dans le cadre de volumes de données réduits, nous proposons d’utiliser la structure et le contenu de l’hypermédia. Pour cela, nous avons utilisé des algorithmes d’apprentissage à noyau pour lesquels nous avons défini l’élément clé qu’est la mesure de similarité entre traces basée sur une « distance » entre documents du site. Notre approche a été validée à l’aide de données synthétiques puis à l’aide de données issues des traces des utilisateurs du site Hypergéo (site webencyclopédique spécialisé dans la géographie). Nos résultats ont été comparés à ceux obtenus à l’aide d’une des techniques du WUM (l’algorithme des motifs caractéristiques). Finalement, nos propositions pour identifier les profils a posteriori ont permis de mettre en évidence cinq profils. En appliquant une« distance sémantique » entre documents, les utilisateurs d’Hypergéo ont été classés correctement selon leurs centres d’intérêt. / This thesis is devoted to identify the profile of hypermedia user, then to adapt it according to user’s profile. This profile is found by using supervised learning algorithm like SVM. The user model is one of the essential components of adaptive hypermedia. One way to characterize this model is to associate a user to a profile. Web Usage Mining (WUM) identifies this profile from traces. However, these techniques usually operate on large mass of data. In the case when not enough data are available, we propose to use the structure and the content of the hypermedia. Hence, we used supervised kernel learning algorithms for which we have defined the measure of similarity between traces based on a “distance” between documents of the site. Our approach was validated using synthetic data and then using real data from the traces of Hypergéo users, Hypergéo is an encyclopedic website specialized in geography. Our results were compared with those obtained using a techniques of WUM(the algorithm of characteristic patterns). Finally, our proposals to identify the profiles a posteriori led usto highlight five profiles. Hypergéo users are classified according to their interests when the “semantic distance” between documents is applied. Read more
|
2 |
La webométrie en sciences sociales et humaines : analyse des données d’usage de la plateforme ÉruditCameron-Pesant, Sarah 11 1900 (has links)
Cette étude exploratoire s’intéresse à l’usage des revues en sciences sociales et humaines diffusées en libre accès complet et en libre accès différé par la plateforme Érudit. Basée sur les données de téléchargements d’Érudit, elle vise à 1) fournir un portrait détaillé de l’usage des articles, 2) décrire les habitudes de téléchargement des usagers au Canada et à l’international, et 3) analyser l’effet des politiques de libre accès des revues sur les téléchargements qu’elles reçoivent. Pour ce faire, 39 437 659 téléchargements, extraits de 999 367 190 requêtes HTTP enregistrées dans les logs du serveur d’Érudit de 2010 à 2015, ont été analysés. Les résultats montrent que la majorité des usagers provient du Québec, de la France et d’autres pays francophones, et que, la plupart du temps, ceux-ci accèdent aux articles par l’intermédiaire de Google. Les habitudes de téléchargement varient d’un pays à l’autre : alors que les usagers canadiens et français utilisent Érudit principalement en journée et en semaine, leurs homologues américains sont davantage actifs en soirée, la nuit, ainsi que les week-ends. Enfin, un avantage important lié au libre accès a été observé : les articles des revues en libre accès sont davantage téléchargés que ceux des revues en libre accès différé et, pour ces dernières, la fin de l’embargo est associée à une croissance importante des téléchargements – croissance moins marquée au Canada où bon nombre d’institutions sont abonnées aux revues de la plateforme. Ces résultats démontrent l’importance des revues nationales pour les sciences sociales et humaines, ainsi que l’effet positif du libre accès sur la diffusion des connaissances, tant au Canada qu’à l’étranger. / This study explores the usage of open access (OA) and delayed OA journals in the social sciences and humanities hosted by the journal platform Érudit. Relying on Érudit’s download data, the goals of the study are: 1) to describe the usage of scholarly articles, 2) to examine download patterns of national and international users, and 3) to analyze the effect of OA policies on journal download rates. The study is based on an analysis of 39,437,659 downloads, which were extracted from 999,367,190 HTTP requests stored in Érudit’s log files between 2010 and 2015. The results show that the majority of users came from Quebec, France and other French-speaking countries, and that most users access articles through Google. Download patterns varied between countries: although articles were most frequently accessed during working hours, US users were more active in the evening, at night and during weekends than Canadian and French users. The study also demonstrates a clear OA advantage, as freely available articles were downloaded more frequently than delayed OA articles affected by an embargo, and downloads per article increased substantially after embargos ended. This effect was less pronounced for Canadian users, who often have access to Érudit journals via institutional subscriptions and are thus not affected by the embargo periods. The results show the positive effect of OA on knowledge dissemination in Canada as well as internationally, and emphasize the importance of national journals in the social sciences and humanities. Read more
|
Page generated in 0.0515 seconds