• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 32
  • 11
  • 5
  • 1
  • Tagged with
  • 47
  • 47
  • 47
  • 39
  • 37
  • 31
  • 14
  • 8
  • 8
  • 7
  • 7
  • 7
  • 6
  • 6
  • 6
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
21

Détection de communautés dans les réseaux d'information utilisant liens et attributs

Combe, David 15 October 2013 (has links) (PDF)
Alors que les réseaux sociaux s'attachent à représenter des entités et les relations existant entre elles, les réseaux d'information intègrent également des attributs décrivant ces entités ; ce qui conduit à revisiter les méthodes d'analyse et de fouille de ces réseaux. Dans ces travaux, nous proposons des méthodes de classification des entités du réseau d'information qui exploitent d'une part les relations entre celles-ci et d'autre part les attributs les caractérisant. Nous nous penchons sur le cas des réseaux à vecteurs d'attributs, où les entités du réseau sont décrites par des vecteurs numériques. Ainsi nous proposons des approches basées sur des techniques reconnues pour chaque type d'information, faisant appel notamment à l'inertie pour la classification automatique et à la modularité de Newman et Girvan pour la détection de communautés. Nous évaluons nos propositions sur des réseaux issus de données bibliographiques, faisant usage en particulier d'information textuelle. Nous évaluons également nos approches face à diverses évolutions du réseau, notamment au regard d'une détérioration des informations des liens et des attributs, et nous caractérisons la robustesse de nos méthodes à celle-ci
22

Socio-semantic Networks Algorithm for a Point of View Based Visualization of On-line Communities

CRUZ GOMEZ, Juan David 10 December 2012 (has links) (PDF)
Dans le problème de détection de communautés il est possible d'utiliser soit la dimension structurelle, soit la dimension compositionelle du réseau : dans le premier cas les communautés seraient composées par des groupes de noeuds fortement connectés mais peu similaires, et pour le deuxième cas, les groupes auraient des noeuds similaires mais faiblement connectés. Donc en ne choisissant qu'une des dimensions la quantité possible d'information à extraire est réduite. Cette thèse a pour objectif de proposer une nouvelle approche pour utiliser en même temps les dimensions structurelle et compositionelle lors de la détection de communautés de façon telle que les groupes aient des noeuds similaires et bien connectés. Pour la mise en oeuvre de cette approche il faut d'abord une nouvelle définition de communauté qui prend en compte les deux dimensions présentées auparavant et ensuite un modèle nouveau de détection qui utilise cette définition, en trouvant des groupes de noeuds similaires et bien connectés. Le modèle commence par l'introduction de la notion de point de vue qui permet de diviser la dimension compositionelle pour analyser le réseau depuis différentes perspectives. Ensuite le modèle, en utilisant l'information compositionelle, influence le processus de détection de communautés qui intègre les deux dimensions du réseau. La dernière étape est la visualisation du graphe de communautés qui positionne les noeuds selon leur similarité structurelle et compositionelle, ce qui permet d'identifier des noeuds importants pour les interactions entre communautés.
23

A storytelling machine ? : automatic video summarization : the case of TV series / Une machine à raconter des histoires ? : Analyse et modélisation des processus de ré-éditorialisation de vidéos

Bost, Xavier 23 November 2016 (has links)
Ces dix dernières années, les séries télévisées sont devenues de plus en plus populaires. Par opposition aux séries TV classiques composées d’épisodes autosuffisants d’un point de vue narratif, les séries TV modernes développent des intrigues continues sur des dizaines d’épisodes successifs. Cependant, la continuité narrative des séries TV modernes entre directement en conflit avec les conditions usuelles de visionnage : en raison des technologies modernes de visionnage, les nouvelles saisons des séries TV sont regardées sur de courtes périodes de temps. Par conséquent, les spectateurs sur le point de visionner de nouvelles saisons sont largement désengagés de l’intrigue, à la fois d’un point de vue cognitif et affectif. Une telle situation fournit au résumé de vidéos des scénarios d’utilisation remarquablement réalistes, que nous détaillons dans le Chapitre 1. De plus, le résumé automatique de films, longtemps limité à la génération de bande-annonces à partir de descripteurs de bas niveau, trouve dans les séries TV une occasion inédite d’aborder dans des conditions bien définies ce qu’on appelle le fossé sémantique : le résumé de médias narratifs exige des approches orientées contenu, capables de jeter un pont entre des descripteurs de bas niveau et le niveau humain de compréhension. Nous passons en revue dans le Chapitre 2 les deux principales approches adoptées jusqu’ici pour aborder le problème du résumé automatique de films de fiction. Le Chapitre 3 est consacré aux différentes sous-tâches requises pour construire les représentations intermédiaires sur lesquelles repose notre système de génération de résumés : la Section 3.2 se concentre sur la segmentation de vidéos,tandis que le reste du chapitre est consacré à l’extraction de descripteurs de niveau intermédiaire,soit orientés saillance (échelle des plans, musique de fond), soit en relation avec le contenu (locuteurs). Dans le Chapitre 4, nous utilisons l’analyse des réseaux sociaux comme une manière possible de modéliser l’intrigue des séries TV modernes : la dynamique narrative peut être adéquatement capturée par l’évolution dans le temps du réseau des personnages en interaction. Cependant, nous devons faire face ici au caractère séquentiel de la narration lorsque nous prenons des vues instantanées de l’état des relations entre personnages. Nous montrons que les approches classiques par fenêtrage temporel ne peuvent pas traiter convenablement ce cas, et nous détaillons notre propre méthode pour extraire des réseaux sociaux dynamiques dans les médias narratifs.Le Chapitre 5 est consacré à la génération finale de résumés orientés personnages,capables à la fois de refléter la dynamique de l’intrigue et de ré-engager émotionnellement les spectateurs dans la narration. Nous évaluons notre système en menant à une large échelle et dans des conditions réalistes une enquête auprès d’utilisateurs. / These past ten years, TV series became increasingly popular. In contrast to classicalTV series consisting of narratively self-sufficient episodes, modern TV seriesdevelop continuous plots over dozens of successive episodes. However, thenarrative continuity of modern TV series directly conflicts with the usual viewing conditions:due to modern viewing technologies, the new seasons of TV series are beingwatched over short periods of time. As a result, viewers are largely disengaged fromthe plot, both cognitively and emotionally, when about to watch new seasons. Sucha situation provides video summarization with remarkably realistic use-case scenarios,that we detail in Chapter 1. Furthermore, automatic movie summarization, longrestricted to trailer generation based on low-level features, finds with TV series a unprecedentedopportunity to address in well-defined conditions the so-called semanticgap: summarization of narrative media requires content-oriented approaches capableto bridge the gap between low-level features and human understanding. We review inChapter 2 the two main approaches adopted so far to address automatic movie summarization.Chapter 3 is dedicated to the various subtasks needed to build the intermediaryrepresentations on which our summarization framework relies: Section 3.2focuses on video segmentation, whereas the rest of Chapter 3 is dedicated to the extractionof different mid-level features, either saliency-oriented (shot size, backgroundmusic), or content-related (speakers). In Chapter 4, we make use of social network analysisas a possible way to model the plot of modern TV series: the narrative dynamicscan be properly captured by the evolution over time of the social network of interactingcharacters. Nonetheless, we have to address here the sequential nature of thenarrative when taking instantaneous views of the state of the relationships between thecharacters. We show that standard time-windowing approaches can not properly handlethis case, and we detail our own method for extracting dynamic social networksfrom narrative media. Chapter 5 is dedicated to the final generation and evaluation ofcharacter-oriented summaries, both able to reflect the plot dynamics and to emotionallyre-engage viewers into the narrative. We evaluate our framework by performing alarge-scale user study in realistic conditions.
24

Coordination et robustesse des systèmes dynamiques multi-agents / Coordination and robustness in dynamical multi-agents systems

Martin, Samuel 28 November 2012 (has links)
Nous nous intéressons à l'étude de la dynamique des réseaux composés d'une multitude d'agents. Les motivations de ce travail trouvent leurs sources dans de nombreux domaines et notamment la biologie avec l'étude de l'émergence de comportements collectifs cohérents chez les animaux (vol en formation d'oiseaux migrateurs). Considérons un certain nombre d’agents (animaux) dont le comportement dynamique individuel peut être modélisé par une équation différentielle. Les agents communiquent : les liens sont représentés sous la forme d’un graphe dont les sommets sont les agents du système. Chaque agent a la connaissance de l’état des agents auxquels il est connecté et ajuste sa dynamique à l’aide de cette information. Des comportements collectifs peuvent alors émerger comme par exemple le phénomène de flocking (tous les agents se déplacent dans la même direction). Plusieurs modèles d'interaction ont été proposés, les plus connus étant le modèle de Viscek (1995) ou le modèle de Cucker-Smale (2007). L'étude de ces modèles repose généralement sur des méthodes d'analyse de stabilité des systèmes dynamiques ou des systèmes hybrides, lorsque le graphe de communication évolue dans le temps. Nous souhaitons dans cette thèse évaluer la robustesse de l'émergence de ces comportements collectifs en étudiant l'influence de divers facteurs: paramètres du modèle, topologie du graphe, nombre d'agents, présences de perturbations. Nous nous intéresserons notamment au phénomène de scission du groupe d'agents en plusieurs groupes d'agents coordonnés. / This thesis presents a study on multi-agent systems. Such systems find numerous applications such as multi-vehicle control in robotics, the design of smart distributed energy networks and the modeling of opinion dynamics. In a first part, we present new results regarding consensus theory which extend the recent work from Hendrickx and Tsitsiklis on cut-balanced consensus. Then, we apply the consensus system to the control of a fleet of vehicles. We present several results regarding velocity alignment (flocking). This study is based upon a graph robustness analysis in order to preserve the connectivity of the interaction network. This concept is of main importance in this study. In the last part, we state results froma collaborative work with a sociologist regarding the social network linked to the controversy concerning o-road motorized leisure in France. We study the link between the national and local scenes. To do so, we use large graph visualization tools and actor centrality measures.
25

Automatic role detection in online forums / Détection automatique des rôles dans les forums en ligne

Lumbreras, Alberto 07 November 2016 (has links)
Nous traitons dans cette thèse le problème de la détection des rôles des utilisateurs sur des forums de discussion en ligne. On peut détenir un rôle comme l'ensemble des comportements propres d'une personne ou d'une position. Sur les forums de discussion, les comportements sont surtout observés à travers des conversations. Pour autant, nous centrons notre attention sur la manière dont les utilisateurs dialoguent. Nous proposons trois méthodes pour détecter des groupes d'utilisateurs où les utilisateurs d'un même groupe dialoguent de façon similaire.Notre première méthode se base sur les structures des conversations dans lesquelles les utilisateurs participent. Nous appliquons des notions de voisinage différentes (radiusbased, order-based, and time-based) applicables aux commentaires qui sont représentés par des noeuds sur un arbre. Nous comparons les motifs de conversation qu'ils permettent de détecter ainsi que les groupes d'utilisateurs associés à des motifs similaires. Notre deuxième méthode se base sur des modèles stochastiques de croissance appliqués aux fils de discussion. Nous proposons une méthode pour trouver des groupes d'utilisateurs qui ont tendance à répondre au même type de commentaire. Nous montrons que, bien qu'il y ait des groupes d'utilisateurs avec des motifs de réponse similaires, il n'y a pas d'évidence forte qui confirme que ces comportements présentent des propriétés prédictives quant aux comportements futurs {sauf pour quelques groupes avec des comportements extrêmes. Avec notre troisième méthode nous intégrons les types de données utilisés dans les deux méthodes précédentes (feature-based et behavioral ou functional-based) et nous montrons que le modèle trouve des groupes en ayant besoin de moins d'observations. L'hypothèse du modèle est que les utilisateurs qui ont des caractéristiques similaires ont aussi des comportements similaires. / This thesis addresses the problem of detecting user roles in online discussion forums. A role may be defined as the set of behaviors characteristic of a person or a position. In discussion forums, behaviors are primarily observed through conversations. Hence, we focus our attention on how users discuss. We propose three methods to detect groups of users with similar conversational behaviors.Our first method for the detection of roles is based on conversational structures. Weapply different notions of neighborhood for posts in tree graphs (radius-based, order-based, and time-based) and compare the conversational patterns that they detect as well as the clusters of users with similar conversational patterns.Our second method is based on stochastic models of growth for conversation threads.Building upon these models we propose a method to find groups of users that tend to reply to the same type of posts. We show that, while there are clusters of users with similar replying patterns, there is no strong evidence that these behaviors are predictive of future behaviors |except for some groups of users with extreme behaviors.In out last method, we integrate the type of data used in the two previous methods(feature-based and behavioral or functional-based) and show that we can find clusters using fewer examples. The model exploits the idea that users with similar features have similar behaviors.
26

L'entrepreneuriat en sciences humaines et sociales : sociologie d'un monde économique incertain / Entrepreneurship in social sciences : sociology of an uncertain economic world

Akermann, Grégori 02 December 2015 (has links)
L’entrepreneuriat en sciences humaines et sociales est un objet aux contours flous. On peut y regrouper un certain nombre d’activités économiques appelées selon les cas bureau d’études sociologiques, cabinet d’ingénierie territoriale, et, pour les personnes, historien-conseil, ethnologue-consultant ou sociologue-praticien. Cette thèse questionne les processus de création d’activités économiques dans des disciplines où on ne les attend pas : l’histoire, la géographie, la sociologie et l’ethnologie. Nous analysons l’évolution de la place de ces activités économiques selon les contextes historiques ainsi que les tensions auxquelles elles ont pu donner lieu dans les différents champs disciplinaires. Nous cherchons également à cerner ces structures et les personnes qui les composent en croisant diverses sources documentaires (fichiers Insee, répertoires professionnels, recherches de données en ligne). Enfin, au moyen d’entretiens biographiques (68 pour 50 cas d’entreprises), nous étudions les processus entrepreneuriaux et leurs ancrages dans des trajectoires d’entrepreneurs, des espaces sociaux, des réseaux de relations sociales et des dispositifs. Réseaux et dispositifs apparaissent comme des appuis pour l’entrée dans l’entrepreneuriat, comme des moyens d’accéder à divers types de ressources et comme des bases de coordination sur des marchés économiques. Dans un contexte peu structuré par des institutions professionnelles, les relations personnelles jouent un rôle particulièrement central dans la création des structures, dans la conduite des activités et dans les coordinations entre clients et entrepreneurs. / Entrepreneurship in social sciences is an object with blurred boundaries. One can group a number of economic activities known as sociological engineering, urban engineering, and for their members, consultant, public historian, ethnologist-consultant, professional sociologist... This thesis studies the process of economic activities in disciplines where it’s not usually expected: history, geography, sociology and ethnology. We analyze the evolution of the role of these economic activities according to historical contexts and the tensions which rise about them in the different disciplines. We also seek to identify structures and people in crossing various documentary sources (INSEE files, professional directories, online data research). Finally, using biographical interviews (62 to 50 cases of companies), we study the entrepreneurial process and their anchorages in entrepreneur life courses, social milieus, social networks and devices. Networks and devices appear to be the basis for entry into entrepreneurship, as means to access to various kinds of resources and as ways of coordination within economic markets. In an unstructured environment by professional institutions, personal relationships play a central role in the establishment of structures, in the activities and in the coordination between customers and entrepreneurs.
27

Méthodes pour la recommandation d’offres d’emploi dans les réseaux sociaux / Methods for Job Recommandation on Social Networks

Diaby, Mamadou 04 June 2015 (has links)
Nous sommes à l’aube d’une nouvelle ère du data mining, celle du stockage, traitement, analyse et exploitation des données massives que l’on appelle Big Data. Les données sont devenues une nouvelle matière première, très prisée par les entreprises de tout type et de toute taille à travers le monde ; elles permettent d’analyser, de comprendre, de modéliser et d’expliquer certains phénomènes comme le comportement et les préférences des utilisateurs ou clients d’une entreprise donnée. La compréhension des préférences des utilisateurs et des clients d’une entreprise permet de leur proposer de la publicité ciblée afin d’augmenter les ventes et la satisfaction des clients et ainsi pouvoir améliorer les revenues de l’entreprise, ce que les géants du Web comme Google, Facebook, LinkedIn et Twitter ont bien compris. Cette thèse de doctorat a été réalisée dans le cadre d’une convention CIFRE entre le laboratoire L2TI de l’université Paris 13 et la start-up franco-américaineWork4 qui développe des applications de recrutement sur Facebook. Son objectif principal était la mise au point d’un ensemble d’algorithmes et méthodes pour proposer aux utilisateurs des réseaux sociaux les offres d’emploi les plus pertinentes. Le développement de nos algorithmes de recommandation a nécessité de surmonter de nombreuses difficultés telles que le préservation de la vie privée des utilisateurs des réseaux sociaux, le traitement des données bruitées et incomplètes des utilisateurs et des offres d’emploi, la difficulté de traitement des données multi-langues et, plus généralement, la difficulté d’extraire automatiquement les offres d’emploi pertinentes pour un utilisateur donné parmi un ensemble d’offres d’emploi. Les systèmes développés durant cette thèse sont principalement basés sur les techniques de systèmes de recommandation, de recherche documentaire,de fouille de données et d’apprentissage artificiel ; ils ont été validés sur des jeux de données réels collectés par l’entreprise Work4. Dans le cadre de cette étude, les utilisateurs d’un réseau social sont liés à trois types entités : les offres d’emploi qui leur sont pertinentes, les autres utilisateurs du réseau social auxquels ils se sont liés d’amitié et les données personnelles qu’ils ont publiées sur leurs profils. Les profils des utilisateurs des réseaux sociaux et la description de nos offres d’emploi sont constitués de plusieurs champs contenant des informations textuelles. / We are entering a new era of data mining in which the main challenge is the storing andprocessing of massive data : this is leading to a new promising research and industry field called Big data. Data are currently a new raw material coveted by businesses of all sizes and all sectors. They allow organizations to analyze, understand, model and explain phenomen a such as the behavior of their users or customers. Some companies like Google, Facebook,LinkedIn and Twitter are using user data to determine their preferences in order to make targeted advertisements to increase their revenues.This thesis has been carried out in collaboration between the laboratory L2TI andWork4, a French-American startup that offers Facebook recruitment solutions. Its main objective was the development of systems recommending relevant jobs to social network users ; the developed systems have been used to advertise job positions on social networks. After studying the literature about recommender systems, information retrieval, data mining and machine learning, we modeled social users using data they posted on their profiles, those of their social relationships together with the bag-of-words and ontology-based models. We measure the interests of users for jobs using both heuristics and models based on machine learning. The development of efficient job recommender systems involved to tackle the problem of categorization and summarization of user profiles and job descriptions. After developing job recommender systems on social networks, we developed a set of systems called Work4 Oracle that predict the audience (number of clicks) of job advertisements posted on Facebook, LinkedIn or Twitter. The analysis of the results of Work4 Oracle allows us to find and quantify factors impacting the popularity of job ads posted on social networks, these results have been compared to those of the literature of Human Resource Management. All our proposed systems deal with privacy preservation by only using the data that social network users explicitly allowed to access to ; they also deal with noisy and missing data of social network users and have been validated on real-world data provided by Work4.
28

Influencers characterization in a social network for viral marketing perspectives / Caractérisation des influenceurs dans un réseau social pour des perspectives de Marketing viral

Jendoubi, Siwar 16 December 2016 (has links)
Le marketing viral est une nouvelle forme de marketing qui exploite les réseaux sociaux afin de promouvoir un produit, une marque, etc. Il se fonde sur l'influence qu'exerce un utilisateur sur un autre. La maximisation de l'influence est le problème scientifique pour le marketing viral. En fait, son but principal est de sélectionner un ensemble d'utilisateurs d'influences qui pourraient adopter le produit et déclencher une large cascade d'influence et d'adoption à travers le réseau. Dans cette thèse, nous proposons deux modèles de maximisation de l'influence sur les réseaux sociaux. L'approche proposée utilise la théorie des fonctions de croyance pour estimer l'influence des utilisateurs. En outre, nous introduisons une mesure d'influence qui fusionne de nombreux aspects d'influence, comme l'importance de l'utilisateur sur le réseau et la popularité de ces messages. Ensuite, nous proposons trois scénarii de marketing viral. Pour chaque scénario, nous introduisons deux mesures d'influence. Le premier scénario cherche les influenceurs ayant une opinion positive sur le produit. Le second scénario concerne les influenceurs ayant une opinion positive et qui influencent des utilisateurs ayant une opinion positive et le dernier scénario cherche des influenceurs ayant une opinion positive et qui influencent des utilisateurs ayant une opinion négative. Dans un deuxième lieu, nous nous sommes tournés vers un autre problème important, qui est le problème de la prédiction du sujet du message social. En effet, le sujet est également un paramètre important dans le problème de la maximisation de l'influence. A cet effet, nous introduisons quatre algorithmes de classification qui ne nécessitent pas le contenu du message pour le classifier, nous avons juste besoin de ces traces de propagation. Dans nos expérimentations, nous comparons les solutions proposées aux solutions existantes et nous montrons la performance des modèles de maximisation de l'influence et les classificateurs proposés. / The Viral Marketing is a relatively new form of marketing that exploits social networks in order to promote a product, a brand, etc. It is based on the influence that exerts one user on another. The influence maximization is the scientific problem for the Viral Marketing. In fact, its main purpose is to select a set of influential users that could adopt the product and trigger a large cascade of influence and adoptions through the network. In this thesis, we propose two evidential influence maximization models for social networks. The proposed approach uses the theory of belief functions to estimate users influence. Furthermore, we introduce an influence measure that fuses many influence aspects, like the importance of the user in the network and the popularity of his messages. Next, we propose three Viral Marketing scenarios. For each scenario we introduce two influence measures. The first scenario is about influencers having a positive opinion about the product. The second scenario searches for influencers having a positive opinion and influence positive opinion users and the last scenario looks for influencers having a positive opinion and influence negative opinion users. On the other hand, we turned to another important problem which is about the prediction of the social message topic. Indeed, the topic is also an important parameter in the influence maximization problem. For this purpose, we introduce four classification algorithms that do not need the content of the message to classify it, they just need its propagation traces. In our experiments, we compare the proposed solutions to existing ones and we show the performance of the proposed influence maximization solutions and the proposed classifiers.
29

Soutien social et réseau personnel au cœur de l’expérience du cancer / Social support and personal network of cancer patients

Defossez, Adrien 09 December 2014 (has links)
Cette thèse s’inscrit dans la continuité des travaux sociologiques de réseaux sociaux qui s’intéressent au concept de soutien social. Le travail de recherche porte sur les ressources insérées dans le réseau de relations des patients atteints de cancer ainsi que sur la configuration de ces réseaux personnels. Pour ce faire, la thèse se focalise sur le soutien informationnel qui constitue un des grands types de soutien que l’on rencontre dans la littérature sociologique. Les informations de santé accessibles à travers l’entourage relationnel sont considérées comme des ressources qui permettent aux malades de répondre aux difficultés qu’ils rencontrent dans le cadre de la pathologie cancéreuse. L’analyse est basée sur des entretiens réalisés auprès de patients pris en charge dans des services d’oncologie. Cette thèse se donne deux objectifs : le premier est de rendre compte du soutien social dans le cadre d’une pathologie chronique telle que le cancer. De ce point de vue-là, la thèse montre les difficultés que les malades rencontrent pour obtenir les ressources recherchées. Le second objectif est de contribuer à la réflexion théorique sur la mobilisation des liens sociaux. La recherche décrit les contraintes et opportunités du réseau des malades notamment à travers l’analyse des modes de régulations des relations personnelles. / The thesis we sustain is rooted in the social network analysis interested in the concept of social support. This study deals with the resources embedded in the social network of cancer patients and on the structure of these personal networks. The thesis focuses on informational support that is one of the main kinds of support we can find in the sociological literature. Health information patients access through their social ties are social resources upon which they may draw when facing difficulties. Based on semi-structured interviews with cancer patients, this study pursues two aims: the first one is to describe social support in the case of chronic diseases such as cancer. From this perspective, the thesis shows the patient difficulties to obtain appropriate resources. The second aim is to contribute to the theoretical thought on social ties’ mobilization. This research describes the constraints and opportunities of patients’ network through an analysis of the social ties rules.
30

Conception d'un outil d'analyse et de visualisation des mèmes internet : le cas du réseau social chinois Sina Weibo / Design of a Internet memes data visualisation toolkit : the case of the chinese social network Sina Weibo

Renaud, Clément 08 October 2014 (has links)
Nous proposons de concevoir et développer un outil permettant d’analyser la diffusion d’information sur les services de réseaux sociaux en ligne grâce au traitement et à la visualisation de données. Fruit d’une réflexion méthodologique, ce dispositif permet d’observer les relations entre les dimensions conversationnelles, sémantiques, temporelles et géographiques des actes de communication en ligne. Courts messages se propageant rapidement sur la Toile selon des modèles encore mal connus, les mèmes Internet comptent parmi les contenus les plus prisés sur les plate-formes web. Les mèmes Internet circulant sur le service de microblog chinois Sina Weibo articulent notamment discussions personnelles, débats sociétaux et vastes campagnes médiatiques. Mobilisant des méthodes issues de l’analyse des réseaux et du traitement automatisé de la langue chinoise, nous procédons à l’analyse d’un vaste corpus de 200 millions de messages représentant l’activité sur Sina Weibo durant l’année 2012. Notre première tâche consiste à identifier des mèmes dans ce large ensemble de données. L’identification de mèmes dans un ensemble de messages est notamment possible grâce à un algorithme de détection non supervisé. Néanmoins, le volume de calculs nécessaires pour obtenir des résultats fiables sur un large corpus nous amène à abandonner cette approche, montrant par là-même la complexité d’une définition intéressante de l’objet numérique composite mème. Notre seconde série d’analyses porte sur le volume de conversations entourant les hashtags du corpus. Les résultats montrent que les usages majoritaires de Sina Weibo sont similaires à ceux des médias traditionnels (publicité, divertissement, loisirs...). Néanmoins, nous écartons les hashtags comme représentants des mèmes Internet, artefacts d’usages commerciaux et stratégiques à la diffusion cadrée et planifiée. L’approche finalement retenue utilise la recherche par mots-clés pour constituer les corpus de messages décrivant une dizaine de mèmes sélectionnés dans la littérature académique et secondaire pour leurs intentions diverses : humour, actualité, scandale politique, faits divers et marketing promotionnel. S’inspirant de la critique des schémas théoriques de communication, une analyse des mots et des réseaux d’échanges entre utilisateurs met à jour les dynamiques discursives de chaque mème. L’organisation de ces informations selon un axe temporel dans un espace de visualisation interactif autorise une lecture détaillée de leur diffusion. La projection de ces réseaux conversationnels et lexicaux sur des cartes géographiques montre également les relations entre leurs aspects textuels et actuels. Les figures obtenues permettent d’ébaucher une typologie structurelle de la diffusion de ces contenus, montrant comment différents régimes d’expression cohabitent sur les réseaux sociaux. La tension entre énonciation et discours qui régit les plateformes Web se manifeste dans des motifs particuliers de circulation des contenus en ligne. Nous pouvons ainsi formuler des recommandations pour l’analyse et la conception de stratégies de communication en ligne d’organismes tant privés que publics. Néanmoins, le caractère exploratoire de cette étude et la difficulté de comprendre les actions humaines par une simple analyse de données nous invite à refuser une généralisation a priori des résultats, préférant considérer ce travail comme la première validation d’une méthodologie pouvant être étendue à d’autres formes de conversations en ligne. / We develop a data mining and visualisation toolkit to study how the information is shared on online social network services. This software allows to observe relationships between conversational, semantical, temporal and geographical dimensions of online communication acts. Internet memes are short messages that spread quickly through the Web. Following models that remain largely unknown, they articulate personal discussions, societal debates and large communication campaign. We analyse a set of Internet memes by using methods from social network analysis and Chinese natural language processing on a large corpus of 200 million tweets which represents/reflects the overall activity on the Chinese social network Sina Weibo in 2012. An interactive visualisation interface showing networks of words, user exchanges and their projections on geographical maps provides a detailed understanding of actual and textual aspects of each meme spread. An analysis of hashtags in the corpus shows that the main content from Sina Weibo is largely similar to the ones in traditional media (advertisement, entertainment, etc.). Therefore, we decided to not consider hashtags as memes representatives, being mostly byproducts of wellplanned strategic or marketingcampaigns. Our final approach studies a dozen of memes selected for the diversity of their topic: humor, political scandal, breaking news and marketing.

Page generated in 0.0905 seconds