Modélisation conjointe des thématiques et des opinions : application à l'analyse des données textuelles issues du Web / Joint topic-sentiment modeling : an application to Web data analysisDermouche, Mohamed 08 June 2015 (has links)
Cette thèse se situe à la confluence des domaines de "la modélisation de thématiques" (topic modeling) et l'"analyse d'opinions" (opinion mining). Le problème que nous traitons est la modélisation conjointe et dynamique des thématiques (sujets) et des opinions (prises de position) sur le Web et les médias sociaux. En effet, dans la littérature, ce problème est souvent décomposé en sous-tâches qui sont menées séparément. Ceci ne permet pas de prendre en compte les associations et les interactions entre les opinions et les thématiques sur lesquelles portent ces opinions (cibles). Dans cette thèse, nous nous intéressons à la modélisation conjointe et dynamique qui permet d'intégrer trois dimensions du texte (thématiques, opinions et temps). Afin d'y parvenir, nous adoptons une approche statistique, plus précisément, une approche basée sur les modèles de thématiques probabilistes (topic models). Nos principales contributions peuvent être résumées en deux points : 1. Le modèle TS (Topic-Sentiment model) : un nouveau modèle probabiliste qui permet une modélisation conjointe des thématiques et des opinions. Ce modèle permet de caractériser les distributions d'opinion relativement aux thématiques. L'objectif est d'estimer, à partir d'une collection de documents, dans quelles proportions d'opinion les thématiques sont traitées. 2. Le modèle TTS (Time-aware Topic-Sentiment model) : un nouveau modèle probabiliste pour caractériser l'évolution temporelle des thématiques et des opinions. En s'appuyant sur l'information temporelle (date de création de documents), le modèle TTS permet de caractériser l'évolution des thématiques et des opinions quantitativement, c'est-à-dire en terme de la variation du volume de données à travers le temps. Par ailleurs, nous apportons deux autres contributions : une nouvelle mesure pour évaluer et comparer les méthodes d'extraction de thématiques, ainsi qu'une nouvelle méthode hybride pour le classement d'opinions basée sur une combinaison de l'apprentissage automatique supervisé et la connaissance a priori. Toutes les méthodes proposées sont testées sur des données réelles en utilisant des évaluations adaptées. / This work is located at the junction of two domains : topic modeling and sentiment analysis. The problem that we propose to tackle is the joint and dynamic modeling of topics (subjects) and sentiments (opinions) on the Web. In the literature, the task is usually divided into sub-tasks that are treated separately. The models that operate this way fail to capture the topic-sentiment interaction and association. In this work, we propose a joint modeling of topics and sentiments, by taking into account associations between them. We are also interested in the dynamics of topic-sentiment associations. To this end, we adopt a statistical approach based on the probabilistic topic models. Our main contributions can be summarized in two points : 1. TS (Topic-Sentiment model) : a new probabilistic topic model for the joint extraction of topics and sentiments. This model allows to characterize the extracted topics with distributions over the sentiment polarities. The goal is to discover the sentiment proportions specfic to each of theextracted topics. 2. TTS (Time-aware Topic-Sentiment model) : a new probabilistic model to caracterize the topic-sentiment dynamics. Relying on the document's time information, TTS allows to characterize the quantitative evolutionfor each of the extracted topic-sentiment pairs. We also present two other contributions : a new evaluation framework for measuring the performance of topic-extraction methods, and a new hybrid method for sentiment detection and classification from text. This method is based on combining supervised machine learning and prior knowledge. All of the proposed methods are tested on real-world data based on adapted evaluation frameworks.
Approche textométrique de l’analyse d’opinion - l’exemple de la crise entre la Chine et Google (2010) / A textometric approach to the analysis of opinions – an example of the crisis between China and Google (2010)Wu, Li-Chi 05 October 2016 (has links)
À l’avènement du Web 2.0, le monde virtuel devient une communauté extrêmement complexe dans laquelle on procède plus ou moins librement à des échanges d’informations et d’avis les plus divers. L’outil de communication, en constante évolution, fait émerger la voix de l’opinion dans le monde virtuel tout en influençant le contenu et la nature mêmes des messages des utilisateurs d’Internet. L’appareil de censure du web chinois, connu sous le nom de Grande Muraille électronique, a souvent fait l’objet de sévères dénonciations. Partant de la controverse, qui a ébranlé le monde politique et commercial, nous avons étudié les comportements linguistiques des acteurs du web chinois et nous avons examiné en profondeur les diverses modalités d’usage de la langue. Sur un corpus établi à partir des sites des médias, des forums, des blogs provenant des différentes communautés sinophones, notre objectif est d’expérimenter l’approche textométrique pour aboutir à une typologie différentielle des opinions. En nous appuyant sur les ressources lexicales, nous proposons divers critères d’analyse comparative pour tenter de dégager les opinions des auteurs à partir des textes qu’ils ont produits. Nous nous intéressons en particulier aux variétés et à la diversité des formes langagières des internautes chinois dont les nouvelles manières d’écrire ne se conforment pas aux règles et aux normes de la langue standard de l’écriture éditoriale. / With the arrival of the Web 2.0, the online world has become an extremely complex community, where information and opinions are more or less freely exchanged on all sides. The communication tools, constantly evolving, bring out public opinion in the online world and simultaneously influence both the content and the nature of Internet messages. Internet censorship in China, known as the Great Firewall, has often received harsh criticism. By the example of the controversy between Google and the Chinese government that shocked the political world and the market in 2010, we study the linguistic behaviour of participants on the Chinese Internet and examine the various forms of the use of language in depth. Based on a corpus established from media websites, forums, blogs in various Chinese-speaking communities, our goal is to apply the textometric approach in order to establish a differential typology of opinions. Building on the lexical resources, we offer various benchmarking criteria to try to extract authors' opinions from the texts that they have produced. We are particularly interested in the varieties and diversities of language forms of Chinese Internet users, where new ways of writing do not comply with the rules and norms of standard language as found in editorial writing.
Graphs and networks for the analysis of autonomous agent systemsHendrickx, Julien 14 February 2008 (has links)
<p>Autonomous agent systems are systems in which many simple entities, called “agents”, interact with each other. The behaviour resulting from such interactions can be much more complex than that of the individual agents. A group of interacting agents can for example accomplish tasks that no single agent could.</p>
<p>Nature provides several examples of autonomous agent systems, such as flocks of birds and insects, schools of fish, and anthills. Progresses in robotics, electronics and telecommunications make it now also possible to design such systems in order to accomplish particular tasks, such as the surveillance or exploration of areas, or the maintenance of some environments.</p>
<p>In this thesis, we analyze two issues related to autonomous agent systems, and more precisely, to the influence of the inter-agent communication network on the system behaviour. In a first part, we consider the problem of preserving the shape of a multi-agent formation by explicitly maintaining the distances between some agents constant. We study the case of distance constraints that are unilateral, that is, constraints for which the responsibility is given to a one of the two agents concerned. This leads to the notions of persistence and constraint consistence. The second part is devoted to the consensus problems: agents have a value which they update by averaging that of other agents. Eventually, all agents may obtain a common value, in which case we say that the system reaches a consensus. One major difficulty in the study of such system is the possible dependence of the interaction and communication topology on the values of the agents. We study two paradigmatic systems in which this dependence can be taken into account, and obtain results on their convergence and on the stability of their equlibria.</p>
De l'empowerment à l'engagement du client sur les plateformes en ligne : ou comment favoriser l'activité des clients sur Internet / From empowerment to customer engagement on online opinion platforms : or how to foster customers activity on the InternetMorrongiello, Caroline 25 June 2014 (has links)
Intérêt du sujet : Avec l’avènement du web2.0, l'influence interpersonnelle inclut désormais son extension dans le cyberespace avec le bouche-à-oreille électronique (eBAO). Internet modifie ainsi en profondeur les relations établies avec les consommateurs et conduit à une redéfinition de la relation marque -consommateur. Le web 2.0 apparaît ainsi comme un outil formidable au rééquilibrage des pouvoirs entre eux. Cependant, au-delà de ce constat, nous nous interrogeons quant à l’asymétrie entre les consommateurs et les marques dans ces conversations : le marketing est-il prêt à jouer le jeu ? Quelle perception le consommateur a-t-il de ce rééquilibrage ? Objectif de recherche : L’objectif de cette recherche est de comprendre les perceptions du web 2.0 par les consommateurs et les comportements qui en résultent. Thèse défendue : Face à cette redéfinition des relations entre consommateurs et entreprises, nous suggérons que les entreprises souhaitant des consommateurs engagés doivent accepter de céder une partie du pouvoir. Contribution attendue : Cette thèse vise à contribuer aux études précédentes et à pallier leurs limites. Alors que la littérature académique étudie les motivations des consommateurs à poster des avis en ligne en général (Hennig-Thurau et al, 2004 ; Sher et Lee, 2009), il manque des études empiriques considérant l’impact de facteurs individuels des consommateurs sur leur participation et sur leur engagement vis-à-vis d’une marque en particulier sur le web 2.0. Nous chercherons ainsi à comprendre le rôle des capacités de pouvoir du consommateur sur cette participation et cet engagement en ligne. Méthode : Une combinaison des approches qualitatives et quantitatives a constitué notre méthodologie de recherche. Dans un premier temps, une étude qualitative et une étude quantitative ont été réalisées auprès des consommateurs dans un contexte touristique. Celle-ci s’est déroulée en collaboration avec les offices de tourisme du Grand Bornand et d’Aix les Bains. Dans un deuxième temps, une expérimentation a été réalisée auprès des jeunes consommateurs (de 18 à 30 ans) dans le secteur spécifique des Smartphones et des tablettes mobiles. Principaux résultats : L’étude exploratoire nous a permis de souligner dans un premier temps les multiples paradoxes générés par l’eBAO diffusé sur les plateformes d’opinions. L’eBAO apparaît comme utile pour les consommateurs et les entreprises, cependant, un fort scepticisme règne face à celles-ci. La première étude quantitative nous a permis de mettre en avant les facteurs de participation et d’engagement : l’aide à l’entreprise, la sincérité perçue des avis postés, le scepticisme des consommateurs concernant les pratiques en ligne et l’attachement à la marque. D’une manière générale, nous constatons la volonté des consommateurs d’influencer. La seconde étude quantitative, l’expérimentation, nous montre que les caractéristiques des plateformes d’opinions en ligne ont un impact sur l’intention d’engagement et le comportement engageant. Cette étude nous montre l’importance de la véracité des commentaires en ligne et le risque infime de voir une plateforme d’opinions se transformer en défouloir. / Topic of interest : With the advent of Web 2.0, the interpersonal influence now includes its extension in cyberspace with electronic word of mouth. Therefore, the Internet deeply modify relationships between consumer and the brand and led to a redefinition of the relationship brand -consumer. Web 2.0 appears as a great tool rebalancing powers between them. However, beyond this, we wonder about the asymmetry between consumer and brand in these conversations: is marketing willing to play the game? What perception the consumer has of this rebalancing? Research Objective : The objective of this research is to understand the perceptions of Web 2.0 by consumers and resulting behaviors.Thesis defended : Faced with this redefinition of the relationship between the consumer and the brand, we suggest that companies wishing to engage consumers must agree to give up some power. Contribution expected : This thesis aims to contribute to previous studies and to overcome their limitations. While the academic literature explores the motivations of consumers to post online reviews in general (Hennig -Thurau & al , 2004; Sher &Lee, 2009) , it lacks empirical studies considering the impact of individual factors on their consumer participation and engagementtoward a particular brand on the web 2.0 . Thus, we seek to understand the role of consumer power capacities on online participation and engagement. Method : Our research methodology consists in a combination of qualitative and quantitative approaches. Firstly, a qualitative study and a quantitative study were conducted with consumers in a tourism context. It was held in collaboration with the tourist offices of the Grand-Bornand and Aix-les-Bains. Secondly, an experiment was conducted among young consumers (18 to 30 years) in the specific sector of Smartphones and mobile tablets. Main results The qualitative study allowed us to initially highlight multiple paradoxes generated by eWOM broadcast on opinion platforms. EWOM appears useful for consumers and businesses; however, a strong skepticism is facing them. The first quantitative study allowed us to highlight the determinants of participation and engagement: Helping company, perceived sincerity of posted comment, consumer skepticism regarding online practices and brand attachment. In general, we see consumer willingness to influence.The second quantitative study, the experimentation, shows that the characteristics of online opinion platforms have an impact on the intention of engaging and engaged behavior. This study shows the importance of online review accuracy of and the small risk for an online opinion platform to become a way to get out consumers anger.
