• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 2
  • Tagged with
  • 2
  • 2
  • 2
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

Approche textométrique de l’analyse d’opinion - l’exemple de la crise entre la Chine et Google (2010) / A textometric approach to the analysis of opinions – an example of the crisis between China and Google (2010)

Wu, Li-Chi 05 October 2016 (has links)
À l’avènement du Web 2.0, le monde virtuel devient une communauté extrêmement complexe dans laquelle on procède plus ou moins librement à des échanges d’informations et d’avis les plus divers. L’outil de communication, en constante évolution, fait émerger la voix de l’opinion dans le monde virtuel tout en influençant le contenu et la nature mêmes des messages des utilisateurs d’Internet. L’appareil de censure du web chinois, connu sous le nom de Grande Muraille électronique, a souvent fait l’objet de sévères dénonciations. Partant de la controverse, qui a ébranlé le monde politique et commercial, nous avons étudié les comportements linguistiques des acteurs du web chinois et nous avons examiné en profondeur les diverses modalités d’usage de la langue. Sur un corpus établi à partir des sites des médias, des forums, des blogs provenant des différentes communautés sinophones, notre objectif est d’expérimenter l’approche textométrique pour aboutir à une typologie différentielle des opinions. En nous appuyant sur les ressources lexicales, nous proposons divers critères d’analyse comparative pour tenter de dégager les opinions des auteurs à partir des textes qu’ils ont produits. Nous nous intéressons en particulier aux variétés et à la diversité des formes langagières des internautes chinois dont les nouvelles manières d’écrire ne se conforment pas aux règles et aux normes de la langue standard de l’écriture éditoriale. / With the arrival of the Web 2.0, the online world has become an extremely complex community, where information and opinions are more or less freely exchanged on all sides. The communication tools, constantly evolving, bring out public opinion in the online world and simultaneously influence both the content and the nature of Internet messages. Internet censorship in China, known as the Great Firewall, has often received harsh criticism. By the example of the controversy between Google and the Chinese government that shocked the political world and the market in 2010, we study the linguistic behaviour of participants on the Chinese Internet and examine the various forms of the use of language in depth. Based on a corpus established from media websites, forums, blogs in various Chinese-speaking communities, our goal is to apply the textometric approach in order to establish a differential typology of opinions. Building on the lexical resources, we offer various benchmarking criteria to try to extract authors' opinions from the texts that they have produced. We are particularly interested in the varieties and diversities of language forms of Chinese Internet users, where new ways of writing do not comply with the rules and norms of standard language as found in editorial writing.
2

Modélisation conjointe des thématiques et des opinions : application à l'analyse des données textuelles issues du Web / Joint topic-sentiment modeling : an application to Web data analysis

Dermouche, Mohamed 08 June 2015 (has links)
Cette thèse se situe à la confluence des domaines de "la modélisation de thématiques" (topic modeling) et l'"analyse d'opinions" (opinion mining). Le problème que nous traitons est la modélisation conjointe et dynamique des thématiques (sujets) et des opinions (prises de position) sur le Web et les médias sociaux. En effet, dans la littérature, ce problème est souvent décomposé en sous-tâches qui sont menées séparément. Ceci ne permet pas de prendre en compte les associations et les interactions entre les opinions et les thématiques sur lesquelles portent ces opinions (cibles). Dans cette thèse, nous nous intéressons à la modélisation conjointe et dynamique qui permet d'intégrer trois dimensions du texte (thématiques, opinions et temps). Afin d'y parvenir, nous adoptons une approche statistique, plus précisément, une approche basée sur les modèles de thématiques probabilistes (topic models). Nos principales contributions peuvent être résumées en deux points : 1. Le modèle TS (Topic-Sentiment model) : un nouveau modèle probabiliste qui permet une modélisation conjointe des thématiques et des opinions. Ce modèle permet de caractériser les distributions d'opinion relativement aux thématiques. L'objectif est d'estimer, à partir d'une collection de documents, dans quelles proportions d'opinion les thématiques sont traitées. 2. Le modèle TTS (Time-aware Topic-Sentiment model) : un nouveau modèle probabiliste pour caractériser l'évolution temporelle des thématiques et des opinions. En s'appuyant sur l'information temporelle (date de création de documents), le modèle TTS permet de caractériser l'évolution des thématiques et des opinions quantitativement, c'est-à-dire en terme de la variation du volume de données à travers le temps. Par ailleurs, nous apportons deux autres contributions : une nouvelle mesure pour évaluer et comparer les méthodes d'extraction de thématiques, ainsi qu'une nouvelle méthode hybride pour le classement d'opinions basée sur une combinaison de l'apprentissage automatique supervisé et la connaissance a priori. Toutes les méthodes proposées sont testées sur des données réelles en utilisant des évaluations adaptées. / This work is located at the junction of two domains : topic modeling and sentiment analysis. The problem that we propose to tackle is the joint and dynamic modeling of topics (subjects) and sentiments (opinions) on the Web. In the literature, the task is usually divided into sub-tasks that are treated separately. The models that operate this way fail to capture the topic-sentiment interaction and association. In this work, we propose a joint modeling of topics and sentiments, by taking into account associations between them. We are also interested in the dynamics of topic-sentiment associations. To this end, we adopt a statistical approach based on the probabilistic topic models. Our main contributions can be summarized in two points : 1. TS (Topic-Sentiment model) : a new probabilistic topic model for the joint extraction of topics and sentiments. This model allows to characterize the extracted topics with distributions over the sentiment polarities. The goal is to discover the sentiment proportions specfic to each of theextracted topics. 2. TTS (Time-aware Topic-Sentiment model) : a new probabilistic model to caracterize the topic-sentiment dynamics. Relying on the document's time information, TTS allows to characterize the quantitative evolutionfor each of the extracted topic-sentiment pairs. We also present two other contributions : a new evaluation framework for measuring the performance of topic-extraction methods, and a new hybrid method for sentiment detection and classification from text. This method is based on combining supervised machine learning and prior knowledge. All of the proposed methods are tested on real-world data based on adapted evaluation frameworks.

Page generated in 0.0562 seconds