La présente thèse recherche une approche sémantique pour l'extraction et l'analyse du discours idéologique au sein de documents textuels sous forme électronique. Cette approche intègre une méthode qualitative d'analyse de textes issue des sciences sociales (analyse critique du discours) avec une méthode quantitative de raisonnement et extraction d'information à base d'ontologies de domaine et de traitement semi-automatique du langage naturel. L'application centrale du projet de thèse vise à étudier le discours marxiste comme représenté par la collection thématique Archive Internet des Marxistes (http://www.marxists.org) contenant près de 15000 textes. L'objectif de l'application est l'acquisition de schémas émergents, qui pourront contribuer à la classification par point de vue idéologique de textes inconnus. / This thesis outlines a semantic approach to the mining and analysis of ideological discourse from electronic texts. This approach integrates a qualitative social scientific method of textual analysis (Critical Discourse Analysis) with a quantitative ontology-based reasoning and information retrieval method using semi-automatic natural language processing techniques. It is applied to the analysis of Marxist discourse, as represented in the Marxists Internet Archive (http://www.marxists.org) thematic collection, containing nearly 15,000 texts. The application focuses on the acquisition of emerging schemas, which can contribute to the classification of unknown texts by ideological perspective.
Identifer | oai:union.ndltd.org:theses.fr/2010LYO22013 |
Date | 08 October 2010 |
Creators | Mavrikas, Efthimios |
Contributors | Lyon 2, Ege Üniversitesi (Izmir, Turquie), Dascalopoulos, Sophia, Zighed, Djamel Abdelkader |
Source Sets | Dépôt national des thèses électroniques françaises |
Language | Modern Greek (1453-) |
Detected Language | French |
Type | Electronic Thesis or Dissertation, Text |
Page generated in 0.0118 seconds