Return to search

Détection automatique de l'ironie dans les contenus générés par les utilisateurs / Automatic irony detection in users generated content

Cette thèse a pour objectif la détection du langage figuratif dans les réseaux sociaux. Nous nous focalisons en particulier sur l'ironie et le sarcasme dans Twitter et proposons une approche basée sur l'apprentissage supervisée afin de prédire si le message véhiculé dans un tweet est ironique ou non. Pour ce faire, trois étapes ont été réalisées : (1) Analyse des phénomènes pragmatiques de l'ironie et annotation multi-niveaux d'un corpus de référence, (2) Développement d'un modèle de détection automatique pour les tweets en français qui exploite à la fois des traits sémantiques et le contexte extralinguistique, (3) Etude de la portabilité du modèle pour la détection de l'ironie dans un cadre multilingue (italien, anglais et arabe). Les résultats obtenus pour cette tâche extrêmement complexe sont très encourageants et permettrons d'améliorer sensiblement la détection de polarité lors de l'analyse de sentiments. / This thesis aims to detect figurative language devices in social networks. We focus in particular on irony and sarcasm in Twitter and propose an approach based on supervised learning to predict if a tweet is ironic or not. This required three steps: (1) Analyze the pragmatic phenomena of irony and a multi-level annotation of a corpus of reference, (2) Development of an automatic detection system for French tweets that exploits both semantic features and the extra-linguistic context, (3) Study of the portability of the model to detect irony in a multilingual setting (Italian, English and Arabic). The obtained results for this extremely complex task are very encouraging and will allow a significant improvement of polarity detection in sentiments analysis.

Identiferoai:union.ndltd.org:theses.fr/2017TOU30145
Date28 September 2017
CreatorsKaroui, Jihen
ContributorsToulouse 3, Benamara, Farah, Moriceau, Véronique, Aussenac-Gilles, Nathalie, Hadrich Belguith, Lamia
Source SetsDépôt national des thèses électroniques françaises
LanguageFrench
Detected LanguageFrench
TypeElectronic Thesis or Dissertation, Text

Page generated in 0.0036 seconds