Titre de l'écran-titre (visionné le 8 août 2023) / La pandémie de COVID-19 a été un sujet de discussion important sur les réseaux dans les dernières années. Le grand nombre de messages qui y ont circulé ont facilité la dissémination de fausses nouvelles au sujet des vaccins et ont contribué à la création d'un environnement d'échanges en ligne toxique. Cette réalité a mis en évidence l'importance de bien comprendre comment l'information circule à travers les discussions publiques en ligne, dans le but de faciliter la diffusion de messages positifs, tout en limitant la propagation de fausses nouvelles. Dans ce mémoire, une nouvelle méthode permettant d'extraire la structure de conversations en ligne au sujet de la COVID-19 est développée et présentée. Cette méthode est basée sur l'entraînement de modèles cachés de Markov, initialisés à partir d'une stratégie de biclustering d'importants attributs des messages. Cette méthode est mise en application sur un jeu de données de conversations Facebook en lien avec la COVID-19, ce qui permet de démontrer qu'elle parvient à extraire la structure des conversations de manière efficace, tout en identifiant les principaux thèmes des messages. De plus, on démontre comment le diagramme de transition des conversations extrait grâce à la méthode peut être utilisé pour simuler les impacts de différentes stratégies de modérations, ce qui permet de facilement développer et tester de nouvelles stratégies pour limiter la circulation de messages nocifs. Bien que la méthode présentée dans ce mémoire se concentre sur les conversations en lien avec la pandémie de COVID-19, elle demeure suffisamment générale pour pouvoir être appliquée sur des données obtenues lors de futures pandémies ou autres crises similaires, ou pour développer de meilleures pratiques de communication sécuritaires pour les communautés en ligne de manière générale. / The COVID-19 pandemic was an important topic of discussion on online social networks (OSNs). The large volume of messages exchanged has facilitated the spread of misinformation surrounding vaccines and created a toxic online environment. This has highlighted the importance of understanding how information flows in public online discussions in order to facilitate the dissemination of positive messages and factual information in the future. In this thesis, we propose a novel unsupervised method to discover the structure of online COVID-19-related conversations. Our method trains a Hidden Markov Model (HMM) initialized from a biclustering of the messages' features. We apply our method on Facebook conversations following COVID-19 news items, and show that it can effectively extract the conversation structure and discover the main themes of the messages. Furthermore, we demonstrate how the conversation graph discovered can be used to simulate the impact of different moderation strategies, which makes it possible to easily develop and test new strategies to limit the spread of harmful messages. Although our work in this thesis focuses on the COVID-19 pandemic, the methodology is general enough to be applied to handle communications during future pandemics and other crises, or to develop better practices for online community moderation in general.
Identifer | oai:union.ndltd.org:LAVAL/oai:corpus.ulaval.ca:20.500.11794/122806 |
Date | 25 March 2024 |
Creators | Gélinas-Gascon, Félix |
Contributors | Khoury, Richard |
Source Sets | Université Laval |
Language | English |
Detected Language | French |
Type | COAR1_1::Texte::Thèse::Mémoire de maîtrise |
Format | 1 ressource en ligne (vii, 76 pages), application/pdf |
Rights | http://purl.org/coar/access_right/c_abf2 |
Page generated in 0.0022 seconds