La détection des données hors distribution (en anglais *Out-of-Distribution*, OOD) est un défi crucial en apprentissage automatique, essentiel pour garantir la fiabilité et la sécurité des modèles dans les applications du monde réel. Cette thèse explore l'utilisation des réseaux antagonistes génératifs (Generative Adversarial Networks, GANs) pour la détection des données OOD. Les GANs, connus pour leur capacité à générer des données synthétiques réalistes, se composent d'un générateur qui produit des données et d'un discriminateur qui distingue entre les données réelles et générées. Entraînés sur des données en distribution (en anglais *in-distribution*, ID), les GANs pourraient offrir une approche prometteuse pour identifier les échantillons OOD. Le premier chapitre fournit une introduction à l'apprentissage automatique et au problème de détection des données OOD. Il définit les concepts clés, souligne l'importance d'une détection efficace des données OOD et présente des métriques d'évaluation pour évaluer les détecteurs OOD. De plus, il discute des différentes mesures de distance entre distributions, jetant les bases de la compréhension des opérations des GANs. Le deuxième chapitre explore les fondements théoriques des GANs, détaillant leur architecture et leur processus d'entraînement antagoniste. Ce chapitre couvre également les métriques d'évaluation des performances des GANs, offrant une compréhension approfondie de leurs forces et de leurs limites. Dans le troisième chapitre, nous introduisons le GAN Entropique (E-GAN), une nouvelle approche pour la détection des données OOD. Dans l'E-GAN, nous modifions la fonction de perte traditionnelle des GANs pour inclure la régularisation de l'entropie, permettant ainsi au générateur de produire à la fois des données ID et OOD. Cela permet au discriminateur de fonctionner comme un classificateur binaire efficace, distinguant entre les échantillons ID et OOD. Nous présentons des résultats expérimentaux démontrant l'efficacité de l'E-GAN et analysons l'impact de la variation des hyperparamètres clés. Le chapitre se termine par une discussion sur les limites de notre approche et les voies potentielles pour des recherches futures. Cette thèse propose une méthode novatrice pour améliorer la détection des données OOD en utilisant les GANs. En introduisant la régularisation de l'entropie dans la structure des GANs, nous améliorons la capacité du modèle à distinguer entre les données ID et OOD, contribuant ainsi au développement de systèmes d'apprentissage automatique plus fiables et sûrs. / Out-of-Distribution (OOD) detection is a critical challenge in machine learning, vital for ensuring the reliability and safety of models in real-world applications. This thesis explores the use of Generative Adversarial Networks (GANs) for OOD detection. GANs, known for their ability to generate realistic synthetic data, consist of a generator that produces data and a discriminator that differentiates between real and generated data. Trained on in-distribution (ID) data, GANs could offer a promising approach for identifying OOD samples. The first chapter provides a comprehensive introduction to machine learning and the OOD detection problem. It defines key concepts, emphasizes the importance of effective OOD detection, and introduces evaluation metrics for assessing OOD detectors. Additionally, it discusses various distance measures between distributions, laying the groundwork for understanding GAN operations. The second chapter delves into the theoretical foundations of GANs, detailing their architecture and adversarial training process. This chapter also covers evaluation metrics for GAN performance, offering a thorough understanding of their strengths and limitations. In the third chapter, we introduce the Entropic GAN (E-GAN), a novel approach for OOD detection. In E-GAN, we modify the traditional GAN loss function to include entropy regularization, enabling the generator to produce both ID and OOD data. This allows the discriminator to function as an effective binary classifier, distinguishing between ID and OOD samples. We present experimental results demonstrating the efficacy of E-GAN and analyze the impact of varying key hyperparameters. The chapter concludes with a discussion on the limitations of our approach and potential avenues for future research. This thesis proposes a novel method for improving OOD detection using GANs. By introducing entropy regularization into the GAN framework, we enhance the model's ability to distinguish between ID and OOD data.
Identifer | oai:union.ndltd.org:LAVAL/oai:corpus.ulaval.ca:20.500.11794/153083 |
Date | 29 October 2024 |
Creators | Yeganehparast, Alireza |
Contributors | Desharnais, Josée |
Source Sets | Université Laval |
Language | English |
Detected Language | French |
Type | COAR1_1::Texte::Thèse::Mémoire de maîtrise |
Format | 1 ressource en ligne (xi, 56 pages), application/pdf |
Rights | http://purl.org/coar/access_right/c_abf2 |
Page generated in 0.0017 seconds