Recently a new method for training generative neural networks called Generative Adversarial Networks (GAN) has shown great results in the computer vision domain and shown potential in other generative machine learning tasks as well. GAN training is an adversarial training method where two neural networks compete and attempt to outperform each other, and in the process they both learn. In this thesis the effectiveness of GAN training is tested on conversational agents also called chat bots. To test this, current state-of-the-art training methods such as Maximum Likelihood Estimation (MLE) models are compared with GAN method trained models. Model performance was measured by closeness of the model distribution from the target distribution after training. This thesis shows that the GAN method performs worse the MLE in some scenarios but can outperform MLE in some cases. / Nyligen har en ny metod för att träna generativa neurala nätverk kallad Generative Adversarial Networks (GAN) visat bra resultat inom datorseendedomänen och visat potential inom andra maskininlärningsområden också GAN-träning är en träningsmetod där två neurala nätverk tävlar och försöker överträffa varandra, och i processen lär sig båda. I detta examensarbete har effektiviteten av GAN-träning testats på konversationsagenter, som också kallas Chat bots. För att testa det här jämfördes modeller tränade med nuvarande state-of- the-art träningsmetoder, så som Maximum likelihood-metoden (ML), med GAN-tränade modeller. Modellernas prestation mättes genom distans från modelldistribution till måldistribution efter träning. Det här examensarbetet visar att GAN-metoden presterar sämre än ML-metoden i vissa scenarier men kan överträffa ML i vissa fall.
Identifer | oai:union.ndltd.org:UPSALLA1/oai:DiVA.org:kth-278143 |
Date | January 2020 |
Creators | Rinnarv, Jonathan |
Publisher | KTH, Skolan för elektroteknik och datavetenskap (EECS) |
Source Sets | DiVA Archive at Upsalla University |
Language | English |
Detected Language | Swedish |
Type | Student thesis, info:eu-repo/semantics/bachelorThesis, text |
Format | application/pdf |
Rights | info:eu-repo/semantics/openAccess |
Relation | TRITA-EECS-EX ; 2020:541 |
Page generated in 0.0019 seconds