The steep growth of video-games is demanding a higher amount of characters in the games. The process of generating characters is very expensive and time consuming. Consequently, this process doesn’t cover the current demands and could be optimized by developing a generative model able to synthesize high- quality 3D avatar faces within minutes. This model would result in drastic gains for gaming companies. Therefore, the aim of this project is to implement a model able to generate realistic 3D avatar faces by generating texture and shape when a limited amount of data is given (<1k samples). This type of model is called 3D Morphable Model and it will also learn the correlation between shape and texture in order to generate consistent results. In order to achieve this final model, which is called joint model, individual models for texture and shape are also developed. The three type of models are built upon StyleGAN2-ADA architecture. The final design of the joint model has three discriminators: a joint discriminator to ensure consistency and two individual discriminators to have good quality for shape and texture. This model was inspired from [1]. The experiments show that the best texture model uses the augmentation techniques introduced in StyleGAN2-ADA. The experiments over the joint model prove that having just one discriminator is not enough to generate good quality results. On the other hand, the joint model with three discriminators give good quality and coherent results. In addition, this joint model outperforms the results of the shape model when training the model with the same number of samples, 969 samples. This model shows a promising path for further improvements. / Den kraftiga ökningen av videospel kräver ett större antal karaktärer i spelen. Processen att skapa karaktärer är mycket dyr och tidskrävande. Denna process täcker därför inte den nuvarande efterfrågan och skulle kunna optimeras genom att utveckla en generativ modell som kan syntetisera högkvalitativa 3D-avataransikten av hög kvalitet på några minuter. Denna modell skulle leda till drastiska vinster för spelföretagen. Syftet med detta projekt är därför att implementera en modell som kan generera realistiska 3D-avataransikten genom att generera textur och form när en begränsad mängd data ges (<1k samplingar). Denna typ av modell kallas 3D Morphable Model och den kommer också att lära sig korrelationen mellan form och textur för att generera konsekventa resultat. För att uppnå denna slutliga modell, som kallas gemensam modell, utvecklas också individuella modeller för textur och form. De tre typerna av modeller bygger på StyleGAN2- ADA-arkitekturen. Den slutliga utformningen av den gemensamma modellen har tre diskriminatorer: en gemensam diskriminator för att säkerställa konsistens och två individuella diskriminatorer för att uppnå god kvalitet för form och textur. Denna modell har inspirerats av [1]. Experimenten visar att den bästa texturmodellen använder de förstärkningstekniker som infördes i StyleGAN2-ADA. Experimenten med den gemensamma modellen visar att det inte räcker med bara en diskriminator för att generera resultat av god kvalitet. Å andra sidan ger den gemensamma modellen med tre diskriminatorer bra kvalitet och sammanhängande resultat. Dessutom överträffar denna gemensamma modell resultaten från formmodellen när modellen tränas med samma antal prov, 969 prov. Denna modell visar en lovande väg för ytterligare förbättringar.
Identifer | oai:union.ndltd.org:UPSALLA1/oai:DiVA.org:kth-305060 |
Date | January 2021 |
Creators | Garcia Vazquez, Flavia |
Publisher | KTH, Skolan för elektroteknik och datavetenskap (EECS) |
Source Sets | DiVA Archive at Upsalla University |
Language | English |
Detected Language | Swedish |
Type | Student thesis, info:eu-repo/semantics/bachelorThesis, text |
Format | application/pdf |
Rights | info:eu-repo/semantics/openAccess |
Relation | TRITA-EECS-EX ; 2021:700 |
Page generated in 0.0025 seconds