Spelling suggestions: "subject:"igenkänning"" "subject:"genkänning""
31 |
Exploring the Use of Attention for Generation Z Fashion Style Recognition with User Annotations as Labels / Undersökande av uppmärksamhet för igenkänning av Generation Z:s klädstilar med användarannoteringar som träningsetiketterSamakovlis, Niki January 2023 (has links)
As e-commerce and online shopping have increased worldwide, the interest and research of intelligent fashion systems have expanded. Given the competitive nature of the fashion market business, digital marketplaces depend on determining customer preferences. The fashion preferences of the next generation of consumers, Generation Z, are highly discovered on social media, where new fashion styles have emerged. For digital marketplaces to gain the attraction of Generation Z consumers, an understanding of their fashion style preferences may be crucial. However, fashion style recognition remains challenging due to the subjective nature of fashion styles. Previous research has approached the task by fine-tuning pre-trained convolutional neural networks (CNNs). The disadvantage of this approach is that a CNN leveraged on its own fails to find subtle visual differences between clothing items. Hence, this thesis seeks to approach the clothing style recognition task as a fine-grained image recognition task by incorporating a component that allows the model to focus on specific parts of the input images, referred to as an attention mechanism, into the network. Specifically, a convolutional block attention module (CBAM) is added to a CNN. Based on the results, it is concluded that the fine-tuned CNN without the attention module achieves superior performance. In contrast, qualitative analysis conducted on GradCAM visualizations shows that the attention mechanism aids the CNN in capturing discriminative features, while the network without the attention module tends to make predictions based on dataset bias. For a fair comparison, future work should involve extending this research by refining the dataset or using an additional dataset. / I takt med att e-handel har ökat världen över har intresset och forskningen för intelligenta modesystem ökat. Modemarknadens konkurrenskraft har gjort digitala marknadsplatser beroende av att bestämma deras kunders preferenser. Modepreferenserna för nästa generations konsumenter, Generation Z, upptäcks ofta på sociala medier, där nya klädstilar har skapats. För att digitala marknadsplatser ska kunna locka Generation Z kan en förståelse för deras klädstilpreferenser vara avgörande. Igenkänning av klädstilar är dock fortfarande svårt på grund av klädtilars subjektiva natur. Tidigare forskning har finjusterat faltningsnätverk. Nackdelen med detta tillvägagångssätt är att ett faltningsnätverk som utnyttjas på egen hand inte lyckas hitta dem subtila visuella skillnader mellan klädesplagg. Därför definierar denna avhandling problemet som finkornig bildigenkänning genom att addera en komponent som gör att modellen kan fokusera på specifika delar av bilderna, kallad en uppmärksamhetsmekanism, i nätverket. Specifikt läggs en convolutional block attention module (CBAM) till i arkitekturen av ett faltningsnätverk. Baserat på resultaten dras slutsatsen att det finjusterade faltningsnätverket utan uppmärksamhetsmekanismen uppnår överlägsen prestanda. Däremot visar kvalitativ analys utförd på Grad-CAMvisualiseringar att uppmärksamhetsmekanismen hjälper faltningsnätverket att fokusera på de diskriminerande egenskaperna, medan nätverket utan uppmärksamhetsmekanismen tenderar att klassificera baserat på bias i inputdatan. För en rättvis jämförelse bör framtida arbete innebära ett förfinande av datamängden eller använda en ytterligare datamängd.
|
32 |
Context-based Multimodal Machine Learning on Game Oriented Data for Affective State Recognition / Kontextbaserad multimodal maskininlärning på spelorienterad data för affektivt tillståndsigenkänningCorneliussen, Ilian January 2021 (has links)
Affective computing is an essential part of Human-Robot Interaction, where knowing the human’s emotional state is crucial to create an interactive and adaptive social robot. Previous work has mainly been focusing on using unimodal or multimodal sequential models for Affective State Recognition. However, few have included context-based information with their models to boost performance. In this paper, context-based features are tested on a multimodal Gated Recurrent Unit model with late fusion on game oriented data. It shows that using context-based features such as game state can significantly increase the performance of sequential multimodal models on game oriented data. / Affektiv beräkning är en viktig del av interaktion mellan människa och robot, där kunskap om människans emotionella tillstånd är avgörande för att skapa en interaktiv och anpassningsbar social robot. Tidigare arbete har främst fokuserat på att använda unimodala eller multimodala sekventiella modeller för affektiv tillståndsigenkänning. Men få har inkluderat kontextbaserad information i sin inställning för att öka prestanda. I denna uppsats testas kontextbaserade funktioner på en multimodal s.k. Gated Recurrent Unit modell med sen fusion på spelorienterad data. Det visar att användning av kontextbaserade information som tillståndet i spelet kan avsevärt öka prestandan hos sekventiella multimodala modeller på spelorienterad data.
|
33 |
Leveraging Adult Fashion to Enhance Children’s Fashion RecognitionIgareta Herráiz, Angel Luis January 2021 (has links)
The future of the fashion industry is expected to be online, thus a significant amount of research is being conducted in the field of fashion image analysis. Currently, a task that places a heavy workload on online stores is manually tagging new garments, including attributes such as category, color, pattern, or style. To this end, extensive research has targeted the automatic prediction of clothing categories and attributes, achieving promising results. Nevertheless, no previous study has been found in the literature that specifically reflects the performance of clothing attribute recognition with children’s clothing. This work intends to fill this gap and effectively present, in the same fashion analysis task, how a model trained in adult fashion performs over a model trained exclusively in children’s fashion. When examining the global understanding of children’s fashion apparel, the experiments exhibit that the best performance is obtained when leveraging the domain knowledge of adult fashion, specifically from the iMaterialist dataset, wherein the best model a difference in the overall performance of about 3% was achieved compared to pre- training on the ImageNet dataset or 12% when only children’s fashion was considered for training. / Modebranschen förväntas i framtiden vara online, och därför bedrivs det mycket forskning inom området bildanalys av modebilder. En uppgift som för närvarande innebär en stor arbetsbörda för nätbutiker är att manuellt tagga nya plagg med attribut som kategori, färg, mönster eller stil. Därför har omfattande forskning genomförts om automatisk förutsägelse av klädkategorier och attribut, och man har uppnått lovande resultat. Trots detta har ingen tidigare studie hittats i litteraturen som specifikt speglar prestandan för igenkänning av klädattribut för barnkläder. Syftet med det här arbetet är att fylla denna lucka och, som en del i en analys av mode, på ett effektivt sätt visa hur en modell som tränats för vuxenmode presterar jämfört med en modell som enbart tränats för barnmode. När man undersöker den globala förståelsen för barnkläder visar experimenten att den bästa prestandan uppnås när man utnyttjar domänkunskapen om vuxenmode, särskilt från iMaterialist- dataset, där man med den bästa modellen uppnådde en skillnad i den totala prestandan på cirka 3% jämfört med förträning på ImageNet- dataset eller 12% när endast barnmode beaktades vid träningen.
|
34 |
Den animerade musikupplevelsen - en studie om animation som visuellt komplement på Spotify / The animated music experience - a study on animation as a visual complement on SpotifyEriksson, Linnea Viola January 2019 (has links)
Denna studie syftar att undersöka huruvida animation som visuellt komplement på Spotify väcker större engagemang emotionellt än ett statiskt skivomslag. Animerade filmer har tagits fram till sex olika låtar på albumet 99.9% av artisten Kaytranada. Detta har gjorts genom en förstudie i form av en enkät, samt research om de befintliga filmer som finns tillgängliga på Spotify i dagsläget. Efter detta har designarbetet utförts genom brainstorming, explorativt skissande och storyboards. För att utvärdera skapades en värderingsmatris med syfte att välja ut de mest engagerande idéerna, för att sedan fortsätta med digitalt skissande och slutligen animering. Efter detta värderades animationerna gentemot det statiska skivomslaget genom en kvalitativ enkät, såväl som två olika fokusgrupper. Resultatet visade att även om animationerna ansågs något repetitiva så ansåg en majoritet att de var mer engagerande emotionellt än ett statiskt skivomslag.
|
35 |
Swedish Sign Language Skills Training and Assessment / Utbildning och bedömning av svensk teckenspråksförmågaPotrus, Dani January 2017 (has links)
Sign language is used widely around the world as a first language for those that are unable to use spoken language and by groups of people that have a disability which precludes them from using spoken language (such as a hearing impairment). The importance of effective learning of sign language and its applications in modern computer science has grown widely in the modern aged society and research around sign language recognition has sprouted in many different directions, some examples using hidden markov models (HMMs) to train models to recognize different sign language patterns (Swedish sign language, American sign language, Korean sign language, German sign language and so on). This thesis project researches the assessment and skill efficiency of using a simple video game to learn Swedish sign language for children in the ages within the range of 10 to 11 with no learning disorders, or any health disorders. During the experimental testing, 38 children are divided into two equally sized groups of 19 where each group plays a sign language video game. The context of the video game is the same for both groups, where both listened to a 3D avatar speak to them using both spoken language and sign language. The first group played the game and answered questions given to them by using sign language, whereas the other group answered questions given to them by clicking on an alternative on the video game screen. A week after the children have played the video game, the sign language skills that they have acquired from playing the video game are assessed by simple questions where they are asked to provide some of the signs that they saw during the duration of the video game. The main hypothesis of the project is that the group of children that answered by signing outperforms the other group, in both remembering the signs and executing them correctly. A statistical null hypothesis test is performed on this hypothesis, in which the main hypothesis is confirmed. Lastly, discussions for future research within sign language assessment using video games is described in the final chapter of the thesis. / Teckenspråk används i stor grad runt om i världen som ett modersmål för dom som inte kan använda vardagligt talsspråk och utav grupper av personer som har en funktionsnedsättning (t.ex. en hörselskada). Betydelsen av effektivt lärande av teckenspråk och dess tillämpningar i modern datavetenskap har ökat i stor utsträckning i det moderna samhället, och forskning kring teckenspråklig igenkänning har spirat i många olika riktningar, ett exempel är med hjälp av statistika modeller såsom dolda markovmodeller (eng. Hidden markov models) för att träna modeller för att känna igen olika teckenspråksmönster (bland dessa ingår Svenskt teckenspråk, Amerikanskt teckenspråk, Koreanskt teckenspråk, Tyskt teckenspråk med flera). Denna rapport undersöker bedömningen och skickligheten av att använda ett enkelt teckenspråksspel som har utvecklats för att lära ut enkla Svenska teckenspråksmönster för barn i åldrarna 10 till 11 års ålder som inte har några inlärningssjukdomar eller några problem med allmän hälsa. Under projektets experiment delas 38 barn upp i två lika stora grupper om 19 i vardera grupp, där varje grupp kommer att få spela ett teckenspråksspel. Sammanhanget för spelet är detsamma för båda grupperna, där de får höra och se en tredimensionell figur (eng. 3D Avatar) tala till dom med både talsspråk och teckenspråk. Den första gruppen spelar spelet och svarar på frågor som ges till dem med hjälp av teckenspråk, medan den andra gruppen svarar på frågor som ges till dem genom att klicka på ett av fem alternativ som finns på spelets skärm. En vecka efter att barnen har utfört experimentet med teckenspråksspelet bedöms deras teckenspråkliga färdigheter som de har fått från spelet genom att de ombeds återuppge några av de tecknena som de såg under spelets varaktighet. Rapportens hypotes är att de barn som tillhör gruppen som fick ge teckenspråk som svar till frågorna som ställdes överträffar den andra gruppen, genom att både komma ihåg tecknena och återuppge dom på korrekt sätt. En statistisk hypotesprövning utförs på denna hypotes, där denna i sin tur bekräftas. Slutligen beskrivs det i rapportens sista kapitel om framtida forskning inom teckenspråksbedömning med tv spel och deras effektivitet.
|
36 |
Metafor - en metod att göra det privata personligtUddenberg, Molly January 2013 (has links)
In this study I have met three authors in a dialogue seminar on their literary work. The discussion, starting from texts by Lacan and Socrates, revolved around the dichotomy of personal and private, and how to benefit from personal material in one’s literary work. The three authors reflected on the writer Karl Ove Knausgård and the photographer Sally Mann, who both are working with their own immediate family as a motif. In Knausgård, you can find a strong and self-dissecting writer persona as a medium of creating recognition in the readers mind. In Sally Mann the metaphorical dimensions of this family motifs transforms them to images of much more general relevance than their private settings. On the subject of truth and story I also reflect on the different approaches that the authors Primo Levi, Viktor Frankl and Imre Kertész have on their experiences of the Holocaust. Finally the importance and relevance of metaphors as a way of getting a touch of one’s own private material is starting to be investigated. / I det här arbetet har jag samlat tre författare i olika genrer till ett dialogseminarium om sin arbetsprocess. Samtalet, som utgick från texter av Lacan och Sokrates, kretsade mycket kring författarens arbetsvillkor och de olika metoder som författarna använder sig av för att hitta sin frihet i förhållande till dem. I samtalet blev det uppenbart hur beroende alla författarna är av en förstående medarbetare. Okunskap och felläsning från en dramaturg eller redaktör kan bokstavligt talat bli förödande. Dialogmötet kom att kretsa kring frågeställningar om hur man skiljer privat och personligt. Vi diskuterade författaren Karl Ove Knausgård och fotografen Sally Mann, som båda jobbar med sin egen familj som motiv. Genom att Knausgård använder sig själv som en roll visar han på en möjlighet att närma sig ett eget material. Hos Sally Mann är det istället de metaforiska dimensionerna i de vardagliga motiven som gör sig tydliga. Också i Imre Kertész skildring av förintelsen förvandlas den till något större: en metafor för hur ödet och slumpen kan påverka våra liv. Hans berättelse blir på det sättet mindre beroende av vad som är sant, än skildringarna av två andra överlevare från Auschwitz: Primo Levi och Viktor Frankl. Vilket inte betyder att de andras texter saknar metaforisk styrka. Avslutningsvis går uppsatsen in på författarnas sätt att använda metaforen som ett verktyg för att berätta. Metaforen är alltid en bild av någonting annat, den skapar en fördjupning och oförväntad igenkänning hos läsaren. Den ger också möjligheter för konstnären/författaren att berätta saker som hen inte kan säga på andra sätt. Metaforen uppstår genom igenkänning i skapandet. Man kan välja att gå med den, eller aktivt gå emot den för att fördjupa textens eller filmens metaforiska dimension. En viktig aspekt för yrkeskunnande inom konsten och författarskap är att aldrig ligga före i sitt arbete genom att oroa sig för vad omgivningen ska tycka och tänka. Då finns det en risk att man blir en feg konstnär, vilket är förödande för ens skapande.
|
Page generated in 0.0654 seconds