Global ETD Search

21	Categorization of Customer Reviews Using Natural Language Processing / Kategorisering av kundrecensioner med naturlig språkbehandling Liliemark, Adam, Enghed, Viktor January 2021 (has links) Databases of user generated data can quickly become unmanageable. Klarna faced this issue, with a database of around 700,000 customer reviews. Ideally, the database would be cleaned of uninteresting reviews and the remaining reviews categorized. Without knowing what categories might emerge, the idea was to use an unsupervised clustering algorithm to ﬁnd categories. This thesis describes the work carried out to solve this problem, and proposes a solution for Klarna that involves artiﬁcial neural networks rather than unsupervised clustering. The implementation done by us is able to categorize reviews as either interesting or uninteresting. We propose a workﬂow that would create means to categorize reviews not only in these two categories, but in multiple. The method revolved around experimentation with clustering algorithms and neural networks. Previous research shows that texts can be clustered, however, the datasets used seem to be vastly diﬀerent from the Klarna dataset. The Klarna dataset consists of short reviews and contain a large amount of uninteresting reviews. Using unsupervised clustering yielded unsatisfactory results, as no discernible categories could be found. In some cases, the technique created clusters of uninteresting reviews. These clusters were used as training data for an artiﬁcial neural network, together with manually labeled interesting reviews. The results from this artiﬁcial neural network was satisfactory; it can with an accuracy of around 86% say whether a review is interesting or not. This was achieved using the aforementioned clusters and ﬁve feedback loops, where the model’s wrongfully predicted reviews from an evaluation dataset was fed back to it as training data. We argue that the main reason behind why unsupervised clustering failed is that the length of the reviews are too short. In comparison, other researchers have successfully clustered text data with an average length in the hundreds. These items pack much more features than the short reviews in the Klarna dataset. We show that an artiﬁcial neural network is able to detect these features despite the short length, through its intrinsic design. Further research in feature extraction of short text strings could provide means to cluster this kind of data. If features can be extracted, the clustering can thus be done on the features rather than the actual words. Our artiﬁcial neural network shows that the arbitrary features interesting and uninteresting can be extracted, so we are hopeful that future researchers will ﬁnd ways of extracting more features from short text strings. In theory, this should mean that text of all lengths can be clustered unsupervised. / Databaser med användargenererad data kan snabbt bli ohanterbara. Klarna stod inför detta problem, med en databas innehållande cirka 700 000 recensioner från kunder. De såg helst att databasen skulle rensas från ointressanta recensioner och att de kvarvarande kategoriseras. Eftersom att kategorierna var okända initialt, var tanken att använda en oövervakad grupperingsalgoritm. Denna rapport beskriver det arbete som utfördes för att lösa detta problem, och föreslår en lösning till Klarna som involverar artiﬁciella neurala nätverk istället för oövervakad gruppering. Implementationen skapad av oss är kapabel till att kategorisera recensioner som intressanta eller ointressanta. Vi föreslår ett arbetsﬂöde som skulle skapa möjlighet att kategorisera recensioner inte bara i dessa två kategorier, utan i ﬂera. Metoden kretsar kring experimentering med grupperingsalgoritmer och artiﬁciella neurala nätverk. Tidigare forskning visar att texter kan grupperas oövervakat, dock med ingångsdata som väsentligt skiljer sig från Klarnas data. Recensionerna i Klarnas data är generellt sett korta och en stor andel av dem kan ses som ointressanta. Oövervakad grupperingen gav otillräckliga resultat, då inga skönjbara kategorier stod att ﬁnna. I vissa fall skapades grupperingar av ointressanta recensioner. Dessa användes som träningsdata för ett artiﬁciellt neuralt nätverk. Till träningsdatan lades intressanta recensioner som tagits fram manuellt. Resultaten från detta var positivt; med en träﬀsäkerhet om cirka 86% avgörs om en recension är intressant eller inte. Detta uppnåddes genom den tidigare skapade träningsdatan samt fem återkopplingsprocesser, där modellens felaktiga prediktioner av evalueringsdata matades in som träningsdata. Vår uppfattning är att den korta längden på recensionerna gör att den oövervakade grupperingen inte fungerar. Andra forskare har lyckats gruppera textdata med snittlängder om hundratals ord per text. Dessa texter rymmer ﬂer meningsfulla enheter än de korta recensionerna i Klarnas data. Det ﬁnns lösningar som innefattar artiﬁciella neurala nätverk å andra sidan kan upptäcka dessa meningsfulla enheter, tack vare sin grundläggande utformning. Vårt arbete visar att ett artiﬁciellt neuralt nätverk kan upptäcka dessa meningsfulla enheter, trots den korta längden per recension. Extrahering av meningsfulla enheter ur korta texter är ett ¨ämne som behöver mer forskning för att underlätta problem som detta. Om meningsfulla enheter kan extraheras ur texter, kan grupperingen göras på dessa enheter istället för orden i sig. Vårt artiﬁciella neurala nätverk visar att de arbiträra enheterna intressant och ointressant kan extraheras, vilket gör oss hoppfulla om att framtida forskare kan ﬁnna sätt att extrahera ﬂer enheter ur korta texter. I teorin innebär detta att texter av alla längder kan grupperas oövervakat. Machine Learning Natural Language Processing Unsupervised Clustering Artificial Neural Network Text Categorization Maskininlärning Natural Language Processing Naturlig Språkbehandling Oövervakad Gruppering Artiﬁciella Neurala Nätverk Textkategorisering Computer and Information Sciences Data- och informationsvetenskap
22	Security Assessment of IoT- Devices Grouped by Similar Attributes : Researching patterns in vulnerabilities of IoT- devices by grouping devices based on which protocols are running. / Säkerhetsbedömning av IoT-Enheter Grupperade efter Liknande Egenskaper Sannervik, Filip, Magdum, Parth January 2021 (has links) The Internet of Things (IoT) is a concept that is getting a lot of attention. IoT devices are growing in popularity and so is the need to protect these devices from attacks and vulnerabilities. Future developers and users of IoT devices need to know what type of devices need extra care and which are more likely to be vulnerable. Therefore this study has researched the correlations between combinations of protocols and software vulnerabilities. Fifteen protocols used by common services over the internet were selected to base the study around. Then an artificial neural network was used to group the devices into 4 groups based on which of these fifteen protocols were running. Publicly disclosed vulnerabilities were then enumerated for all devices in each group. It was found that the percentage of vulnerable devices in each group differed meaning there is some correlation between running combinations of protocols and how likely a device is vulnerable. The severity of the vulnerabilities in the vulnerable devices were also analyzed but no correlation was found between the groups. / Sakernas internet eller Internet of things (IoT) är ett koncept som fått mycket uppmärksamhet. IoT enheter växer drastisk i popularitet, därför är det mer nödvändigt att skydda dessa enheter från attacker och säkerhetsbrister. Framtida utvecklare och användare av IoT system behöver då veta vilka enheter som är mer troliga att ha säkerhetsbrister. Denna studie har utforskat om det finns något samband mellan kombinationer av aktiva protokoll i enheter och säkerhetsbrister. Femton vanligt använda protokoll valdes som bas för studien, ett artificiellt neuralt nätverk användes sedan för att gruppera enheter baserat på dessa protokoll. Kända sårbarheter i enheterna räknades upp för varje grupp. En korrelation mellan kombinationer av protokoll och trolighet för sårbarheter hittades. Allvarlighetsgraden av säkerhetsbristerna i sårbara enheter analyserades också, men ingen korrelation hittades mellan grupperna. Internet of Things (IoT) IoT-Devices Vulnerability Assessment Grouping IoT-Devices Self-Organising maps Vulnerability likelihood. Sakernas Internet (IOT) IoT-Enheter Bedömning av Sårbarhet Gruppering av IoT-Inheter Self-Organising maps (SOMs) Sårbarhetsrisk. Computer Sciences Datavetenskap (datalogi)
23	Visuell hierarki och läsmönster : en studie om kontrast, storlek och positionering Sova, Jemi, Karim, Bobby January 2013 (has links) Syftet med denna uppsats är att identifiera den mest effektiva egenskapen av en text eller sida för att uppnå visuell hierarki, som är ett verktyg för att få det önskade flödet av uppmärksamhet i en sida eller webbsida genom att ge vissa element en viss vikt i kontrast, storlek och placering. Vi vill ge en möjlighet för vidare forskning snarare än att ge en slutsats som ger ett slutgiltigt svar på frågeställningarna. Det finns fler sätt att manipulera text för att uppnå önskad visuell hierarki men vi valde de vanligaste. Detta arbete är baserat på ett experiment som görs på 50 deltagare med ett onlinefrågeformulär och tre självgjorda bilder där vi kan utvärdera resultaten, jämföra dem med andra teorier och beräkna den mest effektiva uppmärksamhetsgivaren. Vi har också utvecklat en hypotes om vad resultatet kommer att visa. Vår studie föreslår att kontrasten i färg kan vara den viktigaste faktorn för att uppnå och upprätthålla visuell hierarki. / The purpose of this paper is to identify the most effective property of a text or a page to achieve visual hierarchy, which is a tool for getting the desired flow of attention in a page or a web page by giving certain elements a degree of weight in contrast, size and positioning.We want to give an opportunity for further research rather than an absolute conclusion of how it really is. There are more ways to manipulate text to achieve the desired visual hierarchy but we choose the most common. This paper is based on an experiment involving 50 participants with an online questionnaire and three self-made pictures where we will evaluate the results, compare them with other theories and calculate the most effective enhancer of attention. We have also developed a hypothesis on what the results will show. Our study proposes that contrast in color might be the most important factor to achieve and maintain visual hierarchy. visual hierarchy visual perception f-shaped reading pattern f-shaped reading pattern f-shaped reading pattern grouping contrast web design user interface interface graphics design visual communication visuell hierarki visuell uppfattning F-formad läsmönster f-formad mönster gruppering kontrast webbdesign användargränssnitt grafisk design grafisk design visuell kommunikation

Page generated in 0.0731 seconds