Global ETD Search

1	Fraud Detection on Unlabeled Data with Unsupervised Machine Learning / Bedrägeridetektering på omärkt data med oövervakad maskininlärning Renström, Martin, Holmsten, Timothy January 2018 (has links) A common problem in systems handling user interaction was the risk for fraudulent behaviour. As an example, in a system with credit card transactions it could have been a person using a another user's account for purchases, or in a system with advertisment it could be bots clicking on ads. These malicious attacks were often disguised as normal interactions and could be difficult to detect. It was especially challenging when working with datasets that did not contain so called labels, which showed if the data point was fraudulent or not. This meant that there were no data that had previously been classified as fraud, which in turn made it difficult to develop an algorithm that could distinguish between normal and fraudulent behavior. In this thesis, the area of anomaly detection was explored with the intent of detecting fraudulent behavior without labeled data. Three neural network based prototypes were developed in this study. All three prototypes were some sort of variation of autoencoders. The first prototype which served as a baseline was a simple three layer autoencoder, the second prototype was a novel autoencoder which was called stacked autoencoder, the third prototype was a variational autoencoder. The prototypes were then trained and evaluated on two different datasets which both contained non fraudulent and fraudulent data. In this study it was found that the proposed stacked autoencoder architecture achieved better performance scores in recall, accuracy and NPV in the tests that were designed to simulate a real world scenario. / Ett vanligt problem med användares interaktioner i ett system var risken för bedrägeri. För ett system som hanterarade dataset med kreditkortstransaktioner så kunde ett exempel vara att en person använde en annans identitet för kortköp, eller i system som hanterade reklam så skulle det kunna ha varit en automatiserad mjukvara som simulerade interaktioner. Dessa attacker var ofta maskerade som normala interaktioner och kunde därmed vara svåra att upptäcka. Inom dataset som inte har korrekt märkt data så skulle det vara speciellt svårt att utveckla en algoritm som kan skilja på om interaktionen var avvikande eller inte. I denna avhandling så utforskas ämnet att upptäcka anomalier i dataset utan specifik data som tyder på att det var bedrägeri. Tre prototyper av neurala nätverk användes i denna studie som tränades och utvärderades på två dataset som innehöll både data som sade att det var bedrägeri och inte bedrägeri. Den första prototypen som fungerade som en bas var en simpel autoencoder med tre lager, den andra prototypen var en ny autoencoder som har fått namnet staplad autoencoder och den tredje prototypen var en variationell autoencoder. För denna studie så gav den föreslagna staplade autoencodern bäst resultat för återkallelse, noggrannhet och NPV i de test som var designade att efterlikna ett verkligt scenario. Anomaly detection fraud detection unsupervised machine learning autoencoder Anomali detektering bedrägeri detektering oövervakad maskininlärning autoencoder Computer Sciences Datavetenskap (datalogi)
2	Analyzing Music Improvisations Using Unsupervised Machine Learning : Towards Automatically Discovering Creative Cognition Principles / Analysera musikaliska improvisationer utan tillsyn Maskininlärning : Mot automatisk upptäckt av principer för kreativ kognition Jorda i Custal, Cristina January 2024 (has links) In the field of musical expression, the complex relationship between improvisation and the cognitive processes that underlie creativity presents a fascinating yet challenging puzzle, prompting this thesis to explore the connection between musical improvisation and creative cognition among musicians. Focusing on the development of robust methods for feature extraction and representation, it utilizes unsupervised Machine Learning (ML) techniques to project improvisations from a prime melody into a high-level latent space. The methodology involves iterative analysis employing Variational Autoencoder (VAE) models, initially pre-trained with a larger dataset and fine-tuned with a musical improvisation dataset provided by the Max Plank Institute. Evaluation encompasses Evidence Lower Bound (ELBO) loss metric and dimensionality reduction techniques like Principal Component Analysis (PCA), t-distributed Stochastic Neighbor Embedding (t-SNE), Multidimensional Scaling (MDS), and Uniform Manifold Approximation and Projection (UMAP) to explore latent space representations. The results reveal that experienced musicians exhibit a greater divergence from the prime melody compared to amateurs. Moreover, professionals’ samples demonstrate more refined clustering and nuanced adjustments between improvisations projected in the latent space. / Inom musikaliska uttryck är det komplexa förhållandet mellan improvisation och de kognitiva processer som ligger till grund för kreativitet ett fascinerande men utmanande pussel, vilket föranleder denna avhandling att utforska sambandet mellan musikalisk improvisation och kreativ kognition bland musiker. Avhandlingen fokuserar på utvecklingen av robusta metoder för extraktion och representation av funktioner och använder oövervakade maskininlärningstekniker (ML) för att projicera improvisationer från en huvudmelodi till ett latent utrymme på hög nivå. Metoden innebär iterativ analys med hjälp av VAE-modeller (Variational Autoencoder), som ursprungligen förutbildades med ett större dataset och finjusterades med ett dataset för musikalisk improvisation från Max Plank Institute. Utvärderingen omfattar förlustmåttet Evidence Lower Bound (ELBO) och dimensionalitetsreducerande tekniker som Principal Component Analysis (PCA), t-distributed Stochastic Neighbor Embedding (t-SNE), Multidimensional Scaling (MDS) och Uniform Manifold Approximation and Projection (UMAP) för att utforska latenta rymdrepresentationer. Resultaten visar att erfarna musiker uppvisar en större avvikelse från huvudmelodin jämfört med amatörer. Dessutom visar professionella musiker mer raffinerade kluster och nyanserade justeringar mellan improvisationer som projiceras i den latenta rymden. Music Improvisation Unsupervised Machine Learning Creative Cognition Musikimprovisation oövervakad maskininlärning kreativ kognition Computer and Information Sciences Data- och informationsvetenskap
3	Computer Vision in Fitness: Exercise Recognition and Repetition Counting / Datorseende i fitness: Träningsigenkänning och upprepningsräkning Barysheva, Anna January 2022 (has links) Motion classification and action localization have rapidly become essential tasks in computer vision and video analytics. In particular, Human Action Recognition (HAR), which has important applications in clinical assessments, activity monitoring, and sports performance evaluation, has drawn a lot of attention in research communities. Nevertheless, the high-dimensional and time-continuous nature of motion data creates non-trivial challenges in action detection and action recognition. In this degree project, on a set of recorded unannotated mixed workouts, we test and evaluate unsupervised and semi-supervised machine learning models to identify the correct location, i.e., a timestamp, of various exercises in videos and to study different approaches in clustering detected actions. This is done by modelling the data via the two-step clustering pipeline using the Bag-of-Visual-Words (BoVW) approach. Moreover, the concept of repetition counting is under consideration as a parallel task. We find that clustering alone tends to produce cluster solutions with a mixture of exercises and is not sufficient to solve the exercise recognition problem. Instead, we use clustering as an initial step to aggregate similar exercises. This allows us to effectively find many repetitions of similar exercises for their further annotation. When combined with a subsequent Support Vector Machine (SVM) classifier, the BoVW concept proved itself, achieving an accuracy score of 95.5% on the labelled subset. Much attention has also been paid to various methods of dimensionality reduction and benchmarking their ability to encode the original data into a lower-dimensional latent space. / Rörelseklassificering och handlingslokalisering har snabbt blivit viktiga uppgifter inom datorseende och videoanalys. I synnerhet har HAR fångat en stor uppmärksamhet i forskarsamhällen, då den har viktiga tillämpningar i kliniska bedömningar, aktivitetsövervakning och utvärdering av sportprestanda.Likväl så skapar den högdimensionella och tidskontinuerliga naturen hos rörelsedata icke-triviala utmaningar i handlingsdetektering och handlingsigenkänning. I detta examensarbete testar vi samt utvärderar oövervakade och semi-övervarakde maskininlärningsmodeller på en samling av inspelade blandade träningspass, som inte är noterade. Detta är för att identifiera den korrekta positionen, d.v.s en tidsstämpel, för olika övningar i videofilmer och för att studera olika tillvägagångssätt för att gruppera upptäckta handlingar. Detta görs genom att modellera data via tvåstegs klustringspipeline, med tillämpning av BoVW-metoden. Som en parallell uppgift övervägs även repetitionsräkning som koncept. Vi finner att kluster enbart tenderar att producera klusterlösningar med en blandning av övningar och är därför inte tillräckligt för att lösa problemet med övningsigenkänning. Istället, använder vi klustring som ett första steg för att sammanställa liknande övningar. Detta gör att vi effektivt kan hitta många upprepningar av liknande övningar för att vidare hantera dess anteckningar. Detta, kombinerad med en efterföljande SVM-klassificerare, visade sig att BoVWkonceptet är mycket effektivt, vilket uppnådde en noggrannhet på 95, 5% på den märkta delmängden. Mycket uppmärksamhet har också ägnats åt olika metoder för dimensionalitetsreduktion och jämförelse av dessa metoders förmåga att koda originaldata till ett dimensionellt lägre latentutrymme. Exercise classification human action recognition repetition counting skeletal motion recognition unsupervised machine learning Övningsklassificering igenkänning av mänsklig handling upprepningsräkning igenkänning av skelettrörelse oövervakad maskininlärning Other Mathematics Annan matematik
4	Analysis of Drinking Water Delivery Patterns in the Northern Part of Stockholm – Effects of Population Growth, Holidays and Weather Conditions / Analys av dricksvattenleveransmönster i norra Stockholm – effekter av befolkningstillväxt, semester och väderförhållanden Elina, Irina January 2022 (has links) Global warming is widely reported to be a cause of water scarcity and increased water con-sumption. As a consequence, it becomes harder for water suppliers to be prepared for increaseddemands. It is possible to predict the upcoming demand with the help of machine learningtools, however, a preliminary analysis of water consumption patterns is important for a goodprediction. This work focuses on water consumption patterns and studies their change withtime as well as the effects of meteorological factors on it.In order to aid the investigation and scrutinization of the patterns, a new semi-automatedtool was developed. Its algorithm is based on the Mann-Whitney U statistical test and performsgrouping of the weeks with similar sets of hourly water consumption. It helps to frame off theseasons of the year within which the patterns are similar. Along with that, K-means clusteringwas applied to the data to retrieve the patterns and to compare the performance with the newlydeveloped algorithm. On top of that, the effects of the population growth and meteorologicalvariables on water consumption were studied.K-means clustering showed more robust performance than the newly developed algorithmand therefore the ways of improvement were discussed along with the significance of gooddata quality and thorough data pre-processing. It was detected that municipalities with thedifferent housing situation had different persistent summer patterns of water consumption. Ingeneral municipalities with prevailing individual housing tend to consume more water duringthe summer per capita than others. Furthermore, municipalities with prevailing individualhousing were observed to be less robust against temperature growth and humidity decreasethan those with prevailing apartment housing as the latter increase their water consumptionless significantly in response to mentioned meteorological variables change. Therefore, consid-ering the population growth, the benefits of planning new multi-apartment dwelling areas inpreference to individual housing were discussed in the context of sustainable water use andclimate change. / Global uppvärmning kan orsaka både vattenbrist och ökad vattenförbrukning. Som en kon-sekvens blir det svårare för vattenförsörjningsföretag att förberedda sig på de ökande kraven.Det är möjligt att förutsäga den kommande efterfrågan med hjälp av verktyg för maskininlärn-ing, men det är viktigt att analysera vattenförbrukningsmönster för att få en bra förutsägelse.Detta arbete fokuserar därför på att analysera, samt studerar effekterna av meteorologiskafaktorer och hur semesterperioden påverkar vattenförbrukningen.Ett nytt halvautomatiskt verktyg utformades för att extrahera dagliga vattenförbrukn-ingsmönster från förbrukningstidserier. Algoritmen anger vilka veckor på året som har liknandemönster och grupperar dem i så kallade konsumtionssäsonger. För att utvärdera prestandan förverktyget användes en grupperingsmetod den så kallade K-means clustering på samma data.Utöver det studerades även effekterna av befolkningstillväxten och meteorologiska variabler påvattenförbrukningen.K-means klustring visade sig ha en mer robust prestanda än den nya framtagna utveckladealgoritmen och därför diskuterades olika sätt att förbättra algoritmen samt vikten av god rå-datakvalitet. Det upptäcktes att kommuner med olika bostadssituation reagerade olika på varmtoch torrt väder samt vissa semesterhändelser. I allmänhet brukar kommuner med enbostadshu-sområden förbruka mer vatten under sommaren per capita än andra. Fördelar med att planeranya flerbostadsområden som ett mer hållbart alternativ till enbostadshusområden diskuteradesi kontexten av befolkningstillväxt och klimatförändringar. clustering unsupervised machine learning water consumption patterns water demand klustring oövervakad maskininlärning vattenförbrukningsmönster vattenbehov Geosciences, Multidisciplinary Multidisciplinär geovetenskap Annan geovetenskap och miljövetenskap Other Environmental Engineering Annan naturresursteknik

1

Page generated in 0.0678 seconds