91 |
Forecasting daily stock market trading volume using Machine LearningHickman, Björn January 2023 (has links)
Today, brokers within the stock market brokerage industry are having difficulties with accurately forecasting the trading volume that is conducted by their customers. This is especially a problem during periods of exceptionally high or low trading volumes. Solving this problem would lead to both monetary savings in terms of server costs and operational planning issues. This thesis uses three Machine Learning models (Random Forest Regressor, Linear Regression, and Support Vector Regression) to predict daily trading volume. In Machine Learning, features are variables that act as explanatory variables for the dependent variable, in this case, the daily trading volume. The primary focus of this study is to evaluate and analyze which types of feature categories are the most important. Therefore, this study uses a variety of features divided into five different categories (Temporal, Historical, Market, External, and Customer). The results from the models trained using each individual feature category are compared against each other. Secondly, this study also focuses on analyzing the performance of all feature categories together. A Naive model of a 20-day rolling average is used as a benchmark to evaluate the results. The findings of this study indicate that Machine Learning models perform better than the proposed Naive approach when predicting daily stock market trading volume. However, the difference is of a small nature. Further, the Historical feature category is the category that performs best and can therefore be argued to be the most important category when predicting daily trading volume. However, the results of this study are not of statistical significance. The findings of this study can be relevant to the research field and can be used in future studies to further investigate the feature importance in stock market trading volume prediction. / Idag har företag inom industrin för aktiemäklare svårigheter att på ett träffsäkert sätt prognostisera sina kunders handelsvolymer. Detta är särskilt ett problem under perioder med extremt höga eller låga volymer. Att lösa detta problem skulle leda till både monetära besparingar i form av serverkostnader, och även lösa operationella planeringsproblem. Denna studie använder tre olika maskininlärningsmodeller (Random Forest Regressor, Linear Regression, och Support Vector Regression) för att förutspå handelsvolym. Denna studie har som primärt fokus att utvärdera och analysera vilka typer av data som är av vikt i syfte att förutspå kommande daglig aktiehandelsvolym. Denna studie använder därmed en mängd olika variabler indelat i fem grupper (Tid, Historik, Marknad, Extern, Kund). Modellerna tränas individuellt med varje grupp och resultatet jämförs inbördes för att besvara studiens frågeställningar. Studien fokuserar även på att analysera resultatet av att träna modellerna på samtliga grupper tillsammans. För att utvärdera resultatet används en naiv modell med 20 dagars rullande medelvärde. Resultatet från denna studie indikerar att användning av maskininlärning presterar bättre än den använda naiva modellen, för att förutspå daglig handelsvolym på aktiemarknaden. Skillnaden i resultat är dock liten. Vidare visar studiens resultat att den grupp av variabler som presterar bäst är kategorin Historik. Därmed kan det sägas att denna grupp av variabler är den viktigaste gruppen för att förutspå daglig handelsvolym, av grupperna använda i denna studie. Det går dock inte att säga att resultaten i denna studie är signifikanta. Resultaten och slutsatserna från denna studie bidrar till forskningsområdet och resultaten kan i framtiden användas för att fortsätta undersöka vilka variabler som är av intresse när det kommer till att förutspå daglig handelsvolym på aktiemarknaden.
|
92 |
Skapa användarcentrerad design med AI-verktyg i konceptfasen : En kvalitativ litteraturstudie om användningen av AI-verktyg för att skapa användbara gränssnitt i konceptfasen / Creating user-centered design with AI tools in the concept phase : A qualitative literature study on the use of AI tools to create useful interfaces in the concept phaseeBylund, Markus, Holmberg, Sara January 2023 (has links)
This paper examines the application of artificial intelligence (AI) in the early stages of the design process, with a specific focus on using AI to develop user-centered designs during the concept phase. The paper presents a qualitative literature study that employs cloud-based tools like Notion and Lateral to organize and categorize relevant research articles. Additionally, the study continuously compares keywords to gain a comprehensive understanding of the topics covered. Its objective is to emphasize the significance of user-centered design and offer a fresh perspective on how AI can assist designers in creating designs that cater to user needs. The paper explores various AI tools and techniques, such as natural language processing (NLP) and machine learning, which can be employed to analyze user data and provide insights into user behavior. Furthermore, it underscores the importance of designers possessing a deep understanding of information architecture, user experience (UX), and interface design to fully leverage the potential of AI tools. While AI tools cannot replace human creativity and expertise, designers must be able to effectively interpret the data provided by these tools and use them to inform their design decisions. The study provides valuable insights into the integration of AI into the design process, resulting in more effective and user-centered designs. It serves as a valuable resource for designers, researchers, and individuals interested in exploring the possibilities of AI in design.
|
93 |
Anomaly Detection with Machine Learning using CLIP in a Video Surveillance ContextGärdin, Christoffer January 2023 (has links)
This thesis explores the application of Contrastive Language-Image Pre-Training (CLIP), a vision-language model, in an automated video surveillance system for anomaly detection. The ability of CLIP to perform zero-shot learning, coupled with its robustness against minor image alterations due to its lack of reliance on pixel-level image analysis, makes it a suitable candidate for this application. The study investigates the performance of CLIP in tandem with various anomaly detection algorithms within a visual surveillance system. A custom dataset was created for video anomaly detection, encompassing two distinct views and two varying levels of anomaly difficulty. One view offers a more zoomed-in perspective, while the other provides a wider perspective. This was conducted to evaluate the capacity of CLIP to manage objects that occupy either a larger or smaller portion of the entire scene. Several different anomaly detection methods were tested with varying levels of supervision, including unsupervised, one-class classification, and weakly- supervised algorithms, which were compared against each other. To create better separation between the CLIP embeddings, a metric learning model was trained and then used to transform the CLIP embeddings to a new embedding space. The study found that CLIP performs effectively when anomalies take up a larger part of the image, such as in the zoomed-in view where some of the One- Class-Classification (OCC) and weakly supervised methods demonstrated superior performance. When anomalies take up a significantly smaller part of the image in the wider view, CLIP has difficulty distinguishing anomalies from normal scenes even using the transformed CLIP embeddings. For the wider view the results showed on better performance for the OCC and weakly supervised methods.
|
94 |
The Hanabi challenge: From Artificial Teams to Mixed Human-Machine TeamsInferadi, Salam, Olof, Johnsson January 2022 (has links)
Denna rapport kommer fokusera på att beskriva processen på den fortsatta utvecklingen av det grafiska användargränssnittet (GUI) för Hanabi Benchmark. Hanabi är ett kortspel som introducerats som ett nytt forskningsområde inom artificiell intelligens (AI). Målet med projektet var att implementera en mänsklig användare, som sedan skulle kunna spela med maskin lärlingsbaserade agenter med andra ord icke-mänskliga spelare genom GUI.För att uppnå målen, implementerade vi kontroller för den mänskliga användaren i GUI. Modeller av agenter integrerades in till GUI som mänskliga användaren sedan skulle spela med. Slutligen utfördes en användarstudie för att utvärdera de olika agenternas prestation. / This report will describe the further development of the Graphical User Interface (GUI) for the Hanabi Benchmark. Hanabi is a card game that has been introduced as a new frontier for artificial intelligence (AI). The goal of the project was to implement a human-user, into the GUI, and give the possibility to play against Machine Learning (ML) based agents, viz, non-human players in the GUI.To achieve these goals, we implemented human controls into the GUI to give a human user the option to play the game in the GUI. Agent models were integrated into to the GUI for the human to play with. Finally, a small study was conducted to evaluate the agent’s performances.
|
95 |
Towards predictive modelling of solar power productionIlani, Hadi January 2022 (has links)
År 2019 installerades 732 solpaneler på taket i ett hus i Örebro universitet. Energiproduktionenav anläggningen samlades i en databas i Akademiska Hus med ett antal parametrar från enväderstation i samma hus. Att kunna modellera den här produktionen som en funktion avväderparametrar och historiska värden med hjälp av maskininlärning, och jämföra olikamodeller är målet i detta projekt. Det finns gjorda arbeten med samma mål i olikalaborationsmiljöer och andra platser men inte för denna anläggning. Mätvärden under två årfrån 2019 till 2021 kommer från Akademiska Hus och resultaten blir två modeller: ett NarrowNeural Network samt en Support Vector Machine med 7 procent avvikelse och en NonlinearAutoregressive Neural Network för envariatmodellen. / In 2019, 732 solar panels were installed on the roof of a building at Örebro University. Thesolar power production of the facility has been collected in a database in Akademiska Hus,along with several parameters from a weather station in the same building. The goal of thisproject is to model solar power production as a function of weather parameters and historicalvalues using machine learning techniques. This study investigates various predictive models tofind a suitable model for predicting this production. There have been several studies in theliterature that have performed this goal in various laboratory environments and other places,but not for this facility. The measured data for this study is recorded by Akademiska Hus forover two years from 2019 to 2021. The results of this work lead to two suitable machine learningmodels while using weather parameters: 1) Narrow Neural Network and 2) Support VectorMachine with 7% errors in both models. Moreover, this study has investigated univariatemodels to predict the solar power production as a time series based on its historical data. Forthis aim, a Nonlinear Autoregressive Neural Network has been applied which results inconsiderably low errors in the evaluations.
|
96 |
Predicting Student Performance Using Machine Learning: A Comparative Study Between Classification AlgorithmsHayder, Alabbas January 2022 (has links)
Forskningsfrågan i denna avhandling var att utvärdera och jämföra två ML-algoritmer som var Support Vector Machine (SVM) och Artificial Neural Network (ANN) i termer av noggrannhet, precision, återkallelse, f1-poäng och förutsägelse när de tränades för att klassificera binära datamängder. Datauppsättningen hämtades från Ladok och bestod av anonyma högskolestudenter från en mängd kurser. Algoritmerna kördes på TensorFlow med Keras som API och byggdes, tränades och kördes för utvärdering, allt på Google Colab. Källkoden skrevs i Python. Det icke-tekniska målet med studien var att försöka hitta ett förutsägelsemönster för studentprestationer och tillhandahålla ett tekniskt ramverktyg för att ge feedback till studenter och universitetsfakulteten. Forskningsfrågan delades upp i tre separata delfrågor. Den första var om ML-algoritmerna var ett lämpligt sätt att hitta dessa elevmönster och den kunskap man fick var att ja eftersom dessa algoritmer var lämpliga för den lilla datauppsättningsstorleken. Den andra handlade om hur man implementerar SVM och ANN och det löstes med TensorFlow med Keras API. Den tredje handlade om mängden som behövdes för att dra slutsatserna och förutsäga dessa algoritmer, och det fastställdes att storleken var tillräcklig på grund av att den tränade noggrannheten var högre än baslinjenoggrannheten i båda algoritmerna. Den huvudsakliga forskningsfrågan resulterade i att SVM-modellen överträffade ANN-modellen vad gäller alla nämnda parametrar. Detta teoretiserades på grund av att SVM har linjärt ökande multiparameter som matchade de ökade ingångarna. Detta var inte fallet med strukturen för ANN. / The research question of this thesis was to evaluate and compare two ML algorithms which were Support Vector Machine (SVM) and Artificial Neural Network (ANN) in terms of accuracy, precision, recall, f1 score, and prediction when trained for classifying binary datasets. The dataset was fetched from Ladok and consisted of anonymous higher education student credit from a multitude of courses. The algorithms were run on TensorFlow with Keras as an API and were built, trained, and run for evaluation all on Google Colab. The source-code was written in Python. The non-technical goal of the study was to try to find a prediction pattern for student performance and provide a technical framework tool to provide feedback for student and university faculty. The research question was broken down into three separate sub questions. The first one was if the ML algorithms were an appropriate way to find these student patterns and the knowledge gained was that yes because theses algorithms were appropriate for the small dataset size. The second one was about how to implement SVM and ANN and that was solved using TensorFlow with Keras API. The third one was about the amount needed to draw the conclusions and prediction these algorithms would make, and it was determined that the size was sufficient due to the trained accuracy being higher that the baseline accuracy in both algorithms. The main research question resulted in the SVM model outperforming the ANN model in terms of all the parameters mentioned. This was theorized due to the nature of SVM having linearly increasing multiparameter that that matched the increased inputs. This was not the case with the structure of the ANN.
|
97 |
Automating dataflow for a machine learning algorithmGunneström, Albert, Bauer, Erik January 2019 (has links)
Machine learning algorithms can be used to predict the future demand for heat in buildings. This can be used as a decision basis by district heating plants when deciding an appropriate heat output for the plant. This project is based on an existing machine learning model that uses temperature data and the previous heat demand as input data. The model has to be able to make new predictions and display the results continuously in order to be useful for heating plant operators. In this project a program was developed that automatically collects input data, uses this data with the machine learning model and displays the predicted heat demand in a graph. One of the sources for input data does not always provide reliable data and in order to ensure that the program runs continuously and in a robust way, approximations of missing data have to be made. The result is a program that runs continuously but with some constraints on the input data. The input data needs to be able to provide some correct values within the last two days in order for the program run continuously. A comparison between calculated predictions and the actual measured heat demand showed that the predictions were in general higher than the actual values. Some possible causes and solutions were identified but are left for future work. / Maskininlärnings-algoritmer kan användas för att göra prediktioner på den framtida efterfrågan på värme i fastigheter. Detta kan användas som ett beslutsunderlag av fjärrvärmeverk för att avgöra en lämplig uteffekt. Detta projektarbete baseras på en befintlig maskininlärnings-modell som använder sig av temperaturdata och tidigare värmedata som inparametrar. Modellen måste kunna göra nya prediktioner och visa resultaten kontinuerligt för att vara användbar för driftpersonal på fjärrvärmeverk. I detta projekt utvecklades ett program som automatiskt samlar in inparameterdata, använder denna data i maskininlärnings-modellen och visar resultaten i en graf. En av källorna för inparameterdata ger inte alltid pålitlig data och för att garantera att programmet körs kontinuerligt och på ett robust vis så måste man approximera inkorrekt data. Resultatet är ett program som kör kontinuerligt men med några restriktioner på inparameterdatan. Inparameterdatan måste ha åtminstone några korrekta värden inom de senaste två dagarna för att programmet ska köras kontinuerligt. En jämförelse mellan beräknade prediktioner och den verkliga uppmätta efterfrågan på värme visade att prediktionerna generellt var högre än de verkliga värdena. Några möjliga orsaker och lösningar identifierades men lämnas till framtida arbeten.
|
98 |
Predicting Tropical Thunderstorm Trajectories Using LSTM / Att använda LSTM för att förutsäga tropiska åskväders banorNordin Stensö, Isak January 2018 (has links)
Thunderstorms are both dangerous as well as important rain-bearing structures for large parts of the world. The prediction of thunderstorm trajectories is however difficult, especially in tropical regions. This is largely due to their smaller size and shorter lifespan. To overcome this issue, this thesis investigates how well a neural network composed of long short-term memory (LSTM) units can predict the trajectories of thunderstorms, based on several years of lightning strike data. The data is first clustered, and important features are extracted from it. These are used to predict the mean position of the thunderstorms using an LSTM network. A random search is then carried out to identify optimal parameters for the LSTM model. It is shown that the trajectories predicted by the LSTM are much closer to the true trajectories than what a linear model predicts. This is especially true for predictions of more than 1 hour. Scores commonly used to measure forecast accuracy are applied to compare the LSTM and linear model. It is found that the LSTM significantly improves forecast accuracy compared to the linear model. / Åskväder är både farliga och livsviktiga bärare av vatten för stora delar av världen. Det är dock svårt att förutsäga åskcellernas banor, främst i tropiska områden. Detta beror till större delen på deras mindre storlek och kortare livslängd. Detta examensarbete undersöker hur väl ett neuralt nätverk, bestående av long short-term memory-lager (LSTM) kan förutsäga åskväders banor baserat på flera års blixtnedlslagsdata. Först klustras datan, och viktiga karaktärsdrag hämtas ut från den. Dessa används för att förutspå åskvädrens genomsnittliga position med hjälp av ett LSTMnätverk. En slumpmässig sökning genomförs sedan för att identifiera optimala parametrar för LSTM-modellen. Det fastslås att de banor som förutspås av LSTM-modellen är mycket närmare de sanna banorna, än de som förutspås av en linjär modell. Detta gäller i synnerhet för förutsägelser mer än 1 timme framåt. Värden som är vanliga för att bedöma prognosers träffsäkerhet beräknas för att jämföra LSTM-modellen och den linjära. Det visas att LSTM-modellen klart förbättrar förutsägelsernas träffsäkerhet jämfört med den linjära modellen.
|
99 |
Classify different types of boat engine sounds with machine learningApplelid, Gunnar, Karlsson, Mikael January 2019 (has links)
When a boat moves in water, it creates a sound with unique features which makes it possible to identify different boat types or even a specific boat. The ability to identify boats is important in the military sector for surveillance purposes.This thesis describes how different audio processing methods and machine learning approaches are implemented, tested and evaluated in order to create a prototype that identifies boats. A total of 87 boat sounds were used and processed in seven different ways. The machine learning approaches Dense Neural Network, Convolutional Neural Network and Recurrent Neural Network were implemented and trained with the processed audio files in order to identify different boat types. Different combinations of audio processing methods and machine learning approaches ability to classify different boat types, were tested with a stratified Kfold test.The result is a prototype with an audio processing method that divides an audio file to equally large segments. Each segment is converted to a logarithmic mel-scaled spectrogram and a delta feature is calculated and added as an extra dimension for each segment. A Convolutional Neural Network is trained with processed audio files and manages to distinguish different boat types with an accuracy of 75%. / En båt kan identifieras genom att analysera ljudet den skapar när den rör sig i vatten. Förmågan att identifiera båtar är viktig ur övervakningssynpunkt i den militära sektorn. Den här rapporten beskriver hur olika metoder inom ljudanalys och maskininlärning har implementerats, testats och utvärderats för att skapa en prototyp som kan identifiera olika båtar. Totalt 87 olika båtljud användes och behandlades på sju olika sätt.Inom området maskininlärning användes teknikerna ”Dense Neural Network”, ”Convolutional Neural Network” och ”Recurrent Neural Network” som tränades för att identifiera olika båttyper. Olika kombinationer av metoder inom ljudbehandling och maskininlärning testades med ett ”stratified Kfold” test för att utvärdera förmågan att klassificera olika båttyper.Resultatet blev en prototyp med en ljudbehandlingsmetod som delar upp en ljudfil i segment av samma storlek. Varje segment konverteras till ett ”logaritmiskt mel-scaled spectrogram” och en extra dimension med ett deltavärde adderas. Ett ” Convolutional Neural Network” tränas med de behandlade ljudfilerna och lyckas urskilja olika båtklasser med 75% sannolikhet.
|
100 |
JÄMFÖRELSE AV ATTITYDANALYS ALGORITMER FÖR SPELOMDÖMEN / COMPARISON OF SENTIMENT ANALYSIS ALGORITHMS FOR GAME REVIEWSGernandt, Niclas, Farhod, Jaser January 2019 (has links)
Idag finns det stora mängder användar-skapat data i form av texter från spelomdömen till åsikter i mikro-bloggar som Twitter. Att analysera detta data kan vara utav värde för både företag och akademisk forskning men är väldigt omfattande. Med hjälp av attitydanalysen kan detta utföras automatiskt och spara resurser, men vilka algoritmer presterar bäst? Med hjälp av en förstudie och ett par kvantitativa tester kunde dem mest populära tillvägagångsätten inom attitydanalysen genom att analysera spelomdömen från plattformen Steam. I testning har det visat sig att maskininlärningsalgoritmer både presterar bättre och är enklare att komma igång i jämförelse med lexikonbaserade algoritmer som knappast uppnår tröskelvärdet för pålitlighet vid klassifikation av omdömen som positiva eller negativa. Men det är fortfarande viktigt anpassa attitydanalysen för just det specifika problemet eftersom båda dessa har sina brister eftersom båda dessa tillvägagångsätt hade en dålig prestation i förhållande till sarkastiska omdömen. / Today there exist a huge amount of user created content in the shape of text from game reviews to opinions in microblogs like Twitter. To analyze this data could be of value for both companies and data scientists but remains to be very daunting. With the help of sentiment analysis this could be achieved automatically and save resources, but the question remains which algorithms have the best performance? With the help of a study and a couple of tests the most popular approaches in sentiment analysis could be compared by analyzing game reviews from the platform Steam. Through testing it has showed that machine learning based algorithms have the best performance and are easier to start with in comparison to lexicon-based approaches, which barely even reach the threshold for reliability in classifying reviews to be positive or negative. But it’s still important to plan and consider which algorithm one chooses for sentiment analysis as both approaches have their flaws and had a weak performance regarding sarcastic reviews.
|
Page generated in 0.0873 seconds