• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 618
  • 200
  • Tagged with
  • 818
  • 715
  • 705
  • 447
  • 392
  • 335
  • 327
  • 250
  • 214
  • 153
  • 148
  • 147
  • 121
  • 118
  • 117
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
231

Explainable Machine Learning for Lead Time Prediction : A Case Study on Explainability Methods and Benefits in the Pharmaceutical Industry / Explainable Machine Learning för Ledtids Prognos : En Fallstudie om Förklarbarhetsmetoder och Fördelar i Farmaceutiska Industri

Fussenegger, Paul, Lange, Niklas January 2022 (has links)
Artificial Intelligence (AI) has proven to be highly suitable for a wide range of problems in manufacturing environments, including the prediction of lead times. Most of these solutions are based on ”black-box” algorithms, which hinder practitioners to understand the prediction process. Explainable Artificial Intelligence (XAI) provides numerous tools and methods to counteract this problem. There is however a need to qualify the methods with human-centered studies in manufacturing environments, since explainabilityis context-specific. The purpose of this mixed-method case study is to examine the explainability of regression models for lead time prediction in quality control laboratories at a biopharmaceutical production site in Sweden. This entails the research questions of which methods can increase the explainability of lead time prediction, what type of explanation is required to enable explainability and what are the benefits of explaining regression models in this context. This is why relevant literature in the field of XAI and AI-based lead time prediction is reviewed. An explainable lead time prediction modelis developed and a Delphi study is carried out to gauge the importance of different explanation types and to identify explainability-related benefits. The results show a transparency-performance trade-off and highlight eight benefits that are mapped to the model’s life cycle. These findings provide new insights into the explainability requirements and benefits in quality control processes and support practitioners in steering their implementation efforts. / Artificiell Intelligens (AI) har visat sig vara mycket lämplig för ett stort antal problem i tillverkningsmiljöer, bland annat när det gäller att förutsäga ledtider. De flesta av dessa lösningar är baserade på algoritmer som är ”svarta lådor”, vilket gör det svårt för tillämparna att förstå förutsägelseprocessen. Explainable Artificial Intelligence (XAI) erbjuder många verktyg och metoder för att motverka detta problem. Det finns dock ett behov av att kvalificera metoderna med människocentrerade studier i tillverkningsmiljöer, eftersom förklarbarhet är kontextspecifikt. Syftet med denna fallstudie med blandad metod är att undersöka förklaringsbarheten hos regressionsmodeller för prediktion av ledtider i kvalitets kontrolllaboratorier vid en biopharmaceutisk produktionsanläggning i Sverige. Vilket syftar till forskningsfrågorna samt vilka metoder som kan öka förklaringsbarheten och av prognoser för ledtider, vilken typ av förklaring som krävs för att möjliggöra en förklarbarhet och vilka fördelar som finns med att förklara regressionsmodeller i detta sammanhang. Det är därför som relevant litteratur på området XAI och AI baserade prognostisering av ledtider granskas. En förklaringsbar modell för prognostisering av ledtider utvecklas och en Delphi-studie genomförs för att bedöma betydelsen av olika typer av förklaringar och för att identifiera förklaringsrelaterade fördelar.
232

Forecasting Electricity Prices for Intraday Markets with Machine Learning : An exploratory comparison of the state of the art

Kotsias, Panagiotis-Christos January 2022 (has links)
Electricity needs to be consumed when it is produced, making sure that supply closely meets demand at all times. To account for the rapidly changing operational status and the need for increasing the flexibility of power systems, financial instruments have been put in place creating markets where electricity is traded as a commodity across different time frames; from months or days to minutes before, or even after, planned delivery. In this work, the focus is placed on the short-term electricity markets and particularly on forecasting the intraday volume-weighted average price of the last three hours of trading of hourly power products. To this end, two state-of-the-art recurrent neural network architectures, namely the Temporal Fusion Transformer and the DeepAR network, are compared against well-established statistical models, such as the Linear Regression, ARX and SARIMAX models, with respect to their forecast accuracy on each of the 24 hourly delivery products. Two different experimental setups are applied, with one utilizing two input features drawn specifically from the findings of relevant literature and the other blindly exploiting all available streams of information in either their raw or aggregated form. All models are trained individually per hourly product per experimental setup to support a fair and decisive comparison, leading to 240 unique model instances being trained in total. Furthermore, the input feature importance is inferred by exploiting the inbuilt attention mechanism of the Temporal Fusion Transformer architecture. Finally, by using various realworld historical market data originating from the Nord Pool power exchange as well as from the Svenska Kraftnät, available up until the day of delivery, it is shown that the statistical models outperform both contemporary neural network architectures, with the latter suffering from the inability to generalize to elevated price levels—which are absent from the training dataset. / El måste förbrukas när den produceras, och se till att utbudet alltid motsvarar efterfrågan. För att ta hänsyn till den snabbt föränderliga operativa statusen och behovet av att öka flexibiliteten i kraftsystemen har finansiella instrument införts för att skapa marknader där el handlas som en vara över olika tidsramar; från månader eller dagar till minuter före, eller till och med efter, planerad leverans. I detta arbete läggs fokus på de kortsiktiga elmarknaderna och särskilt på att prognostisera det intradagsvolymvägda genomsnittspriset för de senaste tre timmarnas handel med timkraftprodukter. För detta ändamål jämförs två toppmoderna återkommande neurala nätverksarkitekturer, nämligen Temporal Fusion Transformer och DeepAR-nätverket, mot väletablerade statistiska modeller, såsom modellerna Linear Regression, ARX och SARIMAX, med avseende på deras prognosnoggrannhet för var och en av 24-timmarsleveransprodukterna. Två olika experimentella uppsättningar tillämpas, där den ena använder två indatafunktioner som hämtats specifikt från resultaten av relevant litteratur och den andra utnyttjar blint alla tillgängliga informationsströmmar i antingen deras råa eller aggregerade form. Alla modeller tränas individuellt per timprodukt per experimentuppställning för att stödja en rättvis och avgörande jämförelse, vilket leder till att 240 unika modellinstanser tränas totalt. Dessutom härleds ingångsfunktionens betydelse genom att utnyttja den inbyggda uppmärksamhetsmekanismen i Temporal Fusion Transformer-arkitekturen. Slutligen, genom att använda olika verkliga historiska marknadsdata från elbörsen Nord Pool såväl som från Svenska Kraftnät, tillgängliga fram till leveransdagen, visas att de statistiska modellerna överträffar både moderna neurala nätverksarkitekturer, med sistnämnda lider av oförmågan att generalisera till förhöjda prisnivåer — som saknas i utbildningsdataset.
233

Bildklassificering av bilar med hjälp av deep learning / Image Classification of Cars using Deep Learning

Lindespång, Victor January 2017 (has links)
Den här rapporten beskriver hur en bildklassificerare skapades med förmågan att via en given bild på en bil avgöra vilken bilmodell bilen är av. Klassificeringsmodellen utvecklades med hjälp av bilder som företaget CAB sparat i samband med försäkringsärenden som behandlats via deras nuvarande produkter. Inledningsvis i rapporten så beskrivs teori för maskininlärning och djupinlärning på engrundläggande nivå för att leda in läsaren på ämnesområdet som rör rapporten, och fortsätter sedan med problemspecifika metoder som var till nytta för det aktuella problemet. Rapporten tar upp metoder för hur datan bearbetats i förväg, hur träningsprocessen gick  till med de valda verktygen samt diskussion kring resultatet och vad som påverkade det – med kommentarer om vad som kan göras i framtiden för att förbättra slutprodukten. / This report describes how an image classifier was created with the ability to identify car makeand model from a given picture of a car. The classifier was developed using pictures that the company CAB had saved from insurance errands that was managed through their current products. First of all the report begins with a brief theoretical introduction to machine learning and deep learning to guide the reader in to the subject of the report, and then continues with problemspecific methods that were of good use for the project. The report brings up methods for how the data was processed before training took place, how the training process went with the chosen tools for this project and also discussion about the result and what effected it – with comments about what can be done in the future to improve the end product.
234

Cyberbullying Detection System On Multimodal Data / System för upptäckt av nätmobbning med hjälp av multimodal data

Nikolskaya, Anna January 2022 (has links)
Cyberbullying has become a significant societal concern as people increasingly use computing technology to mediate all elements of their life. Cyberbullying can cause serious psychological and emotional problems for people who are impacted. Hence, developing automated ways for detecting cyberbullying is critical. While recent efforts to identify cyberbullying have specified advanced text processing approaches, the area of visual data processing has received significantly less attention.  This thesis presents multimodal approach on cyberbullying detection in social media by using a combination of visual and textual features. The work presents the prototype of cyberbullying detection system alongside its design and implementation details.  The foundings of this work prove that visual features can be used for the improvement of the textual approach. The results show that visual features is a best performing approach according to Naive Bayes and Random Forest algorithms and combination of textual and visual features reached the highest performance according to Support Vector Classification model. Furthermore, the result reveal that feature combination leading to the highest performance of Support Vector Classification is a combination of text description, text sentiment and image tags. The strongest feature performance with Random Forest and Naive Bayes model has been demonstrated by image tags. / Cybermobbning har blivit ett stort samhällsproblem i takt med att människor i allt högre grad använder datorteknik i alla delar av sitt liv. Cybermobbning kan orsaka allvarliga psykologiska och känslomässiga problem för de personer som drabbas. Därför är det viktigt att utveckla automatiserade metoder för att upptäcka cybermobbning. Medan de senaste insatserna för att identifiera cybermobbning har specificerat avancerade metoder för textbearbetning, har visuell databehandling fått betydligt mindre uppmärksamhet.  I den här avhandlingen presenteras en multimodal metod för att upptäcka cybermobbning i sociala medier med hjälp av en kombination av visuella och textuella element. I arbetet presenteras prototypen av ett system för upptäckt av cybermobbning tillsammans med detaljer om dess utformning och genomförande.  Resultaten av detta arbete visar att visuella funktioner kan användas för att förbättra den textuella modellen. Resultaten visar att visuella funktioner är det bästa tillvägagångssättet enligt Naive Bayes - och Random Forest­algoritmerna och att kombinationen av text- och visuella funktioner uppnådde den högsta prestandan enligt Support Vector Classification - modellen. Dessutom visar resultatet att kombinationen av funktioner som leder till den högsta prestandan för Support Vector Classification ar en kombination av textbeskrivning, textkänsla och bildtaggar. Den starkaste prestandan med Random Forest - och Naive Bayes -modellen däremot, har visats med bildtaggar.
235

Developing a supervised machine learning model for an optimised aluminium addition based on historical data analytics, for clean steelmaking

Thakur, Arun Kumar January 2022 (has links)
De-oxidation is an important process in clean steelmaking. Al (Aluminium) is mainly used as de-oxidant and controls the final oxygen content and impact the sulphur removal in steel. Adding optimum amount of Al is critical for steel cleanliness and to reduce cost. Unfortunately, recovery of Al is not repeatable due to inherent variation in factors like amount of slag carryover, total oxygen content, tapping weight and so on. To address this challenge, statistical modeling is used to develop a supervised machine learning model to predict Al addition for secondary de-oxidation. Data analytics is used on historical data from production database to gain insights from data on secondary de-oxidation practice, observe patterns, trends and understand correlation among critical process parameters. Simple and multiple linear regression models have been developed with prediction accuracy of 58 and 66% respectively. These models have been trained, tested and cross validated using standard procedures like k-fold cross validation and grid search. To deploy multiple linear regression model into production, a Microsoft Excel based dashboard containing prediction tool, pivot charts, line, and bar graphs for analysing the process is developed. This model when tested in shadow deployment environment perform well on steel grades containing dissolved C (Carbon) up to 0.15% after tapping. In shadow deployment mode the new model can be utilised in parallel to existing tool. For %C greater than 0.15%, prediction accuracy stands at 46%. This is due to nonlinear relationship between oxygen content and added Al. With our model, in process window containing 0 to 0.15 % C after tapping in steel melt, we believe that we can in future achieve better steel quality and repeatability in de-oxidation process, improve productivity in terms of time and resources and facilitates decision making when the model is ready for use in real production environment. Future work in this direction would be to further develop this model for other steel grades. / Deoxidation är en viktig process vid ren ståltillverkning. Al (aluminium) används huvudsakligen som deoxidationsmedel och kontrollerar den slutliga syrehalten och påverkar avlägsnandet av svavel i stålet. Det är viktigt att tillsätta en optimal mängd Al för att stålet ska bli rent och för att minska kostnaderna. Alumiumåterhämtningen är tyvärr inte repeterbar på grund av varierande faktorer som slaggöverföring, total syrehalt, tappvikt och så vidare. För att ta itu med denna utmaning används statistisk modellering för att utveckla en övervakad maskininlärningsmodell för att förutsäga Al-tillsats för sekundär deoxidering. Dataanalys används på historiska data från produktionsdatabasen för att få insikt i data om sekundär deoxidering, observera mönster, trender och förstå korrelationen mellan kritiska processparametrar. Enkla och multipla linjära regressionsmodeller har utvecklats med en prediktionsnoggrannhet på 58 respektive 66 %. Dessa modeller har tränats, testats och korsvaliderats med hjälp av standardförfaranden som k-fold korsvalidering och grid search. För att använda den multipla linjära regressionsmodellen i produktionen har man utvecklat en Microsoft Excel-baserad instrumentpanel som innehåller ett prognosverktyg, pivotdiagram, linje- och stapeldiagram för analys av processen. När denna modell testades i en skuggmiljö fungerade den bra på stålsorter som innehåller upplösta C (kol) på upp till 0,15 % efter tappning. I en skuggbaserad miljö kan den nya modellen användas parallellt med det befintliga verktyget. För % C över 0,15 % är förutsägelsenoggrannheten 46 %. Detta beror på det icke-linjära förhållandet mellan syrehalt och tillsatt Al. Med vår modell, i processfönstret som innehåller 0-0,15 % C efter tappning i stålsmältan, tror vi att vi i framtiden kan uppnå bättre stålkvalitet och repeterbarhet i deoxidering processen, förbättra produktiviteten när det gäller tid och resurser och underlätta beslutsfattandet när modellen är redo att användas i en verklig produktionsmiljö. Framtida arbete i denna riktning skulle vara att vidareutveckla denna modell för andra stålsorter.
236

Fault diagnosis of axlebox roller bearings of high speed rail vehicles based on empirical mode decomposition and machine learning / Feldiagnos av axelbox rullager i höghastighetstågfordon baserat på Empirical Mode Decomposition och maskininlärning

KEHLENBACH, JOSUA January 2021 (has links)
Axlebox bearings are one of the most critical components of a rail vehicle with regard to safety. An axlebox bearing that breaks during operation can be dangerous for the passengers and expensive for the operator. In-service failure of axlebox bearings has been the cause of many catastrophic accidents. Thus, it is of utmost importance to predict bearing failures as early as possible. This will increase reliability and safety of the vehicle as well as reduce the vehicle maintenance cost. Monitoring of roller bearings is an active research eld, and many methods have been proposed by other researchers. Many of these methods employ complex algorithms to make the most use of the given measurements. The algorithms often lack interpretability and have high computational costs, making them dicult to employ in an on-board system. This thesis proposes an interpretable and transparent algorithm that predicts bearing damages with high accuracy. Meanwhile, it tries to retain interpretability as much as possible. The algorithm is based on Empirical Mode Decomposition (EMD) and Singular Value Decomposition (SVD). These two techniques extract essential and meaningful information from the axlebox accelerations. The algorithm is benchmarked on two benchmark datasets, and the results are compared to the respective literature. Then the algorithm is employed on the railway axlebox acceleration measurements that were taken on an axlebox test bench available at SWJTU. The proposed algorithm can be extended to incorporate additional measurements of dierent types, e.g. sound or temperature measurements. The incorporation of other types of measurements will improve the performance of the algorithm even further. / Axelbox lager är en av de viktigaste komponenterna i ett järnvägsfordon när det berör säkerheten. Ett axelbox lager som havererar under drift kan vara farligt for passagerarna och även dyrt för operatören. Driftfel av lagren har varit orsaken till många katastrofala olyckor. Därför är det av yttersta vikt att förutsäga lagerfel så tidigt som möjligt. Detta ökar fordonets tillförlitlighet och säkerhet samt minskar underhållskostnaderna. Mycket forskning har utförts inom övervakning av rullager. Många metoder använder komplexa algoritmer för att maximalt utnyttja matningarna. Algoritmerna saknar ofta tolkbarhet och har höga beräkningskostnader, vilket gör dem svåra att använda i ett integrerat system. Denna avhandling kombinerar era metoder för databehandling och maskininlärning till en algoritm som kan förutsäga lagerskador med hög precision, samtidigt som tolkningsförmågan bibehalls. Bland andra välkända metoder sa använder algoritmen Empirical Mode Decomposition (EMD) och Singular Value Decomposition (SVD) för att extrahera väsentlig information for vibrationsmätningarna. Algoritmen testas sedan med tre olika vibrationsdatamängder, varav en mättes specikt med tanke på simulering av axelbox lager. Ett annat mål med algoritmen är att göra den tillämpad för ytterligare mätningar. Det bör vara möjligt att inkludera mätningar av olika slag, dvs ljud- eller temperaturmätningar, och därigenom förbättra resultaten. Detta skulle minska implementeringskostnaden avsevärt eftersom befintliga sensorer används för detta ändamål. I händelsen av att de föreslagna metoderna inte fungerar med nya mätningar är det även möjligt att integrera ytterligare funktioner i algoritmen.
237

Combating money laundering with machine learning : A study on different supervised-learning algorithms and their applicability at Swedish cryptocurrency exchanges / Bekämpning av penningtvätt med hjälp av maskininlärning : En undersökning av olika supervised-learning algorithms och deras tillämpbarhet på svenska kryptovalutaväxlare

Pettersson Ruiz, Eric January 2021 (has links)
In 2018, Europol (2018) estimated that more than $22 billion dollars were laundered in Europe by using cryptocurrencies. The Financial Action Task Force explains that moneylaunderers may exchange their illicitly gained fiat-money for crypto, launder that crypto by distributing the funds to multiple accounts and then re-exchange the crypto back to fiat-currency. This process of exchanging currencies is done through a cryptocurrency exchange, giving the exchange an ideal position to prevent money laundering from happening as it acts as middleman (FATF, 2021). However, current AML efforts at these exchanges have shown to be outdated and need to be improved. Furthermore, Weber et al. (2019) argue that machine learning could be used for this endeavor. The study's purpose is to investigate how machine learning can be used to combat money laundering activities performed using cryptocurrency. This is done by exploring what machine learning algorithms are suitable for this purpose. In addition, the study further seeks to understand the applicability of the investigated algorithms by exploring their fit at cryptocurrency exchanges. To answer the research question, four supervised-learning algorithms are compared by using the Bitcoin Elliptic Dataset. Moreover, with the objective of quantitively understanding the algorithmic performance differences, three key evaluation metrics are used: F1-score, precision and recall. Then, in order to understand the investigated algorithms applicability, two complementary qualitative interviews are performed at Swedish cryptocurrency exchanges. The study cannot conclude if there is a most suitable algorithm for detecting transactions related to money-laundering. However, the applicability of the decision tree algorithm seems to be more promising at Swedish cryptocurrency exchanges, compared to the other three algorithms. / Europol (2018) uppskattade år 2018, att mer än 22 miljarder USD tvättades i Europa genom användning av kryptovalutor. Financial Action Task Force förklarar att penningtvättare kan byta deras olagligt förvärvade fiat-valutor mot kryptovaluta, tvätta kryptovalutan genom att fördela tillgångarna till ett flertal konton och sedan återväxla kryptovalutan tillbaka till fiat-valuta. Denna process, att växla valutor, görs genom en kryptovalutaväxlare, vilket ger växlaren en ideal position för att förhindra att tvättning sker eftersom de agerar som mellanhänder (FATF, 2021). Dock har de aktuella AMLansträngningarna vid dessa växlare visat sig vara föråldrade och i behov av förbättring. Dessutom hävdar Weber et al. (2019) att maskininlärning skulle kunna användas i denna strävan. Denna studies syfte är att undersöka hur maskininlärning kan användas för att bekämpa penningtvättaktiviteter där kryptovaluta används. Detta görs genom att utforska vilka maskininlärningsalgoritmer som är användbara för detta ändamål. Dessutom strävar undersökningen till att ge förståelse för tillämpligheten hos de undersökta algoritmerna genom att utforska deras lämplighet hos kryptovalutaväxlare. För att besvara frågeställningen har fyra supervised-learning algoritmer jämförts genom att använda Bitcoin Elliptic Dataset. För att kvantitativt förstå olikheterna i algoritmisk prestanda, har tre utvärderingsverktyg använts: F1-score, Precision och Recall. Slutligen, för att ytterligare förstå de undersökta algoritmernas tillämplighet, har två kompletterande kvalitativa intervjuer med svenska kryptovalutaväxlare gjorts. Studien kan inte dra slutsatsen att det finns en bästa algoritm för att upptäcka transaktioner som kan relateras till penningtvätt. Dock verkar tillämpbarheten hos decision tree algoritmen vara mer lovande vid de svenska kyptovalutaväxlarna än de tre andra algoritmerna.
238

Emotion Detection from Electroencephalography Data with Machine Learning : Classification of emotions elicited by auditory stimuli from music on self-collected data sets / Känslodetektion från Elektroencefalografidata med Maskininlärning : Klassificering av känslor framkallade av hörselstimuli från musik på egeninsamlade dataset

Söderqvist, Filip January 2021 (has links)
The recent advances in deep learning have made it state-of-the-art for many different tasks, making its potential usefulness for analyzing electroencephalography (EEG) data appealing. This study aims at automatic feature extraction and classification of likeability, valence, and arousal elicited by auditory stimuli from music by training deep neural networks (DNNs) on  minimally pre-processed multivariate EEG time series. Two data sets were collected, the first containing 840 samples from 21 subjects, the second containing 400 samples from a single subject. Each sample consists of a 30 second EEG stream which was recorded during music playback. Each subject in the multiple subject data set was played 40 different songs from 8 categories, after which they were asked to self-label their opinion of the song and the emotional response it elicited. Different pre- processing and data augmentation methods were tested on the data before it was fed to the DNNs. Three different network architectures were implemented and tested, including a one-dimensional translation of ResNet18, InceptionTime, and a novel architecture built upon from InceptionTime, dubbed EEGNet. The classification tasks were posed both as a binary and a three-class classification problem. The results from the DNNs were compared to three different methods of handcrafted feature extraction. The handcrafted features were used to train LightGBM models, which were used as a baseline. The experiments showed that the DNNs struggled to extract relevant features to discriminate between the different targets, as the results were close to random guessing. The experiments with the baseline models showed generalizability indications in the data, as all 36 experiments performed better than random guessing. The best results were a classification accuracy of 64 % and an AUC of 0.638 for valence on the multiple subject data set. The background study discovered many flaws and unclarities in the published work on the topic. Therefore, future work should not rely too much on these papers and explore other network architectures that can extract the relevant features to classify likeability and emotion from EEG data. / Djupinlärning har visat sig vara effektivt för många olika uppgifter, vilket gör det möjligt att det även kan användas för att analysera data från elektroencefalografi (EEG). Målet med denna studie är att genom två egeninsamlade dataset försöka klassificera huruvida någon gillar en låt eller inte samt vilka känslor låten väcker genom att träna djupa neurala nätverk (DNN) på minimalt pre-processade EEG-tidsserier.  För det första datasettet samlades 840 dataexempel in från 21 deltagare. Dessa fick lyssna på 30-sekunders snuttar av 40 olika låtar från 8 kategorier varvid de fick svara på frågor angående vad de tyckte om låten samt vilka känslor den väckte. Det andra datasettet samlade in 400 dataexempel från endast en deltagare. Datan blev behandlad med flera olika metoder för att öka antalet träningsexempel innan det blev visat för de neurala nätverken. Tre olika nätverksarkitekturer implementerades och testades; en endimensionell variant av ResNet18, InceptionTime samt en egenbyggd arkitektur som byggde vidare på InceptionTime, döpt till EEGNet. Nätverken tränades både för binär och tre-klass klassificering.  Resultaten från nätverken jämfördes med tre olika metoder för att bygga egna prediktorer från EEG-datan. Dessa prediktorer användes för att träna LightGBM modeller, vars resultat användes som baslinje. Experimenten visade att DNNsen hade svårt att extrahera relevanta prediktorer för att kunna diskriminera mellan de olika klasserna, då resultaten var nära till godtyckligt gissande. Experimenten med LightGBM modellerna och de handgjorda prediktorerna visade dock indikationer på att det finns relevant information i datan för att kunna prediktera ett visst utfall, då alla 36 experiment presterade bättre än godyckligt gissande. Det bästa resultatet var 64 % träffsäkerhet för valens och binär klassificering, med en AUC på 0.638, för datasettet med många deltagare. Bakgrundsstudien upptäckte många oklarheter och fel i flera av de artiklar som är publicerade på ämnet. Framtida arbete bör därför inte förlita sig på denna alltför mycket. Den bör fokusera på att utveckla arkitekturer som klarar att extrahera de relevanta prediktorer som behövs för att kunna prediktera huruvida någon tycker om en låt eller inte samt vilka känslor denna väckte.
239

Machine Learning and Computer Vision for PCB Verification

Yang, Chen January 2020 (has links)
Digitizing printed circuit boards (PCB) from images with computer science techniques is efficient in analyzing the PCB circuit. This automatic optic processing could help electronic engineers have a faster and more in-depth insight into complex multilayer PCB. This automatic optic processing could help electronic engineers have a faster and more in-depth insight of complex multi- layer PCB. In this thesis, multiple machine learning and computer vision methods for extracting PCB circuits are investigated, designed, and tested with real- world PCB data. PCB image dataset is collected by professional delayer engineers, that consist of every layer of PCB and Xray 3D models of the whole PCB. Region of interest (RoI) cropping and image alignment are applied firstly as in the pre- process stage. Detection and localization of electronic components are implemented with deep learning networks (Faster RCNN), unsupervised machine learning clustering (XOR-based K- means), and multiple template matching, their accuracy results are 71.2%, 82.3% and 96.5%, respectively. For the multilayer circuit extraction, the metallic print circuit is segmented in YCbCr color space, then the connection of every circuit net is obtained. / Digitalisering av tryckta kretskort (PCB) från bilder med datavetenskapstekniker är effektivt för att analysera PCB: s kretsar. Denna automatiska optiska bearbetning kan hjälpa elektroniska ingenjörer att få en snabbare och mer djupgående inblick i komplexa flerlagers PCB. I denna avhandling undersöks, designas och testas flera maskininlärnings- och datorvisionsmetoder för att extrahera PCB- kretsar med verkliga PCB- data. PCB- bilddataset samlas av professionella de-layer-ingenjörer, som består av varje lager av PCB och röntgen 3Dmodeller av hela PCB. Beskärning av region av intresse (RoI) och bildjustering tillämpas först som i förprocessstadiet. Upptäckt och lokalisering av elektroniska komponenter implementeras med djupinlärningsnätverk (Faster RCNN), utan tillsyn av maskininlärningskluster (XOR- based K- means) och flera mallmatchningar. För extraktion med flera lager kretsar är den metalliska utskriftskretsen segmenterad i YCbCr- färgutrymme, då erhålls anslutningen av varje kretsnät.
240

VATS : Voice-Activated Targeting System / VATS : Röstaktiverat Identifieringssystem

MELLO, SIMON January 2020 (has links)
Machine learning implementations in computer vision and speech recognition are wide and growing; both low- and high-level applications being required. This paper takes a look at the former and if basic implementations are good enough for real-world applications. To demonstrate this, a simple artificial neural network coded in Python and already existing libraries for Python are used to control a laser pointer via a servomotor and an Arduino, to create a voice-activated targeting system. The neural network trained on MNIST data consistently achieves an accuracy of 0.95 ± 0.01 when classifying MNIST test data, but also classifies captured images correctly if noise-levels are low. This also applies to the speech recognition, rarely giving wrong readings. The final prototype achieves success in all domains except turning the correctly classified images into targets that the Arduino can read and aim at, failing to merge the computer vision and speech recognition. / Maskininlärning är viktigt inom röstigenkänning och datorseende, för både små såväl som stora applikationer. Syftet med det här projektet är att titta på om enkla implementationer av maskininlärning duger för den verkligen världen. Ett enkelt artificiellt neuronnät kodat i Python, samt existerande programbibliotek för Python, används för att kontrollera en laserpekare via en servomotor och en Arduino, för att skapa ett röstaktiverat identifieringssystem. Neuronnätet tränat på MNIST data når en precision på 0.95 ± 0.01 när den försöker klassificera MNIST test data, men lyckas även klassificera inspelade bilder korrekt om störningen är låg. Detta gäller även för röstigenkänningen, då den sällan ger fel avläsningar. Den slutliga prototypen lyckas i alla domäner förutom att förvandla bilder som klassificerats korrekt till mål som Arduinon kan läsa av och sikta på, vilket betyder att prototypen inte lyckas sammanfoga röstigenkänningen och datorseendet.

Page generated in 0.1194 seconds