• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 4506
  • 975
  • 69
  • 49
  • 39
  • 11
  • 2
  • 1
  • 1
  • 1
  • Tagged with
  • 5890
  • 5890
  • 5606
  • 5343
  • 5321
  • 773
  • 451
  • 372
  • 320
  • 314
  • 304
  • 286
  • 265
  • 257
  • 254
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
501

3D Estimation of Joints for Motion Analysis in Sports Medicine : A study examining the possibility for monocular 3D estimation to be used as motion analysis for applications within sports with the goal to prevent injury and improve sport specific motion / 3D estimering av leder för rörelseanalys inom idrottsmedicin

Persson, Axel January 2023 (has links)
3D joint estimation can be used to track bodies in areas such as entertainment, sports, biomedicine and surveillance to identify bodies from video streams and images. This is most commonly done with multi-view solutions but researchers are currently spending a large amount of resources into developing mono-view solutions. The idea is to utilise neural networks to identify 3D joints by exploiting patterns and restrictions found in the human pose. Currently these systems are showing great results in controlled settings with good accuracy. However, for this to become a widespread technique it will be crucial for the systems to be able to perform with high accuracy in all types of settings. This thesis will focus on evaluating if current systems could be used to perform 3D estimations with high accuracy on movement analysis in sports settings. Based on a prestudy performing meaningful analysis in the area would require the system to perform with an accuracy of 4 cm. In order to evaluate the accuracy in this setting this thesis consists of three steps. Firstly two methods are picked by performing a prestudy of currently available monocular 3D joint estimation solutions. The accuracy of these two methods is then evaluated on two datasets, one which both have been trained on and another sports focused dataset which neither have been trained on. The sports dataset consisted of video sequences of movements from tennis, volleyball, basketball, badminton, football and rugby. In the last step a smoothing filter is applied on the results from the method that performed best on the sports dataset. This was done in order to further improve the accuracy of the system and evaluate the idea of using such techniques. The comparisons were made by measuring the mean per joint positional error for each of the images in the datasets. Both of the methods used were unable to reach a 4 cm accuracy on the sports dataset and thus are not suitable for this type of analysis in their current states. However applying a filter on the results did result in a small improvement of the accuracy and could be an area of research to look further into when these methods are further developed. / 3D estimering av leder i kroppen är en teknik som kan användas för att spåra och identifiera kroppar utifrån bilder och videoströmmar inom områden som underhållning, sport, biomedicin och övervakning. Detta görs oftast med flera kameror men forskare lägger för närvarande mycket resurser på att utveckla lösningar som bara använder en kamera, så kallade monocular system. Tanken är att använda neurala nätverk för att identifiera 3D leder genom att utnyttja mönster och restriktioner som finns i den mänskliga kroppen. För närvarande visar dessa system mycket lovande resultat i kontrollerade miljöer med mycket god noggrannhet. Men för att detta ska bli en utbredd teknik inom fler områden kommer det att vara avgörande för systemen att kunna prestera med hög noggrannhet i en större mängd miljöer med fler variationer. Denna avhandling fokuserar på att utvärdera om nuvarande metoder skulle kunna användas för att utföra 3D beräkningar av leder med tillräckligt hög noggrannhet för att kunna användas för rörelseanalys i sportmiljöer. Baserat på en förstudie inom det biomedicinska området skulle detta kräva att systemen kan arbeta med en noggrannhet på 4 cm. För att utvärdera noggrannheten i denna miljö, har metoden i denna avhandling delats upp i tre steg. Först kommer två metoder för 3D-uppskattning att väljas genom att utföra en förstudie av för närvarande tillgängliga monocular lösningar. Noggrannheten av dessa två utvärderas sedan på två dataset, ett som båda har tränats på och ett ytterligare dataset med fokus på sport som ingendera har tränats på. Sportdatasetet bestod av videosekvenser av rörelser från tennis, volleyboll, basket, badminton, fotboll och rugby. Detta är avgörande för det sista steget i metoden då ett filter appliceras på resultaten från den metod som presterade bäst på sportdatasetet. Detta gjordes för att ytterligare förbättra systemets noggrannhet och utvärdera idén med att använda sådana tekniker. Jämförelserna gjordes genom att mäta medelvärdet per ledpositionsfel för var och en av bilderna i dataseten. Båda metoderna som användes uppnådde inte den uppsatta noggranhet på 4 cm för sportdatasetet och är därför inte lämpliga för denna typ av analys i deras nuvarande tillstånd. Men att tillämpa ett filter på resultaten ledde till en liten förbättring av noggrannheten och kan vara ett område värt att undersöka ytterligare vid vidare utveckling av dessa metoder.
502

Predicting Top-Oil-Temperature in Power Transformers with Light Gradient Boosting Machine / Predicering av oljetemperatur i krafttransformatorer med Light Gradient Boosting Machine

Löfgren, Victor January 2022 (has links)
Online monitoring of mineral-oil-immersed transformer variables provide capabilities such as failure avoidance, optimization of load capacity and maintenance as well as extending the remaining life expectancy. A central role is played by the Top-Oil-Temperature which in its own is an indicator of harmful events or transformer states. It is also one of the key features for estimating Hot-Spot-Temperature which is associated with directly harmful phenomenons such as arching and partial discharges. Expanding the conventional features of Top-Oil-Temperature, load current and ambient temperature, the potential influence of time-delayed instances of the same are investigated in an attempt to improve machine learning models. To ensure credibility to the research, the methodology of relevant literature is critically assessed. Predictions are performed with the state-of-the-art decision tree framework "light gradient boosting machine". The results found with the framework are substantiated with a multilayer perceptron and basic linear regression. Delayed instances indeed proved advantageous on real transformer data collected from a 220 kV power transformer, gathered over a year, and sampled at 15 minutes interval. The optimal delay was found to be 5 hours, lowering the Root-Mean-Squared-Error of light gradient boosting machine algorithm to 1.22, corresponding to 28% reduction compared to not using any delayed features. / Online övervakning av variabler i oljekylda transformatorer möjliggör förhindring av haveri, optimering av lastkapacitet och underhållsarbete så väl som förlängning av återstående livslängd. En central roll spelas av Top-Oil- Temperature som i sig är en indikator av skadliga händelser eller tillstånd i transformatorer. Därtill så är den en av de huvudsakliga parametrarna för estimering av Hot-Spot-Temperature som är associerad med direkt skadliga fenomen som gnistbildning och partiella urladdningar. Utöver de vedertagna prediktorerna, lastström och omgivande temperatur, så efterforskas den potentiella inverkan av tidsförskjutna instanser av de samma i ett försök att förbättra maskininlärningsmodeller. För att säkra trovärdighet till forskningen så granskas relevant litteratur kritiskt. Prediktioner utförs med det senaste ramverket inom beslutsträd light gradient boosting machine". Resultaten förskaffade med ramverket underbyggs med en multilayer perceptron och en simpel linjär regression. Tidsförskjutna instanser bevisades fördelaktiga på verklig transformator data från en 220 kV krafttransformator, insamlat över ett år och samplat med 15 minuters intervall. Den optimala förskjutningen hittades vid 5 timmar och sänkte roten ur medelkvadrat felet för light Gradient boosting machine till 1.22 vilket motsvarar en sänkning om 27,5% jämfört med att inte använda någon tidsförskjutning alls.
503

Bandit Algorithms for Adaptive Modulation and Coding in Wireless Networks / Bandit Algoritmer för Adaptiv Modulering och Kodning i trådlösa nätverk

Deffayet, Romain January 2020 (has links)
The demand for quality cellular network coverage has been increasing significantly in the recent years and will continue its progression throughout the near future. This results from an increase of transmitted data, because of new use cases (HD videos, live streaming, online games, ...), but also from a diversification of the traffic, notably because of shorter and more frequent transmissions which can be due to IOT devices or other telemetry applications. The cellular networks are becoming increasingly complex, and the need for better management of the network’s properties is higher than ever. The combined effect of these two paradigms creates a trade-off : whereas one would like to design algorithms that achieve high performance decision-making, one would also like those to be able to do so in any settings that can be encountered in this complex network. Instead, this thesis proposes to restrict the scope of the decision-making algorithms through on-line learning. The thesis focuses on the context of initial MCS selection in Adaptive Modulation and Coding, in which one must choose an initial transmission rate guaranteeing fast communications and low error rate. We formulate the problem as a Reinforcement Learning problem, and propose relevant restrictions to simpler frameworks like Multi-Armed Bandits and Contextual Bandits. Eight bandit algorithms are tested and reviewed with emphasis on practical applications. The thesis shows that a Reinforcement Learning agent can improve the utilization of the link capacity between the transmitter and the receiver. First, we present a cell-wide Multi-Armed Bandit agent, which learns the optimal initial offset in a given cell, and then a contextual augmentation of this agent taking user-specific features as input. The proposed method achieves with burst traffic an 8% increase of the median throughput and 65% reduction of the median regret in the first 0:5s of transmission, when compared to a fixed baseline. / Efterfrågan på mobilnät av hög kvalitet har ökat mycket de senaste åren och kommer att fortsätta öka under en nära framtid. Detta är resultatet av en ökad mängd trafik på grund av nya användningsfall (HD-videor, live streaming, onlinespel, ...) men kommer också från en diversifiering av trafiken, i synnerhet på grund av kortare och mer frekventa sändningar vilka kan vara på grund av IOT-enheter eller andra telemetri-applikationer. Mobilnätet blir allt komplexare och behovet av bättre hantering av nätverkets egenskaper är högre än någonsin. Den kombinerade effekten av dessa två paradigmer skapar en avvägning: medan man vill utforma algoritmer som uppnår mycket hög prestanda vid beslutsfattning, skulle man också vilja att algoritmerna kan göra det i alla konfigurationer som kan uppstå i detta komplexa nätverk. Istället föreslår denna avhandling att begränsa omfattningen av beslutsalgoritmerna genom att introducera online-inlärning. Avhandlingen fokuserar på första MCS-valet i Adaptiv Modulering och Kodning, där man måste välja en initial överföringshastighet som garanterar snabb kommunikation och minsta möjliga transmissionsfel. Vi formulerar problemet som ett Reinforcement Learning problem och föreslår relevanta begränsningar för matematikt enklare ramverk som Multi-Armed Bandits och Contextual Bandits. Åtta banditalgoritmer testas och granskas med hänsyn till praktisk tillämpning. Avhandlingen visar att en Reinforcement Learning agent kan förbättra användningen av länkkapaciteten mellan sändare och mottagare. Först presenterar vi en Multi-Armed Bandit agent på cell-nivå, som lär sig den optimala initiala MCSen i en given cell och sedan en kontextuell utvidgning av dennaa agent med användarspecifika funktioner. Den föreslagna metoden uppnår en åttaprocentig (8%) ökning av medianhastigheten och en sextiofemprocentig (65%) minskning av median ångern vid skurvis trafik det första 0.5s av tranmissionen, jämfört med ett fast referensvärde.
504

DQN Tackling the Game of Candy Crush Friends Saga : A Reinforcement Learning Approach / DQN applicerad på Candy Crush Friends Saga : Ett tillvägagångssätt med förstärkande inlärning

Karnsund, Alice January 2019 (has links)
This degree project presents a reinforcement learning (RL) approach called deep Q-network (DQN) for learning how to play the game Candy Crush Friends Saga (CCFS). The DQN algorithm is implemented together with three extensions, which in 2015 resulted in a new state-of-the-art on the Atari 2600 domain. This thesis shows that DQN in combination with the three extensions is an appropriate method for learning how to play CCFS. The influence that each of the extensions has on the performance is investigated separately, and reasoning for why or why not these extensions make sense in this environment is provided. CCFS is a stochastic game environment with many new features per level. This leads to a challenge when designing the reward function. This thesis investigates the impact of three different reward functions and reflects over why a certain type of design is more relevant. The results presented show that the DQN approach is able to learn a policy that increases its performance compared to that of random game-play. However, at this stage the performance is not yet reaching that of human game-play, but with further research we believe that it is possible. / Det här examensarbetet introducerar djupt Q-nätverk (DQN), ett tillvägagångssätt med förstärkande inlärning (RL), för att lära sig att spela spelet Candy Crush Friends Saga (CCFS). DQN implementeras tillsammans med tre tillägg, som 2015 resulterade i ett nytt toppresultat på Atari 2600-domänen. Detta examensarbete visar att DQN i kombination med de tre tilläggen är en lämplig metod för att lära sig att spela CCFS. Inverkan varje tillägg har på prestationen analyseras separat, och argument för och emot varför dessa tillägg är bra alternativ presenteras. CCFS är ett stokastiskt spel med flera nya element per nivå. Detta inför svårigheter i modelleringen av belöningsfunktionen. Detta examensarbete undersöker tre olika belöningsfunktioner och reflekterar över varför en viss typ av design är mer lämplig. Resultaten visar att DQN kan lära sig beslutstaganden som ökar dess prestation i jämförelse med slumpmässigt spel. Resultaten når i nuläget inte upp till mänsklig prestanda, men medytterligare forskning så tror vi att detta går att uppnå.
505

Unsupervised Audio Spectrogram Compression using Vector Quantized Autoencoders / Oövervakad ljudspektrogramkompression med vektor-kvantiserande självkodande neurala nätverk

Hansen Vedal, Amund January 2019 (has links)
Despite the recent successes of neural networks in a variety of domains, musical audio modeling is still considered a hard task, with features typically spanning tens of thousands of dimensions in input space. By formulating audio data compression as an unsupervised learning task, this project investigates the applicability of vector quantized neural network autoencoders for compressing spectrograms – image-like representations of audio. Using a recently proposed gradient-based method for approximating waveforms from reconstructed (real-valued) spectrograms, the discrete pipeline produces listenable reconstructions of surprising fidelity compared to uncompressed versions, even for out-of-domain examples. The results suggest that the learned discrete quantization method achieves about 9x harder spectrogram compression compared to its continuous counterpart, while achieving similar reconstructions, both qualitatively and in terms of quantitative error metrics. / Trots de senaste framgångarna för neurala nätverk på en rad olika områden är musikalisk ljudmodellering fortfarande en svår uppgift, med karakteristiska egenskaper som spänner över tiotusentals dimensioner i inputrymnden. Genom att formulera ljuddatakomprimering som en oövervakad inlärningsuppgift undersöker detta projekt användbarheten av vektorkvantiserade neurala nätverkbaserade självkodare på spektrogram – en bildliknande representation av ljud. Med en nyligen beskriven gradientbaserad metod för approximering av vågformer från rekonstruerade (realvärda) spektrogram, producerar den diskreta pipelinen lyssningsbara rekonstruktioner med överraskande ljudåtergivning jämfört med okomprimerade versioner, även för exempel utanför domänen. Resultaten tyder på att den lärda diskreta kvantiseringsmetoden uppnår ungefär nio gånger hårdare spektrogramkompression jämfört med sin kontinuerliga motsvarighet, samtidigt som den skapar liknande rekonstruktioner, både kvalitativt och enligt kvantitativa felmått.
506

Touch yourself with Bäcka! : Exploring the stigma of the pelvic floor

Lindberg, Erik January 2020 (has links)
This paper explores the pelvic floor and the social stigmas around it, which risks hindering knowledge about intimate health in our society. Working from an autobiographical soma design process, expanded by using both a male and a female participant, relevant experiential qualities were identified and built upon in order create a speculative design prototype. This resulted in Bäcka, an interactive experience that aids self-exploration of the pelvic floor through intimate touch, mediated by an interactive garment and interconnected soundscape. By doing this it aims to prompt discussion about the pelvic floor between participants, playing with the boundaries of normative dichotomies that reinforces a rigidity around this stigma. Thus highlighting these boundaries and subsequently providing an opportunity for participants to question them. With this speculative method, the creation of Bäcka touches on questions for which there are no clear answers, but which tells a story of how we can work to question such social stigmas in intimate health. / Denna rapport utforskar bäckenbotten och de sociala stigman som omger den, vilka riskerar att hindra kunskap om intim hälsa i vårt samhälle. Genom att arbeta från en självbiografisk Soma Design-process, utvidgad genom att använda både en manlig och kvinnlig deltagare, kunde relevanta upplevda erfarenheter identifieras och användas som underlag för att skapa en spekulativ designprototyp. Detta resulterade i Bäcka, en interaktiv upplevelse som stödjer utforskande av ens bäckenbotten genom intim beröring, hjälpt av en interaktiv klädsel och ett sammankopplat ljudlandskap. I och med detta syftar det att väcka diskussion om bäckenbotten mellan deltagare, genom att leka med gränsdragningen av de normativa dikotomier som förstärker en rigiditet runt dessa stigman. Följaktligen kan detta framhäva dessa gränslinjer och således förse deltagare med en möjlighet att ifrågasätta dem. Genom denna spekulativa metod så bidrar skapandet av Bäcka med att beröra frågor som det inte finns helt klara svar till, men som ger en berättelse om hur vi kan arbeta för att ifrågasätta sådana sociala stigman i intim hälsa.
507

A sample of sampling strategies for audio similarity learning / Ett urval av urvalssmetoder för inlärning av ljudlikhet

Fazelzadeh Hashemi, Pärham January 2022 (has links)
Training of machine learning models often require sampling when the dataset is large. The manner in which one samples data points, for the mini-batches as well as for the loss function, has been shown to have an impact on the performance of the model as well as on its convergence during training. We set out to measure the impact of sampling strategies on an audio similarity model developed by Epidemic Sound. To this purpose, we evaluate using distance weighted sampling for the triplet loss and Poisson Disk Sampling for the mini-batch sampling. While we did not find that the alternative strategy for gathering mini-batches improved the model, the alternative triplet mining strategy showed promising results and opened up for further exploration into this area. / Träning av maskininlärningsmodeller kräver ofta att urval sker när datamängden är stor. Hur detta urval sker, för antingen mini-batches eller kostnadsfunktionen, har visats ha en inverkan på modellens slutgiltiga prestation samt på konvergenstid. Vi har valt att utvärdera urvalsstrategins inverkan på en ljudlikhetsmodell utvecklad av Epidemic Sound. I detta syfte har vi valt att utvärdera distance weighted sampling för trillingkostnadsfunktionen och Poissondiskurval som urvalsprocess för mini-batches. Vi fann ej att en alternativ urvalsprocess för mini-batches gav bättre resultat men däremot att den alternativa trillingsurvalsprocessen gav lovande resultat som öppnar upp för vidare forskning.
508

Artificial Neural Networks and Inductive Biases for Multi-Instance Multi-Modal Tabular Data : A Case Study for Default Probability Estimation in Small-to-Medium Enterprise Lending / Artificiella Neuronnätverk och Induktiva Fördomar för Multi-Instans Multi-Modal Tabulär Data

Röhss, Gustav January 2022 (has links)
The success of artificial neural networks in homogeneous data domains such as images, textual data, and audio and other signals has had considerable impact on Machine Learning and science in general. The domain of heterogeneous tabular data, while arguably much more common, remains much less explored with regards to artificial neural networks and deep learning. Furthermore, work on tabular data tends to focus on the single-instance case. Much tabular data in industry is multi-instance; where single samples are composed of multiple entities (rows, records, etc). Tabular data is also often multi-modal; samples are composed of mixtures of e.g. series, sets, graphs, or vectorial data. This thesis is concerned with designing artificial neural networks to directly operate on these complex data structures, through a case study on a specific risk estimation problem in the financial domain. The task is re-framed as a graph-modelling problem, enabling the use of the flexible Graph Network formalism. Several different artificial neural networks are designed within this formalism, utilizing different inductive biases. Through experiments, it is found that on the available dataset weaker inductive biases result in a stronger model at a high statistical certainty, and even a linear model designed to operate on the complex data structure performs competitively. Some more complex models proposed are super-sets of the best performing model; this is surprising, and suggests that the dataset size is a limitation, and that the specific learning procedure requires further exploration. The space of possible model designs within the formulation of the problem proposed in this thesis is much greater in scope than can be thoroughly investigated in this project, and some suggested next steps for further work are discussed. / Den framgång som artificiella neuronnätverk har haft i homogena datadomäner som bilder, text- data, och ljud och andra signaler har haft stor påverkan på maskininlärning och vetenskap mer generellt. Den heterogena tabulära datadomänen, vilken kan argumenteras vara vanligare, förblir mycket mindre utforskad vad gäller artificiella neuronnätverk och djupinlärning. Vidare så tenderar arbete med tabulär data att fokusera på enkel-instans fallet. Mycket tabulär data i industri är multi-instans; där singulära exempel består av flera enheter (rader, punkter, etc). Tabulär data är också ofta multi-modal; där exempel består av blandningar av exempelvis serier, mängder, grafer, eller vektoriell data. I den här avhandlingen behandlas design av artificiella neuronnätverk som direkt verkar på dessa komplexa datastrukturer, genom en fallstudie i ett specifikt risk-estimerings problem från den financiella domänen. Uppgiften tolkas som ett graf-modellerings problem, vilket möjliggör användningen av den flexibla Grafnätverk-formalismen. Flera olika artificiella neuron- nätverk designas inom denna formalism, användande sig av olika induktiva fördomar. Genom experiment visas det att på den tillgängliga datamängden så resulterar svagare induktiva fördomar i en starkare modell med god statistik säkerhet, och till och med en linjär modell designad för att behandla den komplexa datastrukturen presterar väl. Vissa mer komplexa modeller som föreslås har den bäst presterande modellen som delmängd; detta är förvånande, och förslår att datamängdens storlek är en begränsning, och att den specifika inlärningsproceduren behöver vidare utforskning. Mängden möjliga modelldesigner inom problemet som presenteras i denna avhandling är mycket större än vad som kan undersökas i detta projekt, och ett antal förslag på nästa steg i vidare arbete föreslås.
509

A Benchmark and Evaluation of Imperas OVPSim Virtual Platform Tool Using RISC-V Processors / Ett benchmark och utvärdering av Imperas OVPSim Virtual Platform Tool som använder RISC-V-processorer

Liu, Annan January 2022 (has links)
In recent years, there has been a rapid development of embedded processors. These processors are designed for domains like aerospace, automotive, automation, healthcare, and more. However, both hardware and software must be validated before the actual application. Manufacturing a processor requires extremely high cost and a long time to finish. A platform simulator is a good solution for testing specific hardware architectures and software applications before the actual processor system is available. This thesis presents an evaluation of the Open Virtual Platforms (OVP) using benchmarks designed for Reduced Instruction Set Computer Five (RISCV) embedded processors. The RISC-V architecture is selected because it is the only open instruction set. OVPsim can simulate the embedded software on a simulated personal-built embedded platform. A benchmark set containing 10 benchmarks is provided in this thesis, covering different applications to give a comprehensive reflection of performance. The results of the benchmark set could be used in comparison with other simulators or test data from actual platform demos to achieve a better understanding of performance. / Under de senaste åren har det skett en snabb utveckling av inbyggda processorer. Dessa processorer är utformade för områden som flyg, fordon, automation, hälsovård med mera. Både hårdvara och mjukvara måste dock valideras före den faktiska tillämpningen. Tillverkningen av en processor kräver extremt höga kostnader och lång tid för att bli klar. En plattformssimulator är en bra lösning för att testa specifika hårdvaruarkitekturer och programvarutillämpningar innan processorsystemet är tillgängligt. I denna avhandling presenteras en utvärdering av OVP med hjälp av benchmarks som är utformade för RISC-V inbyggda processorer. RISC-V -arkitekturen har valts ut eftersom det är den enda öppna instruktionsuppsättningen. OVPsim kan simulera den inbyggda programvaran på en simulerad egen-utvecklad inbyggd plattform. I avhandlingen tillhandahålls en uppsättning benchmarks med tio program som täcker olika tillämpningar för att ge en omfattande bild av prestandan. Resultaten från benchmarkuppsättningen kan användas i jämförelse med andra simulatorer eller testdata från verkliga plattformsdemonstrationer för att få en bättre förståelse för prestandan.
510

Non-Parametric Calibration for Classification

Wenger, Jonathan January 2019 (has links)
Many applications for classification methods not only require high accuracy but also reliable estimation of predictive uncertainty. This is of particular importance in fields such as computer vision or robotics, where safety-critical decisions are made based on classification outcomes. However, while many current classification frameworks, in particular deep neural network architectures, provide very good results in terms of accuracy, they tend to incorrectly estimate their predictive uncertainty. In this thesis we focus on probability calibration, the notion that a classifier’s confidence in a prediction matches the empirical accuracy of that prediction. We study calibration from a theoretical perspective and connect it to over- and underconfidence, two concepts first introduced in the context of active learning. The main contribution of this work is a novel algorithm for classifier calibration. We propose a non-parametric calibration method which is, in contrast to existing approaches, based on a latent Gaussian process and specifically designed for multiclass classification. It allows for the incorporation of prior knowledge, can be applied to any classification method that outputs confidence estimates and is not limited to neural networks. We demonstrate the universally strong performance of our method across different classifiers and benchmark data sets from computer vision in comparison to existing classifier calibration techniques. Finally, we empirically evaluate the effects of calibration on querying efficiency in active learning. / Många applikationer för klassificeringsmetoder kräver inte bara hög noggrannhet utan även tillförlitlig uppskattning av osäkerheten av beräknat utfall. Detta är av särskild betydelse inom områden som datorseende eller robotik, där säkerhetskritiska beslut fattas utifrån klassificeringsresultat. Medan många av de nuvarande klassificeringsverktygen, i synnerhet djupa neurala nätverksarkitekturer, ger resultat när det gäller noggrannhet, tenderar de att felaktigt uppskatta strukturens osäkerhet. I detta examensarbete fokuserar vi på sannolikhetskalibrering, d.v.s. hur väl en klassificerares förtroende för ett resultat stämmer överens med den faktiska empiriska säkerheten. Vi studerar kalibrering ur ett teoretiskt perspektiv och kopplar det till över- och underförtroende, två begrepp som introducerades första gången i samband med aktivt lärande. Huvuddelen av arbetet är framtagandet av en ny algoritm för klassificeringskalibrering. Vi föreslår en icke-parametrisk kalibreringsmetod som, till skillnad från befintliga tillvägagångssätt, bygger på en latent Gaussisk process och som är specielltutformad för klassificering av flera klasser. Algoritmen är inte begränsad till neurala nätverk utan kan tillämpas på alla klassificeringsmetoder som ger konfidensberäkningar. Vi demonstrerar vår metods allmänt starka prestanda över olika klassifikatorer och kända datamängder från datorseende i motsats till befintliga klassificeringskalibreringstekniker. Slutligen utvärderas effektiviteten av kalibreringen vid aktivt lärande.

Page generated in 0.1164 seconds