Training a Neural Network using Synthetically Generated Data / Att träna ett neuronnät med syntetisktgenererad data

Diffner, Fredrik, Manjikian, Hovig January 2020 (has links)
A major challenge in training machine learning models is the gathering and labeling of a sufficiently large training data set. A common solution is the use of synthetically generated data set to expand or replace a real data set. This paper examines the performance of a machine learning model trained on synthetic data set versus the same model trained on real data. This approach was applied to the problem of character recognition using a machine learning model that implements convolutional neural networks. A synthetic data set of 1’240’000 images and two real data sets, Char74k and ICDAR 2003, were used. The result was that the model trained on the synthetic data set achieved an accuracy that was about 50% better than the accuracy of the same model trained on the real data set. / Vid utvecklandet av maskininlärningsmodeller kan avsaknaden av ett tillräckligt stort dataset för träning utgöra ett problem. En vanlig lösning är att använda syntetiskt genererad data för att antingen utöka eller helt ersätta ett dataset med verklig data. Denna uppsats undersöker prestationen av en maskininlärningsmodell tränad på syntetisk data jämfört med samma modell tränad på verklig data. Detta applicerades på problemet att använda ett konvolutionärt neuralt nätverk för att tyda tecken i bilder från ”naturliga” miljöer. Ett syntetiskt dataset bestående av 1’240’000 samt två stycken dataset med tecken från bilder, Char74K och ICDAR2003, användes. Resultatet visar att en modell tränad på det syntetiska datasetet presterade ca 50% bättre än samma modell tränad på Char74K.

Tracking a ball during bounce and roll using recurrent neural networks / Följning av en boll under studs och rull med hjälp av återkopplande neurala nätverk

Rosell, Felicia January 2018 (has links)
In many types of sports, on-screen graphics such as an reconstructed ball trajectory, can be displayed for spectators or players in order to increase understanding. One sub-problem of trajectory reconstruction is tracking of ball positions, which is a difficult problem due to the fast and often complex ball movement. Historically, physics based techniques have been used to track ball positions, but this thesis investigates using a recurrent neural network design, in the application of tracking bouncing golf balls. The network is trained and tested on synthetically created golf ball shots, created to imitate balls shot out from a golf driving range. It is found that the trained network succeeds in tracking golf balls during bounce and roll, with an error rate of under 11 %. / Grafik visad på en skärm, så som en rekonstruerad bollbana, kan användas i många typer av sporter för att öka en åskådares eller spelares förståelse. För att lyckas rekonstruera bollbanor behöver man först lösa delproblemet att följa en bolls positioner. Följning av bollpositioner är ett svårt problem på grund av den snabba och ofta komplexa bollrörelsen. Tidigare har fysikbaserade tekniker använts för att följa bollpositioner, men i den här uppsatsen undersöks en metod baserad på återkopplande neurala nätverk, för att följa en studsande golfbolls bana. Nätverket tränas och testas på syntetiskt skapade golfslag, där bollbanorna är skapade för att imitera golfslag från en driving range. Efter träning lyckades nätverket följa golfbollar under studs och rull med ett fel på under 11 %.

Modeling the intronic regulation of Alternative Splicing using Deep Convolutional Neural Nets / En metod baserad på djupa neurala nätverk för att modellera regleringen av Alternativ Splicing

Linder, Johannes January 2015 (has links)
This paper investigates the use of deep Convolutional Neural Networks for modeling the intronic regulation of Alternative Splicing on the basis of DNA sequence. By training the CNN on massively parallel synthetic DNA libraries of Alternative 5'-splicing and Alternatively Skipped exon events, the model is capable of predicting the relative abundance of alternatively spliced mRNA isoforms on held-out library data to a very high accuracy (R2 = 0.77 for Alt. 5'-splicing). Furthermore, the CNN is shown to generalize alternative splicing across cell lines efficiently. The Convolutional Neural Net is tested against a Logistic regression model and the results show that while prediction accuracy on the synthetic library is notably higher compared to the LR model, the CNN is worse at generalizing to new intronic contexts. Tests on non-synthetic human SNP genes suggest the CNN is dependent on the relative position of the intronic region it was trained for, a problem which is alleviated with LR. The increased library prediction accuracy of the CNN compared to Logistic regression is concluded to come from the non-linearity introduced by the deep layer architecture. It adds the capacity to model complex regulatory interactions and combinatorial RBP effects which studies have shown largely affect alternative splicing. However, the architecture makes interpreting the CNN hard, as the regulatory interactions are encoded deep within the layers. Nevertheless, high-performance modeling of alternative splicing using CNNs may still prove useful in numerous Synthetic biology applications, for example to model differentially spliced genes as is done in this paper. / Den här uppsatsen undersöker hur djupa neurala nätverk baserade på faltning ("Convolutions") kan användas för att modellera den introniska regleringen av Alternativ Splicing med endast DNA-sekvensen som indata. Nätverket tränas på ett massivt parallelt bibliotek av syntetiskt DNA innehållandes Alternativa Splicing-event där delar av de introniska regionerna har randomiserats. Uppsatsen visar att nätverksarkitekturen kan förutspå den relativa mängden alternativt splicat RNA till en mycket hög noggrannhet inom det syntetiska biblioteket. Modellen generaliserar även alternativ splicing mellan mänskliga celltyper väl. Hursomhelst, tester på icke-syntetiska mänskliga gener med SNP-mutationer visar att nätverkets prestanda försämras när den introniska region som används som indata flyttas i jämförelse till den relativa position som modellen tränats på. Uppsatsen jämför modellen med Logistic regression och drar slutsatsen att nätverkets förbättrade prestanda grundar sig i dess förmåga att modellera icke-linjära beroenden i datan. Detta medför dock svårigheter i att tolka vad modellen faktiskt lärt sig, eftersom interaktionen mellan reglerande element är inbäddat i nätverkslagren. Trots det kan högpresterande modellering av alternativ splicing med hjälp av neurala nät vara användbart, exempelvis inom Syntetisk biologi där modellen kan användas för att kontrollera regleringen av splicing när man konstruerar syntetiska gener.

An overview on the environmental impacts of synthetic leather made of hemp fiber with preliminary lifecycle assessment

Hultkrantz, Martina January 2018 (has links)
This report covers a preliminary life cycle assessment (LCA) on imitation leather made from hemp fiber (hemp leather) and a comparison to bovine leather, to examine whether hemp leather is an environmentally sustainable alternative. The bovine leather industry is responsible for heavy chemical use and emissions, detrimental effects to the environment as well as to human health. The United Nations (UN) and other organizations call for immediate action against the animal product industry sector to greatly reduce emissions and protect the environment. Hemp is a versatile plant that can be used for many things, including paper, composites, textiles, food and medicine, and is probably a suitable material for imitation leather. The hemp plant requires little inputs, grows fast and without pesticides, has positive effects on the environment and can be cultivated on every inhabited continent. The preliminary LCA was based on a patent describing the manufacturing process of hemp leather completed with data from literature and a few assumptions made. LCA-results for bovine leather were collected from literature and the two leather fabrics were then compared. The comparison showed that hemp leather is superior to bovine leather in all compared categories except for water consumption and hazardous waste. Bovine leather had 99% more energy use, 78% higher acidification potential (AP), 99,9% higher eutrophication potential (EP) and 83% higher global warming potential (GWP) than hemp leather. The large water consumption in the manufacturing phase of hemp leather is possible to be explained by over dimensioning of inputs. The report concludes that hemp leather would be the environmentally and ethically admirable choice between the two leathers and that more research on more modern methods of manufacturing it should be performed. / Denna rapport omfattar en preliminär livscykelanalys (LCA) på syntetiskt läder gjort av hampfiber (hampläder) och en jämförelse med nötskinn, för att undersöka om hampläder är ett miljövänligt alternativ. Nötskinnsindustrin är ansvarig för stor kemikalieanvändning och tunga utsläpp, skadlig inverkan på miljö samt människors hälsa. Förenta nationerna och andra organisationer fordrar till omedelbar handling mot djurindustrisektorn för att drastiskt minska utsläpp och skydda miljön. Hampa är en mångsidig växt som kan användas inom många olika applikationer, såsom till papper, kompositer, textiler, mat och medicin, och är förmodligen ett passande material till imitationsläder. Hampan behöver liten mängd tillförd energi, växer fort och utan bekämpningsmedel, har positiva effekter på miljön och kan odlas på alla bebodda kontinenter. Den preliminära LCA:n är baserad på ett patent beskrivande hampläders produktionsprocess, kompletterat med data från litteratur samt några antaganden. LCA-resultat från nötskinnsproduktion samlades från litteratur och resultaten från de två lädertyperna jämfördes sedan. Jämförelsen visade att hampläder är överlägset nötskinn i alla jämförda kategorier utom vattenkonsumtion och farligt avfall. Nötskinn har 99% högre energianvändning, 78% högre försurningspotential (AP), 99,9% högre övergödningspotential (EP) och 83% högre potential till global uppvärmning (GWP) än hampläder, enligt resultaten. Hampläders produktionsprocess stora vattenkonsumtion kan troligtvis förklaras av en överdimensionering av indata. Denna rapport drar slutsatsen att hampläder skulle vara det mest miljövänliga och etiskt försvarbara valet mellan de två lädertyperna och att modernare produktionsmetoder för hampläder bör studeras.

