Global ETD Search

Return to search

Deep Learning for Dynamic Portfolio Optimization / Djupinlärning för dynamisk portföljoptimering

This thesis considers a deep learning approach to a dynamic portfolio optimization problem. A proposed deep learning algorithm is tested on a simplified version of the problem with promising results, which suggest continued testing of the algorithm, on a larger scale for the original problem. First the dynamics and objective function of the problem are presented, and the existence of a no-trade-region is explained via the Hamilton-Jacobi-Bellman equation. The no-trade-region dictates the optimal trading strategy. Solving the Hamilton-Jacobi-Bellman equation to find the no-trade-region is not computationally feasible in high dimension with a classic finite difference approach. Therefore a new algorithm to iteratively update and improve an estimation of the no-trade-region is derived. This is a deep learning algorithm that utilizes neural network function approximation. The algorithm is tested on the one-dimensional version of the problem for which the true solution is known. While testing in one dimension only does not assess whether this algorithm scales better than a finite difference approach to higher dimensions, the learnt solution comes fairly close to true solution with a relative score of 0.72, why it is suggested that continued research of this algorithm is performed for the multidimensional version of the problem. / Den här uppsatsen undersöker en djupinlärningsmetod for att lösa ett dynamiskt portföljoptimeringsproblem. En föreslagen djupinlärningsalgoritm testas på en föreklad version av problemet, med lovande resultat. Därför föreslås det vidare att algoritmens prestanda testas i större skala även för det urpsrungliga problemet. Först presenteras dynamiken och målfunktionen för problemet. Det förklaras via Hamilton-Jacobi-Bellman-ekvationen varför det finns en handelsstoppregion. Handelsstoppregionen bestämmer den optimala handelsstrategin. Att lösa Hamilton-Jacobi-Bellman-ekvationen för att hitta handelsstoppregionen är inte beräkningspratiskt möjligt i hög dimension om ett traditionellt tillvägagångssätt med finita differenser används. Därför härleds en ny algoritm som iterativt uppdaterar och förbättrar en skattning av handelsstoppregionen. Det är en djupinlärningsalgoritm som utnyttjar funktionsapproximation med neurala nätverk. Algoritmen testas på den endimensionella verisonen av problemet, för vilken den sanna lösningen är känd. Tester i det endimensionella fallet kan naturligtvis inte ge svar på frågan om den nya algoritmen skalar bättre än en finit differensmetod till högre dimensioner. Men det är i alla fall klart att den inlärda lösningen kommer tämligen nära den sanna med relativ poäng 0.72, och därför föreslås fortsatt forskning kring algoritmen i förhållande till den flerdimensionella versionen av problemet.

http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-304667

Dynamic portfolio optimization

No-trade-region

Deep learning

Policy iteration

Dynamisk portföljoptimering

Handelsstoppregion

Djupinlärning

Policyiterering

Probability Theory and Statistics

Sannolikhetsteori och statistik

Identifer	oai:union.ndltd.org:UPSALLA1/oai:DiVA.org:kth-304667
Date	January 2021
Creators	Molnö, Victor
Publisher	KTH, Matematisk statistik
Source Sets	DiVA Archive at Upsalla University
Language	English
Detected Language	Swedish
Type	Student thesis, info:eu-repo/semantics/bachelorThesis, text
Format	application/pdf
Rights	info:eu-repo/semantics/openAccess
Relation	TRITA-SCI-GRU ; 2021:216

Page generated in 0.0044 seconds

Deep Learning for Dynamic Portfolio Optimization / Djupinlärning för dynamisk portföljoptimering

Description

Links & Downloads

Tags

Additional Fields