• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 69
  • 21
  • 19
  • 12
  • 7
  • 6
  • 4
  • 4
  • 3
  • 3
  • 2
  • 1
  • 1
  • Tagged with
  • 143
  • 34
  • 27
  • 27
  • 24
  • 20
  • 20
  • 20
  • 16
  • 16
  • 16
  • 15
  • 15
  • 15
  • 14
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
131

由選擇權市場價格建構具一致性之評價模型 / Building a Consistent Pricing Model from Observed Option Prices via Linear Programming

劉桂芳, Liu, Kuei-fang Unknown Date (has links)
本論文研究如何由觀測的選擇權市場價格還原風險中立機率測度(等價平賭測度)。首先建構選擇權投資組合的套利模型,其中假設選擇權為單期,到期日時的狀態為離散點且個數有限,並且對應同一標的資產且不同履約價格。若市場不存在套利機會時,可使用拉格朗日乘數法則將選擇權套利模型導出拉格朗日乘子的可行性問題。將可行性問題作為限制式重新建構線性規劃模型以還原風險中立機率測度,並且利用此風險中立機率測度評價選擇權的公正價格。最後,我們以台指選擇權(TXO)為例,驗證此模型的評價能力。 / This thesis investigates how to recover the risk-neutral probability (equivalent martingale measure) from observed market prices of options. It starts with building an arbitrage model of options portfolio in which the options are assumed to be in one-period time, finite discrete-states, and corresponding to the same underlying asset with different strike prices. If there is no arbitrage opportunity in the market, we can use Lagrangian multiplier method to obtain a Lagrangian multiplier feasibility problem from the arbitrage model. We employ the feasibility problem as the constraints to construct a linear programming model to recover the risk-neutral probability, and utilize this risk-neutral probability to evaluate the fair price of options. Finally, we take TXO as an example to verify the pricing ability of this model.
132

Spojité modely trhu se stochastickou volatilitou / Continuous market models with stochastic volatility

Petrovič, Martin January 2018 (has links)
Vilela Mendes et al. (2015), based on the discovery of long-range dependence in the volatility of stock returns, proposed a stochastic volatility continuous mar- ket model where the volatility is given as a transform of the fractional Brownian motion (fBm) and studied its No-Arbitrage and completeness properties under va- rious assumptions. We investigate the possibility of generalization of their results from fBm to a wider class of Hermite processes. We have reworked and completed the proofs of the propositions in the cited article. Under the assumption of indepen- dence of the stock price and volatility driving processes the model is arbitrage-free. However, apart from a case of a special relation between the drift and the volatility, the model is proved to be incomplete. Under a different assumption that there is only one source of randomness in the model and the volatility driving process is bounded, the model is arbitrage-free and complete. All the above results apply to any Hermite process driving the volatility. 1
133

[en] AN INVITATION TO NOISE SENSITIVITY AND APPLICATIONS TO QUENCHED VORONOI PERCOLATION / [pt] UM CONVITE À SENSIBILIDADE A RUÍDO E APLICAÇÕES PARA PERCOLAÇÃO DE VORONOI DO TIPO QUENCHED

DANIEL DE LA RIVA MASSAAD 25 September 2020 (has links)
[pt] Nós começamos essa dissertação com um panorama geral e introdutório dos tópicos de Sensibilidade a Ruído e Percolação . Como essas áreas podem ser desconhecidas por muitos estudantes de pós-graduação, nós apresentamos o material de uma maneira acessível, com o intuito de divulgar importantes técnicas e resultados dessas áreas. Nós também vamos introduzir o modelo para Percolação de Voronoi e apresentar resultados sobre probabilidades de cruzamentos neste modelo. Nos últimos dois capulos nós iremos considerar Sensibilidade a Ruído para Percolação do tipo quenched. Em particular, no penúltimo capítulo nós vamos apresentar resultados do artigo Quenched Voronoi Percolation de Daniel Ahlberg, Simon Griffiths, Robert Morris e Vincent Tassion, e no último capítulo provaremos um teorema que melhora uma das cotas deste artigo. / [en] We begin this dissertation by giving an introductory overview of the topics of Noise Sensitivity and Percolation. As these areas may be unfamiliar to many graduate students, we present the material in an accessible way, with the objective of publicising important techniques and results in these areas.We shall also introduce the model of Voronoi Percolation and present results of Vincent Tassion on crossing probabilities in this model. In the last two chapters we consider Noise Sensitivity of Quenched Voronoi Percolation. In particular, in the penultimate chapter we present the results of the paper Quenched Voronoi Percolation by Daniel Ahlberg, Simon Griffiths, Robert Morris and Vincent Tassion, and in the final chapter we prove a theorem which improves one of the bounds of that paper.
134

Inégalités de déviations, principe de déviations modérées et théorèmes limites pour des processus indexés par un arbre binaire et pour des modèles markoviens / Deviation inequalities, moderate deviations principle and some limit theorems for binary tree-indexed processes and for Markovian models.

Bitseki Penda, Siméon Valère 20 November 2012 (has links)
Le contrôle explicite de la convergence des sommes convenablement normalisées de variables aléatoires, ainsi que l'étude du principe de déviations modérées associé à ces sommes constituent les thèmes centraux de cette thèse. Nous étudions principalement deux types de processus. Premièrement, nous nous intéressons aux processus indexés par un arbre binaire, aléatoire ou non. Ces processus ont été introduits dans la littérature afin d'étudier le mécanisme de la division cellulaire. Au chapitre 2, nous étudions les chaînes de Markov bifurcantes. Ces chaînes peuvent être vues comme une adaptation des chaînes de Markov "usuelles'' dans le cas où l'ensemble des indices à une structure binaire. Sous des hypothèses d'ergodicité géométrique uniforme et non-uniforme d'une chaîne de Markov induite, nous fournissons des inégalités de déviations et un principe de déviations modérées pour les chaînes de Markov bifurcantes. Au chapitre 3, nous nous intéressons aux processus bifurcants autorégressifs d'ordre p (). Ces processus sont une adaptation des processus autorégressifs linéaires d'ordre p dans le cas où l'ensemble des indices à une structure binaire. Nous donnons des inégalités de déviations, ainsi qu'un principe de déviations modérées pour les estimateurs des moindres carrés des paramètres "d'autorégression'' de ce modèle. Au chapitre 4, nous traitons des inégalités de déviations pour des chaînes de Markov bifurcantes sur un arbre de Galton-Watson. Ces chaînes sont une généralisation de la notion de chaînes de Markov bifurcantes au cas où l'ensemble des indices est un arbre de Galton-Watson binaire. Elles permettent dans le cas de la division cellulaire de prendre en compte la mort des cellules. Les hypothèses principales que nous faisons dans ce chapitre sont : l'ergodicité géométrique uniforme d'une chaîne de Markov induite et la non-extinction du processus de Galton-Watson associé. Au chapitre 5, nous nous intéressons aux modèles autorégressifs linéaires d'ordre 1 ayant des résidus corrélés. Plus particulièrement, nous nous concentrons sur la statistique de Durbin-Watson. La statistique de Durbin-Watson est à la base des tests de Durbin-Watson, qui permettent de détecter l'autocorrélation résiduelle dans des modèles autorégressifs d'ordre 1. Nous fournissons un principe de déviations modérées pour cette statistique. Les preuves du principe de déviations modérées des chapitres 2, 3 et 4 reposent essentiellement sur le principe de déviations modérées des martingales. Les inégalités de déviations sont établies principalement grâce à l'inégalité d'Azuma-Bennet-Hoeffding et l'utilisation de la structure binaire des processus. Le chapitre 5 est né de l'importance qu'a l'ergodicité explicite des chaînes de Markov au chapitre 3. L'ergodicité géométrique explicite des processus de Markov à temps discret et continu ayant été très bien étudiée dans la littérature, nous nous sommes penchés sur l'ergodicité sous-exponentielle des processus de Markov à temps continu. Nous fournissons alors des taux explicites pour la convergence sous exponentielle d'un processus de Markov à temps continu vers sa mesure de probabilité d'équilibre. Les hypothèses principales que nous utilisons sont : l'existence d'une fonction de Lyapunov et d'une condition de minoration. Les preuves reposent en grande partie sur la construction du couplage et le contrôle explicite de la queue du temps de couplage. / The explicit control of the convergence of properly normalized sums of random variables, as well as the study of moderate deviation principle associated with these sums constitute the main subjects of this thesis. We mostly study two sort of processes. First, we are interested in processes labelled by binary tree, random or not. These processes have been introduced in the literature in order to study mechanism of the cell division. In Chapter 2, we study bifurcating Markov chains. These chains may be seen as an adaptation of "usual'' Markov chains in case the index set has a binary structure. Under uniform and non-uniform geometric ergodicity assumptions of an embedded Markov chain, we provide deviation inequalities and a moderate deviation principle for the bifurcating Markov chains. In chapter 3, we are interested in p-order bifurcating autoregressive processes (). These processes are an adaptation of $p$-order linear autoregressive processes in case the index set has a binary structure. We provide deviation inequalities, as well as an moderate deviation principle for the least squares estimators of autoregressive parameters of this model. In Chapter 4, we dealt with deviation deviation inequalities for bifurcating Markov chains on Galton-Watson tree. These chains are a generalization of the notion of bifurcating Markov chains in case the index set is a binary Galton-Watson tree. They allow, in case of cell division, to take into account cell's death. The main hypothesis that we do in this chapter are : uniform geometric ergodicity of an embedded Markov chain and the non-extinction of the associated Galton-Watson process. In Chapter 5, we are interested in first-order linear autoregressive models with correlated errors. More specifically, we focus on the Durbin-Watson statistic. The Durbin-Watson statistic is at the base of Durbin-Watson tests, which allow to detect serial correlation in the first-order autoregressive models. We provide a moderate deviation principle for this statistic. The proofs of moderate deviation principle of Chapter 2, 3 and 4 are essentially based on moderate deviation for martingales. To establish deviation inequalities, we use most the Azuma-Bennet-Hoeffding inequality and the binary structure of processes. Chapter 6 was born from the importance that explicit ergodicity of Markov chains has in Chapter 2. Since explicit geometric ergodicity of discrete and continuous time Markov processes has been well studied in the literature, we focused on the sub-exponential ergodicity of continuous time Markov Processes. We thus provide explicit rates for the sub-exponential convergence of a continuous time Markov process to its stationary distribution. The main hypothesis that we use are : existence of a Lyapunov fonction and of a minorization condition. The proofs are largely based on the coupling construction and the explicit control of the tail of the coupling time.
135

隨機利率下之資產交換-跨通貨股酬交換與利率交換的評價與避險 / Asset Swap Under Stochastic Interest Rate__The Pricing and Hedging of Cross-Currency Equity Swap and Interest Rate Swap

姜碧嘉, Chiang, Bi-Chia Unknown Date (has links)
雖然跨通貨股酬交換在國際投資市場扮演著重要的角色,但文獻上關於股酬交換評價模式的相關探討並不多,且多集中於國內市場或以本國貨幣做為支付幣別的股酬交換。對於跨通貨股酬交換而言,其評價模式較國內股酬交換之評價模式複雜許多,如何將影響其價值之股價指數、匯率與利率此三個主要因子間的交互相關性同時加入考量,即是此產品之評價過程的重點。 本文在完全市場的假設下,同時放寬傳統評價方法之各變數之相關係數為固定值的假設,提出一新的股酬交換評價方法,即以『兩階段兩步驟』之較具經濟含意的複製方式,推導出股酬交換的一般化評價公式。透過此複製方法,可更清楚得知股酬交換於存續期間的價值變動,更可進一步求得其避險方式,以提供股酬交換交易商在面臨不對稱風險(mismatch risk)時的避險方法。而本文的第二個貢獻在於,將本文所提出之『兩階段兩步驟』的複製方法應用於利率交換的評價上,推導出跨通貨利率交換的一般化評價模式,以進一步比較股酬交換與利率交換此兩種商品的差異性,並試圖釐清市場上對於跨通貨股酬交換評價上的誤解。 與傳統評價公式最大的差異在於:本文評價公式額外考慮了一修正項,複製投資組合可藉由此修正項,對未來各參數間的變動隨時做出調整,以使投資組合能完全複製跨通貨股酬交換的價值。 本文發現,對於國內投資人支付固定利率,以交換B市場的股價指數報酬,且以C國的貨幣做為支付幣別的跨通貨股酬交換而言,其價值除了受到當期利率期間結構的影響外,在期初或每期交換後,其價值與股價指數無直接關聯,但在兩支付間,其價值則會受到當時股價指數與前期股價指數之相對比例的影響。同時,C國對本國的未來匯率並未直接影響跨通貨股酬交換的價值。且若假設各國遠期利率的波動度為零下,則當B國股價指數與C國對本國的匯率呈現正關係或當B國股價指數與B國對本國的匯率呈現負關係時,跨通貨股酬交換的價值愈大。另外,市場上投資人通常誤認股酬交換的價值等於利率交換價值,對於股酬交換與利率交換的比較,本文發現在大多數的情況下,股酬交換的價值與利率交換的價值並不相等。
136

Semimartingales et Problématiques Récentes en Finance Quantitative

Kchia, Younes 30 September 2011 (has links) (PDF)
Dans cette thèse, nous étudions différentes problématiques d'actualité en finance quantitative. Le premier chapitre est dédié à la stabilité de la propriété de semimartingale après grossissement de la filtration de base. Nous étudions d'abord le grossissement progressif d'une filtration avec des temps aléatoires et montrons comment la décomposition de la semimartingale dans la filtration grossie est obtenue en utilisant un lien naturel entre la filtration grossie initiallement et celle grossie progressivement. Intuitivement, ce lien se résume au fait que ces deux filtrations coincident après le temps aléatoire. Nous précisons cette idée et l'utilisons pour établir des résultats connus pour certains et nouveaux pour d'autres dans le cas d'un grossissement de filtrations avec un seul temps aléatoire. Les méthodes sont alors étendues au cas de plusieurs temps aléatoires, sans aucune restriction sur l'ordre de ces temps. Nous étudions ensuite ces filtrations grossies du point de vue des rétrécissements des filtrations. Nous nous intéressons enfin au grossissement progressif de filtrations avec des processus. En utilisant des résultats de la convergence faible de tribus, nous établissons d'abord un théorème de convergence de semimartingales, que l'on appliquera dans un contexte de grossissement de filtrations avec un processus pour obtenir des conditions suffisantes pour qu'une semimartingale de la filtration de base reste une semimartingale dans la filtration grossie. Nous obtenons des premiers résultats basés sur un critère de type Jacod pour les incréments du processus utilisé pour grossir la filtration. Nous nous proposons d'appliquer ces résultats au cas d'un grossissement d'une filtration Brownienne avec une diffusion retournée en temps et nous retrouvons et généralisons quelques examples disponibles dans la littérature. Enfin, nous concentrons nos efforts sur le grossissement de filtrations avec un processus continu et obtenons deux nouveaux résultats. Le premier est fondé sur un critère de Jacod pour les temps d'atteinte successifs de certains niveaux et le second est fondé sur l'hypothèse que ces temps sont honnêtes. Nous donnons des examples et montrons comment cela peut constituer un premier pas vers des modèles dynamiques de traders initiés donnant naissance à des opportunités d'arbitrage nocives. Dans la filtration grossie, le terme à variation finie du processus de prix peut devenir singulier et des opportunités d'arbitrage (au sens de FLVR) apparaissent clairement dans ces modèles. Dans le deuxième chapitre, nous réconcilions les modèles structuraux et les modèles à forme réduite en risque de crédit, du point de vue de la contagion de crédit induite par le niveau d'information disponible à l'investisseur. Autrement dit, étant données de multiples firmes, nous nous intéressons au comportement de l'intensité de défaut (par rapport à une filtration de base) d'une firme donnée aux temps de défaut des autres firmes. Nous étudions d'abord cet effet sous des spécifications différentes de modèles structuraux et sous différents niveaux d'information, et tirons, par l'exemple, des conclusions positives sur la présence d'une contagion de crédit. Néanmoins, comme plusieurs exemples pratiques ont un coup calculatoire élevé, nous travaillons ensuite avec l'hypothèse simplificatrice que les temps de défaut admettent une densité conditionnelle par rapport à la filtration de base. Nous étendons alors des résultats classiques de la théorie de grossissement de filtrations avec des temps aléatoires aux temps aléatoires non-ordonnés admettant une densité conditionnelle et pouvons ainsi étendre l'approche classique de la modélisation à forme réduite du risque de crédit à ce cas général. Les intensités de défaut sont calculées et les formules de pricing établies, dévoilant comment la contagion de crédit apparaît naturellement dans ces modèles. Nous analysons ensuite l'impact d'ordonner les temps de défaut avant de grossir la filtration de base. Si cela n'a aucune importance pour le calcul des prix, l'effet est significatif dans le contexte du management de risque et devient encore plus prononcé pour les défauts très corrélés et asymétriquement distribués. Nous proposons aussi un schéma général pour la construction et la simulation des temps de défaut, étant donné qu'un modèle pour les densités conditionnelles a été choisi. Finalement, nous étudions des modèles de densités conditionnelles particuliers et la contagion de crédit induite par le niveau d'information disponible au sein de ces modèles. Dans le troisième chapitre, nous proposons une méthodologie pour la détection en temps réel des bulles financières. Après la crise de crédit de 2007, les bulles financières ont à nouveau émergé comme un sujet d'intéret pour différents acteurs du marché et plus particulièrement pour les régulateurs. Un problème ouvert est celui de déterminer si un actif est en période de bulle. Grâce à des progrès récents dans la caractérisation des bulles d'actifs en utilisant la théorie de pricing sous probabilité risque-neutre qui caractérise les processus de prix d'actifs en bulles comme étant des martingales locales strictes, nous apportons une première réponse fondée sur la volatilité du processus de prix de l'actif. Nous nous limitons au cas particulier où l'actif risqué est modélisé par une équation différentielle stochastique gouvernée par un mouvement Brownien. Ces modèles sont omniprésents dans la littérature académique et en pratique. Nos méthodes utilisent des techniques d'estimation non paramétrique de la fonction de volatilité, combinées aux méthodes d'extrapolation issues de la théorie des reproducing kernel Hilbert spaces. Nous illustrons ces techniques en utilisant différents actifs de la bulle internet (dot-com bubble)de la période 1998 - 2001, où les bulles sont largement acceptées comme ayant eu lieu. Nos résultats confirment cette assertion. Durant le mois de Mai 2011, la presse financière a spéculé sur l'existence d'une bulle d'actif après l'OPA sur LinkedIn. Nous analysons les prix de cet actif en nous basant sur les données tick des prix et confirmons que LinkedIn a connu une bulle pendant cette période. Le dernier chapitre traite des variances swaps échantillonnés en temps discret. Ces produits financiers sont des produits dérivés de volatilité qui tradent activement dans les marchés OTC. Pour déterminer les prix de ces swaps, une approximation en temps continu est souvent utilisée pour simplifier les calculs. L'intérêt de ce chapitre est d'étudier les conditions garantissant que cette approximation soit valable. Les premiers théorèmes caractérisent les conditions sous lesquelles les valeurs des variances swaps échantillonnés en temps discret sont finies, étant donné que les valeurs de l'approximation en temps continu sont finies. De manière étonnante, les valeurs des variances swaps échantillonnés en temps discret peuvent etre infinies pour des modèles de prix raisonnables, ce qui rend la pratique de marché d'utiliser l'approximation en temps continu invalide. Des examples sont fournis. En supposant ensuite que le payoff en temps discret et son approximation en temps continu ont des prix finis, nous proposons des conditions suffisantes pour qu'il y ait convergence de la version discrète vers la version continue. Comme le modèle à volatilité stochastique 3/2 est de plus en plus populaire, nous lui appliquons nos résultats. Bien que nous pouvons démontrer que les deux valeurs des variances swaps sont finies, nous ne pouvons démontrer la convergence de l'approximation que pour certaines valeurs des paramètres du modèle.
137

General-purpose optimization through information maximization

Lockett, Alan Justin 05 July 2012 (has links)
The primary goal of artificial intelligence research is to develop a machine capable of learning to solve disparate real-world tasks autonomously, without relying on specialized problem-specific inputs. This dissertation suggests that such machines are realistic: If No Free Lunch theorems were to apply to all real-world problems, then the world would be utterly unpredictable. In response, the dissertation proposes the information-maximization principle, which claims that the optimal optimization methods make the best use of the information available to them. This principle results in a new algorithm, evolutionary annealing, which is shown to perform well especially in challenging problems with irregular structure. / text
138

Inégalités de déviations, principe de déviations modérées et théorèmes limites pour des processus indexés par un arbre binaire et pour des modèles markoviens

Bitseki Penda, Siméon Valère 20 November 2012 (has links) (PDF)
Le contrôle explicite de la convergence des sommes convenablement normalisées de variables aléatoires, ainsi que l'étude du principe de déviations modérées associé à ces sommes constituent les thèmes centraux de cette thèse. Nous étudions principalement deux types de processus. Premièrement, nous nous intéressons aux processus indexés par un arbre binaire, aléatoire ou non. Ces processus ont été introduits dans la littérature afin d'étudier le mécanisme de la division cellulaire. Au chapitre 2, nous étudions les chaînes de Markov bifurcantes. Ces chaînes peuvent être vues comme une adaptation des chaînes de Markov "usuelles'' dans le cas où l'ensemble des indices à une structure binaire. Sous des hypothèses d'ergodicité géométrique uniforme et non-uniforme d'une chaîne de Markov induite, nous fournissons des inégalités de déviations et un principe de déviations modérées pour les chaînes de Markov bifurcantes. Au chapitre 3, nous nous intéressons aux processus bifurcants autorégressifs d'ordre p (). Ces processus sont une adaptation des processus autorégressifs linéaires d'ordre p dans le cas où l'ensemble des indices à une structure binaire. Nous donnons des inégalités de déviations, ainsi qu'un principe de déviations modérées pour les estimateurs des moindres carrés des paramètres "d'autorégression'' de ce modèle. Au chapitre 4, nous traitons des inégalités de déviations pour des chaînes de Markov bifurcantes sur un arbre de Galton-Watson. Ces chaînes sont une généralisation de la notion de chaînes de Markov bifurcantes au cas où l'ensemble des indices est un arbre de Galton-Watson binaire. Elles permettent dans le cas de la division cellulaire de prendre en compte la mort des cellules. Les hypothèses principales que nous faisons dans ce chapitre sont : l'ergodicité géométrique uniforme d'une chaîne de Markov induite et la non-extinction du processus de Galton-Watson associé. Au chapitre 5, nous nous intéressons aux modèles autorégressifs linéaires d'ordre 1 ayant des résidus corrélés. Plus particulièrement, nous nous concentrons sur la statistique de Durbin-Watson. La statistique de Durbin-Watson est à la base des tests de Durbin-Watson, qui permettent de détecter l'autocorrélation résiduelle dans des modèles autorégressifs d'ordre 1. Nous fournissons un principe de déviations modérées pour cette statistique. Les preuves du principe de déviations modérées des chapitres 2, 3 et 4 reposent essentiellement sur le principe de déviations modérées des martingales. Les inégalités de déviations sont établies principalement grâce à l'inégalité d'Azuma-Bennet-Hoeffding et l'utilisation de la structure binaire des processus. Le chapitre 5 est né de l'importance qu'a l'ergodicité explicite des chaînes de Markov au chapitre 3. L'ergodicité géométrique explicite des processus de Markov à temps discret et continu ayant été très bien étudiée dans la littérature, nous nous sommes penchés sur l'ergodicité sous-exponentielle des processus de Markov à temps continu. Nous fournissons alors des taux explicites pour la convergence sous exponentielle d'un processus de Markov à temps continu vers sa mesure de probabilité d'équilibre. Les hypothèses principales que nous utilisons sont : l'existence d'une fonction de Lyapunov et d'une condition de minoration. Les preuves reposent en grande partie sur la construction du couplage et le contrôle explicite de la queue du temps de couplage.
139

Quelques problèmes en analyse harmonique non commutative / Some problems on noncommutative harmonique analysis

Hong, Guixiang 29 September 2012 (has links)
Quelques problèmes en analyse harmonique non commutative / Some problems on noncommutative harmonique analysis
140

Statistical Design of Sequential Decision Making Algorithms

Chi-hua Wang (12469251) 27 April 2022 (has links)
<p>Sequential decision-making is a fundamental class of problem that motivates algorithm designs of online machine learning and reinforcement learning. Arguably, the resulting online algorithms have supported modern online service industries for their data-driven real-time automated decision making. The applications span across different industries, including dynamic pricing (Marketing), recommendation (Advertising), and dosage finding (Clinical Trial). In this dissertation, we contribute fundamental statistical design advances for sequential decision-making algorithms, leaping progress in theory and application of online learning and sequential decision making under uncertainty including online sparse learning, finite-armed bandits, and high-dimensional online decision making. Our work locates at the intersection of decision-making algorithm designs, online statistical machine learning, and operations research, contributing new algorithms, theory, and insights to diverse fields including optimization, statistics, and machine learning.</p> <p><br></p> <p>In part I, we contribute a theoretical framework of continuous risk monitoring for regularized online statistical learning. Such theoretical framework is desirable for modern online service industries on monitoring deployed model's performance of online machine learning task. In the first project (Chapter 1), we develop continuous risk monitoring for the online Lasso procedure and provide an always-valid algorithm for high-dimensional dynamic pricing problems. In the second project (Chapter 2), we develop continuous risk monitoring for online matrix regression and provide new algorithms for rank-constrained online matrix completion problems. Such theoretical advances are due to our elegant interplay between non-asymptotic martingale concentration theory and regularized online statistical machine learning.</p> <p><br></p> <p>In part II, we contribute a bootstrap-based methodology for finite-armed bandit problems, termed Residual Bootstrap exploration. Such a method opens a possibility to design model-agnostic bandit algorithms without problem-adaptive optimism-engineering and instance-specific prior-tuning. In the first project (Chapter 3), we develop residual bootstrap exploration for multi-armed bandit algorithms and shows its easy generalizability to bandit problems with complex or ambiguous reward structure. In the second project (Chapter 4), we develop a theoretical framework for residual bootstrap exploration in linear bandit with fixed action set. Such methodology advances are due to our development of non-asymptotic theory for the bootstrap procedure.</p> <p><br></p> <p>In part III, we contribute application-driven insights on the exploration-exploitation dilemma for high-dimensional online decision-making problems. Such insights help practitioners to implement effective high-dimensional statistics methods to solve online decisionmaking problems. In the first project (Chapter 5), we develop a bandit sampling scheme for online batch high-dimensional decision making, a practical scenario in interactive marketing, and sequential clinical trials. In the second project (Chapter 6), we develop a bandit sampling scheme for federated online high-dimensional decision-making to maintain data decentralization and perform collaborated decisions. These new insights are due to our new bandit sampling design to address application-driven exploration-exploitation trade-offs effectively. </p>

Page generated in 0.057 seconds