• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 37
  • 8
  • 2
  • 2
  • 2
  • 1
  • 1
  • Tagged with
  • 56
  • 26
  • 20
  • 19
  • 12
  • 10
  • 9
  • 9
  • 7
  • 6
  • 6
  • 6
  • 6
  • 6
  • 5
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
51

Decentralized Algorithms for Wasserstein Barycenters

Dvinskikh, Darina 29 October 2021 (has links)
In dieser Arbeit beschäftigen wir uns mit dem Wasserstein Baryzentrumproblem diskreter Wahrscheinlichkeitsmaße sowie mit dem population Wasserstein Baryzentrumproblem gegeben von a Fréchet Mittelwerts von der rechnerischen und statistischen Seiten. Der statistische Fokus liegt auf der Schätzung der Stichprobengröße von Maßen zur Berechnung einer Annäherung des Fréchet Mittelwerts (Baryzentrum) der Wahrscheinlichkeitsmaße mit einer bestimmten Genauigkeit. Für empirische Risikominimierung (ERM) wird auch die Frage der Regularisierung untersucht zusammen mit dem Vorschlag einer neuen Regularisierung, die zu den besseren Komplexitätsgrenzen im Vergleich zur quadratischen Regularisierung beiträgt. Der Rechenfokus liegt auf der Entwicklung von dezentralen Algorithmen zurBerechnung von Wasserstein Baryzentrum: duale Algorithmen und Sattelpunktalgorithmen. Die Motivation für duale Optimierungsmethoden ist geschlossene Formen für die duale Formulierung von entropie-regulierten Wasserstein Distanz und ihren Derivaten, während, die primale Formulierung nur in einigen Fällen einen Ausdruck in geschlossener Form hat, z.B. für Gaußsches Maß. Außerdem kann das duale Orakel, das den Gradienten der dualen Darstellung für die entropie-regulierte Wasserstein Distanz zurückgibt, zu einem günstigeren Preis berechnet werden als das primale Orakel, das den Gradienten der (entropie-regulierten) Wasserstein Distanz zurückgibt. Die Anzahl der dualen Orakel rufe ist in diesem Fall ebenfalls weniger, nämlich die Quadratwurzel der Anzahl der primalen Orakelrufe. Im Gegensatz zum primalen Zielfunktion, hat das duale Zielfunktion Lipschitz-stetig Gradient aufgrund der starken Konvexität regulierter Wasserstein Distanz. Außerdem untersuchen wir die Sattelpunktformulierung des (nicht regulierten) Wasserstein Baryzentrum, die zum Bilinearsattelpunktproblem führt. Dieser Ansatz ermöglicht es uns auch, optimale Komplexitätsgrenzen zu erhalten, und kann einfach in einer dezentralen Weise präsentiert werden. / In this thesis, we consider the Wasserstein barycenter problem of discrete probability measures as well as the population Wasserstein barycenter problem given by a Fréchet mean from computational and statistical sides. The statistical focus is estimating the sample size of measures needed to calculate an approximation of a Fréchet mean (barycenter) of probability distributions with a given precision. For empirical risk minimization approaches, the question of the regularization is also studied along with proposing a new regularization which contributes to the better complexity bounds in comparison with the quadratic regularization. The computational focus is developing decentralized algorithms for calculating Wasserstein barycenters: dual algorithms and saddle point algorithms. The motivation for dual approaches is closed-forms for the dual formulation of entropy-regularized Wasserstein distances and their derivatives, whereas the primal formulation has a closed-form expression only in some cases, e.g., for Gaussian measures.Moreover, the dual oracle returning the gradient of the dual representation forentropy-regularized Wasserstein distance can be computed for a cheaper price in comparison with the primal oracle returning the gradient of the (entropy-regularized) Wasserstein distance. The number of dual oracle calls in this case will be also less, i.e., the square root of the number of primal oracle calls. Furthermore, in contrast to the primal objective, the dual objective has Lipschitz continuous gradient due to the strong convexity of regularized Wasserstein distances. Moreover, we study saddle-point formulation of the non-regularized Wasserstein barycenter problem which leads to the bilinear saddle-point problem. This approach also allows us to get optimal complexity bounds and it can be easily presented in a decentralized setup.
52

Géométrie des variétés, des espaces de mesures et des espaces de sous-groupes

Kloeckner, Benoît 03 December 2012 (has links) (PDF)
Ce mémoire présente des résultats dans trois directions. En géométrie riemannienne, on montre une généralisation de l'inégalité de Günther sur le volume, et en dimension 4 une inégalité isopérimétrique pour les variétés à courbure majorée. En géométrie des espaces de Wasserstein, issus du transport optimal, on montre des résultats plongement et de non-plongement, on calcule des groupes d'isométries, et on étudie la dynamique de l'action sur les mesures des applications dilatantes du cercle. En topologie de Chabauty, on montre que l'espace des sous-groupes fermés de $R^n$ est simplement connexe.
53

Transport optimal : régularité et applications

Gallouët, Thomas 10 December 2012 (has links) (PDF)
Cette thèse comporte deux parties distinctes, toutes les deux liées à la théorie du transport optimal. Dans la première partie, nous considérons une variété riemannienne, deux mesures à densité régulière et un coût de transport, typiquement la distance géodésique quadratique et nous nous intéressons à la régularité de l'application de transport optimal. Le critère décisif à cette régularité s'avère être le signe du tenseur de Ma-Trudinger-Wang (MTW). Nous présentons tout d'abord une synthèse des travaux réalisés sur ce tenseur. Nous nous intéressons ensuite au lien entre la géométrie des lieux d'injectivité et le tenseur MTW. Nous montrons que dans de nombreux cas, la positivité du tenseur MTW implique la convexité des lieux d'injectivité. La deuxième partie de cette thèse est liée aux équations aux dérivées partielles. Certaines peuvent être considérées comme des flots gradients dans l'espace de Wasserstein W2. C'est le cas de l'équation de Keller-Segel en dimension 2. Pour cette équation nous nous intéressons au problème de quantification de la masse lors de l'explosion des solutions ; cette explosion apparaît lorsque la masse initiale est supérieure à un seuil critique Mc. Nous cherchons alors à montrer qu'elle consiste en la formation d'un Dirac de masse Mc. Nous considérons ici un modèle particulaire en dimension 1 ayant le même comportement que l'équation de Keller-Segel. Pour ce modèle nous exhibons des bassins d'attractions à l'intérieur desquels l'explosion se produit avec seulement le nombre critique de particules. Finalement nous nous intéressons au profil d'explosion : à l'aide d'un changement d'échelle parabolique nous montrons que la structure de l'explosion correspond aux points critiques d'une certaine fonctionnelle.
54

Contribution à l'étude des équations de Boltzmann, Kac et Keller-Segel à l'aide d'équations différentielles stochastiques non linéaires

Godinho, David 25 November 2013 (has links) (PDF)
L'objet de cette thèse est l'étude de l'asymptotique des collisions rasantes pour les équations de Kac et de Boltzmann ainsi que l'étude de la propagation du chaos pour l'équation de Keller-Segel dans un cadre sous-critique à l'aide d'équations différentielles stochastiques non linéaires. Le premier chapitre est consacré à l'équation de Kac avec un potentiel Maxwellien. Nous commençons par donner une vitesse de convergence explicite (que l'on pense être optimale) dans le cadre de l'asymptotique des collisions rasantes. Puis nous approchons la solution de l'équation de Kac dans le cadre général, ce qui nous permet de montrer la propagation du chaos pour un système de particules vers cette dernière de manière quantitative. Dans le deuxième chapitre, nous étudions l'asymptotique des collisions rasantes pour l'équation de Boltzmann avec des potentiels mous et de Coulomb. Nous donnons là encore des vitesses de convergence explicites (mais non optimales). Enfin dans le troisième et dernier chapitre, nous montrons la propagation du chaos pour l'équation de Keller-Segel dans un cadre sous-critique. Pour cela, nous utilisons des arguments de compacité (tension du système de particules).
55

Systèmes de particules en interaction, approche par flot de gradient dans l'espace de Wasserstein / Interacting particles systems, Wasserstein gradient flow approach

Laborde, Maxime 01 December 2016 (has links)
Depuis l’article fondateur de Jordan, Kinderlehrer et Otto en 1998, il est bien connu qu’une large classe d’équations paraboliques peuvent être vues comme des flots de gradient dans l’espace de Wasserstein. Le but de cette thèse est d’étendre cette théorie à certaines équations et systèmes qui n’ont pas exactement une structure de flot de gradient. Les interactions étudiées sont de différentes natures. Le premier chapitre traite des systèmes avec des interactions non locales dans la dérive. Nous étudions ensuite des systèmes de diffusions croisées s’appliquant aux modèles de congestion pour plusieurs populations. Un autre modèle étudié est celui où le couplage se trouve dans le terme de réaction comme les systèmes proie-prédateur avec diffusion ou encore les modèles de croissance tumorale. Nous étudierons enfin des systèmes de type nouveau où l’interaction est donnée par un problème de transport multi-marges. Une grande partie de ces problèmes est illustrée de simulations numériques. / Since 1998 and the seminal work of Jordan, Kinderlehrer and Otto, it is well known that a large class of parabolic equations can be seen as gradient flows in the Wasserstein space. This thesis is devoted to extensions of this theory to equations and systems which do not have exactly a gradient flow structure. We study different kind of couplings. First, we treat the case of nonlocal interactions in the drift. Then, we study cross diffusion systems which model congestion for several species. We are also interested in reaction-diffusion systems as diffusive prey-predator systems or tumor growth models. Finally, we introduce a new class of systems where the interaction is given by a multi-marginal transport problem. In many cases, we give numerical simulations to illustrate our theorical results.
56

Non-convex Bayesian Learning via Stochastic Gradient Markov Chain Monte Carlo

Wei Deng (11804435) 18 December 2021 (has links)
<div>The rise of artificial intelligence (AI) hinges on the efficient training of modern deep neural networks (DNNs) for non-convex optimization and uncertainty quantification, which boils down to a non-convex Bayesian learning problem. A standard tool to handle the problem is Langevin Monte Carlo, which proposes to approximate the posterior distribution with theoretical guarantees. However, non-convex Bayesian learning in real big data applications can be arbitrarily slow and often fails to capture the uncertainty or informative modes given a limited time. As a result, advanced techniques are still required.</div><div><br></div><div>In this thesis, we start with the replica exchange Langevin Monte Carlo (also known as parallel tempering), which is a Markov jump process that proposes appropriate swaps between exploration and exploitation to achieve accelerations. However, the na\"ive extension of swaps to big data problems leads to a large bias, and the bias-corrected swaps are required. Such a mechanism leads to few effective swaps and insignificant accelerations. To alleviate this issue, we first propose a control variates method to reduce the variance of noisy energy estimators and show a potential to accelerate the exponential convergence. We also present the population-chain replica exchange and propose a generalized deterministic even-odd scheme to track the non-reversibility and obtain an optimal round trip rate. Further approximations are conducted based on stochastic gradient descents, which yield a user-friendly nature for large-scale uncertainty approximation tasks without much tuning costs. </div><div><br></div><div>In the second part of the thesis, we study scalable dynamic importance sampling algorithms based on stochastic approximation. Traditional dynamic importance sampling algorithms have achieved successes in bioinformatics and statistical physics, however, the lack of scalability has greatly limited their extensions to big data applications. To handle this scalability issue, we resolve the vanishing gradient problem and propose two dynamic importance sampling algorithms based on stochastic gradient Langevin dynamics. Theoretically, we establish the stability condition for the underlying ordinary differential equation (ODE) system and guarantee the asymptotic convergence of the latent variable to the desired fixed point. Interestingly, such a result still holds given non-convex energy landscapes. In addition, we also propose a pleasingly parallel version of such algorithms with interacting latent variables. We show that the interacting algorithm can be theoretically more efficient than the single-chain alternative with an equivalent computational budget.</div>

Page generated in 0.1265 seconds