Global ETD Search

1	Versions vectorielles de la description de sous-espaces invariants du shift et de bases de noyaux reproduisants dans certains espaces de fonctions holomorphes. Chevrot, Nicolas 30 November 2006 (has links) (PDF) Sarason a décrit les sous-espaces fermés réduisants (invariants par $S$, opérateur de multiplication par $z$, et par $S^$) et<br />doublement-invariants (invariants par $S$ et $S^{-1}$) de l'espace de Hardy $H^2(A)$ où $A$ est un anneau. Nous établissons les versions vectorielles.<br /><br /> Nous donnons aussi la version vectorielle d'un résultat de Hitt<br />portant sur les sous-espaces $S^{}-$faiblement<br />invariants via l'étude des contractions perturbées par des opérateurs de<br />rang fini.\\<br /><br />Dans la seconde partie, nous étudions les bases de<br />noyaux reproduisants sur les espaces de De Branges--Rovnyak, au moyen du modèle de Sz-nagy--Foias. <br />Le dernier problème présenté est de caractériser les opérateurs $T\in \LL(\HH)$ complexes symétriques. Nous en donnons des classes d'exemples. [MATH] Mathematics Espaces de Hardy sous-espaces invariants shift modèle fonctionnel bases de noyaux reproduisants opérateur complexe symétrique
2	Modélisation comportementale de systèmes non-linéaires multivariables par méthodes à noyaux et applications Vazquez, Emmanuel 12 May 2005 (has links) (PDF) Les méthodes de prédiction linéaire de processus aléatoires, ou krigeage, et les méthodes de régression régularisée par une norme d'espace hilbertien à noyau reproduisant (splines, approximation par fonctions de base radiales, régression à vecteurs de support, etc.) constituent deux approches fondamentales de modélisation comportementale de systèmes non-linéaires. Les liens mathématiques entre ces deux approches ont été mentionnés à plusieurs reprises dans le passé. Fort peu exploités, ces liens n'en restent pas moins fondamentaux puisqu'ils permettent par exemple de comprendre comment formuler le problème de régression régularisée pour l'approximation de fonctions à valeurs vectorielles (cas des systèmes multivariables dits MIMO). Dans les deux approches, le choix du noyau est essentiel car il conditionne la qualité des modèles. Les principaux résultats théoriques sont issus de travaux en statistiques. Bien que de type asymptotique, ils ont des conséquences pratiques importantes rappelées et illustrées dans cette étude. Les noyaux considérés habituellement forment une famille restreinte offrant relativement peu de souplesse. Ceci nous a suggéré de développer des méthodes assemblant un noyau à partir d'un grand nombre de noyaux élémentaires. Elles ont permis d'obtenir des résultats satisfaisants notamment sur un problème test classique issu du domaine de la prédiction de séries chronologiques. Enfin, ce travail s'attache à montrer comment utiliser les méthodes de régression à noyaux à travers la présentation de problèmes réels. Le choix de noyau est abordé en pratique. La prise en compte d'informations disponibles a priori par utilisation du krigeage intrinsèque (régression semi-régularisée) est illustrée. Finalement, des éléments de planification d'expériences sont discutés. modélisation comportementale système non-linéaire krigeage méthodes à noyaux reproduisants
3	Apprentissage de modèles de mélange à large échelle par Sketching / Sketching for large-scale learning of mixture models Keriven, Nicolas 12 October 2017 (has links) Les bases de données modernes sont de très grande taille, parfois divisées et distribuées sur plusieurs lieux de stockage, ou encore sous forme de flux de données : ceci soulève de nouveaux défis majeurs pour les méthodes d’apprentissage statistique. Une des méthodes récentes capable de s’adapter à ces situations consiste à d’abord compresser les données en une structure appelée sketch linéaire, puis ensuite de réaliser la tâche d’apprentissage en utilisant uniquement ce sketch, ce qui est extrêmement rapide si celui-ci est de petite taille. Dans cette thèse, nous définissons une telle méthode pour estimer un modèle de mélange de distributions de probabilités à partir des données, en utilisant uniquement un sketch de celles-ci. Ce sketch est défini en s’inspirant de plusieurs notions venant du domaine des méthodes à noyaux : le plongement par noyau moyen et les approximations aléatoires de noyaux. Défini comme tel, le sketch correspond à des mesures linéaires de la distribution de probabilité sous-jacente aux données. Ainsi nous analysons le problème en utilisant des outils venant du domaine de l’acquisition comprimée, dans lequel un signal est mesuré aléatoirement sans perte d’information, sous certaines conditions. Nous étendons certains résultats de l’acquisition comprimée à la dimension infinie, donnons des conditions génériques garantissant le succès de notre méthode d’estimation de modèles de mélanges, et les appliquons à plusieurs problèmes, dont notamment celui d’estimer des mélanges de distributions stables multivariées, pour lequel il n’existait à ce jour aucun estimateur. Notre analyse est basée sur la construction d’opérateurs de sketch construits aléatoirement, qui satisfont une Propriété d’Isométrie Restreinte dans l’espace de Banach des mesures finies signées avec forte probabilité. Dans une second partie, nous introduisons un algorithme glouton capable heuristiquement d’estimer un modèle de mélange depuis un sketch linéaire. Cet algorithme est appliqué sur données simulées et réelles à trois problèmes : l’estimation de centres significatifs dans les données, pour lequel on constate que la méthode de sketch est significativement plus rapide qu’un algorithme de k-moyennes classique, l’estimation de mélanges de Gaussiennes, pour lequel elle est plus rapide qu’un algorithme d’Espérance-Maximisation, et enfin l’estimation de mélange de distributions stables multivariées, pour lequel il n’existait à ce jour, à notre connaissance, aucun algorithme capable de réaliser une telle tâche. / Learning parameters from voluminous data can be prohibitive in terms of memory and computational requirements. Furthermore, new challenges arise from modern database architectures, such as the requirements for learning methods to be amenable to streaming, parallel and distributed computing. In this context, an increasingly popular approach is to first compress the database into a representation called a linear sketch, that satisfies all the mentioned requirements, then learn the desired information using only this sketch, which can be significantly faster than using the full data if the sketch is small. In this thesis, we introduce a generic methodology to fit a mixture of probability distributions on the data, using only a sketch of the database. The sketch is defined by combining two notions from the reproducing kernel literature, namely kernel mean embedding and Random Features expansions. It is seen to correspond to linear measurements of the underlying probability distribution of the data, and the estimation problem is thus analyzed under the lens of Compressive Sensing (CS), in which a (traditionally finite-dimensional) signal is randomly measured and recovered. We extend CS results to our infinite-dimensional framework, give generic conditions for successful estimation and apply them analysis to many problems, with a focus on mixture models estimation. We base our method on the construction of random sketching operators such that some Restricted Isometry Property (RIP) condition holds in the Banach space of finite signed measures with high probability. In a second part we introduce a flexible heuristic greedy algorithm to estimate mixture models from a sketch. We apply it on synthetic and real data on three problems: the estimation of centroids from a sketch, for which it is seen to be significantly faster than k-means, Gaussian Mixture Model estimation, for which it is more efficient than Expectation-Maximization, and the estimation of mixtures of multivariate stable distributions, for which, to our knowledge, it is the only algorithm capable of performing such a task. Méthodes à noyaux reproduisants Traitement du signal et d'images Acquisition comprimée Compressive sensing Statistical learning Kernel methods Mixture models Random features : mean kernel
4	Sous-espaces hilbertiens, sous-dualités et applications MARY, Xavier 18 December 2003 (has links) (PDF) L'étude des fonctions de deux variables et des opérateurs intégraux associés, ou l'étude directe des noyaux au sens de L. Schwartz (définis comme opérateurs faiblement continus du dual topologique d'un espace vectoriel localement convexe dans lui même), est depuis plus d'un demi-siècle une branche des mathématiques en pleine expansion notamment dans le domaine des distributions, des équations différentielles ou dans le domaine des probabilités avec l'étude des mesures gaussiennes et<br />des processus gaussiens.<br /><br />Les travaux de Moore, Bergman et Aronszajn ont notamment abouti au résultat fondamental suivant qui concerne les noyaux positifs : il est toujours possible de construire un sous-espace préhilbertien à partir d'un noyau positif et, moyennant quelques hypothèses (faibles) supplémentaires, de compléter fonctionnellement cet espace afin d'obtenir alors un espace de Hilbert. Cet espace possède alors la propriété d'être continûment inclus dans l'espace vectoriel localement convexe de départ.<br />Il existe donc une relation forte entre noyaux positifs et espaces hilbertiens. Dans cette thèse, nous nous sommes posés le problème suivant : que se passe t'il si l'on lève l'hypothèse<br />de positivité ? D'hermicité ?<br /><br />Dans cette perspective nous considérons une seconde approche qui consiste à travailler directement sur des espaces vectoriels plutôt que sur les noyaux.<br />Précisément, adoptant une démarche classique en mathématiques, nous étudions les propriétés d'une classe d'espaces vérifiant des hypothèses additionnelles. Partant des espaces de Hilbert continûment inclus dans un espace localement convexe donné, cette approche a conduit aux espaces de Hilbert à noyau reproduisant de N. Aronszajn puis aux sous-espaces hilbertiens de L. Schwartz. Cette théorie est présentée dans la première partie de la thèse, le résultat majeur de cette théorie étant sans doute l'équivalence entre sous-espaces hilbertiens<br />et noyaux positifs, résumé par la phrase suivante :<br /><br />``Il existe une bijection entre sous-espaces hibertiens et noyaux positifs.''<br /><br />Le principal apport à la théorie existante est l'utilisation intensive de systèmes en dualité et de formes bilinéaires (et pas uniquement sesquilinéaires). De manière surprenante,<br />cela conduit à une certaine perte de symétrie qui porte les germes de la théorie des sous-dualités.<br /><br />Dans une seconde partie nous suivons encore les travaux de L. Schwartz et étudions la théorie moins connue des sous-espaces de Krein (ou sous-espaces hermitiens).<br />Les espaces de Krein ressemblent aux espaces de Hilbert mais sont munis d'un produit scalaire qui n'est plus nécessairement positif. Les sous-espaces de Krein constituent donc une première généralisation des sous-espaces hilbertiens. Un des principaux intérêt de l'étude de tels espaces réside en la disparition de l'équivalence fondamentale entre les notions de sous-espaces et de noyaux, même si une relation étroite subsiste. Nous étudions plus particulièrement les similitudes et les différences entre ces deux différentes théories, que nous retrouverons dans la théorie des sous-dualités.<br /><br />La troisième partie généralise la perte de symétrie évoquée dans le chapitre 1. Nous développons les bases d'une théorie non plus basée sur une structure hilbertienne, mais sur une certaine dualité.<br />Nous développons ainsi le concept de sous-dualité d'un espace vectoriel localement convexe (ou d'un système dual) et de son noyau associé.<br />Une sous-dualité est définie par un système de deux espaces en dualité vérifiant des conditions d'inclusion algébrique ou<br />topologique. Plus précisément :<br />un système dual $(E,F)$ est une sous-dualité d'un espace localement convexe $\cE$ (ou plus généralement d'un système dual $(\cE,\cF)$) si $E$ et $F$ sont faiblement continûment inclus dans $\cE$.<br />Dans ce cas, il est possible d'associer à cette sous-dualité un unique noyau d'image dense dans la sous-dualité. Nous étudions également l'effet d'une application linéaire faiblement continue. Il devient alors possible (moyennant une relation d'équivalence) de munir l'ensemble des sous-dualités d'une structure d'espace vectoriel qui le rend isomorphe algébriquement à l'espace vectoriels des noyaux. Nous exhibons ensuite un représentant canonique de ces classes d'équivalences, ce qui permet d'établir une bijection entre sous-dualités canoniques et noyaux.<br /><br />Une quatrième et dernière partie propose quelques applications. Le premier champ d'application possible est une généralisation du lien entre sous-espaces hilbertiens et mesures gaussiennes. Le second est l'étude d'opérateurs particuliers, les opérateurs dans les sous-dualités d'évaluation (sous-dualités de $\KK^(\Omega)$) et les opérateurs différentiels. [MATH] Mathematics sous-dualités sous-espaces hilbertiens espaces à noyau reproduisant noyaux reproduisants dualité opérateur de Green <br />opérateur à noyau symbole de Berezin
5	Stochastic approximation in Hilbert spaces / Approximation stochastique dans les espaces de Hilbert Dieuleveut, Aymeric 28 September 2017 (has links) Le but de l’apprentissage supervisé est d’inférer des relations entre un phénomène que l’on souhaite prédire et des variables « explicatives ». À cette fin, on dispose d’observations de multiples réalisations du phénomène, à partir desquelles on propose une règle de prédiction. L’émergence récente de sources de données à très grande échelle, tant par le nombre d’observations effectuées (en analyse d’image, par exemple) que par le grand nombre de variables explicatives (en génétique), a fait émerger deux difficultés : d’une part, il devient difficile d’éviter l’écueil du sur-apprentissage lorsque le nombre de variables explicatives est très supérieur au nombre d’observations; d’autre part, l’aspect algorithmique devient déterminant, car la seule résolution d’un système linéaire dans les espaces en jeupeut devenir une difficulté majeure. Des algorithmes issus des méthodes d’approximation stochastique proposent uneréponse simultanée à ces deux difficultés : l’utilisation d’une méthode stochastique réduit drastiquement le coût algorithmique, sans dégrader la qualité de la règle de prédiction proposée, en évitant naturellement le sur-apprentissage. En particulier, le cœur de cette thèse portera sur les méthodes de gradient stochastique. Les très populaires méthodes paramétriques proposent comme prédictions des fonctions linéaires d’un ensemble choisi de variables explicatives. Cependant, ces méthodes aboutissent souvent à une approximation imprécise de la structure statistique sous-jacente. Dans le cadre non-paramétrique, qui est un des thèmes centraux de cette thèse, la restriction aux prédicteurs linéaires est levée. La classe de fonctions dans laquelle le prédicteur est construit dépend elle-même des observations. En pratique, les méthodes non-paramétriques sont cruciales pour diverses applications, en particulier pour l’analyse de données non vectorielles, qui peuvent être associées à un vecteur dans un espace fonctionnel via l’utilisation d’un noyau défini positif. Cela autorise l’utilisation d’algorithmes associés à des données vectorielles, mais exige une compréhension de ces algorithmes dans l’espace non-paramétrique associé : l’espace à noyau reproduisant. Par ailleurs, l’analyse de l’estimation non-paramétrique fournit également un éclairage révélateur sur le cadre paramétrique, lorsque le nombre de prédicteurs surpasse largement le nombre d’observations. La première contribution de cette thèse consiste en une analyse détaillée de l’approximation stochastique dans le cadre non-paramétrique, en particulier dans le cadre des espaces à noyaux reproduisants. Cette analyse permet d’obtenir des taux de convergence optimaux pour l’algorithme de descente de gradient stochastique moyennée. L’analyse proposée s’applique à de nombreux cadres, et une attention particulière est portée à l’utilisation d’hypothèses minimales, ainsi qu’à l’étude des cadres où le nombre d’observations est connu à l’avance, ou peut évoluer. La seconde contribution est de proposer un algorithme, basé sur un principe d’accélération, qui converge à une vitesse optimale, tant du point de vue de l’optimisation que du point de vue statistique. Cela permet, dans le cadre non-paramétrique, d’améliorer la convergence jusqu’au taux optimal, dans certains régimes pour lesquels le premier algorithme analysé restait sous-optimal. Enfin, la troisième contribution de la thèse consiste en l’extension du cadre étudié au delà de la perte des moindres carrés : l’algorithme de descente de gradient stochastiqueest analysé comme une chaine de Markov. Cette approche résulte en une interprétation intuitive, et souligne les différences entre le cadre quadratique et le cadre général. Une méthode simple permettant d’améliorer substantiellement la convergence est également proposée. / The goal of supervised machine learning is to infer relationships between a phenomenon one seeks to predict and “explanatory” variables. To that end, multiple occurrences of the phenomenon are observed, from which a prediction rule is constructed. The last two decades have witnessed the apparition of very large data-sets, both in terms of the number of observations (e.g., in image analysis) and in terms of the number of explanatory variables (e.g., in genetics). This has raised two challenges: first, avoiding the pitfall of over-fitting, especially when the number of explanatory variables is much higher than the number of observations; and second, dealing with the computational constraints, such as when the mere resolution of a linear system becomes a difficulty of its own. Algorithms that take their roots in stochastic approximation methods tackle both of these difficulties simultaneously: these stochastic methods dramatically reduce the computational cost, without degrading the quality of the proposed prediction rule, and they can naturally avoid over-fitting. As a consequence, the core of this thesis will be the study of stochastic gradient methods. The popular parametric methods give predictors which are linear functions of a set ofexplanatory variables. However, they often result in an imprecise approximation of the underlying statistical structure. In the non-parametric setting, which is paramount in this thesis, this restriction is lifted. The class of functions from which the predictor is proposed depends on the observations. In practice, these methods have multiple purposes, and are essential for learning with non-vectorial data, which can be mapped onto a vector in a functional space using a positive definite kernel. This allows to use algorithms designed for vectorial data, but requires the analysis to be made in the non-parametric associated space: the reproducing kernel Hilbert space. Moreover, the analysis of non-parametric regression also sheds some light on the parametric setting when the number of predictors is much larger than the number of observations. The first contribution of this thesis is to provide a detailed analysis of stochastic approximation in the non-parametric setting, precisely in reproducing kernel Hilbert spaces. This analysis proves optimal convergence rates for the averaged stochastic gradient descent algorithm. As we take special care in using minimal assumptions, it applies to numerous situations, and covers both the settings in which the number of observations is known a priori, and situations in which the learning algorithm works in an on-line fashion. The second contribution is an algorithm based on acceleration, which converges at optimal speed, both from the optimization point of view and from the statistical one. In the non-parametric setting, this can improve the convergence rate up to optimality, even inparticular regimes for which the first algorithm remains sub-optimal. Finally, the third contribution of the thesis consists in an extension of the framework beyond the least-square loss. The stochastic gradient descent algorithm is analyzed as a Markov chain. This point of view leads to an intuitive and insightful interpretation, that outlines the differences between the quadratic setting and the more general setting. A simple method resulting in provable improvements in the convergence is then proposed. Approximation stochastique Optimisation convexe Apprentissage supervisé Estimation non-paramétrique Stochastic approximation Convex optimization Supervised learning Nonparametric estimation Reproducing kernel Hilbert spaces 510
6	Generalization bounds for random samples in Hilbert spaces / Estimation statistique dans les espaces de Hilbert Giulini, Ilaria 24 September 2015 (has links) Ce travail de thèse porte sur l'obtention de bornes de généralisation pour des échantillons statistiques à valeur dans des espaces de Hilbert définis par des noyaux reproduisants. L'approche consiste à obtenir des bornes non asymptotiques indépendantes de la dimension dans des espaces de dimension finie, en utilisant des inégalités PAC-Bayesiennes liées à une perturbation Gaussienne du paramètre et à les étendre ensuite aux espaces de Hilbert séparables. On se pose dans un premier temps la question de l'estimation de l'opérateur de Gram à partir d'un échantillon i. i. d. par un estimateur robuste et on propose des bornes uniformes, sous des hypothèses faibles de moments. Ces résultats permettent de caractériser l'analyse en composantes principales indépendamment de la dimension et d'en proposer des variantes robustes. On propose ensuite un nouvel algorithme de clustering spectral. Au lieu de ne garder que la projection sur les premiers vecteurs propres, on calcule une itérée du Laplacian normalisé. Cette itération, justifiée par l'analyse du clustering en termes de chaînes de Markov, opère comme une version régularisée de la projection sur les premiers vecteurs propres et permet d'obtenir un algorithme dans lequel le nombre de clusters est déterminé automatiquement. On présente des bornes non asymptotiques concernant la convergence de cet algorithme, lorsque les points à classer forment un échantillon i. i. d. d'une loi à support compact dans un espace de Hilbert. Ces bornes sont déduites des bornes obtenues pour l'estimation d'un opérateur de Gram dans un espace de Hilbert. On termine par un aperçu de l'intérêt du clustering spectral dans le cadre de l'analyse d'images. / This thesis focuses on obtaining generalization bounds for random samples in reproducing kernel Hilbert spaces. The approach consists in first obtaining non-asymptotic dimension-free bounds in finite-dimensional spaces using some PAC-Bayesian inequalities related to Gaussian perturbations and then in generalizing the results in a separable Hilbert space. We first investigate the question of estimating the Gram operator by a robust estimator from an i. i. d. sample and we present uniform bounds that hold under weak moment assumptions. These results allow us to qualify principal component analysis independently of the dimension of the ambient space and to propose stable versions of it. In the last part of the thesis we present a new algorithm for spectral clustering. It consists in replacing the projection on the eigenvectors associated with the largest eigenvalues of the Laplacian matrix by a power of the normalized Laplacian. This iteration, justified by the analysis of clustering in terms of Markov chains, performs a smooth truncation. We prove nonasymptotic bounds for the convergence of our spectral clustering algorithm applied to a random sample of points in a Hilbert space that are deduced from the bounds for the Gram operator in a Hilbert space. Experiments are done in the context of image analysis. Opérateur de Gram Data analysis in high dimension PAC-Bayesian learning Principal component analysis Spectral clustering Reproducing kernel Hilbert spaces Kernel methods Gram operator Covariance matrix 510
7	Inférence de réseaux d'interaction protéine-protéine par apprentissage statistique Brouard, Céline 14 February 2013 (has links) (PDF) L'objectif de cette thèse est de développer des outils de prédiction d'interactions entre protéines qui puissent être appliqués en particulier chez l'homme, sur les protéines qui constituent un réseau avec la protéine CFTR. Cette protéine, lorsqu'elle est défectueuse, est impliquée dans la mucoviscidose. Le développement de méthodes de prédiction in silico peut s'avérer utile pour suggérer aux biologistes de nouvelles cibles d'interaction et pour mieux expliquer les fonctions des protéines présentes dans ce réseau. Nous proposons une nouvelle méthode pour le problème de la prédiction de liens dans un réseau. Afin de bénéficier de l'information des données non étiquetées, nous nous plaçons dans le cadre de l'apprentissage semi-supervisé. Nous abordons ce problème de prédiction comme une tâche d'apprentissage d'un noyau de sortie, appelée régression à noyau de sortie. Un noyau de sortie est supposé coder les proximités existantes entre les noeuds du graphe et l'objectif est d'approcher ce noyau à partir de descriptions appropriées en entrée. L'utilisation de l'astuce du noyau dans l'ensemble de sortie permet de réduire le problème d'apprentissage à partir de paires à un problème d'apprentissage d'une fonction d'une seule variable à valeurs dans un espace de Hilbert. En choisissant les fonctions candidates pour la régression dans un espace de Hilbert à noyau reproduisant à valeur opérateur, nous développons, comme dans le cas de fonctions à valeurs scalaires, des outils de régularisation. Nous établissons en particulier des théorèmes de représentation dans le cas supervisé et dans le cas semi-supervisé, que nous utilisons ensuite pour définir de nouveaux modèles de régression pour différentes fonctions de coût, appelés IOKR-ridge et IOKR-margin. Nous avons d'abord testé l'approche développée sur des données artificielles, des problèmes test ainsi que sur un réseau d'interaction protéine-protéine chez la levure S. Cerevisiae et obtenu de très bons résultats. Puis nous l'avons appliquée à la prédiction d'interactions entre protéines dans le cas d'un réseau construit autour de la protéine CFTR. interactions protéine-protéine prédiction de liens méthodes à noyaux apprentissage semi-supervisé noyau à valeur opérateur régression à noyau de sortie sorties structurées

1

Page generated in 0.0851 seconds