• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 72
  • 31
  • 8
  • 7
  • 5
  • 5
  • 4
  • 4
  • 3
  • 3
  • 1
  • 1
  • 1
  • 1
  • 1
  • Tagged with
  • 145
  • 31
  • 29
  • 22
  • 17
  • 16
  • 15
  • 15
  • 14
  • 14
  • 14
  • 13
  • 13
  • 13
  • 13
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
91

Méthodes d'apprentissage statistique pour le ranking théorie, algorithmes et applications

Robbiano, Sylvain 19 June 2013 (has links) (PDF)
Le ranking multipartite est un problème d'apprentissage statistique qui consiste à ordonner les observations qui appartiennent à un espace de grande dimension dans le même ordre que les labels, de sorte que les observations avec le label le plus élevé apparaissent en haut de la liste. Cette thèse vise à comprendre la nature probabiliste du problème de ranking multipartite afin d'obtenir des garanties théoriques pour les algorithmes de ranking. Dans ce cadre, la sortie d'un algorithme de ranking prend la forme d'une fonction de scoring, une fonction qui envoie l'espace des observations sur la droite réelle et l'ordre final est construit en utilisant l'ordre induit par la droite réelle. Les contributions de ce manuscrit sont les suivantes : d'abord, nous nous concentrons sur la caractérisation des solutions optimales de ranking multipartite. Une nouvelle condition sur les rapports de vraisemblance est introduite et jugée nécessaire et suffisante pour rendre le problème de ranking multipartite bien posé. Ensuite, nous examinons les critères pour évaluer la fonction de scoring et on propose d'utiliser une généralisation de la courbe ROC nommée la surface ROC pour cela ainsi que le volume induit par cette surface. Pour être utilisée dans les applications, la contrepartie empirique de la surface ROC est étudiée et les résultats sur sa consistance sont établis. Le deuxième thème de recherche est la conception d'algorithmes pour produire des fonctions de scoring. La première procédure est basée sur l'agrégation des fonctions de scoring apprises sur des sous-problèmes de ranking binaire. Dans le but d'agréger les ordres induits par les fonctions de scoring, nous utilisons une approche métrique basée sur le de Kendall pour trouver une fonction de scoring médiane. La deuxième procédure est une méthode récursive, inspirée par l'algorithme TreeRank qui peut être considéré comme une version pondérée de CART. Une simple modification est proposée pour obtenir une approximation de la surface ROC optimale en utilisant une fonction de scoring constante par morceaux. Ces procédures sont comparées aux algorithmes de l'état de l'art pour le ranking multipartite en utilisant des jeux de données réelles et simulées. Les performances mettent en évidence les cas où nos procédures sont bien adaptées, en particulier lorsque la dimension de l'espace des caractéristiques est beaucoup plus grand que le nombre d'étiquettes. Enfin, nous revenons au problème de ranking binaire afin d'établir des vitesses minimax adaptatives de convergence. Ces vitesses sont montrées pour des classes de distributions contrôlées par la complexité de la distribution a posteriori et une condition de faible bruit. La procédure qui permet d'atteindre ces taux est basée sur des estimateurs de type plug-in de la distribution a posteriori et une méthode d'agrégation utilisant des poids exponentiels.
92

Sur la notion d'optimalité dans les problèmes de bandit stochastique / On the notion of optimality in the stochastic multi-armed bandit problems

Ménard, Pierre 03 July 2018 (has links)
Cette thèse s'inscrit dans les domaines de l'apprentissage statistique et de la statistique séquentielle. Le cadre principal est celui des problèmes de bandit stochastique à plusieurs bras. Dans une première partie, on commence par revisiter les bornes inférieures sur le regret. On obtient ainsi des bornes non-asymptotiques dépendantes de la distribution que l'on prouve de manière très simple en se limitant à quelques propriétés bien connues de la divergence de Kullback-Leibler. Puis, on propose des algorithmes pour la minimisation du regret dans les problèmes de bandit stochastique paramétrique dont les bras appartiennent à une certaine famille exponentielle ou non-paramétrique en supposant seulement que les bras sont à support dans l'intervalle unité, pour lesquels on prouve l'optimalité asymptotique (au sens de la borne inférieure de Lai et Robbins) et l'optimalité minimax. On analyse aussi la complexité pour l'échantillonnage séquentielle visant à identifier la distribution ayant la moyenne la plus proche d'un seuil fixé, avec ou sans l'hypothèse que les moyennes des bras forment une suite croissante. Ce travail est motivé par l'étude des essais cliniques de phase I, où l'hypothèse de croissance est naturelle. Finalement, on étend l'inégalité de Fano qui contrôle la probabilité d'évènements disjoints avec une moyenne de divergences de Kullback-leibler à des variables aléatoires arbitraires bornées sur l'intervalle unité. Plusieurs nouvelles applications en découlent, les plus importantes étant une borne inférieure sur la vitesse de concentration de l'a posteriori Bayésien et une borne inférieure sur le regret pour un problème de bandit non-stochastique. / The topics addressed in this thesis lie in statistical machine learning and sequential statistic. Our main framework is the stochastic multi-armed bandit problems. In this work we revisit lower bounds on the regret. We obtain non-asymptotic, distribution-dependent bounds and provide simple proofs based only on well-known properties of Kullback-Leibler divergence. These bounds show in particular that in the initial phase the regret grows almost linearly, and that the well-known logarithmic growth of the regret only holds in a final phase. Then, we propose algorithms for regret minimization in stochastic bandit models with exponential families of distributions or with distribution only assumed to be supported by the unit interval, that are simultaneously asymptotically optimal (in the sense of Lai and Robbins lower bound) and minimax optimal. We also analyze the sample complexity of sequentially identifying the distribution whose expectation is the closest to some given threshold, with and without the assumption that the mean values of the distributions are increasing. This work is motivated by phase I clinical trials, a practically important setting where the arm means are increasing by nature. Finally we extend Fano's inequality, which controls the average probability of (disjoint) events in terms of the average of some Kullback-Leibler divergences, to work with arbitrary unit-valued random variables. Several novel applications are provided, in which the consideration of random variables is particularly handy. The most important applications deal with the problem of Bayesian posterior concentration (minimax or distribution-dependent) rates and with a lower bound on the regret in non-stochastic sequential learning.
93

備兌型認購權證避險策略與績效之評估

范雅琁 Unknown Date (has links)
備兌型認購權證的發行者,會因為調整避險部位而產生損益,一旦避險不當,避險的損失甚至會侵蝕發行時的權利金收入。本研究分別針對避險帶避險法、Gamma避險法以及Minimax避險法三種避險策略作模擬。在績效評估方面,本文主要以風險值(VaR)衡量風險,以反映避險損失時的下方風險。為了與VaR指標作一比較,本文也將information ratio績效評估的方法納入,同時為了觀察避險誤差與交易成本的抵換關係,本文也以避險誤差與交易成本之總和作為一項績效評估的指標。本文發現: 1.在價平發行時,採用Gamma避險法的績效最高,最適的風險係數為1;在20%價外發行時,採用Minimax避險法的績效最高;40%價外發行時,採用Gamma避險法的績效最高,最適風險係數為1.5;20%價內發行時,採用避險帶避險法的績效最高,最適寬度為7%;40%價內發行時,也是避險帶避險法的績效最高,最適寬度為8%。 2.使用VaR衡量下方風險時,避險帶避險法主要適用於價內發行,Gamma避險法適用於深價外發行與價平發行,Minimax避險法適用於輕度價外發行。
94

Estimation adaptative par sélection de partitions en rectangles dyadiques

Akakpo, Nathalie 07 December 2009 (has links) (PDF)
Dans cette thèse, nous étudions divers problèmes d'estimation par sélection d'estimateurs constants ou polynomiaux par morceaux sur des partitions en intervalles ou rectangles dyadiques, en utilisant un critère de type moindres carrés pénalisé adéquat. Nos travaux portent sur trois sujets différents. Nous nous intéressons tout d'abord à l'estimation d'une loi de probabilité discrète, ainsi qu'à une application à la détection de ruptures multiples. Puis, nous proposons un cadre unifié pour l'estimation fonctionnelle basée sur des données éventuellement censurées. Enfin, nous étudions simultanément l'estimation de densité multivariée et de densité conditionnelle pour des données dépendantes. Le choix de la collection de partitions en intervalles ou rectangles dyadiques s'avère intéressant aussi bien en théorie qu'en pratique. En effet, notre estimateur pénalisé vérifie dans chacun des cadres une inégalité de type oracle non-asymptotique, pour une pénalité bien choisie. Il atteint également la vitesse minimax à constante près sur de nombreuses classes de fonctions, dont la régularité est éventuellement à la fois non homogène et non isotrope. Cette propriété, qui à notre connaissance n'a été démontrée pour aucun autre estimateur, repose sur des résultats d'approximation dont les preuves sont inspirées d'un article de DeVore et Yu. Par ailleurs, le calcul de notre estimateur dans un cadre univarié est basé sur un algorithme de plus court chemin dont la complexité est seulement linéaire en la taille de l'échantillon.
95

Régression non-paramétrique et information spatialement inhomogène

Gaiffas, Stéphane 08 December 2005 (has links) (PDF)
Nous étudions l'estimation non-paramétrique d'un signal à partir de<br />données bruitées spatialement inhomogènes (données dont la quantité<br />varie sur le domaine d'estimation). Le prototype d'étude est le modèle<br />de régression avec design aléatoire. Notre objectif est de comprendre<br />les conséquences du caractère inhomogène des données sur le problème<br />d'estimation dans le cadre d'étude minimax. Nous adoptons deux points<br />de vue : local et global. Du point de vue local, nous nous intéressons<br />à l'estimation de la régression en un point avec peu ou beaucoup de<br />données. En traduisant cette propriété par différentes hypothèses sur<br />le comportement local de la densité du design, nous obtenons toute une<br />gamme de nouvelles vitesses minimax ponctuelles, comprenant des<br />vitesses très lentes et des vitesses très rapides. Puis, nous<br />construisons une procédure adaptative en la régularité de la<br />régression, et nous montrons qu'elle converge avec la vitesse minimax<br />à laquelle s'ajoute un coût minimal pour l'adaptation locale. Du point<br />de vue global, nous nous intéressons à l'estimation de la régression<br />en perte uniforme. Nous proposons des estimateurs qui convergent avec<br />des vitesses dépendantes de l'espace, lesquelles rendent compte du<br />caractère inhomogène de l'information dans le modèle. Nous montrons<br />l'optimalité spatiale de ces vitesses, qui consiste en un renforcement<br />de la borne inférieure minimax classique pour la perte uniforme. Nous<br />construisons notamment un estimateur asymptotiquement exact sur une<br />boule de Hölder de régularité quelconque, ainsi qu'une bande de<br />confiance dont la largeur s'adapte à la quantité locale de données.
96

Contributions à la simulation et à l'analyse de discrétisation de processus, et applications.

GOBET, Emmanuel 24 November 2003 (has links) (PDF)
Nous présentons quelques contributions à la simulation et à l'analyse de discrétisation de processus, avec leurs applications notamment en finance. Nous avons regroupé nos travaux selon 4 thèmes: 1. statistique des processus avec observations discrètes; 2. couverture en temps discret en finance; 3. sensibilités d'espérances; 4. analyses d'erreurs de discrétisation. Le premier chapitre sur la statistique des processus est assez indépendant du reste. En revanche, les trois autres chapitres correspondent à une cohérence et une progression dans les questions soulevées. Néanmoins au fil de la lecture, on remarquera des liens entre les quatre parties: différentiation par rapport à des domaines et amélioration de simulation de temps de sortie, sensibilités d'espérances et statistique asymptotique avec le calcul de Malliavin, sensibilités d'espérances et analyse d'erreur etc... Les preuves des résultats s'appuient notamment sur les outils du calcul de Malliavin, des martingales, des Équations aux Dérivées Partielles et de leurs liens avec les Équations Différentielles Stochastiques.
97

Diagnostic des systèmes aéronautiques et réglage automatique pour la comparaison de méthodes

Marzat, Julien 04 November 2011 (has links) (PDF)
Les travaux présentés dans ce mémoire contribuent à la définition de méthodes pour la détection et le diagnostic de défauts affectant les systèmes aéronautiques. Un système représentatif sert de support d'étude, constitué du modèle non linéaire à six degrés de liberté d'un missile intercepteur, de ses capteurs et actionneurs ainsi que d'une boucle de guidage-pilotage. La première partie est consacrée au développement de deux méthodes de diagnostic exploitant l'information de commande en boucle fermée et les caractéristiques des modèles aéronautiques. La première méthode utilise les objectifs de commande induits par les lois de guidage-pilotage pour générer des résidus indiquant la présence de défauts. Ceci permet la détection des défauts sur les actionneurs et les capteurs, ainsi que leur localisation pour ces derniers. La deuxième méthode exploite la mesure de dérivées des variables d'état (via une centrale inertielle) pour estimer la valeur de la commande réalisée par les actionneurs, sans intégration du modèle non linéaire du système. Le diagnostic est alors effectué en comparant cette estimée avec la valeur désirée, ce qui permet la détection, la localisation et l'identification de défauts multiples sur les actionneurs.La seconde partie propose une méthodologie de réglage automatique des paramètres internes (les hyperparamètres) de méthodes de diagnostic. Ceci permet une comparaison plus objective entre les méthodes en évaluant la meilleure performance de chacune. Le réglage est vu comme un problème d'optimisation globale, la fonction à optimiser étant calculée via la simulation numérique (potentiellement coûteuse) de cas test. La méthodologie proposée est fondée sur un métamodèle de krigeage et une procédure itérative d'optimisation bayésienne, qui permettent d'aborder ce problème à faible coût de calcul. Un nouvel algorithme est proposé afin d'optimiser les hyperparamètres d'une façon robuste vis à vis de la variabilité des cas test pertinents.Mots clés : détection et diagnostic de défauts, guidage-pilotage, krigeage, minimax continu, optimisation globale, redondance analytique, réglage automatique, systèmes aéronautiques.
98

Minimax methods for finding multiple saddle critical points in Banach spaces and their applications

Yao, Xudong 01 November 2005 (has links)
This dissertation was to study computational theory and methods for ?nding multiple saddle critical points in Banach spaces. Two local minimax methods were developed for this purpose. One was for unconstrained cases and the other was for constrained cases. First, two local minmax characterization of saddle critical points in Banach spaces were established. Based on these two local minmax characterizations, two local minimax algorithms were designed. Their ?ow charts were presented. Then convergence analysis of the algorithms were carried out. Under certain assumptions, a subsequence convergence and a point-to-set convergence were obtained. Furthermore, a relation between the convergence rates of the functional value sequence and corresponding gradient sequence was derived. Techniques to implement the algorithms were discussed. In numerical experiments, those techniques have been successfully implemented to solve for multiple solutions of several quasilinear elliptic boundary value problems and multiple eigenpairs of the well known nonlinear p-Laplacian operator. Numerical solutions were presented by their pro?les for visualization. Several interesting phenomena of the solutions of quasilinear elliptic boundary value problems and the eigenpairs of the p-Laplacian operator have been observed and are open for further investigation. As a generalization of the above results, nonsmooth critical points were considered for locally Lipschitz continuous functionals. A local minmax characterization of nonsmooth saddle critical points was also established. To establish its version in Banach spaces, a new notion, pseudo-generalized-gradient has to be introduced. Based on the characterization, a local minimax algorithm for ?nding multiple nonsmooth saddle critical points was proposed for further study.
99

Interactions des dispositifs FACTS dans les grands réseaux électriques

Passelergue, Jean-Christophe 26 November 1998 (has links) (PDF)
L'augmentation des transits de puissance dans les réseaux d'énergie électrique ainsi que les contraintes environnementales ont conduit à l'introduction des dispositifs FACTS (Flexible AC Transmission Systems) pour l'amélioration de l'exploitation des réseaux. Ces dispositifs sont capables de remplir diverses fonctions comme le maintien de la tension, le contrôle des flux de puissance, l'amélioration de la stabilité du réseau, l'augmentation de la puissance transmissible maximale, etc. De plus, grâce à leur temps de réponse rapide, ils sont apparus comme des outils efficaces pour l'amortissement des oscillations électromécaniques très basses fréquences. Cette nouvelle fonction des dispositifs FACTS est d'autant plus importante que les réseaux mondiaux sont de plus en plus interconnectés, donc sensibles aux oscillations électromécaniques inter-régions. Cependant, le recours à de nombreux dispositifs FACTS dans un réseau nécessite d'étudier attentivement les éventuels problèmes d'interaction de régulation des dispositifs FACTS entre eux, mais aussi avec les autres éléments du réseau. Le travail réalisé dans le cadre de cette thèse traite des phénomènes dynamiques liés aux problèmes d'interaction résultant de l'insertion d'un ou plusieurs dispositifs FACTS shunt. Des indices de sensibilité et d'influence sont définis depuis les concepts de commandabilité et d'observabilité respectivement afin de prévoir l'importance des phénomènes d'interaction liés à l'insertion d'un dispositif FACTS et d'identifier les zones d'influence du dispositif FACTS. Ces indices sont appliqués à un réseau test 2 zones 4 machines et à un réseau réel simplifié 29 machines. Deux méthodes de coordination (méthode de type " minimax " et méthode linéaire quadratique décentralisée) sont mises en œuvre pour coordonner les dispositifs FACTS entre eux et avec les stabilisateurs de puissance (PSS - Power System Stabilizer) dans le réseau test 2 zones 4 machines.
100

Méthodes d'agrégation : optimalité et vitesses rapides

Lecué, Guillaume 18 May 2007 (has links) (PDF)
Le principal travail de<br />cette thèse porte sur l'étude des méthodes d'agrégation sous<br />l'hypothèse de marge. Nous avons mis en avant que l'hypothèse de<br />marge améliore les vitesses d'agrégation. Un autre résultat de<br />cette thèse montre que certaines méthodes de minimisation du risque<br />empirique pénalisé sont sous-optimales quand le risque est convexe,<br />même sous l'hypothèse de marge. Contrairement aux procédures<br />d'agrégation à poids exponentiels, ces méthodes n'arrivent pas à<br />profiter de la marge du modèle. Nous avons ensuite appliqué les<br />méthodes d'agrégation à la résolution de quelques problèmes<br />d'adaptation. Une dernière contribution apportée dans cette thèse a<br />été de proposer une approche du contrôle du biais en classification<br />par l'introduction d'espaces de règles de prédiction parcimonieuses.<br />Des vitesses minimax ont été obtenues pour ces modèles et une<br />méthode d'agrégation a donné une version adaptative de ces<br />procédures d'estimation.

Page generated in 0.0831 seconds