• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 11
  • 8
  • 2
  • Tagged with
  • 19
  • 6
  • 4
  • 4
  • 4
  • 3
  • 3
  • 3
  • 3
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
11

Development and Application of Information Theoretical Bounds to Certain Class of Coordination Problems / Développement et application des bornes issues de la théorie de l'information à certains types de problèmes de coordination

Agrawal, Achal 14 June 2016 (has links)
Avec la montée de la connectivité entre les appareils (internet des objets), nouvelles possibilités de coordination entre les différentes entités ont ouvert. En même temps, des résultats récents, issus de la théorie de l'information, ont fourni des limites pour la performance optimale que tout système de coordination pourrait atteindre sous certaines structures d'information. Dans cette thèse, nous développons ces résultats théoriques dans le but de les rendre plus facilement applicable aux problèmes pratiques. À cet égard, la contribution de cette thèse est double : 1) En outre développer les résultats théoriques pour fournir un aperçu de la structure des solutions au problème d'optimisation posés dans les travaux antérieurs, ainsi que la généralisation des résultats. 2) Développer des algorithmes qui exploitent le cadre théorique fourni par les travaux antérieurs pour concevoir des mécanismes de coordination pratiques, décentralisées et robustes. La généralité de l'approche se prête à diverses applications, dont les éléments suivants ont été traités: optimisation de puissance dans les réseaux sans fil, planification de la consommation d'énergie dans les applications de réseau intelligent, ainsi que Witsenhausen contre-exemple, un problème important issu de la théorie du contrôle. Diverses possibilités sont encore à venir pour exploiter le cadre et les outils développés ici. En effet, ils pourraient être utiles même dans des domaines qui ne sont pas abordés dans cette thèse, mais qui nécessitent une coordination entre les agents avec des informations différentes à la disposition de chacun. / With the rise in connectivity between appliances (Internet of Things), new avenues for coordination between various entities have opened up. At the same time, recent information theoretical results have provided bounds for the performance that any coordination scheme could achieve under certain information structures. In this thesis, we further develop those information theoretical results with the aim of making them applicable more easily to practical problems. In this regard, the contribution of this thesis is twofold: 1) Further developing the aforementioned information theoretical results to provide insights into the structure of the solutions to optimization problem posed in them, as well as generalizing some results. 2) Developing algorithms which exploit the theoretical framework provided by Information theory to devise practical, decentralized and robust coordination schemes. The generality of the approach lends itself to various applications, of which the following were treated: power optimization in wireless networks, power consumption scheduling in smart grid applications, as well as Witsenhausen counterexample, an important toy problem in control theory. Various opportunities still lie ahead to exploit the framework and tools developed herein. Indeed, they could be useful even in domains which have not been explored in this thesis but which require coordination between agents with different information available to each.
12

Sur les applications du cercle avec un intervalle plat et flots de Cherry / On the circle endomorphisms with a flat interval and Cherry flows

Palmisano, Liviana 12 December 2013 (has links)
Dans cette thèse nous donnons une description complète de la dynamique d’une classe L de fonctions de degré un du cercle, supposées de classe (deux fois dérivable) C^2 à l’exception de deux points où seule la continuité est exigée, et telles qu’elles soient constantes sur un des intervalles délimité par ces derniers. De plus sur des demi-voisinages ouverts de ces points elles s’écrivent sous la forme x^l où l est un nombre réel positif appelé l’exposant critique de la fonction. Dans le chapitre 2 nous montrons pour la sous-classe de L des fonctions dont le nombre de rotation est de type borné, l’existence d’une transition dans la géométrie du système lorsque l’exposant critique traverse 2. Le cas plus général de fonctions en L avec nombre de rotation infinie est considéré dans le chapitre 3. Il devient pourtant plus délicat d’émettre des conjectures ; on rencontre parfois des surprises dues à laprésence de phénomènes paraboliques. De plus, nos résultats sur les applications du cercle nous permettent d’étudier l’intéressante théorie des flots de Cherry (chapitre 4). En particulier, on construit un exemple de tel flot qui a ensemble quasi-minimale métriquement non trivial. Nous donnons également une description complète des mesures physiques sur ce flot. Dans le chapitre 5 nous construisons un contrexemple de Denjoy qui est un difféomorphisme (indéfiniment dérivable) C^∞ partout sauf dans un point qui est demi-critique plat pour la fonction. / The principal purpose of this thesis is to give a complete description of the dynamics of a class L of circle maps of degree one, supposed to be (two times differentiable) C^2 everywhere with the exception of two points where the maps are continuous. Moreover the maps are constant on any of the two intervals delimited by this two points. In particular, on a half open neighborhood of this two points the maps can be written as an x^l where the real positive number l is called the critical exponent of the function. In Chapter 2 we prove the existence of a global phase transition when the critical exponent passes through l = 2, for functions of L with rotation number of bounded type. The more general case of function in L with rotation number of unbounded type is studied in Chapter 3. In this case it becomes more delicate to make conjectures ; in fact it often hides surprises due to the presence of underlying parabolic phenomena. Moreover, our results on circle maps give us the opportunity to study the interesting theory of Cherry flows (Chapter 4). In particular we construct an example of such a flow with a metrically non-trivial quasi-minimal set and we give a complete description on the physical measures for this kind of flows. In Chapter 5 we construct a Denjoy counterexample which is a (smooth) C^∞ diffeomorphism away from a half-critical point.
13

Exploiting Model Transformation Examples for Easy Model Transformation Handling (Learning and Recovery) / Vers une assistance à la manipulation de transformations de modèles par l'exploitation d'exemples de transformation

Saada, Hajer 04 December 2013 (has links)
L'Ingénierie Dirigée par les Modèles (IDM) est un domaine de recherche en pleine émergence qui considère les modèles comme des éléments de base. Chaque modèle est conforme à un autre modèle, appelé son méta-modèle, qui définit sa syntaxe abstraite et ses concepts. Dans un processus IDM, différents types de modèles sont manipulés par des transformations de modèles. Une transformation génère un modèle dans un langage cible à partir d'un modèle dans un langage source. Pour concevoir une transformation, les développeurs doivent avoir une bonne connaissance des méta-modèles concernés ainsi que des langages de transformation, ce qui rend cette tâche difficile. Dans cette thèse, nous proposons d'assister l'écriture des transformations et plus généralement de comprendre comment une transformation opère. Nous adhérons à l'approche de transformation de modèles par l'exemple qui propose de créer une transformation de modèles à partir d'exemples de transformation. Cela permet d'utiliser la syntaxe concrète définie pour les méta-modèles, et cela évite donc de requérir que les développeurs aient une bonne maîtrise des méta-modèles utilisés. Dans ce contexte, nous proposons deux contributions. La première consiste à définir une méthode pour générer des règles de transformation opérationnelles à partir d'exemples. Nous nous basons sur une approche qui utilise l'Analyse Relationnelle de Concepts (ARC) comme technique d'apprentissage pour obtenir des patrons de transformation à partir d'un appariement de type 1-1 entre les modèles. Nous développons une technique pour extraire des règles de transformation opérationnelles à partir de ces patrons. Ensuite, nous utilisons le langage et le moteur de règles JESS pour exécuter ces règles. Nous étudions aussi comment mieux apprendre des règles de transformations à partir d'exemples, en utilisant séparément chaque exemple ou en réunissant tous les exemples. La deuxième contribution consiste à récupérer les traces de transformation à partir d'exemples de transformation. Ces traces peuvent être utilisées par exemple pour localiser des erreurs durant l'exécution des programmes de transformation ou vérifier la couverture de tous les modèles d'entrée par une transformation. Dans notre contexte, nous supposons que ces traces vont servir pour un futur apprentissage des règles de transformation. Nous traitons tout d'abord le problème de récupération des traces avec des exemples provenant d'un programme de transformation. Nous proposons une approche basée sur une méta-heuristique multi-objectifs pour générer des traces sous forme d'appariement de type n-m entre des éléments de modèles. La fonction objectif s'appuie sur une similarité lexicale et structurelle entre ces éléments. Une extension de cette méthode est proposée pour traiter le problème plus général de l'appariement entre modèles. / Model Driven Engineering (MDE) considers models as first class artifacts. Each model conforms to another model, called its metamodel which defines its abstract syntax and its semantics.Various kinds of models are handled successively in an MDE development cycle. They are manipulated using, among others, programs called model transformations. A transformation takes as input a model in a source language and produces a model in a target language. The developers of a transformation must have a strong knowledge about the source and target metamodels which are involved and about the model transformation language. This makes the writing of the model transformation difficult.In this thesis, we address the problem of assisting the writing of a model transformation and more generally of understanding how a transformation operates.We adhere to the Model Transformation By example (MTBE) approach, which proposes to create a model transformation using examples of transformation. MTBE allows us to use the concrete syntaxes defined for the metamodels. Hence, the developers do not need in-depth knowledge about the metamodels. In this context, our thesis proposes two contributions.As a first contribution, we define a method to generate operational transformation rules from transformation examples. We extend a previous approach which uses Relational Concept Analysis as a learning technique for obtaining transformation patterns from 1-1 mapping between models. We develop a technique for extracting relevant transformation rules from these transformation patterns and we use JESS language and engine to make the rules executable. We also study how we better learn transformation rules from examples, using transformation examples separately or by gathering all the examples.The second contribution consists in recovering transformation traces from transformation examples. This trace recovery is useful for several purposes as locating bugs during the execution of transformation programs, or checking the coverage of all input models by a transformation. In our context, we expect also that this trace will provide data for a future model transformation learning technique. We first address the trace recovery problem with examples coming from a transformation program. We propose an approach, based on a multi-objective meta-heuristic, to generate the textit{many-to-many} mapping between model constructs which correspond to a trace. The fitness functions rely on the lexical and structure similarity between the constructs. We also refine the approach to apply it to the more general problem of model matching.
14

Définition et réalisation d'une boîte à outils générique dédiée à la Programmation sur Exemple

Sanou, Loé 17 December 2008 (has links) (PDF)
L'implémentation d'un système intégrant la Programmation sur Exemple (PsE) demande au développeur de mettre à disposition de l'utilisateur final des outils d'assistance lors de la réalisation des tâches. Pour le développeur, cela passe par la mise à disposition des différents services à partir de l'interface utilisateur de l'application. Le système doit donc fournir des interfaces particulières, car non seulement l'objectif fonctionnel de l'application ne doit pas changer, mais surtout parce que les techniques de la PsE doivent être naturellement intégrées. Un système de PsE est difficile à implanter, et pourtant, la plupart possèdent des éléments en commun parmi lesquels on trouve une représentation des actions utilisateur, un historique des actions, et parfois un algorithme d'apprentissage symbolique opérant sur l'historique. Nous favorisons la création d'un tel système en fournissant les outils nécessaires sous forme d'une boîte à outils par extension de Swing. Les développeurs peuvent bâtir, avec un minimum d'effort, des applications mettant en ?uvre les techniques de la PsE. Les principaux services de base ont été identifiés et définis : enregistrement des actions utilisateur, rejeu des actions et des techniques utilisables pour la mise en ?uvre d'applications types. Ils ont été prototypés à travers l'outil PbDToolkit, ouvrant la voie vers la simplification de la mise en ?uvre des applications de PsE. En utilisant PbDToolkit, il n'est pas nécessaire d'implémenter les fonctionnalités de base car toutes les opérations y sont déjà implémentées avec la liberté d'usage et d'exploitation offerte aux développeurs. PbDToolkit est instrumenté pour permettre de vérifier la conformité d'une IHM à son modèle de tâches. Le concept établit un lien entre les tâches élémentaires du modèle de tâches et les actions de l'IHM. Ainsi, à l'exécution, un scénario est généré suivant le format de scénario de l'environnement K-MADe, outil de modélisation utilisé.
15

Apprentissage de Modèles pour la Classification et la Recherche d'Images

Mensink, Thomas 26 October 2012 (has links) (PDF)
Nous assistons actuellement à une explosion de la quantité des données visuelles. Par exemple, plusieurs millions de photos sont partagées quotidiennement sur les réseaux sociaux. Les méthodes d'interprétation d'images vise à faciliter l'accès à ces données visuelles, d'une manière sémantiquement compréhensible. Dans ce manuscrit, nous définissons certains buts détaillés qui sont intéressants pour les taches d'interprétation d'images, telles que la classification ou la recherche d'images, que nous considérons dans les trois chapitres principaux. Tout d'abord, nous visons l'exploitation de la nature multimodale de nombreuses bases de données, pour lesquelles les documents sont composés d'images et de descriptions textuelles. Dans ce but, nous définissons des similarités entre le contenu visuel d'un document, et la description textuelle d'un autre document. Ces similarités sont calculées en deux étapes, tout d'abord nous trouvons les voisins visuellement similaires dans la base multimodale, puis nous utilisons les descriptions textuelles de ces voisins afin de définir une similarité avec la description textuelle de n'importe quel document. Ensuite, nous présentons une série de modèles structurés pour la classification d'images, qui encodent explicitement les interactions binaires entre les étiquettes (ou labels). Ces modèles sont plus expressifs que des prédicateurs d'étiquette indépendants, et aboutissent à des prédictions plus fiables, en particulier dans un scenario de prédiction interactive, où les utilisateurs fournissent les valeurs de certaines des étiquettes d'images. Un scenario interactif comme celui-ci offre un compromis intéressant entre la précision, et l'effort d'annotation manuelle requis. Nous explorons les modèles structurés pour la classification multi-étiquette d'images, pour la classification d'image basée sur les attributs, et pour l'optimisation de certaines mesures de rang spécifiques. Enfin, nous explorons les classifieurs par k plus proches voisins, et les classifieurs par plus proche moyenne, pour la classification d'images à grande échelle. Nous proposons des méthodes d'apprentissage de métrique efficaces pour améliorer les performances de classification, et appliquons ces méthodes à une base de plus d'un million d'images d'apprentissage, et d'un millier de classes. Comme les deux méthodes de classification permettent d'incorporer des classes non vues pendant l'apprentissage à un coût presque nul, nous avons également étudié leur performance pour la généralisation. Nous montrons que la classification par plus proche moyenne généralise à partir d'un millier de classes, sur dix mille classes à un coût négligeable, et les performances obtenus sont comparables à l'état de l'art.
16

Phénomène de Newhouse et bifurcations en dynamique holomorphe à plusieurs variables / Newhouse's phenomenon and bifurcations in holomorphic dynamics in several variables

Biebler, Sébastien 12 July 2018 (has links)
Cette thèse est consacrée à l’étude du phénomène de Newhouse et des bifurcations en dynamique holomorphe à plusieurs variables. Elle comporte trois Théorèmes principaux. Le premier de ces trois résultats est un Gap Lemma complexe. En dynamique réelle, le Gap Lemma de Newhouse donne un critère sur le produit des épaisseurs de deux ensembles de Cantor dynamiques pour prouver que leur intersection est non vide. On en donne une généralisation partielle au cas des ensembles de Cantor dynamiques dans C. Plus précisément, on introduit une notion d’épaisseur pour un ensemble de Cantor dynamique planaire et on fournit un critère sur le produit de deux épaisseurs afin d’obtenir une intersection entre deux ensembles de Cantor dynamiques. On montre également que l’épaisseur est une quantité qui varie continûment, ce qui permet d’obtenir des intersections persistantes d’ensembles de Cantor dynamiques. Le second Théorème de cette thèse démontre l’existence du phénomène de Newhouse dans l’espace des automorphismes polynomiaux de degré d pour n’importe quel degré d ≥ 2 dans C^{3}. Au contraire de la situation dans C^{2}, le degré est ici connu et optimal. Le point clef de la preuve est l’introduction dans le domaine complexe d’un outil issu de la dynamique réelle : le blender de Bonatti et Diaz. On formalise le concept de blender complexe et on donne un automorphisme polynomial de C^{3} de degré 2 possédant un blender. Puis, on l’utilise afin de construire successivement des tangences persistantes et des sous-ensembles résiduels d’automorphismes ayant une infinité de puits. Enfin, le dernier résultat porte sur les bifurcations d’endomorphismes holomorphes de P^{2}(C) très particuliers, appelés exemples de Lattès, semi-conjugués à une application affine sur un tore. Dujardin a conjecturé que ces derniers étaient accumulés par des ouverts de bifurcations. On montre que tout exemple de Lattès de degré suffisamment élevé est accumulé par de telles bifurcations robustes. Ceci implique en particulier que tout exemple de Lattès possède un itéré dans l’adhérence de l’intérieur du lieu de bifurcation. La démonstration est basée sur l’obtention d’intersections persistantes entre l’ensemble postcritique et un ensemble hyperbolique répulsif contenu dans l’ensemble de Julia. La preuve est divisée en deux parties : on donne tout d’abord un toy-model qui permet d’obtenir des intersections persistantes entre l’ensemble limite d’un certain type d’IFS, appelé IFS correcteur, et une courbe. Ensuite, dans un second temps, on perturbe l’exemple de Lattès pour créer simultanément un IFS correcteur dans l’ensemble de Julia et une courbe bien orientée dans l’ensemble postcritique / In this PhD thesis, we study Newhouse’s phenomenon and bifurcations in the context of dynamics in several complex variables. We prove three main Theorems. The first one is a complex Gap Lemma. In real dynamics, Newhouse’s Gap Lemma gives a criterion on the product of the thicknesses of two dynamical Cantor sets K and L to show that K ∩ L is not empty. We show a partial generalization of this result for dynamical Cantor sets in C. A relevant notion of thickness in this case is defined and we give some criterion on the product of two thicknesses to show that two dynamical Cantor sets in C must intersect. We also show that the thickness varies continuously, which generates persistent intersections of dynamical Cantor sets. In the second Theorem, we show that there exists a polynomial automorphism f of C^{3} of degree 2 such that for every automorphism g sufficiently close to f, g admits a tangency between the stable and unstable laminations of some hyperbolic set. As a consequence, for each d ≥ 2, there exists an open set of polynomial automorphisms of degree at most d in which the automorphisms having infinitely many sinks are dense. In contrary to the case of C^{2}, the degree is known. To prove these results, we give a complex analogous to the notion of blender introduced by Bonatti and Diaz. In particular, we use a blender to produce robust tangencies. In the third and last result, we study the phenomenon of robust bifurcations in the space of holomorphic maps of P^{2}(C). We prove that any Lattès example of sufficiently high degree belongs to the closure of the interior of the bifurcation locus. This gives a partial answer to a conjecture of Dujardin. In particular, every Lattès map has an iterate with this property. To show this, we design a method creating robust intersections between the limit set of a particular type of iterated functions system in C^{2} with a well-oriented complex curve. Then we show that any Lattès map of sufficiently high degree can be perturbed so that the perturbed map exhibits this geometry
17

L'exemple dans les grammaires de l'Europe occidentale des XVe et XVIe siècles / Exemple in the West European grammars, 15-16th centuries

Kistereva, Maria 31 August 2015 (has links)
L’objectif de la présente thèse est de cerner le rôle joué par l’exemple grammatical dans les premières grammaires des langues vernaculaires à l’époque de la Renaissance.<p>C’est à cette époque que la plupart des langues vernaculaires de l’Europe ont été soumises pour la première fois et de façon globale à une codification grammaticale :c’est alors qu’ont été rédigées ou publiées les premières grammaires italiennes (1430-1440), espagnoles (1492), allemandes (1534), portugaises (1536), néerlandaises (1584) et anglaises (1586) (cf. Percival, 1975 ;Padley, 1985 ;Swiggers, 1987). <p>Dans l’Europe romane, jusqu’au XVe siècle, seule la langue latine possédait le triple privilège de disposer d’une forme écrite, de jouir d’une description grammaticale et d’être, de ce fait, l’objet de réflexions scientifiques et d’enseignement. L’apparition de grammaires des langues romanes, langues vernaculaires accédant à un nouveau statut (celui de langue référentielle), est donc un événement majeur dans l’histoire des langues, dans l’histoire des idées, dans l’histoire de la réflexion que l’homme porte sur le langage, c’est-à-dire dans l’histoire de la linguistique et plus généralement dans l’histoire des sciences humaines.<p>Le fait que ces ouvrages appartiennent à une époque passée ne les empêche pas d’être au cœur de problématiques qui sont toujours d’actualité, notamment sur le plan de la didactique. En effet, dans le contexte de la tendance moderne à la standardisation des processus d’apprentissage (non seulement dans le domaine des sciences du langage, mais aussi dans les autres domaines de la science), les premières grammaires peuvent être considérées comme de nouvelles sources des sciences modernes. D’une part, les grammairiens de la Renaissance utilisaient les mêmes normes que les anciens, les scolasticiens et les humanistes ;d’autre part, chaque auteur voulait faire preuve d’originalité dans son ouvrage et c’est ainsi que les « écoles » nationales de langues sont apparues. Les grammaires de la Renaissance ont représenté pour leur époque une étape très importante dans le développement des sciences du langage, qu’elles représentent encore de nos jours. <p>Les auteurs d’études consacrées aux grammaires de cette période sont généralement attentifs au rôle de l’exemple, mais leurs travaux, peu nombreux, ne débouchent pas sur une étude circonstanciée des exemples dans ces grammaires. La question du bon usage et la question de la problématique de l’exemplification dans les ouvrages y sont abordées dans le contexte général de la normalisation des langues nationales dans des pays ou selon la forme de traité, mais les exemples n’y sont pas abordés en tant que tels et n’y constituent pas une problématique centrale.<p>À la lueur de ces différentes observations, nous nous donnerons comme objectif, dans cette thèse, de cerner le rôle joué par l’exemple grammatical dans l’émergence de ces nouvelles sciences que sont les sciences du langage à l’époque de la Renaissance. Notre recherche s’attachera tout particulièrement à observer l’exemple dans les traditions portugaises et françaises, au sein de la Romania, à partir d’un corpus constitué de dix traités.<p>Après le premier chapitre, strictement introductif, le chapitre 2 présentera les approches théoriques de l’exemple dans le contexte des grammaires, en décrivant le positionnement de la recherche par rapport à ces approches. Ensuite, les questions relatives au repérage de l’exemple seront abordées – marquage typographique, formes et fonctions de l’exemple dans le texte grammatical.<p>Le chapitre 3 sera consacré à la présentation de notre corpus. Nous commencerons d’abord par exposer la manière dont nous avons procédé pour le définir, ensuite, pour sélectionner les dix traités qu’il contient, et enfin pour le présenter en tant que tel. Cet exposé méthodologique sera suivi de la présentation des dix grammaires retenues, c’est-à-dire quatre grammaires pour le portugais, quatre grammaires pour le français, auxquelless s’ajoutent une grammaire pour l’italien et une pour l’espagnol qui font office de grammaires de contrôle.<p>Le chapitre 4 présente l’analyse détaillée de l’exemple dans chaque grammaire du corpus. Les grammaires y sont abordées dans l’ordre qui a été suivi dans le chapitre précédent, l’approche différant en ce que l’attention est portée ici exclusivement sur les exemples.<p>Alors que dans les chapitres 3 et 4 l’entrée en matière se fait par le biais des grammaires, dans le chapitre 5, elle se fera par le biais de l’exemple grammatical. Ce chapitre fait la synthèse de toutes les informations collectées dans les chapitres précédents pour les présenter de manière organisée, l’objectif étant d’établir une typologie des caractéristiques des exemples grammaticaux.<p>Le chapitre 6 déterminera les résultats et les conclusions principales de la présente thèse.<p> / Doctorat en philosophie et lettres, Orientation linguistique / info:eu-repo/semantics/nonPublished
18

Active learning et visualisation des données d'apprentissage pour les réseaux de neurones profonds / Active learning and input space analysis for deep networks

Ducoffe, Mélanie 12 December 2018 (has links)
Notre travail est présenté en trois parties indépendantes. Tout d'abord, nous proposons trois heuristiques d'apprentissage actif pour les réseaux de neurones profonds : Nous mettons à l'échelle le `query by committee' , qui agrège la décision de sélectionner ou non une donnée par le vote d'un comité. Pour se faire nous formons le comité à l'aide de différents masques de dropout. Un autre travail se base sur la distance des exemples à la marge. Nous proposons d'utiliser les exemples adversaires comme une approximation de la dite distance. Nous démontrons également des bornes de convergence de notre méthode dans le cas de réseaux linéaires. L’usage des exemples adversaires ouvrent des perspectives de transférabilité d’apprentissage actif d’une architecture à une autre. Puis, nous avons formulé une heuristique d'apprentissage actif qui s'adapte tant au CNNs qu'aux RNNs. Notre méthode sélectionne les données qui minimisent l'énergie libre variationnelle. Dans un second temps, nous nous sommes concentrés sur la distance de Wasserstein. Nous projetons les distributions dans un espace où la distance euclidienne mimique la distance de Wasserstein. Pour se faire nous utilisons une architecture siamoise. Également, nous démontrons les propriétés sous-modulaires des prototypes de Wasserstein et comment les appliquer à l'apprentissage actif. Enfin, nous proposons de nouveaux outils de visualisation pour expliquer les prédictions d'un CNN sur du langage naturel. Premièrement, nous détournons une stratégie d'apprentissage actif pour confronter la pertinence des phrases sélectionnées aux techniques de phraséologie les plus récentes. Deuxièmement, nous profitons des algorithmes de déconvolution des CNNs afin de présenter une nouvelle perspective sur l'analyse d'un texte. / Our work is presented in three separate parts which can be read independently. Firstly we propose three active learning heuristics that scale to deep neural networks: We scale query by committee, an ensemble active learning methods. We speed up the computation time by sampling a committee of deep networks by applying dropout on the trained model. Another direction was margin-based active learning. We propose to use an adversarial perturbation to measure the distance to the margin. We also establish theoretical bounds on the convergence of our Adversarial Active Learning strategy for linear classifiers. Some inherent properties of adversarial examples opens up promising opportunity to transfer active learning data from one network to another. We also derive an active learning heuristic that scales to both CNN and RNN by selecting the unlabeled data that minimize the variational free energy. Secondly, we focus our work on how to fasten the computation of Wasserstein distances. We propose to approximate Wasserstein distances using a Siamese architecture. From another point of view, we demonstrate the submodular properties of Wasserstein medoids and how to apply it in active learning. Eventually, we provide new visualization tools for explaining the predictions of CNN on a text. First, we hijack an active learning strategy to confront the relevance of the sentences selected with active learning to state-of-the-art phraseology techniques. These works help to understand the hierarchy of the linguistic knowledge acquired during the training of CNNs on NLP tasks. Secondly, we take advantage of deconvolution networks for image analysis to present a new perspective on text analysis to the linguistic community that we call Text Deconvolution Saliency.
19

Learning Image Classification and Retrieval Models / Apprentissage de modèles pour la classification et la recherche d'images

Mensink, Thomas 26 October 2012 (has links)
Nous assistons actuellement à une explosion de la quantité des données visuelles. Par exemple, plusieurs millions de photos sont partagées quotidiennement sur les réseaux sociaux. Les méthodes d'interprétation d'images vise à faciliter l'accès à ces données visuelles, d'une manière sémantiquement compréhensible. Dans ce manuscrit, nous définissons certains buts détaillés qui sont intéressants pour les taches d'interprétation d'images, telles que la classification ou la recherche d'images, que nous considérons dans les trois chapitres principaux. Tout d'abord, nous visons l'exploitation de la nature multimodale de nombreuses bases de données, pour lesquelles les documents sont composés d'images et de descriptions textuelles. Dans ce but, nous définissons des similarités entre le contenu visuel d'un document, et la description textuelle d'un autre document. Ces similarités sont calculées en deux étapes, tout d'abord nous trouvons les voisins visuellement similaires dans la base multimodale, puis nous utilisons les descriptions textuelles de ces voisins afin de définir une similarité avec la description textuelle de n'importe quel document. Ensuite, nous présentons une série de modèles structurés pour la classification d'images, qui encodent explicitement les interactions binaires entre les étiquettes (ou labels). Ces modèles sont plus expressifs que des prédicateurs d'étiquette indépendants, et aboutissent à des prédictions plus fiables, en particulier dans un scenario de prédiction interactive, où les utilisateurs fournissent les valeurs de certaines des étiquettes d'images. Un scenario interactif comme celui-ci offre un compromis intéressant entre la précision, et l'effort d'annotation manuelle requis. Nous explorons les modèles structurés pour la classification multi-étiquette d'images, pour la classification d'image basée sur les attributs, et pour l'optimisation de certaines mesures de rang spécifiques. Enfin, nous explorons les classifieurs par k plus proches voisins, et les classifieurs par plus proche moyenne, pour la classification d'images à grande échelle. Nous proposons des méthodes d'apprentissage de métrique efficaces pour améliorer les performances de classification, et appliquons ces méthodes à une base de plus d'un million d'images d'apprentissage, et d'un millier de classes. Comme les deux méthodes de classification permettent d'incorporer des classes non vues pendant l'apprentissage à un coût presque nul, nous avons également étudié leur performance pour la généralisation. Nous montrons que la classification par plus proche moyenne généralise à partir d'un millier de classes, sur dix mille classes à un coût négligeable, et les performances obtenus sont comparables à l'état de l'art. / We are currently experiencing an exceptional growth of visual data, for example, millions of photos are shared daily on social-networks. Image understanding methods aim to facilitate access to this visual data in a semantically meaningful manner. In this dissertation, we define several detailed goals which are of interest for the image understanding tasks of image classification and retrieval, which we address in three main chapters. First, we aim to exploit the multi-modal nature of many databases, wherein documents consists of images with a form of textual description. In order to do so we define similarities between the visual content of one document and the textual description of another document. These similarities are computed in two steps, first we find the visually similar neighbors in the multi-modal database, and then use the textual descriptions of these neighbors to define a similarity to the textual description of any document. Second, we introduce a series of structured image classification models, which explicitly encode pairwise label interactions. These models are more expressive than independent label predictors, and lead to more accurate predictions. Especially in an interactive prediction scenario where a user provides the value of some of the image labels. Such an interactive scenario offers an interesting trade-off between accuracy and manual labeling effort. We explore structured models for multi-label image classification, for attribute-based image classification, and for optimizing for specific ranking measures. Finally, we explore k-nearest neighbors and nearest-class mean classifiers for large-scale image classification. We propose efficient metric learning methods to improve classification performance, and use these methods to learn on a data set of more than one million training images from one thousand classes. Since both classification methods allow for the incorporation of classes not seen during training at near-zero cost, we study their generalization performances. We show that the nearest-class mean classification method can generalize from one thousand to ten thousand classes at negligible cost, and still perform competitively with the state-of-the-art.

Page generated in 0.0583 seconds