• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 16
  • 5
  • 1
  • Tagged with
  • 22
  • 11
  • 8
  • 7
  • 7
  • 6
  • 6
  • 5
  • 5
  • 4
  • 4
  • 4
  • 4
  • 4
  • 4
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
11

Équations de Schrödinger à données aléatoires : construction de solutions globales pour des équations sur-critiques / Random data for Schrödinger equations : construction of global solutions for supercritical equations

Poiret, Aurélien 19 December 2012 (has links)
Dans cette thèse, on construit un grand nombre de solutions globales pour de nombreuses équations de Schrödinger sur-critiques. Le principe consiste à rendre la donnée initiale aléatoire, selon les mêmes méthodes que Nicolas Burq, Nikolay Tzvetkov et Laurent Thomann afin de gagner de la dérivabilité.On considère d'abord l'équation de Schrödinger cubique en dimension 3. En partant de variables aléatoires gaussiennes et de la base de L^2(R^3) formée des fonctions d'Hermite tensorielles, on construit des ensembles de solutions globales pour des données initiales qui sont moralement dans L^2(R^3). Les points clefs de la démonstration sont l'existence d'une estimée bilinéaire de type Bourgain pour l'oscillateur harmonique et la transformation de lentille qui permet de se ramener à prouver l'existence locale de solutions à l'équation de Schrödinger avec potentiel harmonique.On étudie ensuite l'effet régularisant pour prouver un théorème analogue où le gain de dérivée vaut 1/2-2/(p-1) où p correspond à la non linéarité de l'équation. Le gain est donc plus faible que précédemment mais la base de fonctions propres quelconques. De plus, la méthode s'appuyant sur des estimées linéaires, on établit le résultat pour des variables aléatoires dont la queue de distribution est à décroissance exponentielle.Enfin, on démontre des estimées multilinéaires en dimension 2 pour une base de fonctions propres quelconques ainsi que des inégalités de types chaos de Wiener pour une classe générale de variables aléatoires. Cela nous permet d'établir le théorème pour l'équation de Schrödinger quintique, avec un gain de dérivée égal à 1/3, dans le même cadre que la partie précédente. / In this thesis, we build a large number of global solutions for many supercritical Schrödinger equations. The method is to make the random initial data, using the same methods that Nicolas Burq, Nikolay Tzvetkov and Laurent Thomann in order to obtain differentiability. First, we consider the cubic Schrödinger equation in three dimensional. Using Gaussian random variables and the basis of L^2(R^3) consists of tensorial Hermite functions, we construct sets of solutions for initial data that are morally in L^2(R^3). The main ingredients of the proof are the existence of Bourgain type bilinear estimates for the harmonic oscillator and the lens transform which can be reduced to prove a local existence of solutions for the Schrödinger equation with harmonic potential. Next, we study the smoothing effect to prove an analogous theorem which the gain of differentiability is equalto 1/2-2/(p-1) which p is the nonlinearity of the equation. This gain is lower than previously but the basis of eigenfunctions are general. As the method uses only linear estimates, we establish the result for a general class of random variables.Finally, we prove multilinear estimates in two dimensional for a basis of ordinaries eigenfunctions and Wienerchaos type inequalities for classical random variables. This allows us to establish the theorem for the quinticSchrödinger equation, with a gain of differentiability equals to 1/3, in the same context as the previous chapter.
12

Contrôle non linéaire actif d’écoulements turbulents décollés : Théorie et expérimentations / Nonlinear active control of turbulent separated flows : Theory and experiments

Feingesicht, Maxime 11 December 2017 (has links)
Le contrôle des écoulements est un domaine en forte croissance visant à modifier un écoulement à l’aide d’actionneurs et d’algorithmes de contrôle. Un axe important du contrôle des écoulements est le contrôle des décollements car le décollement de la couche limite provoque des augmentations de traînée et donc des pertes énergétiques et des coûts en carburant. Cette thèse vise à développer des algorithmes de contrôles pour le recollement des écoulements à l’aide de jets pulsés. La première partie de cette thèse expose une technique d’identification de modèle basée sur des données expérimentales. Les modèles sont déduits de considérations physiques et de l’Automatique. Ils offrent une bonne correspondance aux données tout en restant simple et en contenant peu de coefficients. La seconde partie de cette thèse utilise ces modèles pour élaborer deux algorithmes de contrôle : le premier est un contrôle optimal en boucle ouverte et le second un contrôle robuste en boucle fermée. Ces algorithmes ont été implémentés sur diverses maquettes expérimentales (LML, ONERA, LAMIH) et leurs propriétés a été testée expérimentalement. Les tests ont été réalisés en utilisant un Arduino Uno pour les mesures et le calcul du contrôle, ce qui montre que la méthode développée est simple à appliquer et requiert peu de puissance de calcul / Flow control is a strongly growing field aiming at modifying fluid flows using actuators and control algorithms. An important part of flow control is the control of flow separation as boundary layer separation increases drag and therefore energy losses and fuel consumption. This thesis focuses on developing control algorithms for flow reattachment using pulsed jets actuators. The first part of this work develops a model identification technique based on experimental data. The models are derived from physical and control theory considerations. They provide a good fit to the data while remaining simple and using few coefficients. The second part of this work uses this models in order to design two different control algorithms : the first one is an optimal feedforward control while the second one is a robust feedback control. The control algorithms have been applied on several experimental setups (LML, ONERA, LAMIH) and their properties have been experimentally tested. The tests were conducted using a simple Arduino Uno for the measurements and computation of the control, showing that the developed method is easy to apply and requires very few computational resources
13

Etude de l'activité neuronale : optimisation du temps de simulation et stabilité des modèles / Study of neuronal activity : optimization of simulation time and stability of models

Sarmis, Merdan 04 December 2013 (has links)
Les neurosciences computationnelles consistent en l’étude du système nerveux par la modélisation et la simulation. Plus le modèle sera proche de la réalité et plus les ressources calculatoires exigées seront importantes. La question de la complexité et de la précision est un problème bien connu dans la simulation. Les travaux de recherche menés dans le cadre de cette thèse visent à améliorer la simulation de modèles mathématiques représentant le comportement physique et chimique de récepteurs synaptiques. Les modèles sont décrits par des équations différentielles ordinaires (EDO), et leur résolution passe par des méthodes numériques. Dans le but d’optimiser la simulation, j’ai implémenté différentes méthodes de résolution numérique des EDO. Afin de faciliter la sélection du meilleur algorithme de résolution numérique, une méthode nécessitant un minimum d’information a été proposée. Cette méthode permet de choisir l’algorithme qui optimise la simulation. La méthode a permis de démontrer que la dynamique d’un modèle de récepteur synaptique influence plus les performances des algorithmes de résolution que la structure cinétique du modèle lui-même. De plus, afin de caractériser des comportements pathogènes, une phase d’optimisation est réalisée. Cependant, certaines valeurs de paramètres rendent le modèle instable. Une étude de stabilité a permis de déterminer la stabilité du modèle pour des paramètres fournis par la littérature, mais également de remonter à des contraintes de stabilité sur les paramètres. Le respect de ces contraintes permet de garantir la stabilité des modèles étudiés, et donc de garantir le succès de la procédure permettant de rendre un modèle pathogène. / Computational Neuroscience consists in studying the nervous system through modeling and simulation. It is to characterize the laws of biology by using mathematical models integrating all known experimental data. From a practical point of view, the more realistic the model, the largest the required computational resources. The issue of complexity and accuracy is a well known problem in the modeling and identification of models. The research conducted in this thesis aims at improving the simulation of mathematical models representing the physical and chemical behavior of synaptic receptors. Models of synaptic receptors are described by ordinary differential equations (ODE), and are resolved with numerical procedures. In order to optimize the performance of the simulations, I have implemented various ODE numerical resolution methods. To facilitate the selection of the best solver, a method, requiring a minimum amount of information, has been proposed. This method allows choosing the best solver in order to optimize the simulation. The method demonstrates that the dynamic of a model has greater influence on the solver performances than the kinetic scheme of the model. In addition, to characterize pathogenic behavior, a parameter optimization is performed. However, some parameter values lead to unstable models. A stability study allowed for determining the stability of the models with parameters provided by the literature, but also to trace the stability constraints depending to these parameters. Compliance with these constraints ensures the stability of the models studied during the optimization phase, and therefore the success of the procedure to study pathogen models.
14

Commande de systèmes dynamiques: stabilité absolue, saturation et bilinéarité

Tognetti, Calliero 06 November 2009 (has links) (PDF)
Cette thèse présente des contributions aux problèmes d'analyse de stabilité et de synthèse de contrôleurs par retour d'état pour des systèmes dynamiques qui ont des éléments non-linéaires, à partir de conditions sous la forme d'inégalités matricielles linéaires et de fonctions de Lyapunov. Pour les systèmes à commutations soumis à saturation sur les actionneurs, sont fournies des conditions convexes pour le calcul des gains commutés et robustes. La saturation est modélisée comme une non-linéarité de secteur et une estimation du domaine de la stabilité est déterminée. Pour les systèmes linéaires avec des incertitudes polytopiques et des non-linéarités de secteurs, sont fournies des conditions convexes de dimension finie pour construire des fonctions de Lur'e avec dépendance polynomiale homogène en les paramètres. Si elles sont satisfaites, les conditions garantissent la stabilité pour tout le domaine d'incertitudes et pour toutes les non-linéarités dans le secteur, et permettent le calcul de contrôleurs stabilisants robustes par retour linéaire et non-linéaire. Pour les systèmes bilinéaires instables, continus et en temps discret, est fournie une procédure pour calculer un gain stabilisant de commande par retour d'état. La méthode est basée sur la solution alternée de deux problèmes d'optimisation convexe décrits par des inégalités matricielles linéaires, et caractérise une estimation du domaine de la stabilité. Des extensions pour traiter les contrôleurs robustes et linéaires variants avec des paramètres sont aussi présentées.
15

Généralisation du lemme de Gronwall-Bellman pour la stabilisation des systèmes fractionnaires

N'Doye, Ibrahima 23 February 2011 (has links) (PDF)
Dans ce mémoire, nous avons proposé une méthode basée sur l'utilisation de la généralisation du lemme de Gronwall-Bellman pour garantir des conditions suffisantes de stabilisation asymptotique pour une classe de systèmes non linéaires fractionnaires. Nous avons étendu ces résultats dans la stabilisation asymptotique des systèmes non linéaires singuliers fractionnaires et proposé des conditions suffisantes de stabilité asymptotique de l'erreur d'observation dans le cas de l'étude des observateurs pour les systèmes non linéaires fractionnaires et singuliers fractionnaires. Pour les systèmes non linéaires à dérivée d'ordre entier, nous avons proposé par l'application de la généralisation du lemme de Gronwall-Bellman des conditions suffisantes pour : - la stabilisation exponentielle par retour d'état statique et par retour de sortie statique, - la stabilisation exponentielle robuste en présence d'incertitudes paramétriques, - la commande basée sur un observateur. Nous avons étudié la stabilisation des systèmes linéaires fractionnaires avec les lois de commande suivantes~: retour d'état statique, retour de sortie statique et retour de sortie basé sur un observateur. Puis, nous avons proposé des conditions suffisantes de stabilisation lorsque le système linéaire fractionnaire est affecté par des incertitudes non linéaires paramétriques. Enfin, nous avons traité la synthèse d'un observateur pour ces systèmes. Les résultats proposés pour les systèmes linéaires fractionnaires ont été étendus au cas où ces systèmes fractionnaires sont singuliers. La technique de stabilisation basée sur l'utilisation de la généralisation du lemme de Gronwall-Bellman est étendue aux systèmes non linéaires fractionnaires et aux systèmes non linéaires singuliers fractionnaires. Des conditions suffisantes de stabilisation asymptotique, de stabilisation asymptotique robuste et de commande basée sur un observateur ont été obtenues pour les classes de systèmes non linéaires fractionnaires et non linéaires singuliers fractionnaires. Par ailleurs, une méthode de synthèse d'observateurs pour ces systèmes non linéaires fractionnaires et non linéaires singuliers fractionnaires est proposée. Cette approche est basée sur la résolution d'un système d'équations de Sylvester. L'avantage de cette méthode est que, d'une part, l'erreur d'observation ne dépend pas explicitement de l'état et de la commande du système et, d'autre part, qu'elle unifie la synthèse d'observateurs de différents ordres (observateurs d'ordre réduit, d'ordre plein et d'ordre minimal).
16

Improving sampling, optimization and feature extraction in Boltzmann machines

Desjardins, Guillaume 12 1900 (has links)
L’apprentissage supervisé de réseaux hiérarchiques à grande échelle connaît présentement un succès fulgurant. Malgré cette effervescence, l’apprentissage non-supervisé représente toujours, selon plusieurs chercheurs, un élément clé de l’Intelligence Artificielle, où les agents doivent apprendre à partir d’un nombre potentiellement limité de données. Cette thèse s’inscrit dans cette pensée et aborde divers sujets de recherche liés au problème d’estimation de densité par l’entremise des machines de Boltzmann (BM), modèles graphiques probabilistes au coeur de l’apprentissage profond. Nos contributions touchent les domaines de l’échantillonnage, l’estimation de fonctions de partition, l’optimisation ainsi que l’apprentissage de représentations invariantes. Cette thèse débute par l’exposition d’un nouvel algorithme d'échantillonnage adaptatif, qui ajuste (de fa ̧con automatique) la température des chaînes de Markov sous simulation, afin de maintenir une vitesse de convergence élevée tout au long de l’apprentissage. Lorsqu’utilisé dans le contexte de l’apprentissage par maximum de vraisemblance stochastique (SML), notre algorithme engendre une robustesse accrue face à la sélection du taux d’apprentissage, ainsi qu’une meilleure vitesse de convergence. Nos résultats sont présent ́es dans le domaine des BMs, mais la méthode est générale et applicable à l’apprentissage de tout modèle probabiliste exploitant l’échantillonnage par chaînes de Markov. Tandis que le gradient du maximum de vraisemblance peut-être approximé par échantillonnage, l’évaluation de la log-vraisemblance nécessite un estimé de la fonction de partition. Contrairement aux approches traditionnelles qui considèrent un modèle donné comme une boîte noire, nous proposons plutôt d’exploiter la dynamique de l’apprentissage en estimant les changements successifs de log-partition encourus à chaque mise à jour des paramètres. Le problème d’estimation est reformulé comme un problème d’inférence similaire au filtre de Kalman, mais sur un graphe bi-dimensionnel, où les dimensions correspondent aux axes du temps et au paramètre de température. Sur le thème de l’optimisation, nous présentons également un algorithme permettant d’appliquer, de manière efficace, le gradient naturel à des machines de Boltzmann comportant des milliers d’unités. Jusqu’à présent, son adoption était limitée par son haut coût computationel ainsi que sa demande en mémoire. Notre algorithme, Metric-Free Natural Gradient (MFNG), permet d’éviter le calcul explicite de la matrice d’information de Fisher (et son inverse) en exploitant un solveur linéaire combiné à un produit matrice-vecteur efficace. L’algorithme est prometteur: en terme du nombre d’évaluations de fonctions, MFNG converge plus rapidement que SML. Son implémentation demeure malheureusement inefficace en temps de calcul. Ces travaux explorent également les mécanismes sous-jacents à l’apprentissage de représentations invariantes. À cette fin, nous utilisons la famille de machines de Boltzmann restreintes “spike & slab” (ssRBM), que nous modifions afin de pouvoir modéliser des distributions binaires et parcimonieuses. Les variables latentes binaires de la ssRBM peuvent être rendues invariantes à un sous-espace vectoriel, en associant à chacune d’elles, un vecteur de variables latentes continues (dénommées “slabs”). Ceci se traduit par une invariance accrue au niveau de la représentation et un meilleur taux de classification lorsque peu de données étiquetées sont disponibles. Nous terminons cette thèse sur un sujet ambitieux: l’apprentissage de représentations pouvant séparer les facteurs de variations présents dans le signal d’entrée. Nous proposons une solution à base de ssRBM bilinéaire (avec deux groupes de facteurs latents) et formulons le problème comme l’un de “pooling” dans des sous-espaces vectoriels complémentaires. / Despite the current widescale success of deep learning in training large scale hierarchical models through supervised learning, unsupervised learning promises to play a crucial role towards solving general Artificial Intelligence, where agents are expected to learn with little to no supervision. The work presented in this thesis tackles the problem of unsupervised feature learning and density estimation, using a model family at the heart of the deep learning phenomenon: the Boltzmann Machine (BM). We present contributions in the areas of sampling, partition function estimation, optimization and the more general topic of invariant feature learning. With regards to sampling, we present a novel adaptive parallel tempering method which dynamically adjusts the temperatures under simulation to maintain good mixing in the presence of complex multi-modal distributions. When used in the context of stochastic maximum likelihood (SML) training, the improved ergodicity of our sampler translates to increased robustness to learning rates and faster per epoch convergence. Though our application is limited to BM, our method is general and is applicable to sampling from arbitrary probabilistic models using Markov Chain Monte Carlo (MCMC) techniques. While SML gradients can be estimated via sampling, computing data likelihoods requires an estimate of the partition function. Contrary to previous approaches which consider the model as a black box, we provide an efficient algorithm which instead tracks the change in the log partition function incurred by successive parameter updates. Our algorithm frames this estimation problem as one of filtering performed over a 2D lattice, with one dimension representing time and the other temperature. On the topic of optimization, our thesis presents a novel algorithm for applying the natural gradient to large scale Boltzmann Machines. Up until now, its application had been constrained by the computational and memory requirements of computing the Fisher Information Matrix (FIM), which is square in the number of parameters. The Metric-Free Natural Gradient algorithm (MFNG) avoids computing the FIM altogether by combining a linear solver with an efficient matrix-vector operation. The method shows promise in that the resulting updates yield faster per-epoch convergence, despite being slower in terms of wall clock time. Finally, we explore how invariant features can be learnt through modifications to the BM energy function. We study the problem in the context of the spike & slab Restricted Boltzmann Machine (ssRBM), which we extend to handle both binary and sparse input distributions. By associating each spike with several slab variables, latent variables can be made invariant to a rich, high dimensional subspace resulting in increased invariance in the learnt representation. When using the expected model posterior as input to a classifier, increased invariance translates to improved classification accuracy in the low-label data regime. We conclude by showing a connection between invariance and the more powerful concept of disentangling factors of variation. While invariance can be achieved by pooling over subspaces, disentangling can be achieved by learning multiple complementary views of the same subspace. In particular, we show how this can be achieved using third-order BMs featuring multiplicative interactions between pairs of random variables.
17

Généralisation du lemme de Gronwall-Bellman pour la stabilisation des systèmes fractionnaires / Generalization of Gronwall-Bellman lemma for the stabilization of fractional-order systems

N'Doye, Ibrahima 23 February 2011 (has links)
Dans ce mémoire, nous avons proposé une méthode basée sur l'utilisation de la généralisation du lemme de Gronwall-Bellman pour garantir des conditions suffisantes de stabilisation asymptotique pour une classe de systèmes non linéaires fractionnaires. Nous avons étendu ces résultats dans la stabilisation asymptotique des systèmes non linéaires singuliers fractionnaires et proposé des conditions suffisantes de stabilité asymptotique de l'erreur d'observation dans le cas de l'étude des observateurs pour les systèmes non linéaires fractionnaires et singuliers fractionnaires.Pour les systèmes non linéaires à dérivée d'ordre entier, nous avons proposé par l'application de la généralisation du lemme de Gronwall-Bellman des conditions suffisantes pour :- la stabilisation exponentielle par retour d'état statique et par retour de sortie statique,- la stabilisation exponentielle robuste en présence d'incertitudes paramétriques,- la commande basée sur un observateur.Nous avons étudié la stabilisation des systèmes linéaires fractionnaires avec les lois de commande suivantes~: retour d'état statique, retour de sortie statique et retour de sortie basé sur un observateur. Puis, nous avons proposé des conditions suffisantes de stabilisation lorsque le système linéaire fractionnaire est affecté par des incertitudes non linéaires paramétriques. Enfin, nous avons traité la synthèse d'un observateur pour ces systèmes. Les résultats proposés pour les systèmes linéaires fractionnaires ont été étendus au cas où ces systèmes fractionnaires sont singuliers.La technique de stabilisation basée sur l'utilisation de la généralisation du lemme de Gronwall-Bellman est étendue aux systèmes non linéaires fractionnaires et aux systèmes non linéaires singuliers fractionnaires. Des conditions suffisantes de stabilisation asymptotique, de stabilisation asymptotique robuste et de commande basée sur un observateur ont été obtenues pour les classes de systèmes non linéaires fractionnaires et non linéaires singuliers fractionnaires.Par ailleurs, une méthode de synthèse d'observateurs pour ces systèmes non linéaires fractionnaires et non linéaires singuliers fractionnaires est proposée. Cette approche est basée sur la résolution d'un système d'équations de Sylvester. L'avantage de cette méthode est que, d'une part, l'erreur d'observation ne dépend pas explicitement de l'état et de la commande du système et, d'autre part, qu'elle unifie la synthèse d'observateurs de différents ordres (observateurs d'ordre réduit, d'ordre plein et d'ordre minimal). / In this dissertation, we proposed sufficient conditions for the asymptotical stabilization of a class of nonlinear fractional-order systems based on the generalization of Gronwall-Bellman lemma. We extended these results for the asymptotical stabilization of nonlinear singular fractional-order systems and proposed sufficient conditions for the existence and asymptotic stability of the observation error for the nonlinear fractional-order systems and nonlinear singular fractional-order systems.For the nonlinear integer-order systems, the proposed generalization of Gronwall-Bellman lemma allowed us to obtain sufficient conditions for :- the static state feedback and the static output feedback exponential stabilizations,- the robust exponential stabilization with regards to parameter uncertainties,- the observer-based control.We treated three cases for the asymptotical stabilization of linear fractional-order systems : the static state feedback, the static output feedback and the observer-based output feedback. Then, we proposed sufficient conditions for the asymptotical stabilization of linear fractional-order systems with nonlinear uncertain parameters. Finally, we treated the observer design for the linear and nonlinear fractional-order systems and for the linear and nonlinear singular fractional-order systems.The stabilization technique based on the generalization of Gronwall-Bellman lemma is extended to nonlinear fractional-order systems and nonlinear singular fractional-order systems. Sufficient conditions for the asymptotical stabilization, the robust asymptotical stabilization and the observer-based control of a class of nonlinear fractional-order systems and nonlinear singular fractional-order systems were obtained.Furthermore, the observer design for the nonlinear fractional-order systems and nonlinear singular fractional-order systems is proposed. This approach is based on a parameterization of the solutions of generalized Sylvester equations. The conditions for the existence of these observers are given and sufficient conditions for their stability are derived using linear matrix inequalities (LMIs) formulation and the generalization of Gronwall-Bellman lemma. The advantage of this method is that, firstly, the observation error does not depend explicitly on the state and control system and, secondly, this method unifies the design of full, reduced and minimal orders observers
18

Développements de modèles optiques et de méthodes non supervisées de résolution des problèmes bilinéaires : application à l’imagerie vibrationnelle / Development of optical models and non-supervised methods to solve bilinear problems : application to vibrationnal mapping

Bonnal, Thomas 24 April 2018 (has links)
La caractérisation fine des matériaux inorganiques nécessite d'avoir accès à des informations complémentaires de celles apportées par des techniques d'analyse élémentaire ou de diffraction. La spectroscopie infrarouge à transformée de Fourier permet de caractériser les liaisons covalentes et l'environnement des groupes fonctionnels dans les matériaux. C'est donc une technique de choix pour l'étude des matériaux hydratés, amorphes ou sujets à des phénomènes de vieillissement. En couplant cette technique à une platine de déplacement, il est possible de réaliser des cartographies des phases sur quelques centimètres carrés : c'est la microscopie infrarouge. Cette thèse développe plus particulièrement l'utilisation de la lumière réfléchie au travers de l'étude de la réflexion spéculaire et de la réflexion totale atténuée (ATR).Après une première partie se focalisant sur les méthodes d'acquisitions disponibles, une seconde partie s'attache à obtenir de manière non supervisée les cartographies chimiques associées aux concentrations relatives des différents composants présents dans la zone analysée. Des techniques de réduction de données et d'analyse factorielle sont mises en place afin d'estimer le nombre de composants chimiques et leurs spectres relatifs ; des problèmes de minimisation sous contraintes sont résolus pour extraire l'information chimique. La réflexion spéculaire ne nécessite aucun contact avec l‘échantillon et, de ce fait, n'entraine aucune altération de la surface analysée. C'est sur le papier une technique de choix pour suivre l'évolution d'un matériau. Cependant, elle souffre de la complexité d'interprétation liée à l'allure des spectres obtenus. Afin de développer la cartographie issue de la réflexion spéculaire, des modèles prenant en compte l'optique géométrique, l'optique ondulatoire, des corrections d'interférogrammes et des méthodes classiques d'homogénéisation ont été développés. Ce travail a permis d'aboutir à un modèle optique liant les spectres issus de la réflexion spéculaire avec les concentrations relatives des composants. Ce modèle tient compte de la polarisation, de l'angle d'incidence et utilise les constantes diélectriques du matériau. Ce modèle a été validé sur un matériau contenant trois composants distincts facilement identifiables en infrarouge et spécialement mis en forme pour cette étude. Ce modèle a ouvert la voie à l'utilisation innovante de lumières polarisées elliptiquement pour déterminer l'indice de réfraction complexe d'un matériau. Ainsi, des spectroscopes infrarouges couplés à un accessoire de contrôle de l'angle d'incidence peuvent être utilisés en complément de l'ellipsométrie / Complementary information, to that provided by elemental analysis and diffraction techniques, is needed to characterize inorganic materials. Fourier Transform Infrared spectroscopy enables to characterize covalent bonds and the environment of functional groups in materials. Thus, it is a technique of interest to study hydrated materials, amorphous materials or any materials, which may experience ageing phenomena. By combining this technique with a micrometric motorized stage, cartographies of chemical compounds can be obtained on several square millimeters: this is the infrared microscopy technique. This Ph.D. thesis focuses on the use of reflected light, in particular through the study of specular reflection and of Attenuated Total Reflectance (ATR). After a first part focused on the different acquisition set-ups, a second part covers the unsupervised methodologies of resolution employed to obtain chemical maps. They result in one map for each component present in the analyzed area. Dimensions reduction techniques and multivariate statistics techniques are implemented to estimate the number of components and their infrared spectra; minimization problems under constraints are solved to retrieve chemical information. When specular reflection is used to acquire spectra, no contact is made with the sample, thus no damage of the analyzed area occurs during the acquisition. A priori, it is a great technique to study the evolution of a material. However, this technique suffers from the complexity of interpretation of the resulting spectra. With the objective to democratize the use of specular reflection to obtain chemical maps, models based on geometrical optics and including diffraction, correction of interferograms and classical homogenization techniques have been developed. This work resulted in an optical model linking the angle of incidence, the polarization state and the dielectric optical constants of the material with the reflected light, which is measured. A model material, constituted of three distinct phases, detectable in the infrared range, has specially been fabricated to validate this optical model. This model set the stage for the use of elliptically polarized light in the determining of the complex refractive indices of materials in the infrared range. Thanks to this development, infrared spectroscopes, equipped with a classical set-up to control the angle of incidence, can now be used in addition to ellipsometry techniques
19

Histoire du théorème de Jordan de la décomposition matricielle (1870-1930).<br />Formes de représentation et méthodes de décomposition.

Brechenmacher, Frederic 09 March 2006 (has links) (PDF)
L'histoire du théorème de Jordan est abordée sous l'angle d'une question d'identité posée sur la période qui sépare la date de 1870 et l'énoncé par Camille Jordan d'une forme canonique des substitutions linéaires des années trente du vingtième siècle au cours desquelles le théorème de Jordan de la décomposition matricielle acquiert une place centrale dans la théorie des matrices canoniques. A partir d'un moment historique de référence, la controverse entre Jordan et Kronecker de 1874, le théorème de Jordan permet de jeter un regard original sur l'histoire de la période 1870-1930 en suivant le rôle joué par des savoirs tacites, des idéaux et des pratiques propres à des réseaux et des communautés. Ce regard permet notamment de mettre en évidence la dynamique d'une tension entre formes canoniques et invariants dans l'évolution de la signification de la notion de forme en mathématiques et contribue à l'histoire de l'algèbre linéaire en décrivant le rôle joué par une méthode de décomposition indissociable d'un mode particulier de représentation : la décomposition matricielle.
20

Improving sampling, optimization and feature extraction in Boltzmann machines

Desjardins, Guillaume 12 1900 (has links)
L’apprentissage supervisé de réseaux hiérarchiques à grande échelle connaît présentement un succès fulgurant. Malgré cette effervescence, l’apprentissage non-supervisé représente toujours, selon plusieurs chercheurs, un élément clé de l’Intelligence Artificielle, où les agents doivent apprendre à partir d’un nombre potentiellement limité de données. Cette thèse s’inscrit dans cette pensée et aborde divers sujets de recherche liés au problème d’estimation de densité par l’entremise des machines de Boltzmann (BM), modèles graphiques probabilistes au coeur de l’apprentissage profond. Nos contributions touchent les domaines de l’échantillonnage, l’estimation de fonctions de partition, l’optimisation ainsi que l’apprentissage de représentations invariantes. Cette thèse débute par l’exposition d’un nouvel algorithme d'échantillonnage adaptatif, qui ajuste (de fa ̧con automatique) la température des chaînes de Markov sous simulation, afin de maintenir une vitesse de convergence élevée tout au long de l’apprentissage. Lorsqu’utilisé dans le contexte de l’apprentissage par maximum de vraisemblance stochastique (SML), notre algorithme engendre une robustesse accrue face à la sélection du taux d’apprentissage, ainsi qu’une meilleure vitesse de convergence. Nos résultats sont présent ́es dans le domaine des BMs, mais la méthode est générale et applicable à l’apprentissage de tout modèle probabiliste exploitant l’échantillonnage par chaînes de Markov. Tandis que le gradient du maximum de vraisemblance peut-être approximé par échantillonnage, l’évaluation de la log-vraisemblance nécessite un estimé de la fonction de partition. Contrairement aux approches traditionnelles qui considèrent un modèle donné comme une boîte noire, nous proposons plutôt d’exploiter la dynamique de l’apprentissage en estimant les changements successifs de log-partition encourus à chaque mise à jour des paramètres. Le problème d’estimation est reformulé comme un problème d’inférence similaire au filtre de Kalman, mais sur un graphe bi-dimensionnel, où les dimensions correspondent aux axes du temps et au paramètre de température. Sur le thème de l’optimisation, nous présentons également un algorithme permettant d’appliquer, de manière efficace, le gradient naturel à des machines de Boltzmann comportant des milliers d’unités. Jusqu’à présent, son adoption était limitée par son haut coût computationel ainsi que sa demande en mémoire. Notre algorithme, Metric-Free Natural Gradient (MFNG), permet d’éviter le calcul explicite de la matrice d’information de Fisher (et son inverse) en exploitant un solveur linéaire combiné à un produit matrice-vecteur efficace. L’algorithme est prometteur: en terme du nombre d’évaluations de fonctions, MFNG converge plus rapidement que SML. Son implémentation demeure malheureusement inefficace en temps de calcul. Ces travaux explorent également les mécanismes sous-jacents à l’apprentissage de représentations invariantes. À cette fin, nous utilisons la famille de machines de Boltzmann restreintes “spike & slab” (ssRBM), que nous modifions afin de pouvoir modéliser des distributions binaires et parcimonieuses. Les variables latentes binaires de la ssRBM peuvent être rendues invariantes à un sous-espace vectoriel, en associant à chacune d’elles, un vecteur de variables latentes continues (dénommées “slabs”). Ceci se traduit par une invariance accrue au niveau de la représentation et un meilleur taux de classification lorsque peu de données étiquetées sont disponibles. Nous terminons cette thèse sur un sujet ambitieux: l’apprentissage de représentations pouvant séparer les facteurs de variations présents dans le signal d’entrée. Nous proposons une solution à base de ssRBM bilinéaire (avec deux groupes de facteurs latents) et formulons le problème comme l’un de “pooling” dans des sous-espaces vectoriels complémentaires. / Despite the current widescale success of deep learning in training large scale hierarchical models through supervised learning, unsupervised learning promises to play a crucial role towards solving general Artificial Intelligence, where agents are expected to learn with little to no supervision. The work presented in this thesis tackles the problem of unsupervised feature learning and density estimation, using a model family at the heart of the deep learning phenomenon: the Boltzmann Machine (BM). We present contributions in the areas of sampling, partition function estimation, optimization and the more general topic of invariant feature learning. With regards to sampling, we present a novel adaptive parallel tempering method which dynamically adjusts the temperatures under simulation to maintain good mixing in the presence of complex multi-modal distributions. When used in the context of stochastic maximum likelihood (SML) training, the improved ergodicity of our sampler translates to increased robustness to learning rates and faster per epoch convergence. Though our application is limited to BM, our method is general and is applicable to sampling from arbitrary probabilistic models using Markov Chain Monte Carlo (MCMC) techniques. While SML gradients can be estimated via sampling, computing data likelihoods requires an estimate of the partition function. Contrary to previous approaches which consider the model as a black box, we provide an efficient algorithm which instead tracks the change in the log partition function incurred by successive parameter updates. Our algorithm frames this estimation problem as one of filtering performed over a 2D lattice, with one dimension representing time and the other temperature. On the topic of optimization, our thesis presents a novel algorithm for applying the natural gradient to large scale Boltzmann Machines. Up until now, its application had been constrained by the computational and memory requirements of computing the Fisher Information Matrix (FIM), which is square in the number of parameters. The Metric-Free Natural Gradient algorithm (MFNG) avoids computing the FIM altogether by combining a linear solver with an efficient matrix-vector operation. The method shows promise in that the resulting updates yield faster per-epoch convergence, despite being slower in terms of wall clock time. Finally, we explore how invariant features can be learnt through modifications to the BM energy function. We study the problem in the context of the spike & slab Restricted Boltzmann Machine (ssRBM), which we extend to handle both binary and sparse input distributions. By associating each spike with several slab variables, latent variables can be made invariant to a rich, high dimensional subspace resulting in increased invariance in the learnt representation. When using the expected model posterior as input to a classifier, increased invariance translates to improved classification accuracy in the low-label data regime. We conclude by showing a connection between invariance and the more powerful concept of disentangling factors of variation. While invariance can be achieved by pooling over subspaces, disentangling can be achieved by learning multiple complementary views of the same subspace. In particular, we show how this can be achieved using third-order BMs featuring multiplicative interactions between pairs of random variables.

Page generated in 0.0478 seconds