• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 26
  • 16
  • 2
  • Tagged with
  • 51
  • 32
  • 26
  • 21
  • 18
  • 18
  • 18
  • 17
  • 16
  • 16
  • 15
  • 14
  • 14
  • 14
  • 13
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
41

Inclinomètre à niveaux hydrostatiques de haute résolution en géophysique / High Resolution Water-Tube Tiltmeter in Geophysics

d'Oreye de Lantremange, Nicolas F.C. 10 November 2003 (has links)
Nous avons développé, et évalué en détail, un nouveau prototype d'inclinomètre longue base à niveaux hydrostatiques appelé " wth2o ". Ce système, aux principes particulièrement simples grâce à l'absence de pièces mécaniques mobiles, présente une grande fiabilité et une excellente stabilité (dérive linéaire de 0.05 µrad par mois). Sa haute résolution jusque dans la gamme des ondes sismiques longues périodes (où, par exemple, la résolution est meilleure que 0.001 masec, soit 5. 10-12 rad), et son niveau de bruit très bas, ont permis d'obtenir des résultats d'analyses harmoniques de marées terrestres (5 ans d'enregistrements) en excellent accord avec les modèles, et dont les écarts quadratiques moyens sont les plus bas de toutes les mesures inclinométriques réalisées au Laboratoire de Géodynamique de Walferdange (Luxembourg). A titre d'exemple, l'amplitude de l'onde M2 est déterminée avec une incertitude de seulement 0.003 masec, tandis que sa phase est déterminée avec un EQM de 0.028°, ce qui correspond à une incertitude de seulement 3.3 secondes. Cet instrument permit également d'observer des phénomènes rarement mesurés avec ce type d'appareil, tel les modes sphéroïdaux et toroïdaux les plus graves des oscillations libres de la Terre excitées par le séisme du Dénali (Mw 7.9) en novembre 2002, ou les passages successifs des ondes de Love jusqu'à G7, correspondant à 3 révolutions de ces ondes de surface autour du globe. Il fut également possible de séparer pour la première fois dans une analyse harmonique de marée terrestre inclinométrique, les constituants des groupes ter- et quater-diurnes. Ces très petites ondes enregistrées sont vraisemblablement liées aux ondes de marées océaniques propres aux eaux peu profondes présentes en Mer du Nord. Les modèles théoriques détaillés de cet appareil (comprenant des composantes relatives à l'amortissement produit par l'écoulement des fluides entre les électrodes des capteurs capacitifs) ont permis de dériver les solutions des équations du mouvement en composante inclinométrique et accélérométrique. De ces solutions furent tirées les formes théoriques des fonctions de transfert de l'appareil. Ces fonctions de transferts furent comparées avec succès aux mesures expérimentales de la réponse en fréquence. Grâce aux formes analytiques des fonctions de transfert en composante inclinométrique et accélérométrique qui sont données dans le présent travail, il est possible de calculer les caractéristiques géométriques optimales pour la construction d'un prototype devant répondre aux besoins particuliers d'une nouvelle application. Une étude originale des effets de ménisques (déformations de l'interface des fluides au contact de la paroi solide des pots) a montré que, s'ils n'ont pas d'influence sur les mesures en mode différentiel, ils peuvent par contre introduire des erreurs de plusieurs pour-cent sur l'estimation de la sensibilité par déplacement d'une quantité de liquide supposée connue. Cette erreur, ne dépendant que des propriétés physico-chimiques des fluides et matériaux en contacts, provient des variations de volumes de liquide contenu dans les ménisques lors des mouvements des interfaces. Si ces mouvements sont effectués lors des étalonnages sans que la ligne de contact ne se déplace, ces erreurs [en %] seront indépendantes du volume déplacé. Ces erreurs ne sont pas particulières à notre instrument mais peuvent affecter les étalonnages réalisés de la sorte pour tout inclinomètre à niveaux hydrostatiques, quel que soit le principe de mesure de l'instrument (mesures différentielles de pression, positionnement de flotteurs etc…). / We developed and evaluated a new prototype of long base water-tube tiltmeter named "wth2o". This system, particularly simple by the absence of moving parts, showed a great reliability and a fairly high stability (linear drift rate of 0.05 µrad/month). We analyzed a 5 years-long data set of Earth tides measurements performed in the Underground Laboratory for Geodynamics in Walferdange (Luxemburg). Its high resolution up to the long-period seismic band (where for instance the resolution is better than 0.001 masec, or 5. 10-12 rad) and its very low noise rate enabled us to obtain results in excellent accordance with the models, with the lowest root mean squares among all the results obtained with other tiltmeters in Walferdange. For instance, the amplitude of the M2 wave is estimated with a RMS as small as 0.003 masec and its phase is determined with an uncertainty below 0.028°, which represents 3.3 seconds only. With the "wth2o" we have also observed some events rarely measured with a water-tube, such as the gravest toroidal and spheroidal modes of the Earth free oscillations excited by the Mw 7.9 Denali earthquake or the successive passages of Love waves (up to G7) circling the globe. For the first time in an analysis of tilt Earth tide measurements, it was possible to separate the small constituents of the ter- and quater-diurnal band. The presence of these very small waves is most likely due to the effects of the shallow-water tides known to be remarkable in the North Sea. Theoretical models of this instrument (taking into account the damping produced by the liquids' flow between the plates of the capacitive sensors) allowed to obtain the solutions of the equations of motion for tilt as well as for acceleration. From these solutions we were able to produce very accurate theoretical transfer functions, as confirmed by the successful comparison with observed frequency responses. Thanks to the analytical tilt and acceleration transfer functions given in the present document it is possible to calculate the best geometrical characteristics for the construction of a new prototype having to respond to specific requirements of a new application. A new extended study of the menisci effects (deformations of the interface of the fluids in contact with the solid wall of the end vessels) showed that they do not influence the differential measurements but they could introduce errors of a few percents in the calibration factor when this factor is evaluated by the displacement of a "known" volume of liquid. This error depends only on the physical and chemical properties of the fluids and solids put in contact. It is due to the variation of volume of liquid trapped in the menisci while the interface is moving up- or downwards. If these interface movements are made without displacing the contact line, the errors [in %] will remain the same whatever the displaced volume of liquid could be. These errors can not only affect our results but can also be found in the calibration procedure of any kind of water-tube (central differential pressure, float positioned etc…).
42

Structure profonde et évolution du Nord du golfe d'Aden oriental : sismique réfraction et modélisation thermomécanique

Watremez, Louise 30 June 2010 (has links) (PDF)
Le golfe d'Aden est un bassin océanique jeune séparant la plaque Arabe de la plaque Somalienne à une vitesse d'environ 2 cm/an depuis au-moins 17,6 Ma, moment du début de l'accrétion océanique ; le rifting ayant débuté il y a environ 35 Ma. Les marges continentales du golfe d'Aden sont volcaniques à l'Ouest, près du point chaud Afar, et non-volcaniques dans la partie orientale du golfe. Encore proches, du fait de leur jeunesse, les marges conjuguées sont facilement corrélables et de plus, elles sont relativement peu sédimentées. Ainsi, l'étude des structures profondes de la marge Nord-orientale du golfe d'Aden et la modélisation thermomécanique appliquée au golfe d'Aden oriental sont simplifiées. Le golfe d'Aden est divisé en trois parties (occidentale, centrale et orientale) par une segmentation de premier ordre (par les transformantes de Shukra-El-Sheik et d'Alula-Fartak). Dans la partie orientale du golfe d'Aden (entre les zones de fractures d'Alula-Fartak à l'Ouest et de Socotra-Hadbeen à l'Est), la marge nord est segmentée au deuxième ordre en trois segment appelés Ashawq-Salalah, Taqah et Mirbat, séparés par des zones d'accommodation. L'acquisition de données de bathymétrie, gravimétrie, magnétisme, sismique réflexion et sismique réfraction sur la marge nord-orientale du golfe d'Aden a été effectuée lors de la campagne Encens (Leroy et al., Février-Mars 2006). L'exploitation et l'interprétation des données de sismique réfraction et de gravimétrie sur le segment d'Ashawq-Salalah ont permis d'imager la structure profonde de la marge. L'amincissement de la croûte continentale se produit sur une distance de 50 à 100 km, les facteurs d'amincissement variant de 3,2 à 5,3. Ces facteurs d'amincissement sont alors suffisant pour que la croûte devienne totalement cassante. Ainsi, l'eau peut pénétrer en profondeur à la faveur de fractures provoquant la serpentinisation du manteau supérieur à la transition océan-continent (TOC). L'épaisseur de la croûte océanique diminue du centre du segment (10 km) vers sa limite avec le segment de Taqah (5,5 km). Cette observation est reliée à une variation d'apport magmatique le long de la paléo-ride océanique. La TOC est étroite (environ 15 km) et on observe en base de croûte un corps à vitesses et densités anormales (vitesses des ondes P entre 7,6 et 7,8 km/s et densité de 3,1 g/cm 3), d'épaisseur maximale d'environ 5 km. Ce corps est interprété comme du sous-plaquage et/ou de la croûte intrudée par du matériel magmatique relié à la présence d'un volcan dans le domaine transitionnel. Ces structures liées à une anomalie de fusion, sont datées d'âge post-rift. Les structures en vitesses de ce segment ne montrent aucune preuve de serpentinisation du manteau, probablement parce que les indices géophysiques de serpentinisation ont pu être effacés par la présence de magmatisme post-rift. Ainsi cette marge non-volcanique montre des évidences de magmatisme, dont le volume observé est cependant moins important que celui des marges volcaniques, et il est en outre associé à un évènement thermique post-rift. La phase de rifting est donc bien amagmatique. La modélisation thermomécanique est réalisée afin d'étudier l'influence sur la chronologie du rifting et l'évolution des marges conjuguées de plusieurs paramètres tels les taux d'érosion/sédimentation, la pression de la colonne d'eau, la résistance de la croûte, l'héritage tectonique, le contraste de densité entre la lithosphère et l'asthénosphère, l'âge thermique du craton et enfin le critère de rupture dans le manteau lithosphérique. Les résultats majeurs montrent que : (1) le contraste de densité entre le manteau lithosphérique et le manteau asthénosphérique gouverne la flexure de la croûte continentale et la profondeur du plancher océanique ; et (2) le critère de rupture dans le manteau lithosphérique contrôle la localisation de la déformation, et de cette manière, la géométrie des marges conjuguées et la chronologie du rifting. La synthèse de ces travaux et les observations disponibles sur le golfe d'Aden ont permis de contraindre les paramètres initiaux qui ont permis la formation et le développement du golfe d'Aden observé aujourd'hui et ainsi de proposer un modèle pour la formation et l'évolution du golfe d'Aden oriental. Ce modèle montre que la fusion partielle du manteau peut se produire au moment de la rupture continentale. Les produits de la fusion partielle peuvent alors " remonter " en surface et de la croûte océanique est susceptible de se former. De cette manière, la TOC peut être constituée de manteau continental exhumé, et être étroite. L'anomalie de fusion post-rift observée grâce aux données géophysiques n'est pas modélisée ici, car elle implique une vision 3D non encore disponible en modélisation thermo-mécanique visco-élasto-plastique. Même en 2D, les travaux de modélisation thermomécanique réalisés apportent une lumière nouvelle sur les processus conduisant à la formation de la TOC d'une marge non-volcanique.
43

Modélisation physique de l’impact du creusement d’un tunnel par tunnelier à front pressurisé sur des fondations profondes / Study of the impact of tunneling with an EPB TBM on the surrounding buildings

Bel, Justin 28 March 2018 (has links)
Le travail de thèse présenté dans ce mémoire vise à analyser et à comprendre les mécanismes mis en jeu au niveau de l’impact du creusement d’un tunnel par bouclier à front pressurisé sur des fondations profondes avoisinantes. Cette thèse a été réalisée dans le cadre du projet européen NeTTUN, au sein du Laboratoire de Tribologie et de Dynamique des Systèmes (LTDS) de l’ENTPE. L’approche phénoménologique conduite lors de ces travaux repose sur deux importantes campagnes expérimentales réalisées à l’aide d’un dispositif unique au plan international de modèle réduit 1g de tunnelier à pression de terre (échelle de l’ordre de 1/10eme). La forte originalité de ce dispositif est de pouvoir simuler de façon réaliste les principales étapes du processus tridimensionnel d’excavation mécanisé d’un tunnel. Dans le cadre de cette thèse, le dispositif existant de modèle réduit de tunnelier a dans un premier temps été reconfiguré afin de pouvoir répondre aux besoins du programme expérimental envisagé. Des modèles physiques de fondations profondes (pieux et groupes de pieux) et de barrières de protection ont été conçus dans le cadre des lois de similitude, fabriqués et instrumentés. Deux campagnes expérimentales d’envergure ont été réalisées en massif de sable sec : l’une concerne les effets du passage d’un tunnelier à front pressurisé sur des fondations profondes avoisinantes (pieux, groupe de pieux), l’autre traite de l’efficacité de barrières de protection (parois moulées) utilisées pour limiter ces effets. Différents paramètres qui influencent l’interaction tunnelier - sol - fondations ont été considérés comme la distance relative tunnel / fondation, la pression frontale de soutènement appliquée par le TBM sur le terrain ou encore la hauteur des barrières de protection. L’analyse phénoménologique menée à l’échelle du modèle concerne en particulier l’évolution des champs de contraintes et de déplacements dans le terrain autour du tunnelier, les déplacements relatifs sol - pieu et sol- barrière, la redistribution des efforts au sein des fondations. L’importante base de données et d’analyse ainsi constituée a été mise à profit pour la validation d’outils de modélisation numérique développés par l’Université de Rome au sein du projet NeTTUN. / The major goal presented in this thesis was to analyze and investigate the mechanisms, which are involved in the impact of the tunnels excavated thanks to an Earth Pressure Balanced Shield on nearby deep foundations. This thesis was realized in European project NeTTUN and the work had been done in the Laboratory of Tribology and Systems Dynamics (LTDS) of ENTPE. During these works, phenomenological approach was based on two important experimental campaigns carried out using a unique device at the international level of a 1g scale model of earth-pressure tunnel boring machine (scale of the order of 1 / 10). The state of the art of this device was to be able to simulate in possibly realistic way the main stages of the three-dimensional process of mechanized excavation of a tunnel. In the framework of this thesis, the existing model tunneling machine device was initially reconfigured in order to reach the expectations of the experimental program envisaged. Physical models of deep foundations (piles and groups of piles) and protective barriers were designed under the similitude laws, manufactured and instrumented. The two large-scale experimental campaigns have been carried out in a dry sand massif. The first one concerned the effects of the passage of a pressurized tunnel boring machine on nearby deep foundations (piles, group of piles), whereas another one dealed with the effectiveness of mitigation procedure (diaphragm walls) used to limit these effects. Different parameters that influenced on the tunneling: soil - foundation interaction considered as the relative tunnel / foundation distance, the frontal face pressure applied by the TBM in the field or the height of the protective barriers. The phenomenological analysis carried out at the scale of the model concerned in particular the evolution of the fields of stresses and displacements in the ground around the tunnel boring machine, relatives pile / soil and wall / soil displacements and the redistribution of stresses along the pile foundations. The large database and analysis constituted was used for the validation of numerical modeling tools developed by the University of Rome within the NeTTUN project.
44

Representation Learning for Visual Data

Dumoulin, Vincent 09 1900 (has links)
No description available.
45

Etude mathématique de modèles de couches visqueuses pour des écoulements naturels / Mathematical study of viscous layer models for natural ows

Legrand, Mathilde 03 November 2016 (has links)
Le système de Saint Venant est répandu pour modéliser des fluides dont la hauteur est inférieure au domaine d'écoulement. Son écriture nécessite des hypothèses sur le profil de vitesse pour connaître le flux de la quantité de mouvement ainsi que le cisaillement sur le fond. Dans cette thèse, nous nous sommes intéressés à un couplage entre un fluide parfait et une couche visqueuse dans l'esprit des couches limites interactives (IBL) introduites en aéronautique. Cette interaction nous permet de proposer un terme de friction en adéquation avec les attentes physiques au regard de la position du maximum local. Une part importante de cette thèse est donc consacrée à la compréhension de la couche visqueuse dans laquelle la recherche du profil de vitesse est cantonnée. Cette étude se décompose en l'écriture des équations de Prandtl puis en l'établissement de l'équation de von Kármán. Cette dernière met en jeu les quantités nécessaires à la définition du flux recherché et est donc un élément clé de la fermeture du système. Des résultats numériques viennent illustrer le modèle obtenu par le couplage entre le fluide parfait et la couche visqueuse. Le dernier chapitre expose deux formulations alternatives obtenues d'un point de vue d'un écoulement d'un fluide parfait dont les conditions sur les bords du domaine sont modifiées, soit par une condition de transpiration définie sur le fond, soit par une modification du domaine enlien avec une topographie apparente. / Shallow Water system is widely used for flows when the depth is smaller than the longitudinal scale. The establishment needs some hypothesis on the velocity profile in order to describe the moment flux and the shear stress on ground. In this thesis, we present a two layer decomposition of the fluid between an ideal fluid and a viscous layer in the spirit of the Interactive Boundary Layer (IBL) introduced in aeronautics. This interaction leads to obtain in our equations a friction term which fits with the physical expectations for the local maximum. So a major part of this work is interested in the comprehension of the viscous layer where the velocity profile is confined. The study is based on the writing of Prandtl equations then the establishment of the von Kármán equation. The last one contains the necessary quantities for a definition of the researched flux. Also this equation is essential for a closure of the system. Some numerical results illustrate the proposed model with the association of ideal fluid ans viscous layer. A last chapter presents two alternatives formulations of the model based on an ideal fluid with modified boundary conditions. The first one keeps the same domain but has a transpiration boundary.
46

La couche limite et l'hydrodynamique 2D à grande échelle de la zone de surf : une étude numérique / Surf zone boundary layer and 2D large scale hydrodynamics / Capa límite e hidrodinámica 2D a gran escala en la zona de surf : un estudio numérico

Suarez Atias, Léandro 30 May 2014 (has links)
Ce travail porte sur les processus hydrodynamiques en zone littorale.Deux principaux thèmes sont abordés. Le premier concerne la couchelimite oscillante provoquée par l’interaction entre les vagues et le fondà l’approche des côtes. Le second traite de l’évolution de la circulationet la vorticité induite par la bathymétrie et/ou le forçage des vagues.Un modèle de couche limite turbulente a été élaboré et utilisé pourobserver l’évolution de la couche limite oscillante sous l’effet de vaguesnon-linéaires, en s’appuyant sur une modélisation physique menéedans le canal à houle du LEGI. Les profils expérimentaux de vitesseet positions du fond fixe instantanés permettent de définir l’évolutiondes non-linéarités induites par les vagues au sein de la couche limite.Le modèle numérique couplé à une modélisation du mouvement dulit mobile est capable de reproduire l’évolution de ces non-linéarités,et explique que la diffusion verticale observée expérimentalementest principalement due au mouvement vertical du lit causé induitpar les vagues. Pour l’étude de la circulation et de la vorticité enzone côtière, un modèle numérique 2D moyenné sur la verticale detype Shallow Water est validé avec les données d’une expériencemenée dans le basin à vagues du Laboratoire Hydraulique de France(ARTELIA). La formation de courants sagittaux a été forcée parun front de vagues avec un déficit d’énergie au centre du bassin. Lemodèle numérique est validé par des mesures de surface libre, devitesse, ainsi que de circulation et vorticité. En utilisant ensuitel’équation de vorticité potentielle comme outil de diagnostic, avec unforçage monochromatique on prédit un équilibre entre la générationde vorticité et son advection par l’écoulement moyen. / This work is about the hydrodynamic processes in the nearshorezone. They are of great importance to estimate the overall dynamicsof the coastal zone. This thesis is divided into two main parts; thefirst one investigates the coastal bottom boundary layer induced bythe interaction of the waves and the bottom when approaching thecoast; the second one is about the evolution of the mean circulationand vorticity induced by an inhomogeneity in the bathymetry orthe wave forcing. A turbulent boundary layer numerical model hasbeen developed and used to simulate the evolution of the oscillatingboundary layers under non-linear waves, of a flume experiment at theLaboratoire des Ecoulements Géophysiques et Industriels (LEGI) inGrenoble, France. The experimental instantaneous velocity profilesand still bed positions, allow defining the non-linear velocity distributionsinduced by the waves within the boundary layer. The numericalmodel coupled with a ad-hoc modeling of the mobile bed motionis able to reproduce the vertical distribution of the non-linearities,and also indicates that the vertical diffusion observed experimentallyis mainly caused by the mobile bed motion induced by the passingwaves. A 2D depth-averaged nonlinear shallow water numericalmodel is used to study the circulation and vorticity in the nearshorezone. This model is validated on a mobile bed experiment in thewave basin of the Laboratoire Hydraulique de France (ARTELIA).The formation of rip currents is forced by a damped wave forcing inthe middle of the wave basin. The numerical model is validated withfree surface and velocity measurements, and by the circulation andvorticity. Using the potential vorticity balance as a diagnosis tooland with a monochromatic wave forcing, an equilibrium between thevorticity generation and advection is observed in the nearshore zone. / Este trabajo trata de los procesos hidrodinámicos en la zona litoral,de grande importancia para la dinámica global del flujo costero. Dostemas principales son estudiados. El primero trata de la capa límiteoscilante provocada por la interacción entre el oleaje y el fondo alacercarse a la costa. El segundo tema trata de la evolución de lacirculación y la vorticidad inducida por la batimetría y/o el oleaje.Un modelo de capa límite turbulenta ha sido elaborado y validadopara analizar la evolución de la capa límite oscilante bajo la influenciade oleaje no-lineal, apoyándose en una modelación física, realizada enel canal de olas del LEGI. Los perfiles experimentales instantáneos develocidad y posición del fondo fijo, permiten definir la evolución delas no-linealidades inducidas por las olas dentro de la capa límite. Elmodelo numérico acoplado a una modelación del movimiento del fondomóvil es capaz de reproducir la evolución de estas no-linealidades, yexplica también que la difusión vertical observada experimentalmentees principalmente debida al movimiento vertical del fondo inducidopor el oleaje. El estudio de la circulación y de la vorticidad en zonascosteras se hace mediante un modelo numérico 2D promediado enla vertical de tipo Shallow Water que es validado con los datos deuna experiencia llevada a cabo en la piscina de olas del LaboratoireHydraulique de France (ARTELIA). La formación de corrientes ripse realiza a través de frentes de olas con un déficit de energía en elmedio de la piscina. El modelo numérico es validado con medicionesde superficie libre, de velocidades, y de circulación y vorticidad.Utilizando la ecuación de vortcidad potencial como herramienta dediagnóstico, con un oleaje monocromático se predice un equilibrioentre la generación de vorticidad y su advección por las corrientes.
47

Towards deep semi supervised learning

Pezeshki, Mohammad 05 1900 (has links)
No description available.
48

Feedforward deep architectures for classification and synthesis

Warde-Farley, David 08 1900 (has links)
No description available.
49

Unsupervised representation learning in interactive environments

Racah, Evan 08 1900 (has links)
Extraire une représentation de tous les facteurs de haut niveau de l'état d'un agent à partir d'informations sensorielles de bas niveau est une tâche importante, mais difficile, dans l'apprentissage automatique. Dans ce memoire, nous explorerons plusieurs approches non supervisées pour apprendre ces représentations. Nous appliquons et analysons des méthodes d'apprentissage de représentations non supervisées existantes dans des environnements d'apprentissage par renforcement, et nous apportons notre propre suite d'évaluations et notre propre méthode novatrice d'apprentissage de représentations d'état. Dans le premier chapitre de ce travail, nous passerons en revue et motiverons l'apprentissage non supervisé de représentations pour l'apprentissage automatique en général et pour l'apprentissage par renforcement. Nous introduirons ensuite un sous-domaine relativement nouveau de l'apprentissage de représentations : l'apprentissage auto-supervisé. Nous aborderons ensuite deux approches fondamentales de l'apprentissage de représentations, les méthodes génératives et les méthodes discriminatives. Plus précisément, nous nous concentrerons sur une collection de méthodes discriminantes d'apprentissage de représentations, appelées méthodes contrastives d'apprentissage de représentations non supervisées (CURL). Nous terminerons le premier chapitre en détaillant diverses approches pour évaluer l'utilité des représentations. Dans le deuxième chapitre, nous présenterons un article de workshop dans lequel nous évaluons un ensemble de méthodes d'auto-supervision standards pour les problèmes d'apprentissage par renforcement. Nous découvrons que la performance de ces représentations dépend fortement de la dynamique et de la structure de l'environnement. À ce titre, nous déterminons qu'une étude plus systématique des environnements et des méthodes est nécessaire. Notre troisième chapitre couvre notre deuxième article, Unsupervised State Representation Learning in Atari, où nous essayons d'effectuer une étude plus approfondie des méthodes d'apprentissage de représentations en apprentissage par renforcement, comme expliqué dans le deuxième chapitre. Pour faciliter une évaluation plus approfondie des représentations en apprentissage par renforcement, nous introduisons une suite de 22 jeux Atari entièrement labellisés. De plus, nous choisissons de comparer les méthodes d'apprentissage de représentations de façon plus systématique, en nous concentrant sur une comparaison entre méthodes génératives et méthodes contrastives, plutôt que les méthodes générales du deuxième chapitre choisies de façon moins systématique. Enfin, nous introduisons une nouvelle méthode contrastive, ST-DIM, qui excelle sur ces 22 jeux Atari. / Extracting a representation of all the high-level factors of an agent’s state from level-level sensory information is an important, but challenging task in machine learning. In this thesis, we will explore several unsupervised approaches for learning these state representations. We apply and analyze existing unsupervised representation learning methods in reinforcement learning environments, as well as contribute our own evaluation benchmark and our own novel state representation learning method. In the first chapter, we will overview and motivate unsupervised representation learning for machine learning in general and for reinforcement learning. We will then introduce a relatively new subfield of representation learning: self-supervised learning. We will then cover two core representation learning approaches, generative methods and discriminative methods. Specifically, we will focus on a collection of discriminative representation learning methods called contrastive unsupervised representation learning (CURL) methods. We will close the first chapter by detailing various approaches for evaluating the usefulness of representations. In the second chapter, we will present a workshop paper, where we evaluate a handful of off-the-shelf self-supervised methods in reinforcement learning problems. We discover that the performance of these representations depends heavily on the dynamics and visual structure of the environment. As such, we determine that a more systematic study of environments and methods is required. Our third chapter covers our second article, Unsupervised State Representation Learning in Atari, where we try to execute a more thorough study of representation learning methods in RL as motivated by the second chapter. To facilitate a more thorough evaluation of representations in RL we introduce a benchmark of 22 fully labelled Atari games. In addition, we choose the representation learning methods for comparison in a more systematic way by focusing on comparing generative methods with contrastive methods, instead of the less systematically chosen off-the-shelf methods from the second chapter. Finally, we introduce a new contrastive method, ST-DIM, which excels at the 22 Atari games.
50

Inductive biases for efficient information transfer in artificial networks

Kerg, Giancarlo 09 1900 (has links)
Malgré des progrès remarquables dans une grande variété de sujets, les réseaux de neurones éprouvent toujours des difficultés à exécuter certaines tâches simples pour lesquelles les humains excellent. Comme indiqué dans des travaux récents, nous émettons l'hypothèse que l'écart qualitatif entre l'apprentissage en profondeur actuel et l'intelligence humaine est le résultat de biais inductifs essentiels manquants. En d'autres termes, en identifiant certains de ces biais inductifs essentiels, nous améliorerons le transfert d'informations dans les réseaux artificiels, ainsi que certaines de leurs limitations actuelles les plus importantes sur un grand ensemble de tâches. Les limites sur lesquelles nous nous concentrerons dans cette thèse sont la généralisation systématique hors distribution et la capacité d'apprendre sur des échelles de temps extrêmement longues. Dans le premier article, nous nous concentrerons sur l'extension des réseaux de neurones récurrents (RNN) à contraintes spectrales et proposerons une nouvelle structure de connectivité basée sur la décomposition de Schur, en conservant les avantages de stabilité et la vitesse d'entraînement des RNN orthogonaux tout en améliorant l'expressivité pour les calculs complexes à court terme par des dynamiques transientes. Cela sert de première étape pour atténuer le problème du "exploding vanishing gradient" (EVGP). Dans le deuxième article, nous nous concentrerons sur les RNN avec une mémoire externe et un mécanisme d'auto-attention comme un moyen alternatif de résoudre le problème du EVGP. Ici, la contribution principale sera une analyse formelle sur la stabilité asymptotique du gradient, et nous identifierons la pertinence d'événements comme un ingrédient clé pour mettre à l'échelle les systèmes d'attention. Nous exploitons ensuite ces résultats théoriques pour fournir un nouveau mécanisme de dépistage de la pertinence, qui permet de concentrer l'auto-attention ainsi que de la mettre à l'échelle, tout en maintenant une bonne propagation du gradient sur de longues séquences. Enfin, dans le troisième article, nous distillons un ensemble minimal de biais inductifs pour les tâches cognitives purement relationnelles et identifions que la séparation des informations relationnelles des entrées sensorielles est un ingrédient inductif clé pour la généralisation OoD sur des entrées invisibles. Nous discutons en outre des extensions aux relations non-vues ainsi que des entrées avec des signaux parasites. / Despite remarkable advances in a wide variety of subjects, neural networks are still struggling on simple tasks humans excel at. As outlined in recent work, we hypothesize that the qualitative gap between current deep learning and human-level artificial intelligence is the result of missing essential inductive biases. In other words, by identifying some of these key inductive biases, we will improve information transfer in artificial networks, as well as improve on some of their current most important limitations on a wide range of tasks. The limitations we will focus on in this thesis are out-of-distribution systematic generalization and the ability to learn over extremely long-time scales. In the First Article, we will focus on extending spectrally constrained Recurrent Neural Networks (RNNs), and propose a novel connectivity structure based on the Schur decomposition, retaining the stability advantages and training speed of orthogonal RNNs while enhancing expressivity for short-term complex computations via transient dynamics. This serves as a first step in mitigating the Exploding Vanishing Gradient Problem (EVGP). In the Second Article, we will focus on memory augmented self-attention RNNs as an alternative way to tackling the Exploding Vanishing Gradient Problem (EVGP). Here the main contribution will be a formal analysis on asymptotic gradient stability, and we will identify event relevancy as a key ingredient to scale attention systems. We then leverage these theoretical results to provide a novel relevancy screening mechanism, which makes self-attention sparse and scalable, while maintaining good gradient propagation over long sequences. Finally, in the Third Article, we distill a minimal set of inductive biases for purely relational cognitive tasks, and identify that separating relational information from sensory input is a key inductive ingredient for OoD generalization on unseen inputs. We further discuss extensions to unseen relations as well as settings with spurious features.

Page generated in 0.0632 seconds