Spelling suggestions: "subject:"adaptive computational"" "subject:"daptive computational""
1 |
Modélisation multiphysique de structures nanométriques résonantes / Multiphysics medling of resonant nanostructuresMezghani, Fadhil 26 September 2016 (has links)
La simulation multiphysique de l'interaction rayonnement-matière, des effets thermiques et mécaniques induits dans un matériau nanostructuré à un intérêt notamment lorsqu'il s'agit d'élaborer des capteurs voire de les optimiser. En effet, les effets thermiques peuvent être utilisés pour des applications chimiques ou biologiques et les dilatations mécaniques peuvent influer sur la durabilité du capteur et sur son efficacité. A l’échelle nanométrique, les longueurs caractéristiques des effets thermo-électro-magnétique-mécaniques ne sont pas du même ordre de grandeur et la simulation éléments finis doit être adaptée à chaque problème avec un contrôle adapté à l'erreur de la solution physique. Une procédure utilisant un remailleur adaptatif 3D Optiform et Comsol Multiphysics permet une relaxation du maillage ou un raffinement adapté afin d'accélérer la résolution (RAM et CPU) et améliorer la solution physique. Des simulations numériques des nano-objets de formes simples et des nanoantennes pour lesquelles l'exaltation du champ électromagnétique est localisée dans des zones de quelques nanomètres, alors que le gradient de température est beaucoup plus homogène dans le domaine de calcul et les dilatations sont nanométriques sont effectuées / Multiphysics simulation of light-matter interaction, induced temperature and dilation in nanostructures is of interest especially when it comes to develop or optimize sensors. Indeed, thermal effects can be used for chemical or biological applications, and mechanical dilation can affect the durability of the sensor and its effectiveness.However, the characteristic lengths of electromagnetic fields, temperature and dilation are not of the same magnitude and the mesh used in a finite element multiphysics model must be adapted to each problem. An efficient numerical model for controlling the error in the computational domain is necessary while allowing the relaxation or the refinement of the mesh, in order to decrease the computational time and memory.The purpose of this thesis is to show that the adaptation loop of the mesh for solving a multiphysics 3D problem using Comsol Multiphysics in OPTIFORM mesher, based on the error estimation of the physical solution, is more efficient than a conventional remeshing process.The proposed procedure is applied to simulate nano-objects with simple shapes and to nanoantennas for which the confinement of the electromagnetic field is localized on a few nanometers, while the gradient of the temperature is much smoother in the computational domain but leading to nanoscale dilation
|
2 |
Neurobiologically-inspired models : exploring behaviour prediction, learning algorithms, and reinforcement learningSpinney, Sean 11 1900 (has links)
Le développement du domaine de l’apprentissage profond doit une grande part de son avancée
aux idées inspirées par la neuroscience et aux études sur l’apprentissage humain. De la
découverte de l’algorithme de rétropropagation à la conception d’architectures neuronales
comme les Convolutional Neural Networks, ces idées ont été couplées à l’ingénierie et aux
améliorations technologiques pour engendrer des algorithmes performants en utilisation
aujourd’hui. Cette thèse se compose de trois articles, chacun éclairant des aspects distincts
du thème central de ce domaine interdisciplinaire. Le premier article explore la modélisation
prédictive avec des données d’imagerie du cerveau de haute dimension en utilisant une nouvelle
approche de régularisation hybride. Dans de nombreuses applications pratiques (comme
l’imagerie médicale), l’attention se porte non seulement sur la précision, mais également
sur l’interprétabilité d’un modèle prédictif formé sur des données haute dimension. Cette
étude s’attache à combiner la régularisation l1 et l2, qui régularisent la norme des gradients,
avec l’approche récemment proposée pour la modélisation prédictive robuste, l’Invariant
Learning Consistency, qui impose l’alignement entre les gradients de la même classe lors
de l’entraînement. Nous examinons ici la capacité de cette approche combinée à identifier
des prédicteurs robustes et épars, et nous présentons des résultats prometteurs sur plusieurs
ensembles de données. Cette approche tend à améliorer la robustesse des modèles épars dans
presque tous les cas, bien que les résultats varient en fonction des conditions. Le deuxième
article se penche sur les algorithmes d’apprentissage inspirés de la biologie, en se concentrant
particulièrement sur la méthode Difference Target Propagation (DTP) tout en l’intégrant à
l’optimisation Gauss-Newton. Le développement de tels algorithmes biologiquement plausibles
possède une grande importance pour comprendre les processus d’apprentissage neuronale,
cependant leur extensibilité pratique à des tâches réelles est souvent limitée, ce qui entrave
leur potentiel explicatif pour l’apprentissage cérébral réel. Ainsi, l’exploration d’algorithmes
d’apprentissage qui offrent des fondements théoriques solides et peuvent rivaliser avec la
rétropropagation dans des tâches complexes gagne en importance. La méthode Difference
Target Propagation (DTP) se présente comme une candidate prometteuse, caractérisée par
son étroite relation avec les principes de l’optimisation Gauss-Newton. Néanmoins, la rigueur
de cette relation impose des limites, notamment en ce qui concerne la formation couche par
couche des poids synaptiques du chemin de rétroaction, une configuration considérée comme
plus biologiquement plausible. De plus, l’alignement entre les mises à jour des poids DTP
et les gradients de perte est conditionnel et dépend des scénarios d’architecture spécifiques.
Cet article relève ces défis en introduisant un schéma innovant d’entraînement des poids
de rétroaction. Ce schéma harmonise la DTP avec la BP, rétablissant la viabilité de la
formation des poids de rétroaction couche par couche sans compromettre l’intégrité théorique.
La validation empirique souligne l’efficacité de ce schéma, aboutissant à des performances
exceptionnelles de la DTP sur CIFAR-10 et ImageNet 32×32. Enfin, le troisième article
explore la planification efficace dans la prise de décision séquentielle en intégrant le calcul
adaptatif à des architectures d’apprentissage profond existantes, dans le but de résoudre des
casse-tête complexes. L’étude introduit des principes de calcul adaptatif inspirés des processus
cognitifs humains, ainsi que des avancées récentes dans le domaine du calcul adaptatif. En
explorant en profondeur les comportements émergents du modèle de mémoire adaptatif
entraîné, nous identifions plusieurs comportements reconnaissables similaires aux processus
cognitifs humains. Ce travail élargit la discussion sur le calcul adaptatif au-delà des gains
évidents en efficacité, en explorant les comportements émergents en raison des contraintes
variables généralement attribuées aux processus de la prise de décision chez les humains. / The development of the field of deep learning has benefited greatly from biologically inspired
insights from neuroscience and the study of human learning more generally, from the discovery
of backpropagation to neural architectures such as the Convolutional Neural Network. Coupled
with engineering and technological improvements, the distillation of good strategies and
algorithms for learning inspired from biological observation is at the heart of these advances.
Although it would be difficult to enumerate all useful biases that can be learned by observing
humans, they can serve as a blueprint for intelligent systems. The following thesis is composed
of three research articles, each shedding light on distinct facets of the overarching theme. The
first article delves into the realm of predictive modeling on high-dimensional fMRI data, a
landscape where not only accuracy but also interpretability are crucial. Employing a hybrid
approach blending l1 and l2 regularization with Invariant Learning Consistency, this study
unveils the potential of identifying robust, sparse predictors capable of transmuting noise laden datasets into coherent observations useful for pushing the field forward. Conversely,
the second article delves into the domain of biologically-plausible learning algorithms, a
pivotal endeavor in the comprehension of neural learning processes. In this context, the
investigation centers upon Difference Target Propagation (DTP), a prospective framework
closely related to Gauss-Newton optimization principles. This exploration delves into the
intricate interplay between DTP and the tenets of biologically-inspired learning mechanisms,
revealing an innovative schema for training feedback weights. This schema reinstates the
feasibility of layer-wise feedback weight training within the DTP framework, while concurrently
upholding its theoretical integrity. Lastly, the third article explores the role of memory in
sequential decision-making, and proposes a model with adaptive memory. This domain entails
navigating complex decision sequences within discrete state spaces, where the pursuit of
efficiency encounters difficult scenarios such as the risk of critical irreversibility. The study
introduces adaptive computation principles inspired by human cognitive processes, as well
as recent advances in adaptive computing. By studying in-depth the emergent behaviours
exhibited by the trained adaptive memory model, we identify several recognizable behaviours
akin to human cognitive processes. This work expands the discussion of adaptive computing beyond the obvious gains in efficiency, but to behaviours emerging due to varying constraints
usually attributable to dynamic response times in humans.
|
3 |
The role of continual learning and adaptive computation in improving computational efficiency of deep learningGupta, Kshitij 01 1900 (has links)
Au cours de la dernière décennie, des progrès significatifs ont été réalisés dans le domaine de l’IA, principalement grâce aux progrès de l’apprentissage automatique, de l’apprentissage profond et de l’utilisation de modèles à grande échelle. Cependant, à mesure que ces modèles évoluent, ils présentent de nouveaux défis en termes de gestion de grands ensembles de données et d’efficacité informatique. Cette thèse propose des approches pour réduire les coûts de calcul de la formation et de l’inférence dans les systèmes d’intelligence artificielle (IA).
Plus précisément, ce travail étudie les techniques d’apprentissage continu et de calcul adaptatif, démontrant des stratégies possibles pour préserver les niveaux de performance de ces systèmes tout en réduisant considérablement les coûts de formation et d’inférence. Les résultats du premier article montrent que les modèles de base peuvent être continuellement pré-entraînés grâce à une méthode d’échauffement et de relecture, ce qui réduit considérable- ment les coûts de calcul de l’entraînement tout en préservant les performances par rapport à un entraînement à partir de zéro.
Par la suite, la thèse étudie comment les stratégies de calcul adaptatif, lorsqu’elles sont combinées avec la mémoire, peuvent être utilisées pour créer des agents d’IA plus efficaces au moment de l’inférence pour des tâches de raisonnement complexes, telles que le jeu stratégique de Sokoban. Nos résultats montrent que les modèles peuvent offrir des per- formances similaires ou améliorées tout en utilisant beaucoup moins de ressources de calcul. Les résultats de cette étude ont de vastes implications pour l’amélioration de l’efficacité in- formatique des systèmes d’IA, soutenant à terme le développement de technologies d’IA plus abordables, accessibles et efficaces. / Over the past decade, significant progress has been made by the field of AI, primarily due to advances in machine learning, deep learning, and the usage of large scale models. However, as these models scale, they present new challenges with respect to handling large datasets and being computationally efficient. This thesis proposes approaches to reducing computational costs of training and inference in artificial intelligence (AI) systems.
Specifically, this work investigates how Continual Learning and Adaptive Computation techniques can be used to reducing training and inference costs while preserving the perfor- mance levels of these systems . The findings of the first article show that foundation models can be continually pre-trained through a method of warm-up and replay, which significantly decreases training computational costs while preserving performance compared to training from scratch.
Subsequently, the thesis investigates how adaptive computation strategies, when com- bined with memory, can be utilized to create more computationally efficient AI agents at inference time for complex reasoning tasks, such as the strategic game of Sokoban. Our results exhibit that models can deliver similar or improved performances while using signifi- cantly fewer computational resources. Findings from this study have broad implications for improving the computational efficiency of AI systems, ultimately supporting the development of more affordable, accessible, and efficient AI technologies.
|
4 |
Towards computationally efficient neural networks with adaptive and dynamic computationsKim, Taesup 08 1900 (has links)
Ces dernières années, l'intelligence artificielle a été considérablement avancée et l'apprentissage en profondeur, où des réseaux de neurones profonds sont utilisés pour tenter d'imiter vaguement le cerveau humain, y a contribué de manière significative. Les réseaux de neurones profonds sont désormais capables d'obtenir un grand succès sur la base d'une grande quantité de données et de ressources de calcul suffisantes. Malgré leur succès, leur capacité à s'adapter rapidement à de nouveaux concepts, tâches et environnements est assez limitée voire inexistante. Dans cette thèse, nous nous intéressons à la façon dont les réseaux de neurones profonds peuvent s'adapter à des circonstances en constante évolution ou totalement nouvelles, de la même manière que l'intelligence humaine, et introduisons en outre des modules architecturaux adaptatifs et dynamiques ou des cadres de méta-apprentissage pour que cela se produise de manière efficace sur le plan informatique.
Cette thèse consiste en une série d'études proposant des méthodes pour utiliser des calculs adaptatifs et dynamiques pour aborder les problèmes d'adaptation qui sont étudiés sous différentes perspectives telles que les adaptations au niveau de la tâche, au niveau temporel et au niveau du contexte.
Dans le premier article, nous nous concentrons sur l'adaptation rapide des tâches basée sur un cadre de méta-apprentissage.
Plus précisément, nous étudions l'incertitude du modèle induite par l'adaptation rapide à une nouvelle tâche avec quelques exemples. Ce problème est atténué en combinant un méta-apprentissage efficace basé sur des gradients avec une inférence variationnelle non paramétrique dans un cadre probabiliste fondé sur des principes. C'est une étape importante vers un méta-apprentissage robuste que nous développons une méthode d'apprentissage bayésienne à quelques exemples pour éviter le surapprentissage au niveau des tâches.
Dans le deuxième article, nous essayons d'améliorer les performances de la prédiction de la séquence (c'est-à-dire du futur) en introduisant une prédiction du futur sauteur basée sur la taille du pas adaptatif. C'est une capacité critique pour un agent intelligent d'explorer un environnement qui permet un apprentissage efficace avec une imagination sauteur futur. Nous rendons cela possible en introduisant le modèle hiérarchique d'espace d'état récurrent (HRSSM) qui peut découvrir la structure temporelle latente (par exemple, les sous-séquences) tout en modélisant ses transitions d'état stochastiques de manière hiérarchique.
Enfin, dans le dernier article, nous étudions un cadre qui peut capturer le contexte global dans les données d'image de manière adaptative et traiter davantage les données en fonction de ces informations. Nous implémentons ce cadre en extrayant des concepts visuels de haut niveau à travers des modules d'attention et en utilisant un raisonnement basé sur des graphes pour en saisir le contexte global. De plus, des transformations au niveau des caractéristiques sont utilisées pour propager le contexte global à tous les descripteurs locaux de manière adaptative. / Over the past few years, artificial intelligence has been greatly advanced, and deep learning, where deep neural networks are used to attempt to loosely emulate the human brain, has significantly contributed to it. Deep neural networks are now able to achieve great success based on a large amount of data and sufficient computational resources. Despite their success, their ability to quickly adapt to new concepts, tasks, and environments is quite limited or even non-existent. In this thesis, we are interested in how deep neural networks can become adaptive to continually changing or totally new circumstances, similarly to human intelligence, and further introduce adaptive and dynamic architectural modules or meta-learning frameworks to make it happen in computationally efficient ways. This thesis consists of a series of studies proposing methods to utilize adaptive and dynamic computations to tackle adaptation problems that are investigated from different perspectives such as task-level, temporal-level, and context-level adaptations.
In the first article, we focus on task-level fast adaptation based on a meta-learning framework.
More specifically, we investigate the inherent model uncertainty that is induced from quickly adapting to a new task with a few examples. This problem is alleviated by combining the efficient gradient-based meta-learning with nonparametric variational inference in a principled probabilistic framework. It is an important step towards robust meta-learning that we develop a Bayesian few-shot learning method to prevent task-level overfitting.
In the second article, we attempt to improve the performance of sequence (i.e. future) prediction by introducing a jumpy future prediction that is based on the adaptive step size. It is a critical ability for an intelligent agent to explore an environment that enables efficient option-learning and jumpy future imagination. We make this possible by introducing the Hierarchical Recurrent State Space Model (HRSSM) that can discover the latent temporal structure (e.g. subsequences) while also modeling its stochastic state transitions hierarchically.
Finally, in the last article, we investigate a framework that can capture the global context in image data in an adaptive way and further process the data based on that information. We implement this framework by extracting high-level visual concepts through attention modules and using graph-based reasoning to capture the global context from them. In addition, feature-wise transformations are used to propagate the global context to all local descriptors in an adaptive way.
|
Page generated in 0.1033 seconds