• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 29
  • 18
  • 4
  • Tagged with
  • 50
  • 33
  • 12
  • 10
  • 9
  • 9
  • 9
  • 9
  • 8
  • 8
  • 8
  • 8
  • 8
  • 8
  • 8
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
41

Simulation numérique d'écoulements multiphasiques, problèmes à interfaces et changement de phase / Numerical simulation of multiphase flows, interface problems and phase change

Furfaro, Damien 06 November 2015 (has links)
Ce travail porte sur la simulation numérique des écoulements multiphasiques compressibles en déséquilibre de vitesses. Un solveur de Riemann diphasique de type HLLC, à la fois robuste, simple et précis est développé et validé à partir de solutions exactes et de données expérimentales. Cette méthode numérique est étendue au cas 3D non-structuré. Par ailleurs, la construction d’une technique numérique pour la répartition de l’énergie d’une onde de choc dans les différentes phases constituant le milieu est établie et permet le respect des conditions de choc multiphasiques. L’extension multiphasique du solveur de Riemann de type HLLC est réalisée, permettant ainsi la simulation d’une plus large gamme d’applications. Enfin, un modèle de transfert de chaleur et de masse dans un brouillard de gouttes ou nuage de bulles, en présence d’effets couplés de diffusion thermique et massiques, est proposé et dévoile des résultats intéressants. / This work deals with the numerical simulation of compressible multiphase flows in velocity disequilibrium. A HLLC-type two-phase Riemann solver is developed and validated against exact solutions and experimental data. This solver is robust, simple, accurate and entropy preserving. The numerical method is then implemented in 3D unstructured meshes. Furthermore, a numerical technique consisting in enforcing the correct energy partition at a discrete level in agreement with the multiphase shock relations is built. The multiphase extension of the HLLC-type Riemann solver is realized and allows the simulation of a wide range of applications. Finally, a droplet heat and mass transfer model with large range of validity is derived. It is valid in any situation: evaporation, flashing and condensation. It accounts for coupled heat and mass diffusion in the gas phase, thermodynamics of the multi-component gas mixture and heat diffusion inside the liquid droplet, enabling in this way consideration of both droplets heating and cooling phenomena.
42

Etude de schémas numériques d'ordre élevé pour la simulation de dispersion de polluants dans des géométries complexes / Analysis of High-Order Finite Volume schemes for pollutant dispersion simulation in complex geometries

Montagnier, Julien 01 July 2010 (has links)
La prévention des risques industriels nécessite de simuler la dispersion turbulente de polluants. Cependant, les outils majoritairement utilisés à ce jour ne permettent pas de traiter les champs proches dans le cas de géométries complexes, et il est nécessaire d'utiliser les outils de CFD (“ Computational Fluid Dynamics ”) plus adaptés, mais plus coûteux. Afin de simuler les écoulements atmosphériques avec dispersion de polluants, les modèles CFD doivent modéliser correctement d'une part, les effets de flottabilité, et d'autre part les effets de la turbulence. Plusieurs approches existent, notamment dans la prise en compte des effets de flottabilité et la modélisation de la turbulence, et nécessitent des méthodes numériques adaptées aux spécificités mathématiques de chacune d'entre elles, ainsi que des schémas numériques précis pour ne pas polluer la modélisation. Une formulation d'ordre élevé en volumes finis, sur maillages non structurés, parallélisée, est proposée pour simuler les écoulements atmosphériques avec dispersion de polluants. L'utilisation de schémas d'ordre élevé doit permettre d'une part de réduire le nombre de cellules et diminuer les temps de simulation pour atteindre une précision donnée, et d'autre part de mieux contrôler la viscosité numérique des schémas en vue de simulations LES (Large Eddy Simulation), pour lesquelles la viscosité numérique des schémas peut masquer les effets de la modélisation. Deux schémas d'ordre élevé ont été étudiés et implémentés dans un solveur 3D Navier Stokes incompressible sur des maillages volumes finis non structurés. Nous avons développé un premier schéma d'ordre élevé, correspondant à un schéma Padé volumes finis, et nous avons étendu le schéma de reconstruction polynomiale de Carpentier (2000) aux écoulements incompressibles. Les propriétés numériques des différents schémas implémentés dans le même code de calcul sont étudiées sur différents cas tests bi-dimensionnels (calcul de flux convectifs et diffusifs sur une solution a-priori, convection d'une tâche gaussienne, décroissance d'un vortex de Taylor et cavité entraînée) et tri-dimensionnel (écoulement autour d'un obstacle cubique). Une attention particulière a été portée à l'étude de la précision et du traitement des conditions limites. L'implémentation proposée du schéma polynomial permet d'approcher, pour un maillage identique, les temps de simulation obtenus avec un schéma décentré classique d'ordre 2, mais avec une précision supérieure. Le schéma compact donne la meilleure précision. En utilisant une méthode de Jacobi sans calcul implicite de la matrice pour calculer le gradient, le temps de simulation devient intéressant uniquement lorsque la précision requise est importante. Une alternative est la résolution du système linéaire par une méthode multigrille algébrique. Cette méthode diminue considérablement le temps de calcul du gradient et le schéma Padé devient performant même pour des maillages grossiers. Enfin, pour réduire les temps de simulation, la parallélisation des schémas d'ordre élevé est réalisée par une décomposition en sous domaines. L'assemblage des flux s'effectue naturellement et différents solveurs proposés par les librairies PETSC et HYPRE (solveur multigrille algébrique et méthode de Krylov préconditionnée) permettent de résoudre les systèmes linéaires issus de notre problème. / The prevention of industrial risks requires simulating turbulent dispersion of pollutants. However, the tools mostly used so far do not allow near fields treated in the case of complex geometries, and it is necessary to utilize the tools of CFD (Computational Fluid Dynamics ") more suitable but more expensive. To simulate atmospheric flows with dispersion of pollutants, the CFD models must correctly model the one hand, the effects of buoyancy, and secondly the effects of turbulence. Several approaches exist, including taking into account the effects of buoyancy and turbulence modeling, and require numerical methods adapted to the specific mathematics of each, and accurate numerical schemes to avoid pollution modeling. A formulation of high order finite volume on unstructured meshes, parallelized, is proposed to simulate the atmospheric flows with dispersion of pollutants. The use of high order schemes allow one hand to reduce the number of cells and decrease the simulation time to achieve a given accuracy, and secondly to better control the viscosity numerical schemes for simulation LES (Large Eddy Simulation), for which the numerical viscosity patterns may mask the effects of modeling. Two high-order schemes have been studied and implemented in a 3D Navier Stokes solver on unstructured mesh finite volume. We developed the first high-order scheme, corresponding to a Padé finite volume scheme, and we have extended the scheme of reconstruction polynomial Carpentier (2000) for incompressible flows. The numerical properties of the various schemes implemented in the same computer code are studied different two-dimensional test cases (calculation of diffusive and convective flow on a solution a priori, a task Gaussian convection, decay of a vortex of Taylor and driven cavity) and tri-dimensional (flow past an obstacle cubic). Particular attention has been paid to the study of the accuracy and treatment of boundary conditions. The implementation of the polynomial allows to obtain quasi identical simulation time compared to a classical upwind scheme of order 2, but with higher accuracy. The compact layout gives the best accuracy. Using a Jacobi method without calculation implied matrix to calculate the gradient, the simulation time becomes interesting only when the required accuracy is important. An alternative is the resolution of linear system by an algebraic multigrid method. This method significantly reduces the computation time of the gradient and the Padé scheme is effective even for coarse meshes. Finally, to reduce simulation time, the parallelization schemes of high order is achieved by a decomposition into subdomains. The assembly flow occurs naturally and different solvers provided by PETSc libraries and HYORE (algebraic multigrid solver and preconditioned Krylov method) used to solve linear systems from our problem. The work was to identify and determine the parameters that lead to lowest time resolution simulation. Various tests of speed-up and scale-up were used to determine the most effective and optimal parameters for solving linear systems in parallel from our problem. The results of this work have been the subject of a communication in an international conference "Parallel CFD 2008" and an article submitted to "International Journal for Numerical Methods in Fluids" (Analysis of high-order finite volume schemes for the incompressible Navier Stokes equations)
43

Stratégies de génération de tests à partir de modèles UML/OCL interprétés en logique du premier ordre et système de contraintes. / Test generation strategies from UML/OCL models interpreted with first order logic constraints system

Cantenot, Jérôme 13 November 2013 (has links)
Les travaux présentés dans cette thèse proposent une méthode de génération automatique de tests à partir de modèles.Cette méthode emploie deux langages de modélisations UML4MBT et OCL4MBT qui ont été spécifiquement dérivées d’ UML et OCL pour la génération de tests. Ainsi les comportements, la structure et l’état initial du système sont décrits au travers des diagrammes de classes, d’objets et d’états-transitions.Pour générer des tests, l’évolution du modèle est représente sous la forme d’un système de transitions. Ainsi la construction de tests est équivalente à la découverte de séquences de transitions qui relient l’´état initial du système à des états validant les cibles de test.Ces séquences sont obtenues par la résolution de scénarios d’animations par des prouveurs SMT et solveurs CSP. Pour créer ces scénarios, des méta-modèles UML4MBT et CSP4MBT regroupant formules logiques et notions liées aux tests ont été établies pour chacun des outils.Afin d’optimiser les temps de générations, des stratégies ont été développé pour sélectionner et hiérarchiser les scénarios à résoudre. Ces stratégies s’appuient sur la parallélisation, les propriétés des solveurs et des prouveurs et les caractéristiques de nos encodages pour optimiser les performances. 5 stratégies emploient uniquement un prouveur et 2 stratégies reposent sur une collaboration du prouveur avec un solveur.Finalement l’intérêt de cette nouvelle méthode à été validée sur des cas d’études grâce à l’implémentation réalisée. / This thesis describes an automatic test generation process from models.This process uses two modelling languages, UML4MBT and OCL4MBT, created specificallyfor tests generation. Theses languages are derived from UML and OCL. Therefore the behaviours,the structure and the initial state of the system are described by the class diagram, the objectdiagram and the state-chart.To generate tests, the evolution of the model is encoded with a transition system. Consequently,to construct a test is to find transition sequences that rely the initial state of the system to thestates described by the test targets.The sequence are obtained by the resolution of animation scenarios. This resolution is executedby SMT provers and CSP solvers. To create the scenario, two dedicated meta-models, UML4MBTand CSP4MBT have been established. Theses meta-models associate first order logic formulas withthe test notions.7 strategies have been developed to improve the tests generation time. A strategy is responsiblefor the selection and the prioritization of the scenarios. A strategy is built upon the properties ofthe solvers and provers and the specification of our encoding process. Moreover the process canalso be paralleled to get better performance. 5 strategies employ only a prover and 2 make theprover collaborate with a solver.Finally the interest of this process has been evaluated through a list of benchmark on variouscases studies.
44

Conception d’un solveur linéaire creux parallèle hybride direct-itératif

Gaidamour, Jérémie 08 December 2009 (has links)
Cette thèse présente une méthode de résolution parallèle de systèmes linéaires creux qui combine efficacement les techniques de résolutions directes et itératives en utilisant une approche de type complément de Schur. Nous construisons une décomposition de domaine. L'intérieur des sous-domaines est éliminé de manière directe pour se ramener à un problème sur l'interface. Ce problème est résolu grâce à une méthode itérative préconditionnée par une factorisation incomplète. Un réordonnancement de l'interface permet la construction d'un préconditionneur global du complément de Schur. Des algorithmes minimisant le pic mémoire de la construction du préconditionneur sont proposés. Nous exploitons un schéma d'équilibrage de charge utilisant une répartition de multiples sous-domaines sur les processeurs. Les méthodes sont implémentées dans le solveur HIPS et des résultats expérimentaux parallèles sont présentés sur de grands cas tests industriels. / This thesis presents a parallel resolution method for sparse linear systems which combines effectively techniques of direct and iterative solvers using a Schur complement approach. A domain decomposition is built ; the interiors of the subdomains are eliminated by a direct method in order to use an iterative method only on the interface unknowns. The system on the interface (Schur complement) is solved thanks to an iterative method preconditioned by a global incomplete factorization. A special ordering on the Schur complement allows to build a scalable preconditioner. Algorithms minimizing the memory peak that appears during the construction of the preconditioner are presented. The memory is balanced thanks to a multiple domains per processors parallelization scheme. The methods are implemented in the HIPS solver and parallel experimental results are presented on large industrial test cases.
45

Optimisation de code Galerkin discontinu sur ordinateur hybride : application à la simulation numérique en électromagnétisme / Discontinuous Galerkin code optimization on hybrid computer : application to the numerical simulation in electromagnetism

Weber, Bruno 26 November 2018 (has links)
Nous présentons dans cette thèse les évolutions apportées au solveur Galerkin Discontinu Teta-CLAC, issu de la collaboration IRMA-AxesSim, au cours du projet HOROCH (2015-2018). Ce solveur permet de résoudre les équations de Maxwell en 3D, en parallèle sur un grand nombre d'accélérateurs OpenCL. L'objectif du projet HOROCH était d'effectuer des simulations de grande envergure sur un modèle numérique complet de corps humain. Ce modèle comporte 24 millions de mailles hexaédriques pour des calculs dans la bande de fréquences des objets connectés allant de 1 à 3 GHz (Bluetooth). Les applications sont nombreuses : téléphonie et accessoires, sport (maillots connectés), médecine (sondes : gélules, patchs), etc. Les évolutions ainsi apportées comprennent, entre autres : l'optimisation des kernels OpenCL à destination des CPU dans le but d'utiliser au mieux les architectures hybrides ; l'expérimentation du runtime StarPU ; le design d'un schéma d'intégration à pas de temps local ; et bon nombre d'optimisations permettant au solveur de traiter des simulations de plusieurs millions de mailles. / In this thesis, we present the evolutions made to the Discontinuous Galerkin solver Teta-CLAC – resulting from the IRMA-AxesSim collaboration – during the HOROCH project (2015-2018). This solver allows to solve the Maxwell equations in 3D and in parallel on a large amount of OpenCL accelerators. The goal of the HOROCH project was to perform large-scale simulations on a complete digital human body model. This model is composed of 24 million hexahedral cells in order to perform calculations in the frequency band of connected objects going from 1 to 3 GHz (Bluetooth). The applications are numerous: telephony and accessories, sport (connected shirts), medicine (probes: capsules, patches), etc. The changes thus made include, among others: optimization of OpenCL kernels for CPUs in order to make the best use of hybrid architectures; StarPU runtime experimentation; the design of an integration scheme using local time steps; and many optimizations allowing the solver to process simulations of several millions of cells.
46

Contribution à la résolution des équations de Maxwell dans les structures périodiques par la méthode des éléments finis

Garnier, Romain 30 January 2013 (has links) (PDF)
En électromagnétisme les structures périodiques suscitent un grand intérêt. Ces structures agissent ainsi comme des filtres fréquentiels et permettent la fabrication de méta-matériaux, composites et artificiels. Elles présentent des propriétés électromagnétiques inédites pour les matériaux naturels telles que des bandes interdites. On a ainsi pu fabriquer de nouveaux dispositifs permettant de guider, de focaliser ou de stopper la propagation. C'est par exemple utile pour éviter le couplage entre différents éléments rayonnants notamment via la caractérisation des ondes de surface qui se propagent à l'interface entre l'air et la structure périodique. Ce travail de thèse s'inscrit dans ce contexte et propose une description de la méthode des éléments finis dédiée à la caractérisation des structures périodiques. La modélisation numérique aboutit à des problèmes de valeurs propres de grandes tailles. Elle implique la résolution de systèmes linéaires composés de matrices creuses. Une méthode est abordée pour résoudre ce type de problème, en optimisant et combinant différents algorithmes. Avant d'aborder les différents aspects de la méthode développée, nous établissons une liste exhaustive de l'ensemble des méthodes qui existent en énonçant leurs avantages et leurs inconvénients. Nous constatons notamment que la méthode des éléments finis permet de traiter un large éventail de structures périodiques en trois dimensions sans limitation sur leur forme géométrique. Nous présentons alors les différentes formulations de cette méthode. Ensuite les aspects algorithmiques de la méthode sont détaillés. Nous montrons notamment qu'une analyse des paramètres de résolution permet de préciser les interprétations physiques des résultats obtenus. Finalement nous présentons les performances de notre outil sur des cas d'applications issus de la littérature et nous abordons la caractérisation des ondes de surface. Pour cela, l'étude d'un réseau d'antennes patchs insérées dans des cavités métalliques est conduite. Notons pour conclure que les études conduites au cours de cette thèse ont abouti à la production d'un code utilisable dans un environnement de calcul initialement présent à l'ONERA.
47

Simulation numérique des écoulements unidimensionnels instationnaires avec autovaporisation

Faucher, Eric 24 January 2000 (has links) (PDF)
Afin d'étudier le comportement des organes de robinetterie, notamment des soupapes de sûreté à ressort, en conditions accidentelles, on s'est intéressé à la simulation des écoulements avec autovaporisation. Ces écoulements diphasiques sont susceptibles d'être rencontrés dans toute installation industrielle utilisant des liquides sous pression. Dans le cas de l'ouverture d'une soupape, la dynamique du clapet est particulièrement sensible aux variations de la pression sous celui-ci. Il est donc indispensable de pouvoir simuler précisément des transitoires très rapides. Cette recherche a été menée selon deux axes : 1°) La modélisation physique du mécanisme de vaporisation par dépressurisation. 2°) La simulation numérique des modèles dans le cas d'écoulements fortement instationnaires. D'un point de vue physique, deux modèles d'autovaporisation ont été étudiés ; le modèle homogène relaxé (HRM), proposé par Bilicki et al., et le modèle développé par Jones et al.. Ils supposent tous les deux l'égalité des pressions et des vitesses dans les phases liquide et gazeuse, et que la vapeur apparaît dans les conditions de saturation. Une comparaison des résultats de ces modèles a été effectuée dans le cas d'écoulements stationnaires, en s'appuyant sur les données expérimentales mesurées sur la boucle Super Moby-Dick du Commissariat à l'Energie Atomique (CEA) de Grenoble. Concernant l'aspect numérique, Il est à noter que les systèmes d'équations obtenus sont inconditionnellement hyperboliques, mais non conservatifs dans le cas unidimensionnel, à cause de la présence des termes de variation de la section en espace et en temps. Des schémas numériques de type Volumes Finis ont donc été développés pour prendre en compte la présence de termes sources raides, et l'utilisation de lois d'état complexes pour des fluides réels. Une attention particulière a été portée sur le calcul des conditions aux limites. Trois schémas numériques ont été testés, VFROE en variables non conservatives, le schéma de Rusanov, et une version modifiée du schéma de Roe. Une étude comparative détaillée des performances de chaque schéma a été menée pour des écoulements instationnaires et stationnaires gazeux, liquides et diphasiques. Elle met en évidence que le schéma VFROE-ncv est le plus précis, et que le schéma de Rusanov est le plus robuste. Une stratégie combinant ces deux schémas est donc envisagée.
48

Simulations expérimentale et numérique des phénomènes de ruissellement et d’atomisation lors d’une procédure de lavage à l’eau / Experimental and numerical simulations of the atomisation and surface run-off phenomena during a water washing process

Pushparajalingam, Jegan Sutharsan 16 February 2012 (has links)
Celui-ci a pour objectif de valider l'ensemble des modèles physiques utilisés dans un code de simulation numérique pour simuler un écoulement de type annulaire dispersé en conduite rencontré lors d'une procédure de lavage à eau utilisé dans les raffineries. Pour ce faire une banque de données expérimentale est mise en place sur des configurations représentatives de celles utilisées en condition industrielle. La géométrie retenue comporte une zone horizontale d'injection rectiligne avec un injecteur central, suivi d'un coude à 90° situé dans un plan vertical. Différentes conditions expérimentales permettent d'étudier l'influence de la vitesse du gaz, de la condition d'injection du brouillard et de la pression sur les différents processus physiques. Ces résultats comprenant des visualisations du brouillard et du film pariétale, des mesures de taille et de distribution de gouttes,des mesures de débit et d'épaisseur de film, sont analysés pour faire ressortir les principaux mécanismes d'interaction entre le gaz et la phase dispersée, le gaz et le film liquide pariétal et la phase dispersée et le film pariétal. En parallèle, des premières simulations, avec une approche RANS, sont réalisées avec le code CEDRE de l'ONERA et les résultats sont confrontés aux mesures. / This work has been realised within a CIFRE contract with TOTAL. Its aim was to validate all the physical models used in a computation, which simulates an annular dispersed flow through a pipe used in a water washing process in refinery plants. That is why, a whole set of data has been gathered using experimental boundary conditions which are representative to those used in industrial configurations. The geometry is made of a horizontal pipe with a centred nozzle followed by a 90º elbow in the vertical plane. Several experimental boundary conditions enable one to study the influence of the gas velocity, the type of the spray injection and the pressure on the different physical phenomena. These results including spray and liquid film visualisations, droplets distribution and size measurements as well as liquid film thickness and mass flow measurements were analysed in order to extract the main interaction mechanism between the gas and the dispersed phase, the gas and the liquid film, and the dispersed phase and the annular liquid film. Meanwhile, simulations using a RANS approach were realized with the ONERA code named CEDRE and its results were compared to the gathered measurements.
49

Optimisations des solveurs linéaires creux hybrides basés sur une approche par complément de Schur et décomposition de domaine / Optimizations of hybrid sparse linear solvers relying on Schur complement and domain decomposition approaches

Casadei, Astrid 19 October 2015 (has links)
Dans cette thèse, nous nous intéressons à la résolution parallèle de grands systèmes linéaires creux. Nous nous focalisons plus particulièrement sur les solveurs linéaires creux hybrides directs itératifs tels que HIPS, MaPHyS, PDSLIN ou ShyLU, qui sont basés sur une décomposition de domaine et une approche « complément de Schur ». Bien que ces solveurs soient moins coûteux en temps et en mémoire que leurs homologues directs, ils ne sont néanmoins pas exempts de surcoûts. Dans une première partie, nous présentons les différentes méthodes de réduction de la consommation mémoire déjà existantes et en proposons une nouvelle qui n’impacte pas la robustesse numérique du précondionneur construit. Cette technique se base sur une atténuation du pic mémoire par un ordonnancement spécifique des tâches de calcul, d’allocation et de désallocation des blocs, notamment ceux se trouvant dans les parties « couplage » des domaines.Dans une seconde partie, nous nous intéressons à la question de l’équilibrage de la charge que pose la décomposition de domaine pour le calcul parallèle. Ce problème revient à partitionner le graphe d’adjacence de la matrice en autant de parties que de domaines désirés. Nous mettons en évidence le fait que pour avoir un équilibrage correct des temps de calcul lors des phases les plus coûteuses d’un solveur hybride tel que MaPHyS, il faut à la fois équilibrer les domaines en termes de nombre de noeuds et de taille d’interface locale. Jusqu’à aujourd’hui, les partitionneurs de graphes tels que Scotch et MeTiS ne s’intéressaient toutefois qu’au premier critère (la taille des domaines) dans le contexte de la renumérotation des matrices creuses. Nous proposons plusieurs variantes des algorithmes existants afin de prendre également en compte l’équilibrage des interfaces locales. Toutes nos modifications sont implémentées dans le partitionneur Scotch, et nous présentons des résultats sur de grands cas de tests industriels. / In this thesis, we focus on the parallel solving of large sparse linear systems. Our main interestis on direct-iterative hybrid solvers such as HIPS, MaPHyS, PDSLIN or ShyLU, whichrely on domain decomposition and Schur complement approaches. Althrough these solvers arenot as time and space consuming as direct methods, they still suffer from serious overheads. Ina first part, we thus present the existing techniques for reducing the memory consumption, andwe present a new method which does not impact the numerical robustness of the preconditioner.This technique reduces the memory peak by doing a special scheduling of computation, allocation,and freeing tasks in particular in the Schur coupling blocks of the matrix. In a second part,we focus on the load balancing of the domain decomposition in a parallel context. This problemconsists in partitioning the adjacency graph of the matrix in as many domains as desired. Wepoint out that a good load balancing for the most expensive steps of an hybrid solver such asMaPHyS relies on the balancing of both interior nodes and interface nodes of the domains.Through, until now, graph partitioners such as MeTiS or Scotch used to optimize only thefirst criteria (i.e., the balancing of interior nodes) in the context of sparse matrix ordering. Wepropose different variations of the existing algorithms to improve the balancing of interface nodesand interior nodes simultaneously. All our changes are implemented in the Scotch partitioner.We present our results on large collection of matrices coming from real industrial cases.
50

A parallel iterative solver for large sparse linear systems enhanced with randomization and GPU accelerator, and its resilience to soft errors / Un solveur parallèle itératif pour les grands systèmes linéaires creux, amélioré par la randomisation et l'utilisation des accélérateurs GPU, et sa résilience aux fautes logicielles

Jamal, Aygul 28 September 2017 (has links)
Dans cette thèse de doctorat, nous abordons trois défis auxquels sont confrontés les solveurs d'algèbres linéaires dans la perspective des futurs systèmes exascale: accélérer la convergence en utilisant des techniques innovantes au niveau algorithmique, en profitant des accélérateurs GPU (Graphics Processing Units) pour améliorer le calcul sur plusieurs systèmes, en évaluant l'impact des erreurs due à l'augmentation du parallélisme dans les superordinateurs. Nous nous intéressons à l'étude des méthodes permettant d'accélérer la convergence et le temps d'exécution des solveurs itératifs pour les grands systèmes linéaires creux. Le solveur plus spécifiquement considéré dans ce travail est le “parallel Algebraic Recursive Multilevel Solver (pARMS)” qui est un soldeur parallèle sur mémoire distribuée basé sur les méthodes de sous-espace de Krylov.Tout d'abord, nous proposons d'intégrer une technique de randomisation appelée “Random Butterfly Transformations (RBT)” qui a été proposée avec succès pour éliminer le coût du pivotage dans la résolution des systèmes linéaires denses. Notre objectif est d'appliquer cette technique dans le préconditionneur ARMS de pARMS pour résoudre plus efficacement le dernier système Complément de Schur dans l'application du processus à multi-niveaux récursif. En raison de l'importance considérable du dernier Complément de Schur pour certains problèmes de test, nous proposons également d'utiliser une variante creux de RBT suivie d'un solveur direct creux (SuperLU). Les résultats expérimentaux sur certaines matrices de la collection de Davis montrent une amélioration de la convergence et de la précision par rapport aux implémentations existantes.Ensuite, nous illustrons comment une approche non intrusive peut être appliquée pour implémenter des calculs GPU dans le solveur pARMS, plus particulièrement pour la phase de préconditionnement locale qui représente une partie importante du temps pour la résolution. Nous comparons les solveurs purement CPU avec les solveurs hybrides CPU / GPU sur plusieurs problèmes de test issus d'applications physiques. Les résultats de performance du solveur hybride CPU / GPU utilisant le préconditionnement ARMS combiné avec RBT, ou le préconditionnement ILU(0), montrent un gain de performance jusqu'à 30% sur les problèmes de test considérés dans nos expériences.Enfin, nous étudions l'effet des défaillances logicielles variable sur la convergence de la méthode itérative flexible GMRES (FGMRES) qui est couramment utilisée pour résoudre le système préconditionné dans pARMS. Le problème ciblé dans nos expériences est un problème elliptique PDE sur une grille régulière. Nous considérons deux types de préconditionneurs: une factorisation LU incomplète à double seuil (ILUT) et le préconditionneur ARMS combiné avec randomisation RBT. Nous considérons deux modèle de fautes logicielles différentes où nous perturbons la multiplication du vecteur matriciel et la phase de préconditionnement, et nous comparons leur impact potentiel sur la convergence. / In this PhD thesis, we address three challenges faced by linear algebra solvers in the perspective of future exascale systems: accelerating convergence using innovative techniques at the algorithm level, taking advantage of GPU (Graphics Processing Units) accelerators to enhance the performance of computations on hybrid CPU/GPU systems, evaluating the impact of errors in the context of an increasing level of parallelism in supercomputers. We are interested in studying methods that enable us to accelerate convergence and execution time of iterative solvers for large sparse linear systems. The solver specifically considered in this work is the parallel Algebraic Recursive Multilevel Solver (pARMS), which is a distributed-memory parallel solver based on Krylov subspace methods.First we integrate a randomization technique referred to as Random Butterfly Transformations (RBT) that has been successfully applied to remove the cost of pivoting in the solution of dense linear systems. Our objective is to apply this method in the ARMS preconditioner to solve more efficiently the last Schur complement system in the application of the recursive multilevel process in pARMS. The experimental results show an improvement of the convergence and the accuracy. Due to memory concerns for some test problems, we also propose to use a sparse variant of RBT followed by a sparse direct solver (SuperLU), resulting in an improvement of the execution time.Then we explain how a non intrusive approach can be applied to implement GPU computing into the pARMS solver, more especially for the local preconditioning phase that represents a significant part of the time to compute the solution. We compare the CPU-only and hybrid CPU/GPU variant of the solver on several test problems coming from physical applications. The performance results of the hybrid CPU/GPU solver using the ARMS preconditioning combined with RBT, or the ILU(0) preconditioning, show a performance gain of up to 30% on the test problems considered in our experiments.Finally we study the effect of soft fault errors on the convergence of the commonly used flexible GMRES (FGMRES) algorithm which is also used to solve the preconditioned system in pARMS. The test problem in our experiments is an elliptical PDE problem on a regular grid. We consider two types of preconditioners: an incomplete LU factorization with dual threshold (ILUT), and the ARMS preconditioner combined with RBT randomization. We consider two soft fault error modeling approaches where we perturb the matrix-vector multiplication and the application of the preconditioner, and we compare their potential impact on the convergence of the solver.

Page generated in 0.0392 seconds