• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 27
  • 10
  • Tagged with
  • 37
  • 37
  • 15
  • 14
  • 12
  • 12
  • 10
  • 10
  • 10
  • 6
  • 6
  • 5
  • 5
  • 5
  • 5
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
11

De l'interaction des communications et de l'ordonnancement de threads au sein des grappes de machines multi-coeurs

Trahay, François 13 November 2009 (has links) (PDF)
La tendance actuelle des constructeurs pour le calcul scientifique est à l'utilisation de grappes de machines dont les noeuds comportent un nombre de coeurs toujours plus grand. Le modèle basé uniquement sur MPI laisse peu à peu la place à des modèles mélangeant l'utilisation de threads et de MPI. Ce changement de modèle entraîne de nombreuses problématiques car les implémentations MPI n'ont pas été conçues pour supporter les applications multi-threadées. Dans cette thèse, afin de garantir le bon fonctionnement des communications, nous proposons un module logiciel faisant interagir l'ordonnanceur de threads et la bibliothèque de communication. Ce module, en collaborant avec l'ordonnanceur de threads, permet de faire progresser les communications en arrière-plan et d'assurer un haut niveau de réactivité, même lorsque la machine est surchargée.
12

Calcul haute performance sur matériel générique

Perotin, Matthieu Martineau, Patrick. January 2008 (has links) (PDF)
Thèse de doctorat : Informatique : Tours : 2008. / Titre provenant de l'écran-titre.
13

Simulation numérique par éléments finis des grandes déformations des sols : application à la scarification

Renon, Nicolas 23 January 2002 (has links) (PDF)
Le déminage mécanique consiste à scarifier le sol avec une " charrue ", outil formé d'une lame en V munie de plusieurs dents, poussée par un engin : les dents déstructurent le sol et le font remonter devant la lame qui l'évacue sur le côté avec les mines qu'il contient. L'objectif de nos travaux est de mettre en œuvre la simulation numérique par éléments finis du problème fortement non linéaire issu de la modélisation de la scarification du sol. Le code d'éléments finis implicite Forge3®, dédié à la mise en forme des métaux, a été choisi comme support numérique. Il permet de prendre en compte les grandes déformations, en particulier à l'aide de son remaillage automatique. Nous avons dans un premier temps implanté dans ce code deux modèles élastoplastiques de comportement, l'un incompressible réservé aux sols fins saturés, purement cohésifs, l'autre compressible, fondé sur la notion d'état critique, pour les matériaux purement frottants ou cohésifs et frottants. Ces modèles adoucissants sont intégrés par un schéma de retour radial généralisé, au sein d'une formulation implicite du problème aux limites. Nous montrons que la matrice de raideur est non symétrique dans le cas compressible et que la symétrisation du système ne conduit pas à une approche robuste. Nous avons donc importé et testé un solveur itératif non-symétrique : Bi-CGSTAB. Nous avons validé la programmation de ces modèles sur des essais triaxiaux. Pour les comportements adoucissants, on constate des oscillations dans la relation contrainte/déformation passé le pic de contrainte. Ces difficultés numériques sont traitées par linéarisation et régularisation. Dans un deuxième temps, nous avons mis en œuvre des simulations de scarification pour différents niveaux de complexité : une dent seule, une dent + une tranche de lame, plusieurs dents, en faisant suffisamment avancer l'outil pour atteindre le régime stationnaire ; cela se révèle d'autant plus long que l'outil est large, ce qui nous amène au calcul très intensif. L'influence de paramètres géométriques comme l'inclinaison de la dent ou l'angle d'étrave du système a été mise en évidence, elle est qualitativement conforme aux observations expérimentales. L'étude de l'influence des paramètres des modèles de comportement montre la prépondérance de ceux liés à l'état critique, i.e. aux propriétés mécaniques après de grandes déformations. Enfin nous avons validé qualitativement le code en termes de modes d'écoulements et de répartition des efforts pour des outils multi-dents. La comparaison quantitative des efforts reste à affiner en revenant sur le comportement choisi et son implémentation.
14

Architectures flot de données dédiées au traitement d'images par morphologie mathématique

Clienti, Christophe 30 September 2009 (has links) (PDF)
Nous abordons ici la thématique des opérateurs et processeurs flot de données dédiés au traitement d'images et orientés vers la morphologie mathématique. L'objectif principal est de proposer des architectures performantes capables de réaliser les opérations simples de ce corpus mathématique afin de proposer des opérateurs morphologiques avancés. Ces dernières années, des algorithmes astucieux ont été proposés avec comme objectif de réduire la quantité des calculs nécessaires à la réalisation de transformations telle que la ligne de partage des eaux. Toutefois, les mises en œuvre proposées font souvent appel à des structures de données complexes qui sont difficiles à employer sur des machines différentes des processeurs généralistes monocœurs. Les processeurs standard poursuivant aujourd'hui leur évolution vers une augmentation du parallélisme, ces implémentations ne nous permettent pas d'obtenir les gains de performance escomptés à chaque nouvelle génération de machine. Nous proposons alors des mises en œuvre rapides des opérations complexes de la morphologie mathématique par des machines exploitant fortement le parallélisme intrinsèque des opérations basiques. Nous étudions dans une première partie les processeurs de voisinage travaillant directement sur un flot de pixels et nous proposons différentes méthodologies de conception rapide de pipelines dédiés à une application. Nous proposons également une structure de pipeline programmable via l'utilisation de processeurs vectoriels avec différentes possibilités de chaînage. Enfin, une étude avec des machines est proposée afin d'observer la pertinence de notre approche.
15

Un cadre conceptuel pour la programmation par objets des architectures parallèles distribuées : application à l'algèbre linéaire

Guidec, Frédéric 02 June 1995 (has links) (PDF)
Les méthodes et les environnements de programmation adaptés aux machines mono-processeur traditionnelles s'avèrent inutilisables avec les machines parallèles à mémoire distribuée, car ils ne permettent pas d'en maîtriser le parallélisme. À ce jour, l'utilisation de ces machines demeure donc très limitée, car les programmeurs sont en général assez réticents à l'idée de devoir y porter manuellement leurs applications. De nombreuses recherches actuelles visent à simplifier le développement des applications parallèles pour ce type de machine. Le travail effectué au cours de cette thèse s'inscrit dans le cadre du développement et de l'expérimentation de l'environnement EPEE (Environnement Parallèle d'exécution de Eiffel). EPEE constitue un cadre conceptuel pour la conception et la mise en oeuvre de composants logiciels parallèles réutilisables à l'aide des mécanismes de la programmation par objets. Nous avons caractérisé les objets pouvant être distribués et exploités en parallèle dans lénvironnement EPEE, et proposé des schémas conceptuels permettant de développer de tels objets en insistant sur les points clés mis en avant dans les techniques modernes de génie logiciel, à savoir la maîtrise de la complexité (résolue par la modularisation, l'encapsulation, l'héritage), et la maintenabilité (corrective et évolutive). Nous avons ensuite appliqué ces schémas conceptuels pour développer une bibliothèque parallèle de démonstration. Cette bibliothèque expérimentale, baptisée Paladin, est dédiée au calcul d'algèbre linéaire sur machines parallèles à mémoire distribuée. Elle est en outre extensible, d'un emploi aisé, performante et portable. Ces caractéristiques confirment la viabilité de l'approche consistant à utiliser les mécanismes de la programmation par objets pour construire des bibliothèques pour machines parallèles.
16

Simulation des grandes échelles des instationnarités basses fréquences d'une interaction onde de choc - couche limite sur plaque plane

Aubard, Guillaume 22 June 2012 (has links) (PDF)
Les interactions ondes de choc/couches limites qui se développent sur les parois des véhicules aéronautiques sont le siège d'instationnarités à des fréquences de l'ordre de la centaine de Hertz qui constituent une source d'excitation aérodynamique. Le projet ANR SPICEX, dans lequel s'inscrit la présente étude, s'attaque à la modélisation numérique de ces phénomènes basses fréquences. On s'intéresse à la dynamique instationnaire du cas d'interaction entre une onde de choc et une couche limite supersonique sur une plaque plane (IOCCL). Un outil numérique de Simulation des Grandes Échelles (SGE) est développé pour les écoulements en régime compressible. Une méthode de capture de choc et une condition d'entrée instationnaire peu coûteuses sont mises en place. Une attention particulière est portée sur la validation de la stratégie numérique adoptée, et notamment sur la modélisation SGE. Des simulations de couche limites turbulentes ainsi que du cas d'IOCCL sont réalisées et permettent d'asseoir les choix numériques adoptés. Une SGE de l'IOCCL instationnaire couvrant plusieurs dizaines de cycles de la dynamique à basses fréquences est également réalisée afin de caractériser cette dernière. Les résultats de l'étude suggèrent que les instationnarités basses fréquences sont liées à une synchronisation globale de l'écoulement, caractérisée par une respiration cyclique de la zone décollée associée à un mouvement de va-et-vient du choc réfléchi, ainsi qu'à une modulation de la couche de mélange. L'étude suggère que le couplage entre la force de rappel exercé par le choc incident et les perturbations issues de la turbulence amont et de la couche de mélange est à l'origine d'une modulation large bande de l'éjection des tourbillons en aval de l'écoulement qui correspond de manière statistique à la dynamique basse fréquence d'intérêt.
17

Évaluation des performances des réseaux sans-fil mobiles

Al Hanbali, Ahmad Altman, Eitan Nain, Philippe January 2006 (has links) (PDF)
Thèse de doctorat : Informatique : Nice : 2006. / Bibliogr. p. 147-154. Résumés en français et en anglais.
18

Efficacité énergétique dans le calcul très haute performance : application à la tolérance aux pannes et à la diffusion de données

Diouri, Mohammed El Mehdi 27 September 2013 (has links) (PDF)
Les infrastructures de calcul très haute performance ont connu une croissance rapide en particulier ces dernières années. Cette croissance a toujours été motivée par les besoins accrus en puissance de calcul qu'expriment les scientifiques dans divers domaines. Cependant, ces systèmes devenus de plus en plus larges constituent de gros consommateurs d'électricité et consomment déjà plusieurs mégawatts. Afin de consommer ''moins'' et ''mieux'', nous avons proposé un environnement logiciel qui d'une part, permet de choisir avant de pré-exécuter l'application, les versions de services applicatifs consommant le moins d'énergie, et qui d'autre part, repose sur une grille électrique intelligente pour planifier les réservations des ressources de calcul de ces infrastructures. Cet environnement, appelé SESAMES, a été adapté à deux services applicatifs indispensables au calcul très haute performance : la tolérance aux pannes et la diffusion de données. Des validations expérimentales ont montré que l'on peut réduire la consommation énergétique de chacun des deux services étudiés en s'appuyant sur les estimations énergétiques précises fournies par SESAMES pour n'importe quel contexte d'exécution et pour n'importe quelle plate-forme dotée de wattmètres. Notre méthodologie d'estimation repose sur une description du contexte d'exécution et sur une calibration de la plate-forme d'exécution basée sur la collecte de mesures énergétiques. Des simulations ont démontré que l'ordonnanceur multi-critères des réservations de ressources proposé dans SESAMES, permet de réduire à la fois la consommation énergétique, le coût financier et l'impact environnemental de ces réservations, tout en respectant les contraintes imposées par l'utilisateur et le fournisseur d'énergie.
19

De l’interaction des communications et de l’ordonnancement de threads au sein des grappes de machines multi-cœurs / About the interactions between communication and thread scheduling in clusters of multicore machines

Trahay, François 13 November 2009 (has links)
La tendance actuelle des constructeurs pour le calcul scientifique est à l'utilisation de grappes de machines dont les noeuds comportent un nombre de coeurs toujours plus grand. Le modèle basé uniquement sur MPI laisse peu à peu la place à des modèles mélangeant l'utilisation de threads et de MPI. Ce changement de modèle entraîne de nombreuses problématiques car les implémentations MPI n'ont pas été conçues pour supporter les applications multi-threadées. Dans cette thèse, afin de garantir le bon fonctionnement des communications, nous proposons un module logiciel faisant interagir l'ordonnanceur de threads et la bibliothèque de communication. Ce gestionnaire d'entrées/sorties générique prend en charge la détection des événements du réseau et exploite les multiples unités de calcul présentes sur la machine de manière transparente. Grâce à la collaboration étroite avec l'ordonnanceur de threads, le gestionnaire d'entrées/sorties que nous proposons assure un haut niveau de réactivité aux événements du réseau. Nous montrons qu'il est ainsi possible de faire progresser les communications réseau en arrière-plan et donc de recouvrir les communications par du calcul. La parallélisation de la bibliothèque de communication est également facilité par un mécanisme d'exportation de tâches capable d'exploiter les différentes unités de calcul disponible tout en prenant en compte la localité des données. Les gains obtenus sur des tests synthétiques et sur des applications montre que l'interaction entre la bibliothèque de communication et l'ordonnanceur de threads permet de réduire le coût des communications et donc d'améliorer les performances d'une application. / The current trend of constructors for scientific computation is to build clusters whose node include an increasing number of cores.The classical programming model that is only based on MPI is being replaced by hybrid approaches that mix communication and multi-threading. This evolution of the programming model leads to numerous problems since MPI implementations were not designed for multi-threaded applications. In this thesis, in order to guarantee a smooth behavior of communication, we propose a software module that interact with both the threads scheduler and the communication library. This module, by working closely with the thread scheduler, allows to make communication progress in the background and guarantees a high level of reactivity to network events, even when the node is overloaded. We show that this permits to make communication progress in the background and thus to overlap communication and computation. The parallelization of the communication library is also made easier thanks to a task onloading mechanism that is able to exploit the available cores while taking data locality into account. The results we obtain on synthetic application as well as real-life applications show that the interaction between the thread scheduler and the communication library allows to reduce the overhead of communication and thus to improve the application performance.
20

Une approche dynamique pour l'optimisation des communications concurrentes sur réseaux hautes performance

Brunet, Elisabeth 08 December 2008 (has links)
Cette thèse cherche à optimiser les communications des applications de calcul intensif s'exécutant sur des grappes de PC. En raison de l'usage massif de processeurs multicoeurs, il est désormais impératif de gérer un grand nombre de flux de communication concurrents. Nous avons mis en évidence et analysé les performances décevantes des solutions actuelles dans un tel contexte. Nous avons ainsi proposé une architecture de communication centrée sur l'arbitrage de l'accès aux matériels. Son originalité réside dans la dissociation de l'activité de l'application de celle des cartes réseaux. Notre modèle exploite l'intervalle de temps introduit entre le dépot des requêtes de communication et la disponibilité des cartes réseaux pour appliquer des optimisations de manière opportuniste. NewMadeleine implémente ce concept et se révèle capable d'exploiter les réseaux les plus performants du moment. Des tests synthétiques et portages d'implémentations caractéristiques de MPI ont permis de valider l'architecture proposée. / The aim of this thesis is to optimize the communications of high performance applications, in the context of clusters computing. Given the massive use of multicore architectures, it is now crucial to handle a large number of concurrent communication flows. We highlighted and analyzed the shortcomings of existing solutions. We therefore designed a new way to schedule communication flows by focusing on the activity of the network cards. Its novelty consists in untying the activity of applications from that of the network cards. Our model takes advantage of the delay that exists between the deposal of the communication requests and the moment when the network cards become idle in order to apply some opportunistic optimizations. NewMadeleine implements this model, thus making possible to exploit last generation high speed networks. The approach of NewMadeleine is not only validated by synthetical tests but also by real applications.

Page generated in 0.0861 seconds