• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 72
  • 29
  • 4
  • 1
  • Tagged with
  • 107
  • 59
  • 51
  • 48
  • 38
  • 37
  • 34
  • 24
  • 19
  • 19
  • 18
  • 16
  • 16
  • 15
  • 14
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
101

Cross-layer self-diagnosis for services over programmable networks / Auto-diagnostic multi-couche pour services sur réseaux programmables

Sánchez Vílchez, José Manuel 07 July 2016 (has links)
Les réseaux actuels servent millions de clients mobiles et ils se caractérisent par équipement hétérogène et protocoles de transport et de gestion hétérogènes, et des outils de gestion verticaux, qui sont très difficiles à intégrer dans leur infrastructure. La gestion de pannes est loin d’être automatisée et intelligent, ou un 40 % des alarmes sont redondantes et seulement un 1 ou 2% des alarmes sont corrélées au plus dans un centre opérationnel. Ça indique qu’il y a un débordement significatif des alarmes vers les adminis-trateurs humains, a comme conséquence un haut OPEX vue la nécessité d’embaucher de personnel expert pour accomplir les tâches de gestion de pannes. Comme conclusion, le niveau actuel d’automatisation dans les tâches de gestion de pannes dans réseaux télécoms n’est pas adéquat du tout pour adresser les réseaux programmables, lesquels promettent la programmation des ressources et la flexibilité afin de réduire le time-to-market des nouveaux services. L’automatisation de la gestion des pannes devient de plus en plus nécessaire avec l’arrivée des réseaux programmables, SDN (Software-Defined Networking), NFV (Network Functions Virtualization) et le Cloud. En effet, ces paradigmes accélèrent la convergence entre les domaines des réseaux et la IT, laquelle accélère de plus en plus la transformation des réseaux télécoms actuels en menant à repenser les opérations de gestion de réseau et des services, en particulier les opérations de gestion de fautes. Cette thèse envisage l’application des principes d’autoréparation en infrastructures basées sur SDN et NFV, en focalisant sur l’autodiagnostic comme facilitateur principal des principes d’autoréparation. Le coeur de cette thèse c’est la conception d’une approche de diagnostic qui soit capable de diagnostiquer de manière continuée les services dynamiques virtualisés et leurs dépendances des ressources virtuels (VNFs et liens virtuels) mais aussi les dépendances de ceux ressources virtuels de la infrastructure physique en-dessous, en prenant en compte la mobilité, la dynamicite, le partage de ressources à l’infrastructure en-dessous / Current networks serve billions of mobile customer devices. They encompass heterogeneous equipment, transport and manage-ment protocols, and vertical management tools, which are very difficult and costly to integrate. Fault management operations are far from being automated and intelligent, where around 40% of alarms are redundant only around 1-2% of alarms are correlated at most in a medium-size operational center. This indicates that there is a significant alarm overflow for human administrators, which inherently derives in high OPEX due to the increasingly need to employ high-skilled people to perform fault management tasks. In conclusion, the current level of automation in fault management tasks in Telcos networks is not at all adequate for programmable networks, which promise a high degree of programmability and flexibility to reduce the time-to-market. Automation on fault management is more necessary with the advent of programmable networks, led by with SDN (Software-Defined Networking), NFV (Network Functions Virtualization) and the Cloud. Indeed, the arise of those paradigms accelerates the convergence between networks and IT realms, which as consequence, is accelerating faster and faster the transformation of cur-rent networks leading to rethink network and service management and operations, in particular fault management operations. This thesis envisages the application of self-healing principles in SDN and NFV combined infrastructures, by focusing on self-diagnosis tasks as main enabler of self-healing. The core of thesis is to devise a self-diagnosis approach able to diagnose at run-time the dynamic virtualized networking services and their dependencies from the virtualized resources (VNFs and virtual links) but also the dependencies of those virtualized resources from the underlying network infrastructure, taking into account the mobility, dynamicity, and sharing of resources in the underlying infrastructure
102

Model-based control and diagnosis of inland navigation networks / Contrôle et diagnostic à base de modèle de réseaux de navigation intérieure

Segovia Castillo, Pablo 11 June 2019 (has links)
Cette thèse contribue à répondre au problème de la gestion optimale des ressources en eau dans les réseaux de navigation intérieure du point de vue de la théorie du contrôle. Les objectifs principales à atteindre consistent à garantir la navigabilité des réseaux de voies navigables, veiller à la réduction des coûts opérationnels et à la longue durée de vie des équipements. Lors de la conception de lois de contrôle, les caractéristiques des réseaux doivent être prises en compte, à savoir leurs dynamiques complexes, des retards variables et l’absence de pente. Afin de réaliser la gestion optimale, le contrôle efficace des structures hydrauliques doit être assuré. A cette fin, une approche de modélisation orientée contrôle est dérivée. Cependant, la formulation obtenue appartient à la classe des systèmes de descripteurs retardés, pour lesquels la commande prédictive MPC et l’estimation d’état sur horizon glissant MHE peuvent être facilement adaptés à cette formulation, tout en permettant de gérer les contraintes physiques et opérationnelles de manière naturelle. En raison de leur grande dimensionnalité, une mise en œuvre centralisée n’est souvent ni possible ni souhaitable. Compte tenu du fait que les réseaux de navigation intérieure sont des systèmes fortement couplés, une approche distribuée est proposée, incluant un protocole de communication entre agents. Malgré l’optimalité des solutions, toute erreur peut entraîner une gestion inefficace du système. Par conséquent, les dernières contributions de la thèse concernent la conception de stratégies de supervision permettant de détecter et d’isoler les pannes des équipements. Toutes les approches présentées sont appliquées à une étude de cas réaliste basée sur le réseau de voies navigables du nord e la France afin de valider leur efficacité. / This thesis addresses the problem of optimal management of water resources in inland navigation networks from a control theory perspective. The main objectives to be attained consist in guaranteeing the navigability condition of the network, minimizing the operational cost and ensuring a long lifespan of the equipment. However, their complex dynamics, large time delays and negligible bottom slopes complicate their management. In order to achieve the optimal management, the efficient control of the hydraulic structures must be ensured. To this end, a control-oriented modeling approach is derived. The resulting formulation belongs to the class of delayed desciptor systems, for which model predictive control and moving horizon estimation can be easily adapted, as well as being able to deal with physical and operational constraints in a natural manner. However, a centralized implementation is often neither possible nor desirable. As these networks are strongly coupled systems, a distributed approach is followed, featuring a communication protocol among agents. Despite the optimality of the solutions, any malfunction can lead to an inefficient system management. Therefore, the last part of the thesis regards the design of supervisory strategies that allow to detect and isolate faults. All the presented approaches are applied to a realistic case study based on the inland navigation network in the north of France to validate their effectiveness.
103

Subspace-based system identification and fault detection: Algorithms for large systems and application to structural vibration analysis

Döhler, Michael 10 October 2011 (has links) (PDF)
L'identification des modes vibratoires est un sujet prioritaire dans le cadre de la surveillance des structures civiles. Certaines techniques d'identification, les méthodes sous espace, ont prouvé leur adéquation pour l'identification et la détection de changements dans les caractéristiques vibratoires, ceci sous des conditions opérationnelles. Le but de cette thèse est l'amélioration de l'efficacité et de la robustesse de ces approches pour l'identification vibratoire et pour la détection des pannes dans les structures de grande taille, équipées d'un grand nombre de capteurs et fonctionnant en conditions environnementales diverses et bruitées. Dans cette thèse, quatre verrous majeurs ont été levés. D'abord, à partir de mesures collectées à différents points de mesure et sous différentes conditions environnementales, un algorithme d'extraction des déformées est proposé, alliant simplicité, modularité et compacité. Ensuite, une reformulation d'un problème moindre carrés amène à une amélioration conséquente du temps de calcul, lors du calcul multi ordre utilisé pour séparer les vrais modes de structures des modes parasites. D'autre part, une approche statistique pour la détection de pannes est améliorée et modifiée par l'usage d'un résidu robuste aux variations dans l'excitation ambiante inconnue. Finalement est considéré le problème de localisation de fautes quand l'absence de modèle aux éléments finis doit être compensée par un calcul direct de sensibilités à partir des données mesurées. Les différentes méthodes sont validées sur simulations et sont appliquées avec succès pour l'identification et la détection de fautes sur plusieurs structures civiles de grande taille.
104

Combining checkpointing and other resilience mechanisms for exascale systems / L'utilisation conjointe de mécanismes de sauvegarde de points de reprise (checkpoints) et d'autres mécanismes de résilience pour les systèmes exascales

Bentria, Dounia 10 December 2014 (has links)
Dans cette thèse, nous nous sommes intéressés aux problèmes d'ordonnancement et d'optimisation dans des contextes probabilistes. Les contributions de cette thèse se déclinent en deux parties. La première partie est dédiée à l’optimisation de différents mécanismes de tolérance aux pannes pour les machines de très large échelle qui sont sujettes à une probabilité de pannes. La seconde partie est consacrée à l’optimisation du coût d’exécution des arbres d’opérateurs booléens sur des flux de données.Dans la première partie, nous nous sommes intéressés aux problèmes de résilience pour les machines de future génération dites « exascales » (plateformes pouvant effectuer 1018 opérations par secondes).Dans le premier chapitre, nous présentons l’état de l’art des mécanismes les plus utilisés dans la tolérance aux pannes et des résultats généraux liés à la résilience.Dans le second chapitre, nous étudions un modèle d’évaluation des protocoles de sauvegarde de points de reprise (checkpoints) et de redémarrage. Le modèle proposé est suffisamment générique pour contenir les situations extrêmes: d’un côté le checkpoint coordonné, et de l’autre toute une famille de stratégies non-Coordonnées. Nous avons proposé une analyse détaillée de plusieurs scénarios, incluant certaines des plateformes de calcul existantes les plus puissantes, ainsi que des anticipations sur les futures plateformes exascales.Dans les troisième, quatrième et cinquième chapitres, nous étudions l'utilisation conjointe de différents mécanismes de tolérance aux pannes (réplication, prédiction de pannes et détection d'erreurs silencieuses) avec le mécanisme traditionnel de checkpoints et de redémarrage. Nous avons évalué plusieurs modèles au moyen de simulations. Nos résultats montrent que ces modèles sont bénéfiques pour un ensemble de modèles d'applications dans le cadre des futures plateformes exascales.Dans la seconde partie de la thèse, nous étudions le problème de la minimisation du coût de récupération des données par des applications lors du traitement d’une requête exprimée sous forme d'arbres d'opérateurs booléens appliqués à des prédicats sur des flux de données de senseurs. Le problème est de déterminer l'ordre dans lequel les prédicats doivent être évalués afin de minimiser l'espérance du coût du traitement de la requête. Dans le sixième chapitre, nous présentons l'état de l'art de la seconde partie et dans le septième chapitre, nous étudions le problème pour les requêtes exprimées sous forme normale disjonctive. Nous considérons le cas plus général où chaque flux peut apparaître dans plusieurs prédicats et nous étudions deux modèles, le modèle où chaque prédicat peut accéder à un seul flux et le modèle où chaque prédicat peut accéder à plusieurs flux. / In this thesis, we are interested in scheduling and optimization problems in probabilistic contexts. The contributions of this thesis come in two parts. The first part is dedicated to the optimization of different fault-Tolerance mechanisms for very large scale machines that are subject to a probability of failure and the second part is devoted to the optimization of the expected sensor data acquisition cost when evaluating a query expressed as a tree of disjunctive Boolean operators applied to Boolean predicates. In the first chapter, we present the related work of the first part and then we introduce some new general results that are useful for resilience on exascale systems.In the second chapter, we study a unified model for several well-Known checkpoint/restart protocols. The proposed model is generic enough to encompass both extremes of the checkpoint/restart space, from coordinated approaches to a variety of uncoordinated checkpoint strategies. We propose a detailed analysis of several scenarios, including some of the most powerful currently available HPC platforms, as well as anticipated exascale designs.In the third, fourth, and fifth chapters, we study the combination of different fault tolerant mechanisms (replication, fault prediction and detection of silent errors) with the traditional checkpoint/restart mechanism. We evaluated several models using simulations. Our results show that these models are useful for a set of models of applications in the context of future exascale systems.In the second part of the thesis, we study the problem of minimizing the expected sensor data acquisition cost when evaluating a query expressed as a tree of disjunctive Boolean operators applied to Boolean predicates. The problem is to determine the order in which predicates should be evaluated so as to shortcut part of the query evaluation and minimize the expected cost.In the sixth chapter, we present the related work of the second part and in the seventh chapter, we study the problem for queries expressed as a disjunctive normal form. We consider the more general case where each data stream can appear in multiple predicates and we consider two models, the model where each predicate can access a single stream and the model where each predicate can access multiple streams.
105

On numerical resilience in linear algebra / Conception d'algorithmes numériques pour la résilience en algèbre linéaire

Zounon, Mawussi 01 April 2015 (has links)
Comme la puissance de calcul des systèmes de calcul haute performance continue de croître, en utilisant un grand nombre de cœurs CPU ou d’unités de calcul spécialisées, les applications hautes performances destinées à la résolution des problèmes de très grande échelle sont de plus en plus sujettes à des pannes. En conséquence, la communauté de calcul haute performance a proposé de nombreuses contributions pour concevoir des applications tolérantes aux pannes. Cette étude porte sur une nouvelle classe d’algorithmes numériques de tolérance aux pannes au niveau de l’application qui ne nécessite pas de ressources supplémentaires, à savoir, des unités de calcul ou du temps de calcul additionnel, en l’absence de pannes. En supposant qu’un mécanisme distinct assure la détection des pannes, nous proposons des algorithmes numériques pour extraire des informations pertinentes à partir des données disponibles après une pannes. Après l’extraction de données, les données critiques manquantes sont régénérées grâce à des stratégies d’interpolation pour constituer des informations pertinentes pour redémarrer numériquement l’algorithme. Nous avons conçu ces méthodes appelées techniques d’Interpolation-restart pour des problèmes d’algèbre linéaire numérique tels que la résolution de systèmes linéaires ou des problèmes aux valeurs propres qui sont indispensables dans de nombreux noyaux scientifiques et applications d’ingénierie. La résolution de ces problèmes est souvent la partie dominante; en termes de temps de calcul, des applications scientifiques. Dans le cadre solveurs linéaires du sous-espace de Krylov, les entrées perdues de l’itération sont interpolées en utilisant les entrées disponibles sur les nœuds encore disponibles pour définir une nouvelle estimation de la solution initiale avant de redémarrer la méthode de Krylov. En particulier, nous considérons deux politiques d’interpolation qui préservent les propriétés numériques clés de solveurs linéaires bien connus, à savoir la décroissance monotone de la norme-A de l’erreur du gradient conjugué ou la décroissance monotone de la norme résiduelle de GMRES. Nous avons évalué l’impact du taux de pannes et l’impact de la quantité de données perdues sur la robustesse des stratégies de résilience conçues. Les expériences ont montré que nos stratégies numériques sont robustes même en présence de grandes fréquences de pannes, et de perte de grand volume de données. Dans le but de concevoir des solveurs résilients de résolution de problèmes aux valeurs propres, nous avons modifié les stratégies d’interpolation conçues pour les systèmes linéaires. Nous avons revisité les méthodes itératives de l’état de l’art pour la résolution des problèmes de valeurs propres creux à la lumière des stratégies d’Interpolation-restart. Pour chaque méthode considérée, nous avons adapté les stratégies d’Interpolation-restart pour régénérer autant d’informations spectrale que possible. Afin d’évaluer la performance de nos stratégies numériques, nous avons considéré un solveur parallèle hybride (direct/itérative) pleinement fonctionnel nommé MaPHyS pour la résolution des systèmes linéaires creux, et nous proposons des solutions numériques pour concevoir une version tolérante aux pannes du solveur. Le solveur étant hybride, nous nous concentrons dans cette étude sur l’étape de résolution itérative, qui est souvent l’étape dominante dans la pratique. Les solutions numériques proposées comportent deux volets. A chaque fois que cela est possible, nous exploitons la redondance de données entre les processus du solveur pour effectuer une régénération exacte des données en faisant des copies astucieuses dans les processus. D’autre part, les données perdues qui ne sont plus disponibles sur aucun processus sont régénérées grâce à un mécanisme d’interpolation. / As the computational power of high performance computing (HPC) systems continues to increase by using huge number of cores or specialized processing units, HPC applications are increasingly prone to faults. This study covers a new class of numerical fault tolerance algorithms at application level that does not require extra resources, i.e., computational unit or computing time, when no fault occurs. Assuming that a separate mechanism ensures fault detection, we propose numerical algorithms to extract relevant information from available data after a fault. After data extraction, well chosen part of missing data is regenerated through interpolation strategies to constitute meaningful inputs to numerically restart the algorithm. We have designed these methods called Interpolation-restart techniques for numerical linear algebra problems such as the solution of linear systems or eigen-problems that are the inner most numerical kernels in many scientific and engineering applications and also often ones of the most time consuming parts. In the framework of Krylov subspace linear solvers the lost entries of the iterate are interpolated using the available entries on the still alive nodes to define a new initial guess before restarting the Krylov method. In particular, we consider two interpolation policies that preserve key numerical properties of well-known linear solvers, namely the monotony decrease of the A-norm of the error of the conjugate gradient or the residual norm decrease of GMRES. We assess the impact of the fault rate and the amount of lost data on the robustness of the resulting linear solvers.For eigensolvers, we revisited state-of-the-art methods for solving large sparse eigenvalue problems namely the Arnoldi methods, subspace iteration methods and the Jacobi-Davidson method, in the light of Interpolation-restart strategies. For each considered eigensolver, we adapted the Interpolation-restart strategies to regenerate as much spectral information as possible. Through intensive experiments, we illustrate the qualitative numerical behavior of the resulting schemes when the number of faults and the amount of lost data are varied; and we demonstrate that they exhibit a numerical robustness close to that of fault-free calculations. In order to assess the efficiency of our numerical strategies, we have consideredan actual fully-featured parallel sparse hybrid (direct/iterative) linear solver, MaPHyS, and we proposed numerical remedies to design a resilient version of the solver. The solver being hybrid, we focus in this study on the iterative solution step, which is often the dominant step in practice. The numerical remedies we propose are twofold. Whenever possible, we exploit the natural data redundancy between processes from the solver toperform an exact recovery through clever copies over processes. Otherwise, data that has been lost and is not available anymore on any process is recovered through Interpolationrestart strategies. These numerical remedies have been implemented in the MaPHyS parallel solver so that we can assess their efficiency on a large number of processing units (up to 12; 288 CPU cores) for solving large-scale real-life problems.
106

Exécution d'applications parallèles en environnements hétérogènes et volatils : déploiement et virtualisation / Parallel applications execution in heterogeneous and volatile environnments : mapping and virtualization

Miquée, Sébastien 25 January 2012 (has links)
La technologie actuelle permet aux scientifiques de divers domaines d'obtenir des données de plus en plus précises et volumineuses, Afin de résoudre ces problèmes associés à l'obtention de ces données, les architectures de calcul évoluent, en fournissant toujours plus de ressources, notamment grâce à des machines plus puissantes et à leur mutualisation. Dans cette thèse, nous proposons d’étudier dans un premier temps le placement des tâches d'applications itératives asynchrones dans des environnements hétérogènes et volatils. Notre solution nous permet également de s'affranchir de l(hétérogénéité des machines hôtes tout en offrent une implantation facilitée de politiques de tolérance aux pannes, les expérimentations que nous avons menées sont encourageantes et montrent qu'il existe un réel potentiel quand à l'utilisation d'une telle plateforme pour l'exécution d'applications scientifiques. / The current technology allows scientists of several domains to obtain more precise and large data. In the same time, computing architectures evolve too, by providing even more computing resources, with more powerful machines and the pooling of them. In this thesis, in a first time we propose to study the problem of the mapping of asynchronous iterative applications tasks into heterogeneous and volatile environments. Our solution allows also to overcome the heterogeneity of host machines while offering an easier implementation of policies for fault tolerance. The experiments we have conducted are encouraging ad show that there is real potential for the use of such a platform for running scientific applications.
107

Optimisation du routage, tolérance aux pannes et gestion de l'énergie et de l'interférence pour la transmission des flux multimédia temps réel dans les réseaux de capteur sans fil / Optimization and fault tolerance for real-time media stream transmission in wireless sensor networks

Bouatit, Mohamed Nacer 28 June 2018 (has links)
Les applications multimédias, dans les réseaux de capteurs sans fil, véhiculent des données volumineuses, qui nécessitent un taux de transmission élevé et un traitement intensif et par conséquent une consommation d'énergie importante. Transmettre efficacement ces flux hétérogènes, tout en assurant leur fiabilité et garantir les exigences de QoS, avec les ressources limitées disponibles, en particulier dans les contextes critiques, demeure un verrou scientifique ouvert. C’est pourquoi, dans le cadre de cette thèse, nous nous sommes intéressés aux aspects liés : au routage, à la tolérance aux pannes et à la gestion des interférences dans les RCMSF.Compte tenu, du très faible nombre de protocoles de routage, qui ont approché la phase expérimentale et encore moins ceux qui l’ont abordé pendant la transmission des données en temps réel, nous avons développé dans ce contexte, un protocole routage géographique baptisé GNMFT (Geographic Non-interfering Multipath Fault-tolerant),En premier lieu, nous avons amélioré le mode de sélection des nœuds, utilisé par le transfert glouton, pour faire face au problème du Minimum-local, où une fonction objective multicritères (distance, énergie et puissance de réception) relative au choix du prochain saut a été définie. Puis, nous avons introduit une phase d’optimisation des chemins construits afin d’éliminer les boucles et une approche adaptative gérant les transmissions simultanées des différents trafics.Par la suite, nous nous sommes orientés vers la tolérance aux pannes, pour assurer la fiabilité des données transmises ainsi que la connectivité du réseau. A cet effet, nous avons modélisé le nombre des paquets perdus durant la livraison des paquets et proposé deux mécanismes : un curatif pour réparer les défaillances soudaines et un préventif afin d’anticiper l’épuisement des batteries. Les deux mécanismes sont combinés avec une stratégie de basculement dynamique lors de la construction des chemins alternatives.En dernier lieu, nous avons présenté un modèle d’interférence et un troisième mécanisme qui limite les interactions entre les liens adjacents. De plus, nous avons défini également un modèle de perte de chemins dans un environnement multi-paires (source,sink) et nous avons calculé le coefficient de probabilité d’erreurs basée sur une fonction de distance qui sépare les flux de données. Une nouvelle métrique a été ajouté dans la fonction objective, relative à la somme des bruits des nœuds actifs qui interférent sur les nœuds du ForwardingSet du nœud courant.Les résultats obtenus montrent l’efficacité des approches proposées qui ont été étudiées et validées à la fois par simulation et sur un banc d’essai expérimental. / Multimedia applications in WSNs convey large data (image, audio and video) that requires high transmission rate and intensive treatment and therefore high energy consumption. Effectively transmit these heterogeneous flows, while ensuring their reliability and guaranteeing QoS requirements, with the limited resources available, especially in critical contexts, remains an open scientific problem. That is why, in this thesis, we are interested in aspects related to : routing, fault tolerance and interference management in WMSNs.Given the very low number of routing protocols, that have approached the experimental phase and still less those who approached it during data transmission in real time, we developed in this context, a geographic routing protocol baptised GNMF (Geographic Non-interfering Multipath Fault-tolerant),First, we improved node's selection mode used by the greedy-forwarding, to deal with local minimum problem, where a multi-criteria objective function (distance, energy and reception power) related to next-hop choice has been defined. Then, we introduced an optimization phase of built paths to eliminate loops and an adaptive approach to manage simultaneous traffic transmissions.After that, we oriented towards fault tolerance, to ensure transmitted data reliability and network connectivity. To this end, we modeled the number of lost packets during package delivery and proposed two mechanisms. The curative is used when sudden failures occurs and the preventive to anticipate batteries depletion. Both are combined with a dynamic failover strategy during alternative paths construction.Finally, we presented an interference model and a third mechanism that limits interactions between adjacent links. In addition, we also defined a path loss model in a multipairs environment (source, sink) and computed the error probability coefficient based on a distance function that separates the data flows. A new metric has been added in the objective function, related to noise sum of the active nodes that interferes on forwarding set nodes of the current node.Obtained results show the effectiveness of the proposed approaches that have been studied and validated both by simulation and on an experimental testbed.

Page generated in 1.3165 seconds