Global ETD Search

1	Parallel processing for statistical computation with particular emphasis on bootstrap methods Adams, Niall January 1996 (has links) No description available. 519.5
2	Improving High Performance Networking Technologies for Data Center Clusters Grant, RYAN 25 September 2012 (has links) This dissertation demonstrates new methods for increasing the performance and scalability of high performance networking technologies for use in clustered computing systems, concentrating on Ethernet/High-Speed networking convergence. The motivation behind the improvement of high performance networking technologies and their importance to the viability of modern data centers is discussed first. It then introduces the concepts of high performance networking in a commercial data center context as well as high performance computing (HPC) and describes some of the most important challenges facing such networks in the future. It reviews current relevant literature and discusses problems that are not yet solved. Through a study of existing high performance networks, the most promising features for future networks are identified. Sockets Direct Protocol (SDP) is shown to have unexpected performance issues for commercial applications, due to inefficiencies in handling large numbers of simultaneous connections. The first SDP over eXtended Reliable Connections implementation is developed to reduce connection management overhead, demonstrating that performance issues are related to protocol overhead at the SDP level. Datagram offloading for IP over InfiniBand (IPoIB) is found to work well. In the first work of its kind, hybrid high-speed/Ethernet networks are shown to resolve the issues of SDP underperformance and demonstrate the potential for hybrid high-speed networking local area Remote Direct Memory Access (RDMA) technologies and Ethernet wide area networking for data centers. Given the promising results from these studies, a set of solutions to enhance performance at the local and wide area network level for Ethernet is introduced, providing a scalable, connectionless, socket-compatible, fully RDMA-capable networking technology, datagram-iWARP. A novel method of performing RDMA Write operations (called RDMA Write-Record) and RDMA Read over unreliable datagrams over Ethernet is designed, implemented and tested. It shows its applicability in scientific and commercial application spaces and is applicable to other verbs-based networking interfaces such as InfiniBand. The newly proposed RDMA methods, both for send/recv and RDMA Write-Record, are supplemented with interfaces for both socket-based applications and Message Passing Interface (MPI) applications. An MPI implementation is adapted to support datagram-iWARP. Both scalability and performance improvements are demonstrated for HPC and commercial applications. / Thesis (Ph.D, Electrical & Computer Engineering) -- Queen's University, 2012-09-25 09:43:55.262 Data centers Cluster Computing High Performance Networks
3	Calculabilité et conditions de progression des objets partagés en présence de défaillances Imbs, Damien 12 April 2012 (has links) (PDF) Dans un système distribué, différents processus communiquent et se synchronisent pour résoudre un calcul global. La difficulté vient du fait qu'un processus ne connait pas les entrées des autres. Nous considérons ici un système asynchrone: on ne fait aucune hypothèses sur les vitesses d'exécution relatives des différents processus. De plus, pour modéliser les pannes, nous considérons que les processus peuvent crasher: ils peuvent arrêter leur exécution à n'importe quel endroit de leur programme. Dans l'étude théorique des systèmes distribués, les problèmes doivent être considérés selon deux aspects: la sûreté et la progression. La sûreté définit quand une valeur de sortie est correcte. La progression définit dans quelles conditions un processus doit terminer une opération, indépendamment de la valeur qu'il choisit comme sortie. Cette thèse se concentre sur les liens entre calculabilité et conditions de progression des objets distribués. Dans un premier temps, nous introduisons et étudions la notion de conditions de progression asymétriques: des conditions de progression qui peuvent être différentes pour différents processus du système. Nous étudions ensuite la possibilité de fournir des abstractions dans un système donné. La question de l'équivalence de modèles de systèmes est ensuite abordée, en particulier dans le cas où les processus ont accès à des objets puissants. Pour finir, la thèse traite le sujet des tâches colorées en fournissant un algorithme de renommage adapté au cas où la concurrence est réduite. Une nouvelle classe de tâches colorées est enfin introduite qui englobe, sous un formalisme unique, plusieurs problèmes considérés jusqu'ici comme indépendants. Systèmes répartis
4	Étude des problèmes d'ordonnancement sur des plates-formes hétérogènes en modèle multi-port Rejeb, Hejer 30 August 2011 (has links) (PDF) Les travaux menés dans cette thèse concernent les problèmes d'ordonnancement sur des plates-formes de calcul dynamiques et hétérogènes et s'appuient sur le modèle de communication "multi-port" pour les communications. Nous avons considéré le problème de l'ordonnancement des tâches indépendantes sur des plates-formes maîtres-esclaves, dans les contextes statique et dynamique. Nous nous sommes également intéressé au problème de la redistribution de fichiers répliqués dans le cadre de l'équilibrage de charge. Enfin, nous avons étudié l'importance des mécanismes de partage de bande passante pour obtenir une meilleure efficacité du système. ordonnancement parallélisme
5	The Design of Cloud-Economical Computing Services for Program Trading Hsu, Chi-Shin 26 August 2012 (has links) Program Trading has gotten more popular recent years. According to thestatistics, there was about 53.6% of daily volume in the United States, and increased to 73% in 2009. With the universal of program trading, more people have begun to research program trading. The purpose of this paper is constructing a developed platform of program trading for researching or developing. In addition to developed platform, we provide the run-time environment, and three main functions: 1. The job scheduler 2. The high scalability 3. The developed platform In this paper, we use SLURM to implement an economical computing service for program trading. SLURM is a resource management software for some large clusters. However it lacked for an easy interface to the ended users. We modify Xinetd as the external interface for SLURM, and implement the program trading development platform for researching or developing. According to the result, using our scheduler and the external interface that modify from Xinetd can be effective in controlling the server resource and increase the availability. cluster computing cloud computing SLURM Xinetd program trading
6	Evaluation and Tuning of Gigabit Ethernet performance on Clusters Desai, Harit S. 30 July 2007 (has links) No description available. Computer Science Gigabit ethernet performance Cluster computing TCP/IP performance
7	High Performance and Scalable MPI Intra-node Communication Middleware for Multi-core Clusters Chai, Lei 27 August 2009 (has links) No description available. Computer Science MPI Cluster Computing Multi-core Processors
8	Software rejuvenation in cluster computing systems with dependency between nodes Yang, M., Min, Geyong, Yang, W., Li, Z. 17 March 2014 (has links) No / Software rejuvenation is a preventive and proactive fault management technique that is particularly useful for counteracting the phenomenon of software aging, aimed at cleaning up the system internal state to prevent the occurrence of future failure. The increasing interest in combing software rejuvenation with cluster systems has given rise to a prolific research activity in recent years. However, so far there have been few reports on the dependency between nodes in cluster systems when software rejuvenation is applied. This paper investigates the software rejuvenation policy for cluster computing systems with dependency between nodes, and reconstructs an stochastic reward net model of the software rejuvenation in such cluster systems. Simulation experiments and results reveal that the software rejuvenation strategy can decrease the failure rate and increase the availability of the cluster system. It also shows that the dependency between nodes affects software rejuvenation policy. Based on the theoretic analysis of the software rejuvenation model, a prototype is implemented on the Smart Platform cluster computing system. Performance measurement is carried out on this prototype, and experimental results reveal that software rejuvenation can effectively prevent systems from entering into disabled states, and thereby improving the ability of software fault-tolerance and the availability of cluster computing systems. / National Natural Science Foundation of China under the grant No. 60872044, 71133006, and Fundamental Research Funds for the Central Universities, and the Research Funds of Renmin University of China.
9	P2P-MPI : A fault-tolerant Message Passing Interface Implementation for Grids Rattanapoka, Choopan 22 April 2008 (has links) (PDF) Cette thèse démontre la faisabilité d'un intergiciel destiné aux grilles de calcul, prenant en compte la dynamicité de ce type de plateforme, et les impératifs des programmes parallèles à passage de message. Pour cela, nous mettons en avant l'intérêt d'utiliser une architecture la plus distribuée possible : nous reprenons l'idée d'une infrastructure pair-à-pair pour l'organisation des ressources, qui facilite notamment la découverte des ressources, et nous retenons les détecteurs de défaillance distribués pour gérer la tolérance aux pannes. La dynamicité de ce type d'environnement est également un problème pour le modèle d'exécution sous-jacent à MPI, car la panne d'un seul processus entraine l'arrêt de l'application. La contribution de P2P-MPI dans ce domaine est la tolérance aux pannes par réplication. Nous pensons qu'elle est la mieux adaptée à une architecture pair-à-pair, les techniques classiques basées sur le check-point and restart nécessitant un ou des serveurs de sauvegardes. De plus, la réplication est totalement transparente à l'utilisateur et rejoint ainsi l'objectif de simplicité d'utilisation que nous nous sommes fixés. Nous pensons que garder un environnement très simple d'utilisation, entièrement maîtrisable par un utilisateur, est un des facteurs permettant d'augmenter le nombre de ressources disponibles sur la grille. Enfin, la contribution majeure de P2P-MPI est la librairie de communication proposée, qui est une implémentation de MPJ (MPI adapté à Java), et qui intègre la réplication des processus. Ce point particulier de notre travail plaide pour une collaboration étroite entre l'intergiciel, qui connaît l'état de la grille (détection des pannes par exemple) et la couche de communication qui peut adapter son comportement en connaissance de cause. systèmes distribués tolérance aux pannes MPI grille
10	Structures et systèmes répartis Trédan, Gilles 26 November 2009 (has links) (PDF) Le modèle du système réparti s'oppose au modèle classique dit ''client-serveur'' par l'absence de serveur central. Supprimer ce serveur a des conséquences bénéfiques: le réseau entier ne dépend plus de cette unique entité et ainsi un système réparti est plus robuste. Mais cette suppression a aussi un coût: le serveur centralise les données et a une connaissance globale (ou totale) du système. Dans un système réparti au contraire, aucune entité n'a de connaissance globale du système et de son état. Chaque entité échange de l'information avec un sous-ensemble des entités du système. On parle alors de vision locale (ou partielle) du système. Dans cette thèse, nous nous intéressons à la structure induite par ces visions locales et à son impact sur les applications réparties. Notre étude prend pour contexte différents modèles des systèmes répartis: le modèle partiellement synchrone, le modèle pair-à-pair et le modèle des réseaux de capteurs fixes. Notre approche se divise en trois parties: 1) nous montrons l'impact des structures de communication sur les applications réparties, et proposons une manière de capturer cet impact. Ensuite, 2) nous montrons comment l'utilisation d'hypothèses sur ces structures permet de résoudre deux problèmes classiques des systèmes répartis. Enfin 3) nous montrons comment transformer ces structures de communication en des structures logiques et explicites: les systèmes de coordonnées. Informatique répartie systèmes distribués

Search results