Return to search

High-Performance Network Data Transfers to GPU : A Study of Nvidia GPU Direct RDMA and GPUNetIO

This study investigates high-performance network data transfers, focusing on Nvidia Graphics Processing Unit (GPU) Direct Remote Direct Memory Access (RDMA) and GPUNetIO. These methods have emerged as promising strategies for improving data communication between GPUs and network interfaces, but harnessing their potential requires meticulous configuration and optimization. This research aims to clarify those architectures and achieve optimal performance in this context. The study begins with analyzing the source code for both architectures, explaining their underlying principles and what they have improved on the previous structures. A useroriented testing tool is also developed to provide users with a simplified interface for conducting tests and system configuration requirements. The research methodology consists of reviewing the literature and analyzing the source code of GPUDirect RDMA and GPUNetIO. Additionally, experiments are designed to evaluate various performance aspects, ranging from Central Processing Unit (CPU)- related factors to GPU metrics and network card performance. The results indicate a significant acceleration in data copying when based on GPUDirect RDMA technology. The introduction of GPUNetIO leads to a substantial decrease in CPU utilization. Furthermore, the user interface is designed for simple deployment on hosts and easy access by users. The interface is equipped with the recommended configuration settings. / Denna studie undersöker högpresterande nätverksdataöverföringar med fokus på Nvidia GPU Direct RDMA och GPUNetIO. GPU Direct RDMA har visat sig vara en lovande metod för att förbättra datakommunikationen mellan GPU:er och nätverksgränssnitt, men för att utnyttja dess potential krävs noggrann konfiguration och optimering. Denna forskning syftar till att klargöra komplexiteten och svårigheterna med att uppnå optimal prestanda i detta sammanhang. Studien inleds med en analys av källkoden för båda arkitekturerna, som förklarar deras underliggande principer och vad de har förbättrat jämfört med de tidigare strukturerna. Dessutom utvecklas ett användarorienterat testverktyg som syftar till att ge användarna ett förenklat gränssnitt för att utföra tester. Forskningsmetoden består av en genomgång av litteraturen och en analys av källkoden för GPUDirect RDMA och GPUNetIO. Dessutom har en uppsättning experiment utformats för att utvärdera olika prestandaaspekter, allt från CPU-relaterade faktorer till GPU-mätvärden och nätverkskortsprestanda. Resultaten indikerar en betydande acceleration av datakopieringen när den baseras på GPUDirect RDMA-teknik. Införandet av GPUNetIO leder till en betydande minskning av CPU-användningen. Dessutom är användargränssnittet utformat för enkel driftsättning på värdar och enkel åtkomst för användare. Gränssnittet är utrustat med rekommenderade konfigurationsinställningar.

Identiferoai:union.ndltd.org:UPSALLA1/oai:DiVA.org:kth-342948
Date January 2023
CreatorsGao, Yuchen
PublisherKTH, Skolan för elektroteknik och datavetenskap (EECS)
Source SetsDiVA Archive at Upsalla University
LanguageEnglish
Detected LanguageEnglish
TypeStudent thesis, info:eu-repo/semantics/bachelorThesis, text
Formatapplication/pdf
Rightsinfo:eu-repo/semantics/openAccess
RelationTRITA-EECS-EX ; 2023:817

Page generated in 0.0017 seconds