• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 25
  • 15
  • 5
  • 3
  • 2
  • 1
  • Tagged with
  • 56
  • 36
  • 22
  • 20
  • 14
  • 12
  • 12
  • 10
  • 10
  • 9
  • 7
  • 7
  • 6
  • 6
  • 5
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
31

Sub-frame synchronisation and motion interpolation for panoramic video stitching / Synkronisering och Interpolering av Videodata för Panoramagenerering

Remì, Chierchia January 2022 (has links)
This study was carried out in collaboration with Tracab, a brand leader in real-time digital sports data. As a result, the application field is centred on sports analytics. The technology, for instance, consists of multiple cameras that capture a football pitch in a panoramic setup. The alignment of two or more cameras in both a spatial and temporal manner is referred to as sub-frame synchronisation. Because the cameras are already in the same geometric coordinates, only temporal synchronisation will be addressed in this project. The main method for retrieving the desynchronisation information that affects the cameras is based on optical flow. The off-sync cameras' spacial information is then synthesised to the time required by the synchronisation constraint using motion interpolation. In addition, the created system is compared to a real-time intermediate flow interpolation approach. The latter method relies on machine learning techniques, whereas this study focuses on more traditional methods. The metrics Peak Signal-to-Noise Ratio and Structural Similarity Index Measure are used to address the quality criteria required by this subject of study. Furthermore, visually perceived quality is examined to identify differences between measured and perceived quality. The results reveal that in every realistic situation investigated, temporal synchronisation can be addressed by an error measure of less than 1ms. The frame synthesis stage, on the other hand, fails to accurately estimate complicated scenarios, while the machine learning approach stands out. The implemented approach, on the other hand, addresses fast-moving objects with greater precision. Furthermore, the machine learning approach is unable to interpolate intermediate frames in arbitrary time steps, which is critical for the project's application. Finally, considering the lack of real-time computational speed and the quality achieved by machine learning approaches, more research is required in these directions. / Denna studie genomfördes i samarbete med Tracab, en marknadsledare inom digital sportdata levererad i realtid. Studiens applikationsområde kommer där av centreras kring sportdata där två eller flera kameror filmar en fotbollsplan i ett videopanorama. Kamerasynkroniseringen måste ske både spatialt och temporalt. Eftersom kamerorna har samma position kommer endast den temporala synkronisering tas upp i detta projekt. Den övergripande metoden för att göra detta är baserat på optiskt flöde. Data från en ej synkroniserad kamera syntetiseras via en synkroniseringkonstant mha. rörelseinterpolering. Detta jämförs även mot ett tillvägagångssätt som bygger på maskininlärning medan man i denna studie fokuserar på en mer traditionell lösningsmetod. Mätvärdena Peak Signal-to-Noise Ratio och Structural Similarity Index Measure används som kvalitetskriteria. Även visuellt upplevd kvalitet undersöks för att identifiera skillnaden mellan mätt och upplevd kvalitet. Resultatet visar att vid realistiska situationer kan den temporala synkroniseringen beräknas till under 1ms. Den syntetiserade datan lyckas dock inte estimera komplicerade situationer, medan maskininlärningsmetoden presterar bra. Dock så klarar studiens lösningsmetod att bättre generera objekt i snabb rörelse. Vidare så kan inte maskininlärningsmetoden generera video med en godtycklig tidförskjutning, något som är avgörande för projektets tillämpningsområde. Slutligen, med tanke på svårigheter i realtidsberäkning kontra kvaliteten hos maskin- inlärningsmetoder krävs därför mer forskning inom området.
32

On GPU Assisted Polar Decoding : Evaluating the Parallelization of the Successive Cancellation Algorithmusing Graphics Processing Units / Polärkodning med hjälp av GPU:er : En utvärdering av parallelliseringmöjligheterna av SuccessiveCancellation-algoritmen med hjälp av grafikprocessorer

Nordqvist, Siri January 2023 (has links)
In telecommunication, messages sent through a wireless medium often experience noise interfering with the signal in a way that corrupts the messages. As the demand for high throughput in the mobile network is increasing, algorithms that can detectand correct these corrupted messages quickly and accurately are of interest to the industry. Polar codes have been chosen by the Third Generation Partnership Project as the error correction code for 5G New Radio control channels. This thesis work aimed to investigate whether the polar code Successive Cancellation (SC) could be parallelized and if a graphics processing unit (GPU) can be utilized to optimize the execution time of the algorithm. The polar code Successive Cancellation was enhanced by implementing tree pruning and support for GPUs to leverage their parallelization. The difference in execution time between the concurrent and sequential versions of the SC algorithm with and without tree pruning was evaluated. The tree pruning SC algorithm almost always offered shorter execution times than the SC algorithm that did not employ treepruning. However, the support for GPUs did not reduce the execution time in these tests. Thus, the GPU is not certain to be able to improve this type of enhanced SC algorithm based on these results. / Meddelanden som överförs över ett mobilt nät utsätts ofta för brus som distorterar dem. I takt med att intresset ökat för hög genomströmning i mobilnätet har också intresset för algoritmer som snabbt och tillförlitligt kan upptäcka och korrigera distorderade meddelanden ökat. Polarkoder har valts av "Third Generation Partnership Project" som den klass av felkorrigeringskoder som ska användas för 5G:s radiokontrollkanaler. Detta examensarbete hade som syfte att undersöka om polarkoden "Successive Cancellation" (SC) skulle kunna parallelliseras och om en grafisk bearbetningsenhet (GPU) kan användas för att optimera exekveringstiden för algoritmen. SC utökades med stöd för trädbeskärning och parallellisering med hjälp av GPU:er. Skillnaden i exekveringstid mellan de parallella och sekventiella versionerna av SC-algoritmen med och utan trädbeskärning utvärderades. SC-algoritmen för trädbeskärning erbjöd nästan alltid kortare exekveringstider än SC-algoritmen som inte använde trädbeskärning. Stödet för GPU:er minskade dock inte exekveringstiden. Således kan man med dessa resultat inte med säkerhet säga att GPU-stöd skulle gynna SC-algoritmen.
33

Level Up CFD - GPU-Beschleunigung in Ansys Fluent

Findeisen, Fabian 20 June 2024 (has links)
In der numerischen Strömungssimulation (Computational Fluid Dynamics, CFD) stellt die Berechnungsgeschwindigkeit einen kritischen Faktor dar. Insbesondere bei transienten Berechnungen oder bei der Simulation von umfangreichen Modellen können Berechnungen auf Hochleistungsrechnern mit mehreren hundert Kernen schnell zu einer zeitintensiven Aufgabe werden, die Tage oder sogar Wochen in Anspruch nimmt. Der Vortrag bietet einen detaillierten Einblick in die Möglichkeiten der GPU-Beschleunigung in Ansys Fluent und beleuchtet das Potenzial dieser innovativen Technologie. Zu Beginn wird der neue GPU-Solver in Ansys Fluent vorgestellt. Dieser Gleichungslöser nutzt die Rechenkapazität von Grafikprozessoren (GPUs), um CFD-Berechnungen durch extreme Parallelisierung effizienter durchzuführen als herkömmliche CPU-basierte Solver. Ein zusätzlicher Vorteil dieser Methode ist die signifikante Reduzierung des Energieverbrauchs und der Hardware-Investitionskosten. Im Anschluss werden Benchmarks von CPU- gegenüber GPU-basierten Lösungen anhand verschiedener Anwendungsfälle präsentiert. Diese Benchmarks verdeutlichen die Leistungsfähigkeit und Effizienz von GPU-Solvern im Vergleich zu CPU-Solvern. So kann beispielsweise die Außenumströmung eines Fahrzeugs mit dem Coupled GPU Solver zehnmal schneller auf einer Nvidia A100 GPU berechnet werden als auf herkömmlicher HPC-Hardware mit 48 Kernen. Der Vortrag bietet auch einen Überblick über den aktuellen Funktionsumfang und die zukünftige Entwicklungsroadmap von Ansys Fluent. Dies gibt einen Einblick in die aktuellen Funktionen des Tools und die geplanten Entwicklungen für die Zukunft. Ein weiterer wichtiger Aspekt sind die Lizenz- und Hardwareanforderungen. Dies hilft, die notwendigen Ressourcen für die Implementierung dieser Technologie in eigenen Projekten zu verstehen. Abschließend bietet der Vortrag einen Ausblick auf die Anwendung von Künstlicher Intelligenz (KI) für CFD. Mit der fortschreitenden Entwicklung der KI-Technologie eröffnen sich neue Möglichkeiten für die Verbesserung und Beschleunigung von CFD-Berechnungen. Insgesamt bietet der Vortrag einen umfassenden Überblick über die Anwendung von GPU-Beschleunigung in moderner CFD-Software und die zukünftigen Entwicklungen in diesem Bereich. / Calculation speed is a critical factor in computational fluid dynamics (CFD). Especially for transient calculations or the simulation of extensive models, calculations on high-performance computers with several hundred cores can quickly become a time-consuming task that takes days or even weeks. The presentation offers a detailed insight into the possibilities of GPU acceleration in Ansys Fluent and highlights the potential of this innovative technology. At the beginning, the new GPU solver in Ansys Fluent will be introduced. This solver uses the computing power of graphics processing units (GPUs) to perform CFD calculations more efficiently than conventional CPU-based solvers through extreme parallelization. An additional advantage of this method is the significant reduction in energy consumption and hardware investment costs. Subsequently, benchmarks of CPU- versus GPU-based solutions will be presented based on different use cases. These benchmarks illustrate the performance and efficiency of GPU solvers compared to CPU solvers. For example, the external airflow of a vehicle can be calculated ten times faster with the Coupled GPU Solver on an Nvidia A100 GPU than on conventional HPC hardware with 48 cores. The presentation will also provide an overview of the current range of functions and the future development roadmap.
34

Detekce a klasifikace dopravních prostředků v obraze pomocí hlubokých neuronových sítí / Detection and Classification of Road Users in Aerial Imagery Based on Deep Neural Networks

Hlavoň, David January 2018 (has links)
This master's thesis deals with a vehicle detector based on the convolutional neural network and scene captured by drone. Dataset is described at the beginning, because the main aim of this thesis is to create practicly usable detector. Architectures of the forward neural networks which detector was created from are described in the next chapter. Techniques for building a detector based on the naive methods and current the most successful meta architectures follow the neural network architectures. An implementation of the detector is described in the second part of this thesis. The final detector was built on meta architecture Faster R-CNN and PVA neural network on which the detector achieved score over 90 % and 45 full HD frames per seconds.
35

Návrh vestavaného systému inteligentného vidění na platformě NVIDIA / Embedded Vision System on NVIDIA platform

Krivoklatský, Filip January 2019 (has links)
This diploma thesis deals with design of embedded computer vision system and transfer of existing computer vision application for 3D object detection from Windows OS to designed embedded system with Linux OS. Thesis focuses on design of communication interface for system control and camera video transfer through local network with video compression. Then, detection algorithm is enhanced by transferring computationally expensive functions to GPU using CUDA technology. Finally, a user application with graphical interface is designed for system control on Windows platform.
36

Geometrické transformace obrazu / Geometrical Image Transforms

Němeček, Petr Unknown Date (has links)
This master's thesis deals with acceleration of geometrical image transforms using the GPU and NVIDIA (R) CUDA TM architecture. Time critical parts of the code are moved on the GPU and executed in parallel. One of the results is a demonstrational application for performance comparison of both architectures: the CPU, and GPU in combination with the CPU. As a reference implementation, there are used highly optimized routines from the OpenCV library, made by the Intel company.
37

Interpolace obrazových bodů / Pixel Interpolation Methods

Mintěl, Tomáš January 2009 (has links)
This master's thesis deals with acceleration of pixel interpolation methods using the GPU and NVIDIA (R) CUDA TM architecture. Graphic output is represented by a demonstrational application for geometrical image transforms using chosen interpolation method. Time critical parts of the code are moved on the GPU and executed in parallel. There are used highly optimized routines from the OpenCV library, made by the Intel company for an image and video processing.
38

Design, development and evaluation of the ruggedized edge computing node (RECON)

Patel, Sahil Girin 09 December 2022 (has links)
The increased quality and quantity of sensors provide an ever-increasing capability to collect large quantities of high-quality data in the field. Research devoted to translating that data is progressing rapidly; however, translating field data into usable information can require high performance computing capabilities. While high performance computing (HPC) resources are available in centralized facilities, bandwidth, latency, security and other limitations inherent to edge location in field sensor applications may prevent HPC resources from being used in a timely fashion necessary for potential United States Army Corps of Engineers (USACE) field applications. To address these limitations, the design requirements for RECON are established and derived from a review of edge computing, in order to develop and evaluate a novel high-power, field-deployable HPC platform capable of operating in austere environments at the edge.
39

Exploring High Performance SQL Databases with Graphics Processing Units

Hordemann, Glen J. 26 November 2013 (has links)
No description available.
40

Raytracing i Kanalmodellsimuleringar med GPU:er / Raytracing in Channel Model Simulations Using GPUs

Sjökvist, Emil, Landberg, Simon January 2022 (has links)
Eftersom att dataanvändningen runt om i världen är något som hastigt ökar måste tekniken hänga med den ständigt höga efterfrågan på data. 5G är en ny teknik som utvecklas för fullt och redan finns på vissa ställen i världen. Innan man installer arantenner och implementerar 5G i samhället skulle det underlätta om man först på något sätt skulle kunna simulera hur signalerna kommer att röra sig och träffa mottagare beroende på var man sänder ifrån och på så sätt få en uppfattning om hur och var det vore optimalt att installera 5G­sändare. Målet för projektet är att ta fram metoder, mjukvara och miljöer för att kunna utföra denna simulering samt använda en raytracer för att på ett så verklighetstroget sätt som möjligt skapa virtuella radiovågor. För att uppnå detta utfördes mycket forskning kring vad för mjukvara som är optimalt att använda för projektets ändamål och en stor mängd analysering av kodsamt experimentation inuti OptiX för att få förståelse för hur strålar genereras, färdas och interagerar i scenerna. Slutligen lyckades framtagning av all programvara som behövs för att utveckla simuleringen samt kan strålar skickas och användas i scenen med viss funktionalitet. Dock behövs vidare utveckling på projektet för att visualisera strålarna på ett korrekt sätt samt implementera flera av de fysiska egenskaperna.

Page generated in 0.0557 seconds