Global ETD Search

21	Designing optimized MPI+NCCL hybrid collective communication routines for dense many-GPU clusters Senthil Kumar, Nithin 04 October 2021 (has links) No description available. Computer Science MPI NCCL NVIDIA Collective Communications Library CUDA-aware MPI MVAPICH2-GDR MVAPICH2
22	Optimizing Harris Corner Detection on GPGPUs Using CUDA Loundagin, Justin 01 March 2015 (has links) (PDF) ABSTRACT Optimizing Harris Corner Detection on GPGPUs Using CUDA The objective of this thesis is to optimize the Harris corner detection algorithm implementation on NVIDIA GPGPUs using the CUDA software platform and measure the performance benefit. The Harris corner detection algorithm—developed by C. Harris and M. Stephens—discovers well defined corner points within an image. The corner detection implementation has been proven to be computationally intensive, thus realtime performance is difficult with a sequential software implementation. This thesis decomposes the Harris corner detection algorithm into a set of parallel stages, each of which are implemented and optimized on the CUDA platform. The performance results show that by applying strategic CUDA optimizations to the Harris corner detection implementation, realtime performance is feasible. The optimized CUDA implementation of the Harris corner detection algorithm showed significant speedup over several platforms: standard C, MATLAB, and OpenCV. The optimized CUDA implementation of the Harris corner detection algorithm was then applied to a feature matching computer vision system, which showed significant speedup over the other platforms. CUDA GPGPU NVIDIA Harris Corner Detection Computational Engineering Electrical and Computer Engineering Signal Processing
23	Machine Learning Aided Millimeter Wave System for Real Time Gait Analysis Alanazi, Mubarak Alayyat 10 August 2022 (has links) No description available. Electrical Engineering
24	An Improved Extrinsic Calibration Framework for Low-cost Lidar and Camera peng, tao 20 December 2022 (has links) No description available. Electrical Engineering Optics LiDAR Camera Calibration Mobile Robot Sensor Fusion NVIDIA Jetson
25	Construção de mosaico de imagens aéreas em plataformas heterogêneas para aplicações agrícolas / Construction of aerial imagery mosaic on platforms for agricultural applications Candido, Leandro Rosendo 29 March 2019 (has links) A agricultura de precisão tem agregado alto valor para os agricultores por causa das tecnologias que estão ligadas a ela. Sistemas que extraem informações de imagens digitais são extremamente utilizados para que o agricultor tome decisões a fim de aumentar sua produtividade. Uma das técnicas de realizar o monitoramento é a construção de um mosaico de imagens aéreas, onde são utilizadas aeronaves voando em baixa altitude. Esta técnica pode levar dezenas de horas para ser concluída, dependendo da configuração do computador que a executa. Com o intuito de reduzir o tempo nessa construção e tornar possível o embarque a essa aplicação, este trabalho apresenta uma maneira simplificada de construir o mosaico de imagens aéreas baseada na técnica de georreferenciamento direto, no qual utiliza a computação heterogênea para acelerar o desempenho. Essa abordagem é composta por apenas três técnicas que também compõem a abordagem clássica para a construção de mosaicos (warping, extração de características e combinação de características), além de inserir em seus cálculos os dados fornecidos pelos sensores GPS e IMU com a finalidade de direcionar e posicionar cada imagem pertencente ao conjunto que formará o mosaico. A plataforma de computação heterogênea utilizada neste trabalho é a NVIDIA Jetson TK1 escolhida pelo fato de disponibilizar de uma GPU que suporta a linguagem de programação CUDA. Utilizando esta abordagem, a falta de correção da perspectiva do conteúdo (geometria) da imagem gera um resultado inesperado, pois os dados fornecidos pela IMU, ao contrário do que se imagina, apenas servem para corrigir a posição das coordenadas do GPS registradas no momento de captura de cada imagem que compõem o mosaico. O tempo de execução da aplicação desenvolvida é satisfatório tornando possível a adoção desta abordagem. / Accuracy agriculture has added value to farmers thanks to the new technologies that are linked to it. Systems that extract information from digital images are very usefull to help farmers making decisions in order to increase their productivity. One of the techniques to perform this kind of monitoring is the construction of an aerial imagery mosaic where aircrafts flies in low altitude. This technique may take hours to be completed, depending on computer\'s configuration. With the purpose of reducing time in this construction, this thesis presents a simplified way to make aerial imagery mosaic based on direct georeferencing. This approach is composed by three techniques that also make up the classic approach to building mosaics (warping, extraction of characteristics and combination of characteristics), the difference is with this technique here presented is also possible to insert into the calculations the data provided by the GPS and IMU sensors with the purpose of directing and positioning each image to the belonging set to form the mosaic. The heterogeneous computing platform used in this work is the NVIDIA JetsonTK1, this platform was chosen because it offers a GPU that supports the language of CUDA programming. If the images\' geometry errors weren\'t rectfyed, using this approach, an unexpected result happens, because the data provided by IMU, contrary to what is imagined, only serve to correct the position of the GPS coordinates recorded at the moment of capture of each image that composes the mosaic. The developing time in this application is satisfactory making the adoption of this approch favorable. Aerial image mosaic Agricultura de precisão Agriculture of precision Bundle adjustment Bundle adjustment Computação heterogênea CUDA CUDA Direct georeferencing Georreferenciamento direto GPS GPS Heterogeneous computing IMU IMU JetsonTK1 Mosaico de imagens aéreas NVIDIA NVIDIA Jetson TK1 Triangulação Triangulation
26	Normal Mapping för Hårda Ytor : Photoshop och Maya Transfer Maps för Normal Mapping av icke-organiska geometri i datorspel / Normal Mapping for Hard Surfaces : Photoshop and Maya Transfer Maps for Normal Mapping of non-organic geometry in computer games Fors, Martin January 2009 (has links) I mitt examensarbete har jag undersökt om det lämpar sig att använda en manuell metod för att skapa normal maps till icke-organiska polygonmodeller avsedda för datorspel. Jag har använt mig av Photoshop för att måla normal maps som jag sedan applicerar på lågdetaljerade modeller jag skapat, för att höja detaljgraden avsevärt. Då icke-organisk modellering inbegriper modeller som ska representera hårda ytor, och därmed inte animeras med deformation, så antog jag att denna metod skulle lämpa sig väldigt väl åt dessa ytor som ofta har extremt mjuka former och precisa vassare kanter. Min metod har varit att studera litteratur om Normal Mapping och hur man använder Photoshop för detta. Jag har sedan utfört praktiskt arbete för att utvärdera hur effektiv metoden är samt vilka fördelar den bidrar med. Jag går igenom teori för normal mapping som jag stödjer med hjälp av faktatexter och instruktions-DVDer i ämnet för att sedan redovisa metoden jag använt i mitt arbete. Jag avslutar sedan med en diskussion kring mitt resultat och redovisar vad jag kommit fram till genom mina experiment. Jag kommer fram till att Normal Mapping med Photoshop är mycket väl lämpat åt hårda ytor och även bidrar med optimeringar i arbetsflödet både vad gäller organisering, tidsåtgång samt kontroll över resultatet. Ytterligare så ges förslag på förbättringar i pluginets funktionalitet för att öka användarvänligheten. polygon modeling texturing normal map non-organic nvidia photoshop computer games lowpoly low polygon transfer maps polygon modellering texturering normal map icke-organisk non-organic nvidia photoshop datorspel lågpoly lågpolygon transfer maps Aesthetic subjects Estetiska ämnen
27	Normal Mapping för Hårda Ytor : Photoshop och Maya Transfer Maps för Normal Mapping av icke-organiska geometri i datorspel / Normal Mapping for Hard Surfaces : Photoshop and Maya Transfer Maps for Normal Mapping of non-organic geometry in computer games Fors, Martin January 2009 (has links) <p><p>I mitt examensarbete har jag undersökt om det lämpar sig att använda en manuell metod för att skapa normal maps till icke-organiska polygonmodeller avsedda för datorspel. Jag har använt mig av Photoshop för att måla normal maps som jag sedan applicerar på lågdetaljerade modeller jag skapat, för att höja detaljgraden avsevärt.</p><p> </p><p>Då icke-organisk modellering inbegriper modeller som ska representera hårda ytor, och därmed inte animeras med deformation, så antog jag att denna metod skulle lämpa sig väldigt väl åt dessa ytor som ofta har extremt mjuka former och precisa vassare kanter.</p><p> </p><p>Min metod har varit att studera litteratur om Normal Mapping och hur man använder Photoshop för detta. Jag har sedan utfört praktiskt arbete för att utvärdera hur effektiv metoden är samt vilka fördelar den bidrar med. Jag går igenom teori för normal mapping som jag stödjer med hjälp av faktatexter och instruktions-DVDer i ämnet för att sedan redovisa metoden jag använt i mitt arbete. Jag avslutar sedan med en diskussion kring mitt resultat och redovisar vad jag kommit fram till genom mina experiment.</p><p> </p><p>Jag kommer fram till att Normal Mapping med Photoshop är mycket väl lämpat åt hårda ytor och även bidrar med optimeringar i arbetsflödet både vad gäller organisering, tidsåtgång samt kontroll över resultatet. Ytterligare så ges förslag på förbättringar i pluginets funktionalitet för att öka användarvänligheten.</p></p> polygon modeling texturing normal map non-organic nvidia photoshop computer games lowpoly low polygon transfer maps polygon modellering texturering normal map icke-organisk non-organic nvidia photoshop datorspel lågpoly lågpolygon transfer maps Aesthetic subjects Estetiska ämnen
28	Dynamický částicový systém jako účinný nástroj pro statistické vzorkování / A dynamical particle system as a driver for optimal statistical sampling Mašek, Jan Unknown Date (has links) The presented doctoral thesis aims at development a new efficient tool for optimization of uniformity of point samples. One of use-cases of these point sets is the usage as optimized sets of integration points in statistical analyses of computer models using Monte Carlo type integration. It is well known that the pursuit of uniformly distributed sets of integration points is the only possible way of decreasing the error of estimation of an integral over an unknown function. The tasks of the work concern a survey of currently used criteria for evaluation and/or optimization of uniformity of point sets. A critical evaluation of their properties is presented, leading to suggestions towards improvements in spatial and statistical uniformity of resulting samples. A refined variant of the general formulation of the phi optimization criterion has been derived by incorporating the periodically repeated design domain along with a scale-independent behavior of the criterion. Based on a notion of a physical analogy between a set of sampling points and a dynamical system of mutually repelling particles, a hyper-dimensional N-body system has been selected to be the driver of the developed optimization tool. Because the simulation of such a dynamical system is known to be a computationally intensive task, an efficient solution using the massively parallel GPGPU platform Nvidia CUDA has been developed. An intensive study of properties of this complex architecture turned out as necessary to fully exploit the possible solution speedup.
29	Objektdetektering av trafikskyltar på inbyggda system med djupinlärning / Object detection of traffic signs on embedded systems using deep learning Wikström, Pontus, Hotakainen, Johan January 2023 (has links) In recent years, AI has developed significantly and become more popular than ever before. The applications of AI are expanding, making knowledge about its application and the systems it can be applied to more important. This project compares and evaluates deep learning models for object detection of traffic signs on the embedded systems Nvidia Jetson Nano and Raspberry Pi 3 Model B. The project compares and evaluates the models YOLOv5, SSD Mobilenet V1, FOMO, and Efficientdet-lite0. The project evaluates the performance of these models on the aforementioned embedded systems, measuring metrics such as CPU usage, FPS and RAM. Deep learning models are resource-intensive, and embedded systems have limited resources. Embedded systems often have different types of processor architectures than regular computers, which means that some frameworks and libraries may not be compatible. The results show that the tested systems are capable of object detection but with varying performance. Jetson Nano performs at a level we consider sufficiently high for use in production depending on the specific requirements. Raspberry Pi 3 performs at a level that may not be acceptable for real-time recognition of traffic signs. We see the greatest potential for Efficientdet-lite0 and YOLOv5 in recognizing traffic signs. The distance at which the models detect signs seems to be important for how many signs they find. For this reason, SSD MobileNet V1 is not recommended without further trai-ning despite its superior speed. YOLOv5 stood out as the model that detected signs at the longest distance and made the most detections overall. When considering all the results, we believe that Efficientdet-lite0 is the model that performs the best. / Under de senaste åren har AI utvecklats mycket och blivit mer populärt än någonsin. Tillämpningsområdena för AI ökar och därmed blir kunskap om hur det kan tillämpas och på vilka system viktigare. I det här projektet jämförs och utvärderas djupinlärningsmodeller för objektdetektering av trafikskyltar på de inbyggda systemen Nvidia Jetson Nano och Raspberry Pi 3 Model B. Modellerna som jämförs och utvärderas är YOLOv5, SSD Mobilenet V1, FOMO och Efficientdet-lite0. För varje modell mäts blandannat CPU-användning, FPS och RAM. Modeller för djupinlärning är resurskrävande och inbyggda system har begränsat med resurser. Inbyggda system har ofta andra typer av processorarkitekturer än en vanlig dator vilket gör att olika ramverk och andra bibliotek inte är kompatibla. Resultaten visar att de testade systemen klarar av objektdetektering med varierande prestation. Jetson Nano presterar på en nivå vi anser vara tillräckligt hög för användning i produktion beroende på hur hårda krav som ställs. Raspberry Pi 3 presterar på en nivå som möjligtvis inte är acceptabel för igenkänning av trafikskyltar i realtid. Vi ser störst potential för Efficientdet-lite0 och YOLOv5 för igenkänning av trafikskyltar. Hur långt avstånd modellerna upptäcker skyltar på verkar vara viktigt för hur många skyltar de hittar. Av den anledningen är SSD MobileNet V1 inte att rekommendera utan vidare träning trots sin överlägsna hastighet. YOLOv5 utmärkte sig som den som upptäckte skyltar på längst avstånd och som gjorde flest upptäckter totalt. När alla resultat vägs in anser vi dock att Efficientdet-lite0 är den modell som presterar bäst. Deep learning Edge device Machine learning Nvidia Jetson Nano Objectdetection Raspberry Pi 3 Traffic sign recognition Djupinlärning Inbyggda system Maskininlärning Nvidia Jetson Nano Objektdetektering Raspberry Pi 3 Trafikskyltsigenkänning Computer Sciences Datavetenskap (datalogi)
30	Sub-frame synchronisation and motion interpolation for panoramic video stitching / Synkronisering och Interpolering av Videodata för Panoramagenerering Remì, Chierchia January 2022 (has links) This study was carried out in collaboration with Tracab, a brand leader in real-time digital sports data. As a result, the application field is centred on sports analytics. The technology, for instance, consists of multiple cameras that capture a football pitch in a panoramic setup. The alignment of two or more cameras in both a spatial and temporal manner is referred to as sub-frame synchronisation. Because the cameras are already in the same geometric coordinates, only temporal synchronisation will be addressed in this project. The main method for retrieving the desynchronisation information that affects the cameras is based on optical flow. The off-sync cameras' spacial information is then synthesised to the time required by the synchronisation constraint using motion interpolation. In addition, the created system is compared to a real-time intermediate flow interpolation approach. The latter method relies on machine learning techniques, whereas this study focuses on more traditional methods. The metrics Peak Signal-to-Noise Ratio and Structural Similarity Index Measure are used to address the quality criteria required by this subject of study. Furthermore, visually perceived quality is examined to identify differences between measured and perceived quality. The results reveal that in every realistic situation investigated, temporal synchronisation can be addressed by an error measure of less than 1ms. The frame synthesis stage, on the other hand, fails to accurately estimate complicated scenarios, while the machine learning approach stands out. The implemented approach, on the other hand, addresses fast-moving objects with greater precision. Furthermore, the machine learning approach is unable to interpolate intermediate frames in arbitrary time steps, which is critical for the project's application. Finally, considering the lack of real-time computational speed and the quality achieved by machine learning approaches, more research is required in these directions. / Denna studie genomfördes i samarbete med Tracab, en marknadsledare inom digital sportdata levererad i realtid. Studiens applikationsområde kommer där av centreras kring sportdata där två eller flera kameror filmar en fotbollsplan i ett videopanorama. Kamerasynkroniseringen måste ske både spatialt och temporalt. Eftersom kamerorna har samma position kommer endast den temporala synkronisering tas upp i detta projekt. Den övergripande metoden för att göra detta är baserat på optiskt flöde. Data från en ej synkroniserad kamera syntetiseras via en synkroniseringkonstant mha. rörelseinterpolering. Detta jämförs även mot ett tillvägagångssätt som bygger på maskininlärning medan man i denna studie fokuserar på en mer traditionell lösningsmetod. Mätvärdena Peak Signal-to-Noise Ratio och Structural Similarity Index Measure används som kvalitetskriteria. Även visuellt upplevd kvalitet undersöks för att identifiera skillnaden mellan mätt och upplevd kvalitet. Resultatet visar att vid realistiska situationer kan den temporala synkroniseringen beräknas till under 1ms. Den syntetiserade datan lyckas dock inte estimera komplicerade situationer, medan maskininlärningsmetoden presterar bra. Dock så klarar studiens lösningsmetod att bättre generera objekt i snabb rörelse. Vidare så kan inte maskininlärningsmetoden generera video med en godtycklig tidförskjutning, något som är avgörande för projektets tillämpningsområde. Slutligen, med tanke på svårigheter i realtidsberäkning kontra kvaliteten hos maskin- inlärningsmetoder krävs därför mer forskning inom området. Sub-Frame Synchronisation Motion Interpolation Optical Flow Panoramic Stitching Traditional Approach NVIDIA Optical Flow SDK Synkronisering Interpolering Rörelseinterpolering NVIDIA Optical Flow SDK Panoramagenerering Panorama Optiskt Flöde Natural Sciences Naturvetenskap

Search results