• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 475
  • 88
  • 87
  • 56
  • 43
  • 21
  • 14
  • 14
  • 11
  • 5
  • 5
  • 3
  • 3
  • 3
  • 3
  • Tagged with
  • 989
  • 321
  • 204
  • 184
  • 169
  • 165
  • 154
  • 138
  • 124
  • 104
  • 97
  • 95
  • 93
  • 88
  • 83
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
751

Optimalizace renderování rozsáhlého terénu / Optimization of Large Scale Terrain Rendering

Luner, Radek January 2010 (has links)
This work is focusing on optimization of large scale terrain rendering. It explains basic methods and data structures for optimization. It describes fundamentals of methods such as ROAM, Geometrical clipmaps, GPU Based Geometrical Clipmaps, GeoMipMapping and Chunked LOD. It explains implementation details of system for terrain optimization based on GeoMipMapping method.
752

Hardware Accelerated Digital Image Stabilization in a Video Stream / Hardware Accelerated Digital Image Stabilization in a Video Stream

Pacura, Dávid January 2016 (has links)
Cílem této práce je návrh nové techniky pro stabilizaci obrazu za pomoci hardwarové akcelerace prostřednictvím GPGPU. Využití této techniky umožnuje stabilizaci videosekvencí v reálném čase i pro video ve vysokém rozlišení. Toho je zapotřebí pro ulehčení dalšího zpracování v počítačovém vidění nebo v armádních aplikacích. Z důvodu existence vícerých programovacích modelů pro GPGPU je navrhnutý stabilizační algoritmus implementován ve třech nejpoužívanějších z nich. Jejich výkon a výsledky jsou následně porovnány a diskutovány.
753

Simulations of complex atmospheric flows using GPUs - the model ASAMgpu -: Simulations of complex atmospheric flows using GPUs - the model ASAMgpu -

Horn, Stefan 08 July 2015 (has links)
Die vorliegende Arbeit beschreibt die Entwicklung des hochauflösenden Atmosphärenmodells ASAMgpu. Dabei handelt es sich um ein sogenanntes Grobstrukturmodell bei dem gröbere Strukturen mit typischen Skalen von Deka- bis Kilometern in der atmosphärischen Grenzschicht explizit aufgelöst werden. Hochfrequentere Anteile und deren Dissipation müssen dabei entweder explizit mit einem Turbulenzmodell oder, wie im Falle des beschriebenen Modells, implizit behandelt werden. Dazu wurde der Advektionsoperator mit einem dissipativen Upwind-Verfahren dritter Ordnung diskretisiert. Das Modell beinhaltet ein Zwei-Momenten-Schema zur Beschreibung mikrophysikalischer Prozesse. Ein weiterer wichtiger Aspekt ist die verwendete thermodynamische Variable, die einige Vorteile herkömmlicher Ansätze vereint. Im Falle adiabatischer Prozesse stellt sie eine Erhaltungsgröße dar und die Quellen und Senken im Falle von Phasenumwandlungen sind leicht ableitbar. Außerdem können die benötigten Größen Temperatur und Druck explizit berechnet werden. Das gesamte Modell wurde in C++ implementiert und verwendet OpenGL und die OpenGL Shader Language (GLSL) um die nötigen Berechnungen auf Grafikkarten durchzuführen. Durch diesen Ansatz können genannte Simulationen, für die bisher Supercomputer nötig waren, sehr preisgünstig und energieeffizient durchgeführt werden. Neben der Modellbeschreibung werden die Ergebnisse einiger erfolgreicher Test-Simulationen, darunter drei Fälle mit mariner bewölkter Grenzschicht mit flacher Cumulusbewölkung, vorgestellt.
754

Evaluation of precoding and feedback quantization schemes for multiuser communications systems

Domene Oltra, Fernando 13 February 2015 (has links)
Los sistemas de comunicaciones con múltiples antenas o sistemas MIMO (multiple-input multiple-output) se presentan como una de las tecnologías más prometedoras en el campo de las comunicaciones inalámbricas, ya que permiten aprovechar la dimensión espacial además de las dimensiones de frecuencia y tiempo. De esta forma, se pueden obtener tasas de transmisión más elevadas usando el mismo ancho de banda, que es un recurso escaso, y manteniendo una potencia de transmisión baja, lo cual es crucial para dispositivos alimentados por baterías. Por estas razones, la tecnología MIMO ha sido adoptada en muchos estándares como Long-Term Evolution (LTE), LTE Advanced y Worldwide Interoperability for Microwave Access (WiMAX). Las técnicas MIMO también pueden se pueden emplear en un escenario multiusuario, donde varios usuarios comparten la dimensión espacial provocando una interferencia multiusuario. A través de la precodificación y del uso de múltiples antenas en el transmisor, la señal de los diferentes usuarios puede ser multiplexada espacialmente de forma que se mitigue la interferencia multiusuario incluso con usuarios de una sola antena. Estos sistemas, conocidos como sistemas MU-MISO (multiuser multiple-input single-output), han atraído mucho la atención en los últimos años ya que permiten el desarrollo de terminales pequeños y baratos, manteniendo así el equipamiento más caro en el transmisor. Sin embargo, estos beneficios conllevan un sistema más complejo. Por una parte, el multiplexado espacial requiere una carga de procesado considerable, que depende del tamaño del sistema: número de antenas transmisoras, número de receptores y ancho de banda. Por otra parte, las técnicas MIMO requieren un conocimiento del canal en transmisión o CSIT (channel state information at the transmitter) preciso. En sistemas con duplexación por división en frecuencia o FDD (frequency-division duplex), la información de canal o CSI (channel state information) debe ser estimada en el receptor y proporcionada al transmisor a través del enlace de realimentación, reduciendo así la eficiencia del sistema. Por lo tanto, esta tesis se centra en la mejora de la eficiencia de las implementaciones de precodificación y en el rendimiento de los esquemas de realimentación de canal en sistemas MU-MISO. El problema de la precodificación se aborda en primer lugar. Se ha llevado a cabo un análisis de algunas de las técnicas de precodificación más usadas, prestando especial atención a su rendimiento y a su complejidad. Este análisis revela que aquellas técnicas que hacen uso de lattice reduction (LR) obtienen un mejor rendimiento. Sin embargo, la complejidad computacional de la técnica LR dificulta su implementación en la práctica. El análisis también revela que las técnicas zero-forcing (ZF), Tomlinson-Harashima precoding (THP) y LR-THP son las técnicas más adecuadas para cubrir todo el rango de rendimiento y complejidad computacional. Asimismo, se ha llevado a cabo un análisis de estas técnicas bajo CSIT imperfecto. Dicho análisis ha demostrado que LR es una técnica muy importante también para el caso de CSIT imperfecto. A continuación, se han presentado implementaciones paralelas de técnicas de precodificación sobre unidades de procesamiento gráfico o GPUs (graphic processing unit), comparándose con implementaciones en unidades de procesamiento central o CPU (central processing unit). Dado que las implementaciones de THP y LR-THP han demostrado ser las que mejor se adaptan a la arquitectura de la GPU y ya que tienen muchas operaciones comunes, se ha propuesto una implementación sobre GPU de un esquema THP reconfigurable combinado con LR. La reconfigurabilidad de las GPUs permite desactivar la etapa de LR cuando los requisitos de los usuarios están garantizados por el esquema THP, combinando complejidad computacional con rendimiento. Aunque esta implementación consigue una mejora significativa respecto a la implementación sobre CPU, su paralelismo viene limitado por la naturaleza secuencial del problema LR. Por ello, se han propuesto varias estrategias para la paralelización del problema LR que han sido evaluadas en distintas plataformas: CPU multi-núcleo, GPU y plataforma heterogénea que consiste en CPU+GPU. Los resultados revelan que la arquitectura GPU permite reducir considerablemente el tiempo de computación del problema LR, especialmente en la plataforma heterogénea. La segunda parte de la tesis trata el problema de la realimentación de canal en sistemas FDD. En estos sistemas, los receptores normalmente proporcionan una versión cuantificada del canal a través del canal de realimentación. Con el objetivo de mantener una eficiencia alta, el canal debe ser cuantificado con los mínimos bits posibles. En primer lugar, se explora el uso de la correlación en frecuencia para reducir el volumen de información de realimentación. Se han presentado dos esquemas diferentes basados en cuantificación vectorial o VQ (vector quantization) y en la transformación Karhunen-Loève, respectivamente, y se han comparado con esquemas existentes en términos de rendimiento y complejidad computacional. Los resultados muestran que ambas técnicas son capaces de reducir significativamente el volumen de información de realimentación aprovechando la correlación en frecuencia. Finalmente, la correlación espacial también se aprovecha para reducir la información de realimentación. Se ha presentado una caracterización espacial estadística del modelo de canal SCM (spatial channel model) del 3GPP (3rd Generation Partnership Project) para un entorno de alta correlación. Basado en esta caracterización, se propone un esquema de cuantificación de canal para entornos de alta correlación. Con el objetivo de obtener una caracterización para alta y baja correlación, se considera un modelo de correlación más sencillo como el modelo de Kronecker. Basado en esta caracterización, se proponen dos esquemas de cuantificación y se evalúan con un modelo de canal realista como el SCM. Los resultados muestran que ambos esquemas son capaces de reducir la información de realimentación en ambientes con correlación alta y moderada. / Multiple-input multiple-output (MIMO) communication systems have emerged as one of the most promising technologies in the field of wireless communications, allowing to exploit the spatial dimension as well as the time and frequency dimensions. Thus, higher rates can be obtained by using the same bandwidth, which is a scarce resource, and keeping a low transmit power, which is crucial in battery-operated devices. For these reasons, MIMO technologies have been adopted by many standards such as Long-Term Evolution (LTE), LTE advanced (LTE-A) and Worldwide Interoperability for Microwave Access (WiMAX). MIMO techniques can also be used in a multiuser scenario, where several usersshare the spatial dimension causing multiuser interference. By means of precoding and the use of multiple antennas at the transmitter, the signal of the different users can be spatially multiplexed so that multiuser interference is mitigated even for single-antenna users. These systems, known as multiuser multiple-input singular-output (MU-MISO) systems, have attracted much attention in recent years since they allow the development of small and inexpensive terminals, keeping the most expensive hardware at the transmitter. However, these benefits come at the cost of having a more complex system. On the one hand, spatial multiplexing requires a considerable processing load that depends on the size of the system: number of transmit antennas, number of receivers and bandwidth. On the other hand, MIMO techniques require accurate channel state information at the transmitter (CSIT). In frequency-division duplex (FDD) systems, channel state information (CSI) has to be estimated at the receiver and provided to the transmitter through the feedback link, hence reducing the efficiency of the system. Therefore, this thesis is primarily focused on improving the efficiency of precoding implementations and the performance of feedback schemes in MU-MISO systems. First, the problem of precoding is addressed. An analysis of some of the most utilized precoding techniques is conducted, paying special attention to their performance and computational complexity. The analysis reveals that those techniques that make use of lattice reduction (LR) achieve the best performance. However, the computational complexity of LR makes its implementation difficult for practical systems. The analysis reveals that zero-forcing (ZF), Tomlinson-Harashima precoding (THP) and lattice reduction Tomlinson-Harashima precoding (LR-THP) are the most suitable techniques for covering the entire range of performance and computational complexity. An analysis of these techniques with imperfect CSIT has also been performed. In this analysis, LR has proven to be a key technique also when imperfect CSIT is available. Next, parallel implementations of the precoding techniques on a graphic processing unit (GPU) are presented and compared to implementations that use a central processing unit (CPU). Since the implementations of THP and LR-THP have shown to best fit the GPU architecture and since they also share many operations, a GPU implementation of a reconfigurable THP scheme combined with LR has been proposed. The reconfigurable nature of GPUs allows gating the LR stage off when the user requirements are sufficiently guaranteed by the THP scheme, trading computational cost and performance. Although this implementation achieves a significant speed-up compared to its CPU implementation, its parallelism is limited by the sequential nature of LR. Therefore, several strategies for the parallelization of the LR problem are proposed and evaluated on different platforms: multicore CPU, GPU and a heterogeneous platform consisting of CPU+GPU. Results reveal that a GPU architecture allows a considerable reduction of the computational time of the LR problem, especially in the heterogeneous platform. The second part of this thesis addresses the problem of feedback in FDD systems. In these systems, a quantized version of the channel is usually provided by the receivers through the feedback link. In order to keep a high efficiency, the channel must be quantized using as few bits as possible. First, the use of the frequency correlation to reduce the feedback information is explored. Two different schemes based on vector quantization (VQ) and the Karhunen-Loève (KL) transform, respectively, are presented and compared with existing schemes in terms of performance and complexity. Results show that both techniques are able to significantly reduce the feedback overhead by taking advantage of the frequency correlation. Finally, the spatial correlation is leveraged to reduce the feedback information. A spatial statistical characterization of the spatial channel model (SCM) from the 3rd Generation Partnership Project (3GPP) for a highly correlated environment is presented. Based on this characterization, a channel quantization scheme for highly correlated environments is proposed. In order to obtain a statistical characterization for both high and low correlations, a simpler model such as the Kronecker correlation model is considered. Based on this characterization, two quantization schemes have been presented and evaluated using a realistic channel model such as the SCM. Results show that both schemes are able to reduce the feedback overhead in highly and moderately correlated scenarios. / Domene Oltra, F. (2015). Evaluation of precoding and feedback quantization schemes for multiuser communications systems [Tesis doctoral]. Editorial Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/46971 / Alfresco
755

FUZZING HARD-TO-COVER CODE

Hui Peng (10746420) 06 May 2021 (has links)
<div>Fuzzing is a simple yet effect approach to discover bugs by repeatedly testing the target system using randomly generated inputs. In this thesis, we identify several limitations in state-of-the-art fuzzing techniques: (1) the coverage wall issue , fuzzer-generated inputs cannot bypass complex sanity checks in the target programs and are unable to cover code paths protected by such checks; (2) inability to adapt to interfaces to inject fuzzer-generated inputs, one important example of such interface is the software/hardware interface between drivers and their devices; (3) dependency on code coverage feedback, this dependency makes it hard to apply fuzzing to targets where code coverage collection is challenging (due to proprietary components or special software design).</div><div><br></div><div><div>To address the coverage wall issue, we propose T-Fuzz, a novel approach to overcome the issue from a different angle: by removing sanity checks in the target program. T-Fuzz leverages a coverage-guided fuzzer to generate inputs. Whenever the coverage wall is reached, a light-weight, dynamic tracing based technique detects the input checks that the fuzzer-generated inputs fail. These checks are then removed from the target program. Fuzzing then continues on the transformed program, allowing the code protected by the removed checks to be triggered and potential bugs discovered. Fuzzing transformed programs to find bugs poses two challenges: (1) removal of checks leads to over-approximation and false positives, and (2) even for true bugs, the crashing input on the transformed program may not trigger the bug in the original program. As an auxiliary post-processing step, T-Fuzz leverages a symbolic execution-based approach to filter out false positives and reproduce true bugs in the original program.</div></div><div><br></div><div><div>By transforming the program as well as mutating the input, T-Fuzz covers more code and finds more true bugs than any existing technique. We have evaluated T-Fuzz on the DARPA Cyber Grand Challenge dataset, LAVA-M dataset and 4 real-world programs (pngfix, tiffinfo, magick and pdftohtml). For the CGC dataset, T-Fuzz finds bugs in 166 binaries, Driller in 121, and AFL in 105. In addition, we found 4 new bugs in previously-fuzzed programs and libraries.</div></div><div><br></div><div><div>To address the inability to adapt to inferfaces, we propose USBFuzz. We target the USB interface, fuzzing the software/hardware barrier. USBFuzz uses device emulation</div><div>to inject fuzzer-generated input to drivers under test, and applies coverage-guided fuzzing to device drivers if code coverage collection is supported from the kernel. In its core, USBFuzz emulates an special USB device that provides data to the device driver (when it performs IO operations). This allows us to fuzz the input space of drivers from the device’s perspective, an angle that is difficult to achieve with real hardware. USBFuzz discovered 53 bugs in Linux (out of which 37 are new, and 36 are memory bugs of high security impact, potentially allowing arbitrary read or write in the kernel address space), one bug in FreeBSD, four bugs (resulting in Blue Screens of Death) in Windows and three bugs (two causing an unplanned restart, one freezing the system) in MacOS.</div></div><div><br></div><div><div>To break the dependency on code coverage feedback, we propose WebGLFuzzer. To fuzz the WebGL interface (a set of JavaScript APIs in browsers allowing high performance graphics rendering taking advantage of GPU acceleration on the device), where code coverage collection is challenging, we introduce WebGLFuzzer, which internally uses a log guided fuzzing technique. WebGLFuzzer is not dependent on code coverage feedback, but instead, makes use of the log messages emitted by browsers to guide its input mutation. Compared with coverage guided fuzzing, our log guided fuzzing technique is able to perform more meaningful mutation under the guidance of the log message. To this end, WebGLFuzzer uses static analysis to identify which argument to mutate or which API call to insert to the current program to fix the internal WebGL program state given a log message emitted by the browser. WebGLFuzzer is under evaluation and so far, it has found 6 bugs, one of which is able to freeze the X-Server.</div></div>
756

TOWARDS TRUSTWORTHY ON-DEVICE COMPUTATION

Heejin Park (12224933) 20 April 2022 (has links)
<div>Driven by breakthroughs in mobile and IoT devices, on-device computation becomes promising. Meanwhile, there is a growing concern over its security: it faces many threats</div><div>in the wild, while not supervised by security experts; the computation is highly likely to touch users’ privacy-sensitive information. Towards trustworthy on-device computation, we present novel system designs focusing on two key applications: stream analytics, and machine learning training and inference.</div><div><br></div><div>First, we introduce Streambox-TZ (SBT), a secure stream analytics engine for ARM-based edge platforms. SBT contributes a data plane that isolates only analytics’ data and</div><div>computation in a trusted execution environment (TEE). By design, SBT achieves a minimal trusted computing base (TCB) inside TEE, incurring modest security overhead.</div><div><br></div><div>Second, we design a minimal GPU software stack (50KB), called GPURip. GPURip allows developers to record GPU computation ahead of time, which will be replayed later</div><div>on client devices. In doing so, GPURip excludes the original GPU stack from run time eliminating its wide attack surface and exploitable vulnerabilities.</div><div><br></div><div>Finally, we propose CoDry, a novel approach for TEE to record GPU computation remotely. CoDry provides an online GPU recording in a safe and practical way; it hosts GPU stacks in the cloud that collaboratively perform a dryrun with client GPU models. To overcome frequent interactions over a wireless connection, CoDry implements a suite of key optimizations.</div>
757

MIMOPack: A High Performance Computing Library for MIMO Communication Systems

Ramiro Sánchez, Carla 30 July 2015 (has links)
[EN] Nowadays, several communication standards are emerging and evolving, searching higher transmission rates, reliability and coverage. This expansion is primarily driven by the continued increase in consumption of mobile multimedia services due to the emergence of new handheld devices such as smartphones and tablets. One of the most significant techniques employed to meet these demands is the use of multiple transmit and receive antennas, known as MIMO systems. The use of this technology allows to increase the transmission rate and the quality of the transmission through the use of multiple antennas at the transmitter and receiver sides. MIMO technologies have become an essential key in several wireless standards such as WLAN, WiMAX and LTE. These technologies will be incorporated also in future standards, therefore is expected in the coming years a great deal of research in this field. Clearly, the study of MIMO systems is critical in the current investigation, however the problems that arise from this technology are very complex. High Performance Computing (HPC) systems, and specifically, modern hardware architectures as multi-core and many-cores (e.g Graphics Processing Units (GPU)) are playing a key role in the development of efficient and low-complexity algorithms for MIMO transmissions. Proof of this is that the number of scientific contributions and research projects related to its use has increased in the last years. Also, some high performance libraries have been implemented as tools for researchers involved in the development of future communication standards. Two of the most popular libraries are: IT++ that is a library based on the use of some optimized libraries for multi-core processors and the Communications System Toolbox designed for use with MATLAB, which uses GPU computing. However, there is not a library able to run on a heterogeneous platform using all the available resources. In view of the high computational requirements in MIMO application research and the shortage of tools able to satisfy them, we have made a special effort to develop a library to ease the development of adaptable parallel applications in accordance with the different architectures of the executing platform. The library, called MIMOPack, aims to implement efficiently using parallel computing, a set of functions to perform some of the critical stages of MIMO communication systems simulation. The main contribution of the thesis is the implementation of efficient Hard and Soft output detectors, since the detection stage is considered the most complex part of the communication process. These detectors are highly configurable and many of them include preprocessing techniques that reduce the computational cost and increase the performance. The proposed library shows three important features: portability, efficiency and easy of use. Current realease allows GPUs and multi-core computation, or even simultaneously, since it is designed to use on heterogeneous machines. The interface of the functions are common to all environments in order to simplify the use of the library. Moreover, some of the functions are callable from MATLAB increasing the portability of developed codes between different computing environments. According to the library design and the performance assessment, we consider that MIMOPack may facilitate industrial and academic researchers the implementation of scientific codes without having to know different programming languages and machine architectures. This will allow to include more complex algorithms in their simulations and obtain their results faster. This is particularly important in the industry, since the manufacturers work to analyze and to propose their own technologies with the aim that it will be approved as a standard. Thus allowing to enforce their intellectual property rights over their competitors, who should obtain the corresponding licenses to include these technologies into their products. / [ES] En la actualidad varios estándares de comunicación están surgiendo buscando velocidades de transmisión más altas y mayor fiabilidad. Esta expansión está impulsada por el aumento en el consumo de servicios multimedia debido a la aparición de nuevos dispositivos como los smartphones y las tabletas. Una de las técnicas empleadas más importantes es el uso de múltiples antenas de transmisión y recepción, conocida como sistemas MIMO, que permite aumentar la velocidad y la calidad de la transmisión. Las tecnologías MIMO se han convertido en una parte esencial en diferentes estándares tales como WLAN, WiMAX y LTE. Estas tecnologías se incorporarán también en futuros estándares, por lo tanto, se espera en los próximos años una gran cantidad de investigación en este campo. Está claro que el estudio de los sistemas MIMO es crítico en la investigación actual, sin embargo los problemas que surgen de esta tecnología son muy complejos. La sistemas de computación de alto rendimiento, y en concreto, las arquitecturas hardware actuales como multi-core y many-core (p. ej. GPUs) están jugando un papel clave en el desarrollo de algoritmos eficientes y de baja complejidad en las transmisiones MIMO. Prueba de ello es que el número de contribuciones científicas y proyectos de investigación relacionados con su uso se han incrementado en el últimos años. Algunas librerías de alto rendimiento se están utilizando como herramientas por investigadores en el desarrollo de futuros estándares. Dos de las librerías más destacadas son: IT++ que se basa en el uso de distintas librerías optimizadas para procesadores multi-core y el paquete Communications System Toolbox diseñada para su uso con MATLAB, que utiliza computación con GPU. Sin embargo, no hay una biblioteca capaz de ejecutarse en una plataforma heterogénea. En vista de los altos requisitos computacionales en la investigación MIMO y la escasez de herramientas capaces de satisfacerlos, hemos implementado una librería que facilita el desarrollo de aplicaciones paralelas adaptables de acuerdo con las diferentes arquitecturas de la plataforma de ejecución. La librería, llamada MIMOPack, implementa de manera eficiente un conjunto de funciones para llevar a cabo algunas de las etapas críticas en la simulación de un sistema de comunicación MIMO. La principal aportación de la tesis es la implementación de detectores eficientes de salida Hard y Soft, ya que la etapa de detección es considerada la parte más compleja en el proceso de comunicación. Estos detectores son altamente configurables y muchos de ellos incluyen técnicas de preprocesamiento que reducen el coste computacional y aumentan el rendimiento. La librería propuesta tiene tres características importantes: la portabilidad, la eficiencia y facilidad de uso. La versión actual permite computación en GPU y multi-core, incluso simultáneamente, ya que está diseñada para ser utilizada sobre plataformas heterogéneas que explotan toda la capacidad computacional. Para facilitar el uso de la biblioteca, las interfaces de las funciones son comunes para todas las arquitecturas. Algunas de las funciones se pueden llamar desde MATLAB aumentando la portabilidad de códigos desarrollados entre los diferentes entornos. De acuerdo con el diseño de la biblioteca y la evaluación del rendimiento, consideramos que MIMOPack puede facilitar la implementación de códigos sin tener que saber programar con diferentes lenguajes y arquitecturas. MIMOPack permitirá incluir algoritmos más complejos en las simulaciones y obtener los resultados más rápidamente. Esto es particularmente importante en la industria, ya que los fabricantes trabajan para proponer sus propias tecnologías lo antes posible con el objetivo de que sean aprobadas como un estándar. De este modo, los fabricantes pueden hacer valer sus derechos de propiedad intelectual frente a sus competidores, quienes luego deben obtener las correspon / [CA] En l'actualitat diversos estàndards de comunicació estan sorgint i evolucionant cercant velocitats de transmissió més altes i major fiabilitat. Aquesta expansió, està impulsada pel continu augment en el consum de serveis multimèdia a causa de l'aparició de nous dispositius portàtils com els smartphones i les tablets. Una de les tècniques més importants és l'ús de múltiples antenes de transmissió i recepció (MIMO) que permet augmentar la velocitat de transmissió i la qualitat de transmissió. Les tecnologies MIMO s'han convertit en una part essencial en diferents estàndards inalàmbrics, tals com WLAN, WiMAX i LTE. Aquestes tecnologies s'incorporaran també en futurs estàndards, per tant, s'espera en els pròxims anys una gran quantitat d'investigació en aquest camp. L'estudi dels sistemes MIMO és crític en la recerca actual, no obstant açó, els problemes que sorgeixen d'aquesta tecnologia són molt complexos. Els sistemes de computació d'alt rendiment com els multi-core i many-core (p. ej. GPUs)), estan jugant un paper clau en el desenvolupament d'algoritmes eficients i de baixa complexitat en les transmissions MIMO. Prova d'açò és que el nombre de contribucions científiques i projectes d'investigació relacionats amb el seu ús s'han incrementat en els últims anys. Algunes llibreries d'alt rendiment estan utilitzant-se com a eines per investigadors involucrats en el desenvolupament de futurs estàndards. Dos de les llibreries més destacades són: IT++ que és una llibreria basada en lús de diferents llibreries optimitzades per a processadors multi-core i el paquet Communications System Toolbox dissenyat per al seu ús amb MATLAB, que utilitza computació amb GPU. No obstant açò, no hi ha una biblioteca capaç d'executar-se en una plataforma heterogènia. Degut als alts requisits computacionals en la investigació MIMO i l'escacès d'eines capaces de satisfer-los, hem implementat una llibreria que facilita el desenvolupament d'aplicacions paral·leles adaptables d'acord amb les diferentes arquitectures de la plataforma d'ejecució. La llibreria, anomenada MIMOPack, implementa de manera eficient, un conjunt de funcions per dur a terme algunes de les etapes crítiques en la simulació d'un sistema de comunicació MIMO. La principal aportació de la tesi és la implementació de detectors eficients d'exida Hard i Soft, ja que l'etapa de detecció és considerada la part més complexa en el procés de comunicació. Estos detectors són altament configurables i molts d'ells inclouen tècniques de preprocessament que redueixen el cost computacional i augmenten el rendiment. La llibreria proposta té tres característiques importants: la portabilitat, l'eficiència i la facilitat d'ús. La versió actual permet computació en GPU i multi-core, fins i tot simultàniament, ja que està dissenyada per a ser utilitzada sobre plataformes heterogènies que exploten tota la capacitat computacional. Amb el fi de simplificar l'ús de la biblioteca, les interfaces de les funcions són comunes per a totes les arquitectures. Algunes de les funcions poden ser utilitzades des de MATLAB augmentant la portabilitat de còdics desenvolupats entre els diferentes entorns. D'acord amb el disseny de la biblioteca i l'evaluació del rendiment, considerem que MIMOPack pot facilitar la implementació de còdics a investigadors sense haver de saber programar amb diferents llenguatges i arquitectures. MIMOPack permetrà incloure algoritmes més complexos en les seues simulacions i obtindre els seus resultats més ràpid. Açò és particularment important en la industria, ja que els fabricants treballen per a proposar les seues pròpies tecnologies el més prompte possible amb l'objectiu que siguen aprovades com un estàndard. D'aquesta menera, els fabricants podran fer valdre els seus drets de propietat intel·lectual enfront dels seus competidors, els qui després han d'obtenir les corresponents llicències si vole / Ramiro Sánchez, C. (2015). MIMOPack: A High Performance Computing Library for MIMO Communication Systems [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/53930 / TESIS / Premios Extraordinarios de tesis doctorales
758

Interpolace obrazových bodů / Pixel Interpolation Methods

Mintěl, Tomáš January 2009 (has links)
This master's thesis deals with acceleration of pixel interpolation methods using the GPU and NVIDIA (R) CUDA TM architecture. Graphic output is represented by a demonstrational application for geometrical image transforms using chosen interpolation method. Time critical parts of the code are moved on the GPU and executed in parallel. There are used highly optimized routines from the OpenCV library, made by the Intel company for an image and video processing.
759

WaldBoost na GPU / WaldBoost on GPU

Polok, Lukáš January 2009 (has links)
Image recognition and machine vision in general is quickly evolving field, due boom of cheap and powerful computation technologies. Image recognition has many different applications in wide spectrum of industries, ranging from communications trough security to entertainment. Algorithms for image recognition are still evolving and are often quite computationaly demanding. That is why some of authors deal with implementing the algorithms on specialized hardware accelerators. This work describes implementation of image recognition using the WaldBoost algorithm on the graphic accelerator (GPU) platform.
760

Spatial prestandaprofilering i spel : Lokalisering av prestandaproblem i spelnivåer / Spatial performance profiling in games : Localisation of performance problems in game levels

Chanane, Karim January 2022 (has links)
Profilering är ett underutforskat område inom spelutveckling trots de höga prestandakraven och därmed optimeringsbehov i moderna spel. Detta arbete ämnar underlätta profileringsarbete genom att spatialt visualisera profileringsdata i form av värmekartor och dessutom visualisera GPU- och CPU-bundenhet. Målet med detta arbete var att avancera profileringsområdet inom spelutveckling, att uppmana vidareutveckling av profileringsverktyg för att dra ner på kostnader och tid som i ställetkan spenderas på implementering av ny funktionalitet. Projektet har bidragit till området automatiserad profilering, genom att ta fram en metod för att underlätta tolkningsaspekten av profileringsarbetet och kan därmed bidra till att göra profilering mer tillgängligt för utvecklare som saknar djupgående kunskap kring mjuk- och hårdvara. / <p>Det finns övrigt digitalt material (t.ex. film-, bild- eller ljudfiler) eller modeller/artefakter tillhörande examensarbetet som ska skickas till arkivet.</p><p>There are other digital material (eg film, image or audio files) or models/artifacts that belongs to the thesis and need to be archived.</p>

Page generated in 0.3319 seconds