1 |
IMPROVING PERFORMANCE AND ENERGY EFFICIENCY FOR THE INTEGRATED CPU-GPU HETEROGENEOUS SYSTEMSWen, Hao 01 January 2018 (has links)
Current heterogeneous CPU-GPU architectures integrate general purpose CPUs and highly thread-level parallelized GPUs (Graphic Processing Units) in the same die. This dissertation focuses on improving the energy efficiency and performance for the heterogeneous CPU-GPU system.
Leakage energy has become an increasingly large fraction of total energy consumption, making it important to reduce leakage energy for improving the overall energy efficiency. Cache occupies a large on-chip area, which are good targets for leakage energy reduction. For the CPU cache, we study how to reduce the cache leakage energy efficiently in a hybrid SPM (Scratch-Pad Memory) and cache architecture. For the GPU cache, the access pattern of GPU cache is different from the CPU, which usually has little locality and high miss rate. In addition, GPU can hide memory latency more effectively due to multi-threading. Because of the above reasons, we find it is possible to place the cache lines of the GPU data caches into the low power mode more aggressively than traditional leakage management for CPU caches, which can reduce more leakage energy without significant performance degradation.
The contention in shared resources between CPU and GPU, such as the last level cache (LLC), interconnection network and DRAM, may degrade both CPU and GPU performance. We propose a simple yet effective method based on probability to control the LLC replacement policy for reducing the CPU’s inter-core conflict misses caused by GPU without significantly impacting GPU performance. In addition, we develop two strategies to combine the probability based method for the LLC and an existing technique called virtual channel partition (VCP) for the interconnection network to further improve the CPU performance.
For a specific graph application of Breadth first search (BFS), which is a basis for graph search and a core building block for many higher-level graph analysis applications, it is a typical example of parallel computation that is inefficient on GPU architectures. In a graph, a small portion of nodes may have a large number of neighbors, which leads to irregular tasks on GPUs. These irregularities limit the parallelism of BFS executing on GPUs. Unlike the previous works focusing on fine-grained task management to address the irregularity, we propose Virtual-BFS (VBFS) to virtually change the graph itself. By adding virtual vertices, the high-degree nodes in the graph are divided into groups that have an equal number of neighbors, which increases the parallelism such that more GPU threads can work concurrently. This approach ensures correctness and can significantly improve both the performance and energy efficiency on GPUs.
|
2 |
An Energy Efficient Data Cache Implementing 2-way LRC ArchitectureMusalappa, Saibhushan 09 December 2006 (has links)
Conventional level one data caches are widely used in high-performance microprocessors. Shrinking process parameters in chip fabrication technology allow a much larger number of devices on a chip with every new generation. This reduction in device size has led to an increase in the magnitude of a type of energy dissipation hitherto ignored?leakage energy. Transistor level leakage energy research for sub-micron processes has shown that leakage can be as much as or greater than the dynamic energy for advanced circuit designs. Researchers have devised techniques to reduce leakage energy at the fabrication and circuit levels. Transitioning the idle circuits from operating voltage to a reduced voltage is one such circuit-level technique. The ELRU-SEQ replacement policy exploits this technique to control cache bank transitions. This thesis proposes a new cache architecture called 2-way Leakage Reduction Cache (LRC) that uses this replacement policy. The architecture employs xor-mapping function to reduce conflict misses.
|
3 |
Diagnosis of Pneumatic Cylinders Using Acoustic Emission Methods / Diagnosis of Pneumatic Cylinders Using Acoustic Emission MethodsMahmoud, Houssam January 2019 (has links)
Tato práce se zabývá vývojem nového efektivního diagnostického postupu pro kontrolu funkce pneumatických válců pomocí metody akustické emise. Cílem práce bylo navrhnout a určit diagnostická kritéria pro hodnocení kvality vybraných typů pneumatických válců. Prvním krokem bylo nalezení typického akustického emisního signálu, který je spojen s určitým typem poškození ve válci využitím frekvenčního spektra signálu. Později byl tento parametr nahrazen parametrem RMS během sledování změn v průběhu testů. Na konkrétních válcích byl sledován vztah mezi akustickou emisí a různými typy defektů a byl představen nový přístup k určování těchto typů vad a jejich odlišením v signálu akustické emise. Druhý krok studie že neporušené a poškozené válce byly porovnávány tak, aby se zjistily výrazné rozdíly, které určují, zda je válec poškozen nebo nepoškozen. Několik nepoškozených válců bylo testováno akustickou emisí a následně v nich byly vytvořeny umělé vady. Signály z vysouvání a zasouvání pístu byly zaznamenány a analyzovány pomocí řady parametrů. Na základě časového zpoždění a normalizace RMS byly rozpoznány odezvy mezi poškozenými a nepoškozenými pneumatickými válci. Rozdíly byly zjištěny porovnáním maximální hodnoty RMS ze snímače upevněného na předním víku válce a snímače upevněného na zadním víku válce pro jeden cyklus. Poškozené a nepoškozené válce byly rozlišeny pomocí rozdílů energetických hodnot přítomných v signálech z obou snímačů v závislosti na zdvihu pístu. Konečné vyhodnocení válce bylo určeno výpočtem celkové hodnoty RMS. Ve třetím kroku experimentu byly válce postupně zatěžovány různými závažími ve svislém směru. Signály akustické emise byly zaznamenány z vysouvání a zasouvání pístu a poté analyzovány. Časové zpoždění se vypočítává z digitálního vstupu a začátku pohybu pístu. Energie signálu a RMS akustické emise porovnávají různé reakce v poškozených a nepoškozených pneumatických válcích s a bez zatížení. Výsledky testu ukázaly lineární vztah mezi křivkou RMS a zatížením. Defekty ovlivňují vztah mezi aplikovaným zatížením a zaznamenaným signálem snímačů.
|
Page generated in 0.0517 seconds