• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 84
  • 72
  • 21
  • 6
  • Tagged with
  • 182
  • 112
  • 77
  • 77
  • 77
  • 56
  • 44
  • 23
  • 22
  • 21
  • 21
  • 21
  • 20
  • 17
  • 17
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
81

Task Pool Teams for Implementing Irregular Algorithms on Clusters of SMPs

Hippold, Judith, Rünger, Gudula 06 April 2006 (has links) (PDF)
The characteristics of irregular algorithms make a parallel implementation difficult, especially for PC clusters or clusters of SMPs. These characteristics may include an unpredictable access behavior to dynamically changing data structures or strong irregular coupling of computations. Problems are an unknown load distribution and expensive irregular communication patterns for data accesses and redistributions. Thus the parallel implementation of irregular algorithms on distributed memory machines and clusters requires a special organizational mechanism for a dynamic load balance while keeping the communication and administration overhead low. We propose task pool teams for implementing irregular algorithms on clusters of PCs or SMPs. A task pool team combines multithreaded programming using task pools on single nodes with explicit message passing between different nodes. The dynamic load balance mechanism of task pools is generalized to a dynamic load balance scheme for all distributed nodes. We have implemented and compared several versions for task pool teams. As application example, we use the hierarchical radiosity algorithm, which is based on dynamically growing quadtree data structures annotated by varying interaction lists expressing the irregular coupling between the quadtrees. Experiments are performed on a PC cluster and a cluster of SMPs.
82

Architectures and Theoretical Models for Shared Scratchpad Memory Systems

Wittig, Robert Klaus 10 November 2021 (has links)
Computer engineering is advancing rapidly. For 55 years, the performance of integrated circuits has almost doubled every 18 months. Mostly, these advancements were enabled by technological progress. Even the end of frequency scaling could not bring the ever-increasing performance growth to a halt. However, technology burdens, like noticeable leakage currents, have piled up, which shifts the focus towards architectural improvements. Especially the multi-core paradigm has proven its virtue for chip designs over the last decade. While having been introduced in high-performance computing areas, modern technology nodes also enable low-cost, low-power embedded designs to benefi t from multiple cores and accelerators. Since the majority of cores depend on memory, which requires a considerable amount of chip area, this common resource needs to be shared effi ciently. High-performance cores use shared caches to increase memory utilization. However, many accelerators do not use caches as they need predictable and fast scratchpad memory (SM). But sharing SM entails confl icts, questioning its fast and predictable nature. Hence, the question arises on how to adapt architectures for sharing while retaining SM’s advantages. This thesis presents a novel, shared SM architecture that embraces the idea of a minimal logic path between core and memory, thereby increasing the maximum operating frequency. Because of its additional capabilities, like dynamic address translation and programmable priorities, it is also well suited for heterogeneous platforms that use dynamic scheduling and require predictable behavior. Demonstrating its advantages, we analyze the characteristics of the new architecture and compare it to state-of-the-art approaches. To further mitigate confl icts, we present the conception of access interval prediction (AIP). By predicting memory accesses with a granularity of a single clock cycle, AIP guides the allocation of resources. This method maximizes memory utilization while reducing confl ict delays. With the help of various methods inspired by branch prediction, we achieve over 90 % of accurate predictions and reduce stall cycles signifi cantly. Another key contribution of this thesis is the extension of analytic models to estimate the throughput of shared SM systems. Again, the focus lies on heterogeneous systems with different priorities and access patterns. The results show a promising error reduction, boosting the used models applicability for real design use cases.
83

Analyse und Erweiterung des Paradyn Performance Tools

Arndt, Michael 12 May 2006 (has links)
Das kostenfrei erhältliche Performanz Analyse Werkzeug Paradyn wird im Hinblick auf die Tauglichkeit zur Performanzanalyse quantenmechanischer Anwendungen (konkret Abinit) untersucht. Zusätzlich wird Paradyn so erweitert, dass eine Analyse mittels vorhandener Hardwarecounter möglich ist. Da Paradyn plattformunabhängig ist werden Performance Counter Bibliotheken wie PCL oder PAPI verwendet.
84

Analyzing Real-Time Behavior of Flash Memories

Parthey, Daniel 02 April 2007 (has links)
Flash memories are used as the main storage in many portable consumer electronic devices because they are more robust than hard drives. This document gives an overview of existing consumer flash memory technologies which are mostly removable flash memory cards. It discusses to which degree consumer flash devices are suitable for real-time systems and provides a detailed timing analysis of some consumer flash devices. Further, it describes methods to analyze mount times, access performance and timing predictability of flash memories. Important factors which influence access timings of flash memories are pointed out and different flash file systems are evaluated with regard to their suitability for real-time systems. Some remaining problems of existing flash file system implementations concerning real-time use are discussed.
85

Material development of doped hafnium oxide for non-volatile ferroelectric memory application

Lederer, Maximilian 16 June 2022 (has links)
Seit der Entdeckung von Ferroelektrizität in Hafniumoxid stellt es aufgrund seiner Prozesskompatibilität im Bereich der Mikroelektronik sowie seiner besonderen Eigenschaften ein wachsendes Forschungsfeld dar. Im Speziellen wird die Anwendung in nicht-flüchtigen Speichern, in neuromorphen Bauelementen sowie in piezo-/pyroelektrischen Sensoren untersucht. Jedoch ist das Verhalten von ferroelektrischem Hafniumoxid im Vergleich zu Ferroelektrika mit Perovskit-Struktur nicht im Detail verstanden. Zudem spielen Prozesseinflüsse während und nach der Abscheidung eine entscheidende Rolle für die Materialeigenschaften aufgrund der metastabilen Natur der ferroektrischen Phase in diesem Materialsystem. In dieser Arbeit werden die grundlegenden physikalischen Eigenschaften von Hafniumoxid, Prozesseinflüsse auf die Mikrostruktur und Zuverlässigkeitsaspekte von nicht-flüchtigen sowie neuromorphen Bauelementen untersucht. Im Bezug auf die physikalischen Eigenschaften zeigen sich hier deutliche Belege für ferroelastische 90° Domänenwandbewegungen in Hafniumoxid-basierten Dünnschichten, welche in einem ähnlichen Verhalten wie ein Antiferroelektrikum resultieren. Weiterhin wird über die Entdeckung von einer mittels elektrischem Feld induzierten Kristallisation in diesem Materialsystem berichtet. Für die Charakterisierung der Mikrostruktur wird als neue Methode Transmissions-Kikuchi-Diffraktion eingeführt, welche eine detaillierte Untersuchung der lokalen kristallographischen Phase, Orientierung und Gefügestruktur ermöglicht. Hierbei zeigen sich deutliche Vorzugsorientierungen in Abhängigkeit des Substrates, der Dotierstoffkonzentration sowie der Glühtemperatur. Auf Basis dieser Ergebnisse lassen sich die beobachteten Zuverlässigkeitsverhalten in Bauelementen erklären und mittels Defektkontrolle weiter optimieren. Schließlich wird das Verhalten in neuromorphen Bauelementen untersucht und Leitlinien für Prozess- und Bauelementoptimierung gegeben.:Abstract i Abstract ii List of Figures vi List of Tables x Acronyms xi Symbols xiv 1 Introduction 1 2 Theoretical background 3 2.1 Behavior of ferroelectric materials 3 2.1.1 Phase transitions at the Curie temperature 4 2.1.2 Domains, domain walls, and microstructure 5 2.2 Ferroelectricity in HfO2 6 2.2.1 Thermodynamics and kinetics 8 2.2.2 Antiferroelectric-like behavior, wake-up effect, and fatigue 11 2.2.3 Piezo- and pyroelectric effects 13 2.3 Ferroelectric FETs 13 2.3.1 Endurance, retention and variability 14 2.3.2 Neuromorphic devices 15 3 Methodology 17 3.1 Electrical analysis 17 3.1.1 Capacitors 17 3.1.2 FeFETs 19 3.2 Structural and chemical analysis 20 3.2.1 Grazing-incident X-ray diffraction (GIXRD) 20 3.2.2 Transmission electron microscopy (TEM) 20 3.2.3 Time-of-flight secondary ion mass spectrometry (ToF-SIMS) 21 3.3 Transmission Kikuchi diffraction 21 3.4 Sample preparation 23 4 The physics of ferroelectric HfO2 25 4.1 Ferroelastic switching 25 4.2 Electric field-induced crystallization 30 5 Microstructure engineering 33 5.1 Microstructure and ferroelectric domains in HfO2 33 5.2 Doping influences 34 5.2.1 Zr doping (similar ionic radius) 35 5.2.2 Si doping (smaller ionic radius) 43 5.2.3 La doping (larger ionic radius) 50 5.2.4 Co-doping 50 5.3 Annealing influences 53 5.4 Interlayer influences 58 5.5 Interface layer influences 62 5.5.1 Structural differences in the HfO2 layer 63 5.5.2 Interactions of the interface and HfO2 layer 67 5.5.3 Substrate-driven changes in the Si-doping profile 73 5.6 Phenomenological wake-up behaviors and process guidelines 77 6 HfO2-based ferroelectric FETs 81 6.1 Endurance, retention and variability 81 6.1.1 Analytic model of HfO2-based FeFETs 84 6.1.2 Endurance improvements by interface fluorination 94 6.2 Neuromorphic devices and circuits 98 6.2.1 Current peroclation paths in FeFETs 100 6.2.2 Material and stack influences on synaptic devices 105 6.2.3 Reliability aspects of synaptic devices 106 7 Conclusion and outlook 109 Appendix 142 Density-functional-theory calculations 142 Supplementary Figures 143 Publications 145 Acknowledgment 156 Declaration 158 / The discovery of ferroelectricity in hafnium oxide spurred a growing research field due to hafnium oxides compatibility with processes in microelectronics as well as its unique properties. Notably, its application in non-volatile memories, neuromorphic devices as well as piezo- and pyroelectric sensors is investigated. However, the behavior of ferroelectric hafnium oxide is not understood into depth compared to common perovskite structure ferroelectrics. Due the the metastable nature of the ferroelectric phase, process conditions have a strong influence during and after its deposition. In this work, the physical properties of hafnium oxide, process influences on the microstructure as well as reliability aspects in non-volatile and neuromorphic devices are investigated. With respect to the physical properties, strong evidence is provided that the antiferroelectric-like behavior in hafnium oxide based thin films is governed by ferroelastic 90° domain wall movement. Furthermore, the discovery of an electric field-induced crystallization process in this material system is reported. For the analysis of the microstructure, the novel method of transmission Kikuchi diffraction is introduced, allowing an investigation of the local crystallographic phase, orientation and grain structure. Here, strong crystallographic textures are observed in dependence of the substrate, doping concentration and annealing temperature. Based on these results, the observed reliability behavior in the electronic devices is explainable and engineering of the present defect landscape enables further optimization. Finally, the behavior in neuromorphic devices is explored as well as process and design guidelines for the desired behavior are provided.:Abstract i Abstract ii List of Figures vi List of Tables x Acronyms xi Symbols xiv 1 Introduction 1 2 Theoretical background 3 2.1 Behavior of ferroelectric materials 3 2.1.1 Phase transitions at the Curie temperature 4 2.1.2 Domains, domain walls, and microstructure 5 2.2 Ferroelectricity in HfO2 6 2.2.1 Thermodynamics and kinetics 8 2.2.2 Antiferroelectric-like behavior, wake-up effect, and fatigue 11 2.2.3 Piezo- and pyroelectric effects 13 2.3 Ferroelectric FETs 13 2.3.1 Endurance, retention and variability 14 2.3.2 Neuromorphic devices 15 3 Methodology 17 3.1 Electrical analysis 17 3.1.1 Capacitors 17 3.1.2 FeFETs 19 3.2 Structural and chemical analysis 20 3.2.1 Grazing-incident X-ray diffraction (GIXRD) 20 3.2.2 Transmission electron microscopy (TEM) 20 3.2.3 Time-of-flight secondary ion mass spectrometry (ToF-SIMS) 21 3.3 Transmission Kikuchi diffraction 21 3.4 Sample preparation 23 4 The physics of ferroelectric HfO2 25 4.1 Ferroelastic switching 25 4.2 Electric field-induced crystallization 30 5 Microstructure engineering 33 5.1 Microstructure and ferroelectric domains in HfO2 33 5.2 Doping influences 34 5.2.1 Zr doping (similar ionic radius) 35 5.2.2 Si doping (smaller ionic radius) 43 5.2.3 La doping (larger ionic radius) 50 5.2.4 Co-doping 50 5.3 Annealing influences 53 5.4 Interlayer influences 58 5.5 Interface layer influences 62 5.5.1 Structural differences in the HfO2 layer 63 5.5.2 Interactions of the interface and HfO2 layer 67 5.5.3 Substrate-driven changes in the Si-doping profile 73 5.6 Phenomenological wake-up behaviors and process guidelines 77 6 HfO2-based ferroelectric FETs 81 6.1 Endurance, retention and variability 81 6.1.1 Analytic model of HfO2-based FeFETs 84 6.1.2 Endurance improvements by interface fluorination 94 6.2 Neuromorphic devices and circuits 98 6.2.1 Current peroclation paths in FeFETs 100 6.2.2 Material and stack influences on synaptic devices 105 6.2.3 Reliability aspects of synaptic devices 106 7 Conclusion and outlook 109 Appendix 142 Density-functional-theory calculations 142 Supplementary Figures 143 Publications 145 Acknowledgment 156 Declaration 158
86

Rylene Bisimide-Diarylethene Photochromic Systems for Non-Destructive Memory Read-out / Photochrome Rylenbisimid-Diarylethen-Systeme für Nichtdestruktives Datenspeicherauslesen

Berberich, Martin January 2012 (has links) (PDF)
Diese Doktorarbeit zeigt deutlich verbesserte aus Rylenbisimiden und Diarylethenen aufgebaute, photochrome Systeme für das nicht-destruktive Auslesen von Fluoreszenz. Dabei wird die Fluoreszenz der Emittereinheit durch photoinduzierten Elektronentransfer nur zu einer isomeren Form des Photochromes gelöscht. Die Triebkraft für den Fluoreszenz-löschenden Elektronentransfer wurde mittels Rehm-Weller-Gleichung berechnet. Die erhaltenen Systeme erfüllen die notwendigen Anforderungen für ein nicht-destruktives Auslesen in einem auf Schreiben, Auslesen und Löschen basierenden fluoreszierenden Datenspeicher. / The thesis enhances the strategy of non-destructive fluorescence read-out in rylene bisimide-diarylethene containing photochromic systems. The fluorescence of the emitter unit is quenched by a photoinduced electron transfer only to one of the isomeric forms of the photochrome. The driving force of the fuorescence-quenching electron transfer was calculated by the help of the Rehm-Weller equation. The novel photochromic systems satisfy the necessary requirements for non-destructive read-out in write/read/erase fluorescent memory devices.
87

Insights into Texture and Phase Coexistence in Polycrystalline and Polyphasic Ferroelectric HfO2 Thin Films using 4D-STEM

Grimley, Everett D., Frisone, Sam, Schenk, Tony, Park, Min Hyuk, Mikolajick, Thomas, Fancher, Chris M., Jones, Jacob L., Schroeder, Uwe, LeBeau, James M. 11 April 2022 (has links)
An abstract is not available for this content.
88

Effiziente parallele Sortier- und Datenumverteilungsverfahren für Partikelsimulationen auf Parallelrechnern mit verteiltem Speicher / Efficient Parallel Sorting and Data Redistribution Methods for Particle Codes on Distributed Memory Systems

Hofmann, Michael 16 April 2012 (has links) (PDF)
Partikelsimulationen repräsentieren eine Klasse von daten- und rechenintensiven Simulationsanwendungen, die in unterschiedlichen Bereichen der Wissenschaft und der industriellen Forschung zum Einsatz kommen. Der hohe Berechnungsaufwand der eingesetzten Lösungsmethoden und die großen Datenmengen, die zur Modellierung realistischer Probleme benötigt werden, machen die Nutzung paralleler Rechentechnik hierfür unverzichtbar. Parallelrechner mit verteiltem Speicher stellen dabei eine weit verbreitete Architektur dar, bei der eine Vielzahl an parallel arbeitenden Rechenknoten über ein Verbindungsnetzwerk miteinander Daten austauschen können. Die Berechnung von Wechselwirkungen zwischen Partikeln stellt oft den Hauptaufwand einer Partikelsimulation dar und wird mit Hilfe schneller Lösungsmethoden, wie dem Barnes-Hut-Algorithmus oder der Schnellen Multipolmethode, durchgeführt. Effiziente parallele Implementierungen dieser Algorithmen benötigen dabei eine Sortierung der Partikel nach ihren räumlichen Positionen. Die Sortierung ist sowohl notwendig, um einen effizienten Zugriff auf die Partikeldaten zu erhalten, als auch Teil von Optimierungen zur Erhöhung der Lokalität von Speicherzugriffen, zur Minimierung der Kommunikation und zur Verbesserung der Lastbalancierung paralleler Berechnungen. Die vorliegende Dissertation beschäftigt sich mit der Entwicklung eines effizienten parallelen Sortierverfahrens und der dafür benötigten Kommunikationsoperationen zur Datenumverteilung in Partikelsimulationen. Hierzu werden eine Vielzahl existierender paralleler Sortierverfahren für verteilten Speicher analysiert und mit den Anforderungen von Seiten der Partikelsimulationsanwendungen verglichen. Besondere Herausforderungen ergeben sich dabei hinsichtlich der Aufteilung der Partikeldaten auf verteilten Speicher, der Gewichtung zu sortierender Daten zur verbesserten Lastbalancierung, dem Umgang mit doppelten Schlüsselwerten sowie der Verfügbarkeit und Nutzung speichereffizienter Kommunikationsoperationen. Um diese Anforderungen zu erfüllen, wird ein neues paralleles Sortierverfahren entwickelt und in die betrachteten Anwendungsprogramme integriert. Darüber hinaus wird ein neuer In-place-Algorithmus für der MPI_Alltoallv-Kommunikationsoperation vorgestellt, mit dem der Speicherverbrauch für die notwendige Datenumverteilung innerhalb der parallelen Sortierung deutlich reduziert werden kann. Das Verhalten aller entwickelten Verfahren wird jeweils isoliert und im praxisrelevanten Einsatz innerhalb verschiedener Anwendungsprogramme und unter Verwendung unterschiedlicher, insbesondere auch hochskalierbarer Parallelrechner untersucht.
89

Synthesis of silicon nanocrystal memories by sputter deposition / Untersuchung zur Herstellung von Silizium-Nanokristall-Speichern durch Sputterverfahren

Schmidt, Jan Uwe 06 March 2005 (has links) (PDF)
In Silizium-Nanokristall-Speichern werden im Gate-Oxid eines Feldeffekttransistors eingebettete Silizium Nanokristalle genutzt, um Elektronen lokal zu speichern. Die gespeicherte Ladung bestimmt dann den Zustand der Speicherzelle. Ein wichtiger Aspekt in der Technologie dieser Speicher ist die Erzeugung der Nanokristalle mit einerwohldefinierten Größenverteilung und einem bestimmten Konzentrationsprofil im Gate-Oxid. In der vorliegenden Arbeit wurde dazu ein sehr flexibler Ansatz untersucht: die thermische Ausheilung von SiO2/SiOx (x < 2) Stapelschichten. Es wurde ein Sputterverfahren entwickelt, das die Abscheidung von SiO2 und SiOx Schichten beliebiger Zusammensetzung erlaubt. Die Bildung der Nanokristalle wurde in Abhängigkeit vom Ausheilregime und der SiOx Zusammensetzung charakterisiert, wobei unter anderem Methoden wie Photolumineszenz, Infrarot-Absorption, spektroskopische Ellipsometrie und Elektronenmikroskopie eingesetzt wurden. Anhand von MOS-Kondensatoren wurden die elektrischen Eigenschaften derart hergestellter Speicherzellen untersucht. Die Funktionalität der durch Sputterverfahren hergestellten Nanokristall-Speicher wurde erfolgreich nachgewiesen. / In silicon nanocrystal memories, electronic charge is discretely stored in isolated silicon nanocrystals embedded in the gate oxide of a field effect transistor. The stored charge determines the state of the memory cell. One important aspect in the technology of silicon nanocrystal memories is the formation of nanocrystals near the SiO2-Si interface, since both, the size distribution and the depth profile of the area density of nanocrystals must be controlled. This work has focussed on the formation of gate oxide stacks with embedded nanocrystals using a very flexible approach: the thermal annealing of SiO2/SiOx (x < 2) stacks. A sputter deposition method allowing to deposit SiO2 and SiOx films of arbitrary composition has been developed and optimized. The formation of Si NC during thermal annealing of SiOX has been investigated experimentally as a function of SiOx composition and annealing regime using techniques such as photoluminescence, infrared absorption, spectral ellipsometry, and electron microscopy. To proof the concept, silicon nanocrystal memory capacitors have been prepared and characterized. The functionality of silicon nanocrystal memory devices based on sputtered gate oxide stacks has been successfully demonstrated.
90

Effiziente parallele Sortier- und Datenumverteilungsverfahren für Partikelsimulationen auf Parallelrechnern mit verteiltem Speicher

Hofmann, Michael 09 March 2012 (has links)
Partikelsimulationen repräsentieren eine Klasse von daten- und rechenintensiven Simulationsanwendungen, die in unterschiedlichen Bereichen der Wissenschaft und der industriellen Forschung zum Einsatz kommen. Der hohe Berechnungsaufwand der eingesetzten Lösungsmethoden und die großen Datenmengen, die zur Modellierung realistischer Probleme benötigt werden, machen die Nutzung paralleler Rechentechnik hierfür unverzichtbar. Parallelrechner mit verteiltem Speicher stellen dabei eine weit verbreitete Architektur dar, bei der eine Vielzahl an parallel arbeitenden Rechenknoten über ein Verbindungsnetzwerk miteinander Daten austauschen können. Die Berechnung von Wechselwirkungen zwischen Partikeln stellt oft den Hauptaufwand einer Partikelsimulation dar und wird mit Hilfe schneller Lösungsmethoden, wie dem Barnes-Hut-Algorithmus oder der Schnellen Multipolmethode, durchgeführt. Effiziente parallele Implementierungen dieser Algorithmen benötigen dabei eine Sortierung der Partikel nach ihren räumlichen Positionen. Die Sortierung ist sowohl notwendig, um einen effizienten Zugriff auf die Partikeldaten zu erhalten, als auch Teil von Optimierungen zur Erhöhung der Lokalität von Speicherzugriffen, zur Minimierung der Kommunikation und zur Verbesserung der Lastbalancierung paralleler Berechnungen. Die vorliegende Dissertation beschäftigt sich mit der Entwicklung eines effizienten parallelen Sortierverfahrens und der dafür benötigten Kommunikationsoperationen zur Datenumverteilung in Partikelsimulationen. Hierzu werden eine Vielzahl existierender paralleler Sortierverfahren für verteilten Speicher analysiert und mit den Anforderungen von Seiten der Partikelsimulationsanwendungen verglichen. Besondere Herausforderungen ergeben sich dabei hinsichtlich der Aufteilung der Partikeldaten auf verteilten Speicher, der Gewichtung zu sortierender Daten zur verbesserten Lastbalancierung, dem Umgang mit doppelten Schlüsselwerten sowie der Verfügbarkeit und Nutzung speichereffizienter Kommunikationsoperationen. Um diese Anforderungen zu erfüllen, wird ein neues paralleles Sortierverfahren entwickelt und in die betrachteten Anwendungsprogramme integriert. Darüber hinaus wird ein neuer In-place-Algorithmus für der MPI_Alltoallv-Kommunikationsoperation vorgestellt, mit dem der Speicherverbrauch für die notwendige Datenumverteilung innerhalb der parallelen Sortierung deutlich reduziert werden kann. Das Verhalten aller entwickelten Verfahren wird jeweils isoliert und im praxisrelevanten Einsatz innerhalb verschiedener Anwendungsprogramme und unter Verwendung unterschiedlicher, insbesondere auch hochskalierbarer Parallelrechner untersucht.

Page generated in 0.062 seconds