• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 22
  • 20
  • 6
  • 6
  • 2
  • 1
  • 1
  • 1
  • 1
  • 1
  • Tagged with
  • 71
  • 23
  • 20
  • 19
  • 16
  • 15
  • 14
  • 13
  • 12
  • 12
  • 12
  • 11
  • 11
  • 10
  • 9
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
51

Scalabilité et amélioration des propriétés de couplage d'échange pour TA-MRAM / Scalability and improvement of exchange bias properties for Thermally Assisted MRAM

Vinai, Giovanni Maria 16 December 2013 (has links)
Le couplage d’échange entre une couche ferromagnétique (F) et une couche antiferromagnétique (AF) permet de piéger l’aimantation de la couche ferromagnétique. Ce phénomène est largement utilisé dans des systèmes magnétiques complexes, telles que les vannes de spins, ou les mémoires MRAM, où il permet de constituer des couches de références, normalement insensibles aux cycles d’écriture des couches de stockage. On remarque aux petites dimensions, lorsque la taille des cellules diminue en dessous de la centaine de nm, des renversements partiels ou complets des électrodes de référence, dus à un basculement du réseau de spins dans l’AF. L’objectif de cette thèse est de comprendre ces phénomènes de renversement, de les quantifier en fonction de la dimension latérale des dispositifs, et de présenter des solutions viables afin d’accroître la stabilité des systèmes de stockage. Ce travail essentiellement expérimental, comprenant dépôts, lithogravure et caractérisations, se déroulera pour la majeure partie au sein du laboratoire SPINTEC (UMR8191). L’étudiant sera cependant amené à collaborer avec plusieurs entités du pôle grenoblois, notamment pour les mesures magnéto-optiques, les analyses cristallographiques, ainsi que pour une partie de simulation atomistique ; il devra aussi s’intéresser à l’intégration industrielle de ses études en rendant compte de ses résultats, en les discutant, afin que Crocus Technology en bénéficie directement. La thèse, se déroulant sur trois ans, explorera les points suivants : i) Etude de la stabilité thermique en fonction de la taille des motifs (0-15mois) L’étudiant déposera par pulvérisation cathodique des bicouches F/AF (AF=FeMn, PtMn ou IrMn) qui seront gravées sur la plate forme de technologie amont (PTA) localisée sur le site du CEA/Grenoble. Il caractérisera par des mesures d’effet kerr ou de magnétotransport les propriétés magnétiques des bicouches, notamment les distributions de TB, de champ d’échange, en fonction de la taille des motifs. Il participera aux analyses cristallographiques en collaboration avec le Service général des rayons X et le laboratoires d'Etude des Matériaux par Microscopie Avancée (LEMMA) (du CEA/Grenoble/INAC/SP2M). Ces analyses qui donneront des renseignements sur les tailles de grains et leur distribution seront utilisées pour comprendre les mesures magnétiques dans un premier temps, et seront un point de départ pour optimiser via des recuits, ou l’ajout d’éléments d’addition, la stabilité des systèmes aux dimensions réduites, typiquement <100nm. ii) Etude du couplage inter-grain dans l’AF (15-22mois) L’étudiant réalisera des mesures de trainage magnétique et déterminera les volumes de nucléation dans l’AF et les comparera aux données cristallographiques. Il essaiera de déterminer l’importance de ce couplage dans la stabilité des points mémoire en jouant sur son intensité (recuits, éléments d’addition…), ceci participant de l’optimisation de l’anisotropie d’échange aux petites dimensions présentée dans la partie précédente. iii) Volet de simulations atomistiques (22-30mois) L’étudiant collaborera avec le laboratoire LSIM et notamment F. Lançon afin de simuler, grâce à un code de calcul développé localement, l’impact de la cristallographie (taille de grains, couplage inter-grains, désordre interfacial et rugosité) sur les propriétés de l’anisotropie d’échange dans les systèmes F/AF de taille réduite. Ces simulations permettront de comprendre les mesures expérimentales réalisées en parallèle et d’ouvrir de nouvelles voies exploratoires pour optimiser les valeurs de champ d’échange en vue de leur intégration dans les dispositifs. / Exchange coupling between a ferromagnetic (F) and an antiferromagnetic (AF) layer is responsible of a higher coercivity and of a shift in the hysteresis loop. This phenomenon is widely used in magnetic systems like spin-valves and MRAM to set the reference layer, that remains fixed during the writing processes of the storage layer. It has been noticed that, for systems with reduced lateral size , the magnetization of the reference layer can (completely or partially) reverse because of spin switches in the AF layer. The aim of this thesis project is the understanding of these reversal phenomena, the quantification as a function of lateral dimension and the proposal of feasable solutions in order to increase the stability of the storage layer. The thesis will be maily experimental, including deposition, lithography and characterization processes. The main part of the thesis will be spent at SPINTEC (UMR8191) laboratories. The student will also collaborate with other research groups in Grenoble, in particular for magneto-optical measurements, crystallographic analysis, and atomic simulations. He will also manage the industrial integration of his studies, by sharing and discussing his results with Crocus Technology. The thesis, during a period of three years, will cover the following subjects: i) Study of the termal stability as a function of lateral size (0-15 months). The student will deposit F/AF bilayers being AF FeMn, PtMn or IrMn) by magnetron sputtening. These layers will be etched at Pthe TA cleanroom facility, in CEA-Grenoble. TB and exchange field distributions will be characterized by Kerr effect and magnetotrasport measurements as a function of lateral size. He will collaborate to the crystallographic analysis with the X-ray general service and the 'laboratoires d'Etude des Matériaux par Microscopie Avancée' (LEMMA) (CEA/Grenoble/INAC/SP2M). These analysis, that will give informations about grain size and distribution, will help the understanding of the magnetic measurements and will be a starting point for an optimization, through annealing steps or additional elements, of the stability of systems with reduced lateral size (typically below 100nm). ii) Study of AF inter-grain coupling (15-22 months) The student will perform magnetic training measurements. He will determine the nucleation volumes in the AF and compare them with the crystallographic results. He will manage to establish the importance of this coupling in the stability of magnetic memories and to vary its intensity (annealing, additional elements). This study will contribute to optimize the exchange anisotropy at reduced dimensions presented in the previous point. iii) Atomic simulations (22-30 months) The student will collaborate with LSIM laboratory, in particular with F.Lançon. He will simulate the impact of crystallography (grain size, inter-grain coupling, interfacial disorder, rugosity) on exchange anisotropy properties in F/AF systems with reduced lateral size. Simulations will be performed with a code developped in the lab. These simulations will help in understanding the experimental measures performed previously, and will give new suggestions in the optimization process of the exchange field for technological integration.
52

Spin-transfer torques in MgO-based magnetic tunnel junctions

Bernert, Kerstin 03 February 2014 (has links)
This thesis discusses spin-transfer torques in MgO-based magnetic tunnel junctions. The voltage-field switching phase diagrams have been experimentally determined for in-plane CoFeB/MgO/CoFeB magnetic tunnel junctions. In order to limit the effect of thermal activation, experiments have been carried out using nanosecond voltage pulses, as well as at low-temperature (4.2 K). The bias-dependence of the two spin-torque terms (Slonczewski-like and field-like) has been determined from thermally-excited ferromagnetic resonance measurements, yielding values which are in good agreement with previous reports. Additionally, material parameters such as the effective magnetisation and the damping factor have also been extracted. Using these values as input, the switching voltages as function of the applied magnetic field have been calculated numerically and analytically by solving the modified Landau-Lifshitz-Gilbert equation. Unlike previous studies, the field-like spin-torque has also been included. Moreover, different configurations have been considered for the magnetic anisotropy directions of the reference and free layer, respectively.:1 Introduction 2 Fundamentals 2.1 Magnetoresistance 2.1.1 Giant magnetoresistance 2.1.2 Tunnel magnetoresistance 2.2 Spin-transfer torque effect 2.2.1 Physical picture of the STT 2.2.2 In-plane and perpendicular STT 2.3 Equation of motion for the magnetisation 2.3.1 The Landau-Lifshitz-Gilbert equation 2.3.2 Extension including spin-transfer-torque (LLGS) 2.4 Applications of MR and spin-transfer torque 2.4.1 Read heads in hard disk drives 2.4.2 Spin-transfer torque magnetic random access memory 2.5 STT effects in magnetic tunnel junctions 2.5.1 Current-induced switching 2.5.2 Magnetisation precession 2.5.3 Bias-dependence of STT 2.5.4 Back-hopping 3 Experimental 3.1 Samples 3.1.1 Stack composition 3.1.2 Properties of samples used in this work 3.2 Experimental setup 3.2.1 Overview of equipment for the different measurement techniques 3.2.2 Electromagnet and Kepco power supply 3.2.3 Contacting of the sample 3.2.4 Principle specifications of equipment 3.3 Experimental techniques 3.3.1 Measurement of DC R-H and R-I loops 3.3.2 Measurement of phase diagrams: off and on-pulse 3.3.3 Thermally-excited ferromagnetic resonance 4 Results and discussion 4.1 Switching phase diagrams of MTJs 4.1.1 Theory: Calculating the phase diagram 4.1.2 Experimental phase diagrams 4.2 Thermally excited ferromagnetic resonance 4.2.1 Smoothing and fitting of raw data 4.2.2 Determination of Ms 4.2.3 Signal evolution with bias voltage 4.2.4 Analysis of peak position: perpendicular STT 4.2.5 Analysis of peak linewidth 5 Summary and outlook A Appendix List of figures List of tables Bibliography / Diese Arbeit befasst sich mit Spin-Transfer-Torque-Effekten in MgO-basierten magnetischen Tunnelstrukturen. Die Phasendiagramme als Funktion von Spannung und Magnetfeld von CoFeB/MgO/CoFeB-Tunnelstrukturen mit Magnetisierung in der Ebene wurden experimentell bestimmt. Um thermische Anregungseffekte zu limitieren, wurden die Experimente einerseits mit nanosekundenlangen Spannungspulsen und andererseits bei niedrigen Temperaturen (4.2 K) durchgeführt. Die Spannungsabhängigkeit der beiden Spin-Torque-Parameter (in-plane und senkrechter Spin-Transfer-Torque) wurde aus Messungen der thermisch angeregten ferromagnetischen Resonanz bestimmt, wobei sich Werte ergaben, die gut mit vorangegangenen Untersuchungen übereinstimmen. Zusätzlich wurden Werte für Materialparameter wie die effektive Magnetisierung und den Dämpfungsparameter gewonnen. Unter Verwendung der erhaltenen Werte wurden die Schaltspannungen als Funktion des angelegten Magnetfeldes analytisch und numerisch berechnet, indem die erweiterte Landau-Lifshitz-Gilbert-Gleichung gelöst wurde. Im Gegensatz zu vorangegangenen Untersuchungen wurde der senkrechte Spin-Transfer-Torque dabei mit einbezogen. Darüber hinaus wurden verschiedene Konfigurationen für die Richtung der magnetischen Anisotropie der freien und fixierten Schicht berücksichtigt.:1 Introduction 2 Fundamentals 2.1 Magnetoresistance 2.1.1 Giant magnetoresistance 2.1.2 Tunnel magnetoresistance 2.2 Spin-transfer torque effect 2.2.1 Physical picture of the STT 2.2.2 In-plane and perpendicular STT 2.3 Equation of motion for the magnetisation 2.3.1 The Landau-Lifshitz-Gilbert equation 2.3.2 Extension including spin-transfer-torque (LLGS) 2.4 Applications of MR and spin-transfer torque 2.4.1 Read heads in hard disk drives 2.4.2 Spin-transfer torque magnetic random access memory 2.5 STT effects in magnetic tunnel junctions 2.5.1 Current-induced switching 2.5.2 Magnetisation precession 2.5.3 Bias-dependence of STT 2.5.4 Back-hopping 3 Experimental 3.1 Samples 3.1.1 Stack composition 3.1.2 Properties of samples used in this work 3.2 Experimental setup 3.2.1 Overview of equipment for the different measurement techniques 3.2.2 Electromagnet and Kepco power supply 3.2.3 Contacting of the sample 3.2.4 Principle specifications of equipment 3.3 Experimental techniques 3.3.1 Measurement of DC R-H and R-I loops 3.3.2 Measurement of phase diagrams: off and on-pulse 3.3.3 Thermally-excited ferromagnetic resonance 4 Results and discussion 4.1 Switching phase diagrams of MTJs 4.1.1 Theory: Calculating the phase diagram 4.1.2 Experimental phase diagrams 4.2 Thermally excited ferromagnetic resonance 4.2.1 Smoothing and fitting of raw data 4.2.2 Determination of Ms 4.2.3 Signal evolution with bias voltage 4.2.4 Analysis of peak position: perpendicular STT 4.2.5 Analysis of peak linewidth 5 Summary and outlook A Appendix List of figures List of tables Bibliography
53

Jonctions tunnel magnétiques à aimantation perpendiculaire : anisotropie, magnétorésistance, couplages magnétiques et renversement par couple de transfert de spin

Nistor, Lavinia 07 October 2011 (has links) (PDF)
Le but de cette thèse est l'étude des propriétés de jonctions tunnel magnétiques à aimantation perpendiculaire, en utilisant l'anisotropie perpendiculaire présente à l'interface entre un métal magnétique et un oxyde. En théorie, dans le cas des applications mémoires, les jonctions tunnel perpendiculaires devraient nécessiter moins d'énergie (courant) pour l'écriture par courant polarisé en spin. Mais la fabrication de telles structures représente un défi et une tâche difficile puisque les propriétés de transport (TMR) et d'anisotropie imposent des contraintes sur les matériaux utilisées en limitant la fenêtre de travail, notamment en ce qui concerne l'épaisseur des couches magnétiques. Pour atteindre cet objectif nous avons tout d'abord étudié les propriétés de ces structures comme l'anisotropie de l'interface métal magnétique-oxyde, le transport tunnel et le couplage entre les couches magnétiques à travers la barrière isolante. L'amplitude de l'anisotropie d'interface entre un métal magnétique et un oxyde dépend de l'épaisseur des couches magnétiques, de la température de recuit et la concentration de l'oxygène à l'interface. Différentes structures ont été réalisées afin de choisir la structure la mieux adaptée pour les applications mémoires MRAM. Une corrélation entre la TMR et l'anisotropie a été observée permettant de valider l'origine de l'anisotropie perpendiculaire : la formation de liaisons métal magnétique-oxygène. Un couplage antiferromagnétique à été aussi observé entre les couches magnétiques à anisotropie perpendiculaire à travers l'oxyde. Une étude détaillée sur le couplage a été faite en fonction de la température de recuit et de l'épaisseur des couches magnétiques pour mieux comprendre l'origine du couplage et une possible relation avec l'amplitude de l'anisotropie perpendiculaire. Finalement des jonctions perpendiculaires ont été nano-lithographiées et des mesures de commutation d'aimantation par transfert de spin sur des piliers nanométriques ont été réalisées avec de faibles courants critiques.
54

Resonant switching and vortex dynamics in spin-flop bi-layers

Cherepov, Sergiy January 2010 (has links)
This thesis is a study of the static and dynamic behavior of the magne-tization in spin-flop bi-layers, which consist of two soft ferromagnetic layerscoupled by dipolar forces through a thin nonmagnetic spacer. The focus ofthe work is three fold: collective spin dynamics in the anti-parallel groundstate; resonant switching in the presence of thermal agitation; and static anddynamic behavior of the system in the vortex-pair state, with a particularemphasis on the interlayer core-core interaction. Two collective spin-flop resonance modes are observed and interpreted asacoustical and optical spin precessions, in which the moments of the two lay-ers oscillate in phase and out of phase, respectively. An analytical macrospinmodel is developed to analyze the experimental results and is found to ac-curately predict the resonance frequencies and their field dependence in thelow-field anti-parallel state and the high-field near saturated state. A micro-magnetic model is developed and successfully explains the static and dynamicbehavior of the system in the entire field range, including the C- and S-typespin-perturbed scissor state of the bi-layer at intermediate fields. The optical spin-flop resonance at 3-4 GHz is used to demonstrate resonantswitching in the system, in the range of the applied field where quasi-staticswitching is forbidden. An off-axis field of relatively small amplitude canexcite large-angle scissor-like oscillations at the optical resonance frequency,which can result in a full 180-degree reversal, with the two moments switchingpast each other into the mirror anti-parallel state. It is found that the switch-ing probability increases with increasing the duration of the microwave fieldpulse, which shows that the resonant switching process is affected by thermalagitation. Micromagnetic modeling incorporating the effect of temperature isperformed and is in good agreement with the experimental results. Vortex pair states in spin-flop bi-layers are produced using high amplitudefield pulses near the optical spin resonance in the system. The stable vortex-pair states, 16 in total, of which 4 sub-classes are non-degenerate in energy, areidentified and investigated using static and dynamic applied fields. For AP-chirality vortex-pair states, the system can be studied while the two vortexcores are coupled and decoupled in a single field sweep. It is found thatthe dynamics of the AP-chirality vortex pairs is critically determined by thepolarizations of the two vortex cores and the resulting attractive or repulsivecore-core interaction. The measured spin resonance modes in the system areinterpreted as gyrational, rotational, and vibrational resonances with the helpof the analytical and micromagnetic models developed herein. A significant effort during this project was made to build two instrumentsfor surface and transport characterization of magnetic nanostructures: a high-current Scanning Tunneling Microscope for studying transport in magneticpoint contacts, and a Current In Plane Tunneling instrument for characteriz-ing unpatterned magnetic tunnel junctions. The design and implementationof the instruments as well as the test data are presented. / QC 20101209
55

Développement, mécanismes de programmation et fiabilité de mémoires non volatiles à commutation de résistance MRAM et OxRRAM

Courtade, Lorène 17 December 2009 (has links) (PDF)
La microélectronique a montré une évolution rapide motivée par l'accroissement des performances et par l'abaissement des coûts. Le marché des mémoires est un domaine clé de ce secteur. L'enjeu majeur est d'accéder à la mémoire universelle qui remplacera toutes les autres en associant la densité et l'endurance "illimitée" des DRAM, la rapidité des SRAM et la non-volatilité des Flash. Nous nous sommes intéressés aux technologies MRAM et OxRRAM possédant l'avantage d'être, comme la technologie Flash, non volatile et compatible avec la technologie MOS. Elles promettent également, suivant l'architecture adoptée, d'être aussi rapides qu'une SRAM, aussi dense qu'une DRAM et avoir une endurance quasi-illimitée. Ces technologies reposent sur des concepts dans lesquels la discrimination des deux états du point mémoire est assurée par un changement de résistance. La première partie de cette thèse a été consacrée à la technologie MRAM et notamment à la fiabilité de l'oxyde tunnel intégré dans la jonction magnétique, élément de base des cellules mémoires MRAM. La seconde partie a été axée sur le développement et la compréhension des mécanismes physiques de programmation des mémoires OxRRAM intégrant un oxyde binaire NiO dans l'élément de mémorisation. Un accent particulier a été porté sur le développement d'une solution technologique simple dans son mode de fabrication et permettant d'aboutir à un empilement présentant des performances électriques conformes aux spécifications. Il est alors possible d'envisager l'intégration de l'oxyde de nickel dans des structures de très faibles dimensions et de viser une réduction substantielle de la taille de la cellule mémoire
56

Power-Efficient and Low-Latency Memory Access for CMP Systems with Heterogeneous Scratchpad On-Chip Memory

Chen, Zhi 01 January 2013 (has links)
The gradually widening speed disparity of between CPU and memory has become an overwhelming bottleneck for the development of Chip Multiprocessor (CMP) systems. In addition, increasing penalties caused by frequent on-chip memory accesses have raised critical challenges in delivering high memory access performance with tight power and latency budgets. To overcome the daunting memory wall and energy wall issues, this thesis focuses on proposing a new heterogeneous scratchpad memory architecture which is configured from SRAM, MRAM, and Z-RAM. Based on this architecture, we propose two algorithms, a dynamic programming and a genetic algorithm, to perform data allocation to different memory units, therefore reducing memory access cost in terms of power consumption and latency. Extensive and intensive experiments are performed to show the merits of the heterogeneous scratchpad architecture over the traditional pure memory system and the effectiveness of the proposed algorithms.
57

Commutation précessionelle de mémoire magnétique avec polariseur à anisotropie perpendiculaire

Marins de castro souza, Maria 27 September 2011 (has links) (PDF)
Cette thèse est consacrée à l'intégration d'un polariseur à anisotropie perpendiculaire dans une jonction tunnel magnétique aux aimantations planaires. Par effet du transfert de spin venant du polariseur perpendiculaire, il est possible d'induire des oscillations de l'aimantation de la couche libre. Ces oscillations ultra-rapides de l'ordre de la picoseconde, peuvent être utilisées comme mode d'écriture dans une cellule magnétique MRAM. Ce type d'écriture est appelée écriture précessionnelle. Nous avons optimisé des structures fonctionnelles tout en gardant des bonnes qualités électriques et magnétiques. Les tests d'écriture sur des nanopiliers ont permis de valider le concept d'écriture précessionnelle ouvrant ainsi une porte à la compréhension des différents phénomènes liés au transport tunnel et à la dynamique de l'aimantation.
58

Adaptive Beyond Von-Neumann Computing Devices and Reconfigurable Architectures for Edge Computing Applications

Hossain, Mousam 01 January 2024 (has links) (PDF)
The Von-Neumann bottleneck, a major challenge in computer architecture, results from significant data transfer delays between the processor and main memory. Crossbar arrays utilizing spin-based devices like Magnetoresistive Random Access Memory (MRAM) aim to overcome this bottleneck by offering advantages in area and performance, particularly for tasks requiring linear transformations. These arrays enable single-cycle and in-memory vector-matrix multiplication, reducing overheads, which is crucial for energy and area-constrained Internet of Things (IoT) sensors and embedded devices. This dissertation focuses on designing, implementing, and evaluating reconfigurable computation platforms that leverage MRAM-based crossbar arrays and analog computation to support deep learning and error resilience implementations. One key contribution is the investigation of Spin Torque Transfer MRAM (STT-MRAM) technology scaling trends, considering power dissipation, area, and process variation (PV) across different technology nodes. A predictive model for power estimation in hybrid CMOS/MTJ technology has been developed and validated, along with new metrics considering the Internet of Things (IoT) energy profile of various applications. The dissertation introduces the Spintronically Configurable Analog Processing in-memory Environment (SCAPE), integrating analog arithmetic, runtime reconfigurability, and non-volatile devices within a selectable 2-D topology of hybrid spin/CMOS devices. Simulation results show improvements in error rates, power consumption, and power-error-product metric for real-world applications like machine learning and compressive sensing, while assessing process variation impact. Additionally, it explores transportable approaches to more robust SCAPE implementations, including applying redundancy techniques for artificial neural network (ANN)-based digit recognition applications. Generic redundancy techniques are developed and applied to hybrid spin/CMOS-based ANNs, showcasing improved/comparable accuracy with smaller-sized networks. Furthermore, the dissertation examines hardware security considerations for emerging memristive device-based applications, discussing mitigation approaches against malicious manufacturing interventions. It also discusses reconfigurable computing for AI/ML applications based on state-of-the-art FPGAs, along with future directions in adaptive computing architectures for AI/ML at the edge of the network.
59

Jonctions tunnel magnétiques à anisotropie perpendiculaire et écriture assistée thermiquement

Bandiera, Sebastien 21 October 2011 (has links) (PDF)
Dans le cadre de l'augmentation de la densité de stockage des mémoires magnétorésistives à accès direct (MRAM), les matériaux à anisotropie magnétique perpendiculaire sont particulièrement intéressants car ils possèdent une très forte anisotropie. Cependant, cette augmentation d'anisotropie induit également un accroissement de la consommation d'écriture. Un nouveau concept d'écriture assistée thermiquement a été proposé par le laboratoire SPINTEC. Le principe est de concevoir une structure très stable à température ambiante, mais qui perd son anisotropie lorsqu'elle est chauffée, facilitant ainsi l'écriture. Le but de cette thèse est de valider expérimentalement ce concept. Les premiers chapitres sont consacrés à l'optimisation des matériaux à anisotropie perpendiculaire que sont les multicouches (Co/Pt), (Co/Pd) et (Co/Tb). Leur intégration dans une jonction tunnel magnétique est ensuite présentée. L'évolution de l'anisotropie en température, paramètre crucial au bon fonctionnement de l'assistance thermique, a également été étudiée. Enfin, il est démontré que l'écriture thermiquement assistée est particulièrement efficace : les structures développées présentent une consommation d'écriture réduite par rapport aux structures classiques et une forte stabilité à température ambiante.
60

IN-MEMORY COMPUTING WITH CMOS AND EMERGING MEMORY TECHNOLOGIES

Shubham Jain (7464389) 17 October 2019 (has links)
Modern computing workloads such as machine learning and data analytics perform simple computations on large amounts of data. Traditional von Neumann computing systems, which consist of separate processor and memory subsystems, are inefficient in realizing modern computing workloads due to frequent data transfers between these subsystems that incur significant time and energy costs. In-memory computing embeds computational capabilities within the memory subsystem to alleviate the fundamental processor-memory bottleneck, thereby achieving substantial system-level performance and energy benefits. In this dissertation, we explore a new generation of in-memory computing architectures that are enabled by emerging memory technologies and new CMOS-based memory cells. The proposed designs realize Boolean and non-Boolean computations natively within memory arrays.<br><div><br></div><div>For Boolean computing, we leverage the unique characteristics of emerging memories that allow multiple word lines within an array to be simultaneously enabled, opening up the possibility of directly sensing functions of the values stored in multiple rows using single access. We propose Spin-Transfer Torque Compute-in-Memory (STT-CiM), a design for in-memory computing with modifications to peripheral circuits that leverage this principle to perform logic, arithmetic, and complex vector operations. We address the challenge of reliable in-memory computing under process variations utilizing error detecting and correcting codes to control errors during CiM operations. We demonstrate how STT-CiM can be integrated within a general-purpose computing system and propose architectural enhancements to processor instruction sets and on-chip buses for in-memory computing. <br></div><div><br></div><div>For non-Boolean computing, we explore crossbar arrays of resistive memory elements, which are known to compactly and efficiently realize a key primitive operation involved in machine learning algorithms, i.e., vector-matrix multiplication. We highlight a key challenge involved in this approach - the actual function computed by a resistive crossbar can deviate substantially from the desired vector-matrix multiplication operation due to a range of device and circuit level non-idealities. It is essential to evaluate the impact of the errors introduced by these non-idealities at the application level. There has been no study of the impact of non-idealities on the accuracy of large-scale workloads (e.g., Deep Neural Networks [DNNs] with millions of neurons and billions of synaptic connections), in part because existing device and circuit models are too slow to use in application-level evaluation. We propose a Fast Crossbar Model (FCM) to accurately capture the errors arising due to crossbar non-idealities while being four-to-five orders of magnitude faster than circuit simulation. We also develop RxNN, a software framework to evaluate DNN inference on resistive crossbar systems. Using RxNN, we evaluate a suite of large-scale DNNs developed for the ImageNet Challenge (ILSVRC). Our evaluations reveal that the errors due to resistive crossbar non-idealities can degrade the overall accuracy of DNNs considerably, motivating the need for compensation techniques. Subsequently, we propose CxDNN, a hardware-software methodology that enables the realization of large-scale DNNs on crossbar systems with minimal degradation in accuracy by compensating for errors due to non-idealities. CxDNN comprises of (i) an optimized mapping technique to convert floating-point weights and activations to crossbar conductances and input voltages, (ii) a fast re-training method to recover accuracy loss due to this conversion, and (iii) low-overhead compensation hardware to mitigate dynamic and hardware-instance-specific errors. Unlike previous efforts that are limited to small networks and require the training and deployment of hardware-instance-specific models, CxDNN presents a scalable compensation methodology that can address large DNNs (e.g., ResNet-50 on ImageNet), and enables a common model to be trained and deployed on many devices. <br></div><div><br></div><div>For non-Boolean computing, we also propose TiM-DNN, a programmable hardware accelerator that is specifically designed to execute ternary DNNs. TiM-DNN supports various ternary representations including unweighted (-1,0,1), symmetric weighted (-a,0,a), and asymmetric weighted (-a,0,b) ternary systems. TiM-DNN is an in-memory accelerator designed using TiM tiles --- specialized memory arrays that perform massively parallel signed vector-matrix multiplications on ternary values per access. TiM tiles are in turn composed of Ternary Processing Cells (TPCs), new CMOS-based memory cells that function as both ternary storage units and signed scalar multiplication units. We evaluate an implementation of TiM-DNN in 32nm technology using an architectural simulator calibrated with SPICE simulation and RTL synthesis. TiM-DNN achieves a peak performance of 114 TOPs/s, consumes 0.9W power, and occupies 1.96mm2 chip area, representing a 300X improvement in TOPS/W compared to a state-of-the-art NVIDIA Tesla V100 GPU. In comparison to popular quantized DNN accelerators, TiM-DNN achieves 55.2X-240X and 160X-291X improvement in TOPS/W and TOPS/mm2, respectively.<br></div><div><br></div><div>In summary, the dissertation proposes new in-memory computing architectures as well as addresses the need for scalable modeling frameworks and compensation techniques for resistive crossbar based in-memory computing fabrics. Our evaluations show that in-memory computing architectures are promising for realizing modern machine learning and data analytics workloads, and can attain orders-of-magnitude improvement in system-level energy and performance over traditional von Neumann computing systems. <br></div>

Page generated in 0.1373 seconds