Memory Accelerator

Memory accelerators aim to drastically improve the energy efficiency and speed of deep neural network (DNN) inference by performing computations directly within the memory array, minimizing data movement. Current research focuses on optimizing various DNN architectures, including convolutional neural networks (CNNs), recurrent neural networks (RNNs), and transformers, for in-memory computing using techniques like ternary weight quantization and hardware-aware training. This approach holds significant promise for reducing the power consumption and latency of AI applications, particularly in resource-constrained environments like edge devices and IoT systems.

Papers

January 12, 2025

COMPASS: A Compiler Framework for Resource-Constrained Crossbar-Array Based In-Memory Deep Learning Accelerators
Jihoon Park, Jeongin Choe, Dohyun Kim, Jae-Joon Kim
DNN Accelerator Modern Compiler Crossbar Array COntrastive Multimodal Pretraining Better on Chip Data Memory Accelerator

October 30, 2024

An Event-Based Digital Compute-In-Memory Accelerator with Flexible Operand Resolution and Layer-Wise Weight/Output Stationarity
Nicolas Chauvaux, Adrian Kneip, Christoph Posch, Kofi Makinwa, Charlotte Frenkel
Energy Efficiency Event Data DNN Accelerator Arbitrary Resolution Compute in Memory Hardware Simulation Layer Weight Memory Accelerator

January 23, 2024

Full-Stack Optimization for CAM-Only DNN Inference
João Paulo C. de Lima, Asif Ali Khan, Luigi Carro, Jeronimo Castrillon
Supervised ImageNet Associative Memory DNN Inference Compute in Memory Memory Accelerator Racetrack Memory

April 22, 2023

A Deep Neural Network Deployment Based on Resistive Memory Accelerator Simulation
Tejaswanth Reddy Maram, Ria Barnwal, Dr. Bindu B
Neural Network Resistive Random Access Memory Resistive Memory Memory Accelerator

March 13, 2023

X-Former: In-Memory Acceleration of Transformers
Shrihari Sridharan, Jacob R. Stevens, Kaushik Roy, Anand Raghunathan
Transformer Megatron Decepticons Computing in Memory X Former Memory Accelerator

February 16, 2023

Hardware-aware training for large-scale and diverse deep learning inference workloads using in-memory computing-based accelerators
Malte J. Rasch, Charles Mackin, Manuel Le Gallo, An Chen, Andrea Fasoli, Frederic Odermatt, Ning Li, S. R. Nandakumar, Pritish Narayanan, Hsinyu Tsai, Geoffrey W. Burr, Abu Sebastian, Vijay Narayanan
Memory Computing DNN Accuracy Inference Workload Analog in Memory Computing Hardware Aware Training Memory Accelerator

January 19, 2022

FAT: An In-Memory Accelerator with Fast Addition for Ternary Weight Neural Networks
Shien Zhu, Luan H. K. Duong, Hui Chen, Di Liu, Weichen Liu
Memory Computing Ternary Neural Network Order of Addition FAT Accumulation Memory Accelerator

January 4, 2022

A Heterogeneous In-Memory Computing Cluster For Flexible End-to-End Inference of Real-World Deep Neural Networks
Angelo Garofalo, Gianmarco Ottavi, Francesco Conti, Geethan Karunaratne, Irem Boybat, Luca Benini, Davide Rossi
Deep Learning Analog in Memory Computing Practical Deep Memory Accelerator

Memory Accelerator

Papers

COMPASS: A Compiler Framework for Resource-Constrained Crossbar-Array Based In-Memory Deep Learning Accelerators

An Event-Based Digital Compute-In-Memory Accelerator with Flexible Operand Resolution and Layer-Wise Weight/Output Stationarity

Full-Stack Optimization for CAM-Only DNN Inference

A Deep Neural Network Deployment Based on Resistive Memory Accelerator Simulation

X-Former: In-Memory Acceleration of Transformers

Hardware-aware training for large-scale and diverse deep learning inference workloads using in-memory computing-based accelerators

FAT: An In-Memory Accelerator with Fast Addition for Ternary Weight Neural Networks

A Heterogeneous In-Memory Computing Cluster For Flexible End-to-End Inference of Real-World Deep Neural Networks