DNN Accelerator

DNN accelerators are specialized hardware designed to efficiently execute deep neural network (DNN) computations, primarily aiming to improve speed, reduce energy consumption, and minimize latency. Current research focuses on optimizing various aspects of these accelerators, including novel memory hierarchies, efficient in-memory computing (IMC) using stochastic processing, and adaptive hardware/software co-optimization techniques, often applied to models like ResNet and Vision Transformers. These advancements are crucial for deploying DNNs on resource-constrained edge devices and in safety-critical applications, impacting both the efficiency of AI systems and their reliability in real-world deployments.

Papers

July 15, 2022

Computing-In-Memory Neural Network Accelerators for Safety-Critical Systems: Can Small Device Variations Be Disastrous?
Zheyu Yan, Xiaobo Sharon Hu, Yiyu Shi
DNN Accelerator Safety Critical System Non Volatile Memory Deep Neural Network Performance Device Variation

July 8, 2022

RF-Photonic Deep Learning Processor with Shannon-Limited Data Movement
Ronald Davis, Zaijun Chen, Ryan Hamerly, Dirk Englund
Neural Network DNN Accelerator Analog Neural Network

June 30, 2022

QUIDAM: A Framework for Quantization-Aware DNN Accelerator and Model Co-Exploration
Ahmet Inci, Siri Garudanagiri Virupaksha, Aman Jain, Ting-Wu Chin, Venkata Vivek Thallam, Ruizhou Ding, Diana Marculescu
New Framework DNN Accelerator Accelerator Design Quantization Aware Neural Network Configuration

May 20, 2022

QADAM: Quantization-Aware DNN Accelerator Modeling for Pareto-Optimality
Ahmet Inci, Siri Garudanagiri Virupaksha, Aman Jain, Venkata Vivek Thallam, Ruizhou Ding, Diana Marculescu
Pareto Optimal DNN Accelerator Efficient Hardware Quantization Aware Neural Network Configuration

May 19, 2022

Multi-DNN Accelerators for Next-Generation AI Systems
Stylianos I. Venieris, Christos-Savvas Bouganis, Nicholas D. Lane
Neural Network Deep Neural Network DNN Accelerator AI Technology Future AI System DNN Workload

May 17, 2022

QAPPA: Quantization-Aware Power, Performance, and Area Modeling of DNN Accelerators
Ahmet Inci, Siri Garudanagiri Virupaksha, Aman Jain, Venkata Vivek Thallam, Ruizhou Ding, Diana Marculescu
System Performance DNN Accelerator DNN Workload Quantization Aware Area Modeling

May 14, 2022

A Comprehensive Survey on Model Quantization for Deep Neural Networks in Image Classification
Babak Rokh, Ali Azarpeyvand, Alireza Khanteymoori
Deep Neural Network Image Classification Comprehensive Survey Multiplier Free Quantization DNN Accelerator Model Quantization

March 16, 2022

Hardware Approximate Techniques for Deep Neural Network Accelerators: A Survey
Giorgos Armeniakos, Georgios Zervakis, Dimitrios Soudris, Jörg Henkel
Deep Neural Network Timely Survey DNN Accelerator Approximate Computing Deep Learning Accelerator Hardware Approximation Approximate DNN Accelerator

March 13, 2022

FlexBlock: A Flexible DNN Training Accelerator with Multi-Mode Block Floating Point Support
Seock-Hwan Noh, Jahyun Koo, Seunghyun Lee, Jongse Park, Jaeha Kung
Exceptional Point Multidimensional Local Precision Rate DNN Accelerator Multi Modal Outer Arithmetic Block Accurate Training

March 8, 2022

AdaPT: Fast Emulation of Approximate DNN Accelerators in PyTorch
Dimitrios Danopoulos, Georgios Zervakis, Kostas Siozios, Dimitrios Soudris, Jörg Henkel
Pytorch Model DNN Framework DNN Accelerator Model Retraining Approximate DNN Accelerator

March 3, 2022

Weightless Neural Networks for Efficient Edge Inference
Zachary Susskind, Aman Arora, Igor Dantas Dos Santos Miranda, Luis Armando Quintanilla Villon, Rafael Fontella Katopodis, Leandro Santiago de Araujo, Diego Leonel Cadette Dutra, Priscila Machado Vieira Lima, Felipe Maia Galvao Franca, Mauricio Breternitz, Lizy K. John
Neural Network Architecture DNN Accelerator Edge Inference SNN Architecture

February 18, 2022

EF-Train: Enable Efficient On-device CNN Training on FPGA Through Data Reshaping for Online Adaptation or Personalization
Yue Tang, Xinyi Zhang, Peipei Zhou, Jingtong Hu
DNN Accelerator Online Adaptation Device Training Device Deep

February 14, 2022

BED: A Real-Time Object Detection System for Edge Devices
Guanchu Wang, Zaid Pervaiz Bhat, Zhimeng Jiang, Yi-Wei Chen, Daochen Zha, Alfredo Costilla Reyes, Afshin Niktash, Gorkem Ulkar, Erman Okman, Xuanting Cai, Xia Hu
Neural Network Deep Neural Network Edge Device DNN Accelerator Real Time Object Device Deep BED Turnaround Time

February 10, 2022

Mixture-of-Rookies: Saving DNN Computations by Predicting ReLU Outputs
Dennis Pinto, Jose-María Arnau, Antonio González
Deep Neural Network Computation Method DNN Accelerator Unknown Teammate ReLU Operation

January 26, 2022

January 20, 2022

HEAM: High-Efficiency Approximate Multiplier Optimization for Deep Neural Networks
Su Zheng, Zhen Li, Yao Lu, Jingbo Gao, Jide Zhang, Lingli Wang
Deep Neural Network DNN Framework DNN Accelerator Class Wise Multiplier Accuracy Loss Approximate Multiplier

DNN Accelerator

Papers

Computing-In-Memory Neural Network Accelerators for Safety-Critical Systems: Can Small Device Variations Be Disastrous?

RF-Photonic Deep Learning Processor with Shannon-Limited Data Movement

QUIDAM: A Framework for Quantization-Aware DNN Accelerator and Model Co-Exploration

QADAM: Quantization-Aware DNN Accelerator Modeling for Pareto-Optimality

Multi-DNN Accelerators for Next-Generation AI Systems

QAPPA: Quantization-Aware Power, Performance, and Area Modeling of DNN Accelerators

A Comprehensive Survey on Model Quantization for Deep Neural Networks in Image Classification

Hardware Approximate Techniques for Deep Neural Network Accelerators: A Survey

FlexBlock: A Flexible DNN Training Accelerator with Multi-Mode Block Floating Point Support

AdaPT: Fast Emulation of Approximate DNN Accelerators in PyTorch

Weightless Neural Networks for Efficient Edge Inference

EF-Train: Enable Efficient On-device CNN Training on FPGA Through Data Reshaping for Online Adaptation or Personalization

BED: A Real-Time Object Detection System for Edge Devices

Mixture-of-Rookies: Saving DNN Computations by Predicting ReLU Outputs

DiGamma: Domain-aware Genetic Algorithm for HW-Mapping Co-optimization for DNN Accelerators

DNNFuser: Generative Pre-Trained Transformer as a Generalized Mapper for Layer Fusion in DNN Accelerators

HEAM: High-Efficiency Approximate Multiplier Optimization for Deep Neural Networks