Activation Sparsity

Activation sparsity, the phenomenon where only a small fraction of a neural network's neurons are active for a given input, is a key research area aiming to improve the efficiency of deep learning models, particularly large language models (LLMs). Current research focuses on methods to induce and leverage this sparsity during both training and inference, exploring techniques like thresholding, specialized activation functions (e.g., ReLU variants), and Mixture-of-Experts (MoE) architectures. This work is significant because it promises to reduce computational costs and memory requirements, enabling faster and more energy-efficient deployment of large models on resource-constrained devices, including edge devices and mobile phones.

Papers

March 27, 2024

The Impact of Uniform Inputs on Activation Sparsity and Energy-Latency Attacks in Computer Vision
Andreas Müller, Erwin Quiring
Computer Vision Global Impact Sparsity Increase Activation Sparsity Model Based Prior Latency Attack

February 25, 2024

Deep Neural Network Initialization with Sparsity Inducing Activations
Ilan Price, Nicholas Daultry Ball, Samuel C. H. Lam, Adam C. Jones, Jared Tanner
Activation Sparsity Sparse Activation Nonlinear Activation Neural Network Initialization

February 21, 2024

ProSparse: Introducing and Enhancing Intrinsic Activation Sparsity within Large Language Models
Chenyang Song, Xu Han, Zhengyan Zhang, Shengding Hu, Xiyu Shi, Kuai Li, Chen Chen, Zhiyuan Liu, Guangli Li, Tao Yang, Maosong Sun
ReLU Activation Activation Sparsity

February 9, 2024

Learn To be Efficient: Build Structured Sparsity in Large Language Models
Haizhong Zheng, Xiaoyan Bai, Xueshen Liu, Z. Morley Mao, Beidi Chen, Fan Lai, Atul Prakash
High Efficiency Inference Cost Structured Sparsity Activation Sparsity Dynamic Sparse Training

February 2, 2024

From PEFT to DEFT: Parameter Efficient Finetuning for Reducing Activation Density in Transformers
Bharat Runwal, Tejaswini Pedapati, Pin-Yu Chen
Transformer Megatron Decepticons Parameter Efficient Fine Tuning Pretrained Language Model Parameter Efficient Activation Sparsity

November 13, 2023

Activity Sparsity Complements Weight Sparsity for Efficient RNN Inference
Rishav Mukherji, Mark Schöne, Khaleelulla Khan Nazeer, Christian Mayr, Anand Subramoney
Neuromorphic Computing Activation Sparsity Sparse Activation RNN Inference

November 7, 2023

Harnessing Manycore Processors with Distributed Memory for Accelerated Training of Sparse and Recurrent Models
Jan Finkbeiner, Thomas Gmeinder, Mark Pupilli, Alexander Titterton, Emre Neftci
Many Sparse Faster Training Activation Sparsity Sparse Activation Tensor Processing Unit AI Hardware Sparse Tensor Shared Memory

October 29, 2023

Emergence of Shape Bias in Convolutional Neural Networks through Activation Sparsity
Tianqin Li, Ziqi Wen, Yangfan Li, Tai Sing Lee
Convolutional Neural Network Path Breaking Emergence Object Recognition Activation Sparsity Human Visual System Shape Bias Sparse Code Structural Encoding

October 6, 2023

September 12, 2023

Accelerating Deep Neural Networks via Semi-Structured Activation Sparsity
Matteo Grimaldi, Darshan C. Ganji, Ivan Lazarevich, Sudhakar Sah
Deep Neural Network Structured Pruning Structured Sparsity Sparse Training Activation Sparsity Unstructured Sparsity

September 6, 2023

A Theoretical Explanation of Activation Sparsity through Flat Minima and Adversarial Robustness
Ze Peng, Lei Qi, Yinghuan Shi, Yang Gao
Adversarial Robustness Theoretical Understanding Sparsity Increase Activation Sparsity Flat Minimum Gradient Sparsification Sparsity Ratio

June 10, 2023

RAMAN: A Re-configurable and Sparse tinyML Accelerator for Inference on Edge
Adithya Krishna, Srikanth Rohit Nudurupati, Chandana D G, Pritesh Dwivedi, André van Schaik, Mahesh Mehendale, Chetan Singh Thakur
Scientific Inference Extreme Edge TinyML Model Activation Sparsity Dataflow Architecture Raman System Configurable Software System

March 30, 2023

SparseViT: Revisiting Activation Sparsity for Efficient High-Resolution Vision Transformer
Xuanyao Chen, Zhijian Liu, Haotian Tang, Li Yi, Hang Zhao, Song Han
Activation Sparsity Deep Learning Workload Sparse Update Layerwise Sparsity High Resolution Vision Transformer

February 3, 2023

SPARLING: Learning Latent Representations with Extremely Sparse Activations
Kavi Gupta, Osbert Bastani, Armando Solar-Lezama
Latent Representation Activation Sparsity Sparse Activation High Sparsity Sparse Tensor

December 29, 2022

FlatENN: Train Flat for Enhanced Fault Tolerance of Quantized Deep Neural Networks
Akul Malhotra, Sumeet Kumar Gupta
Activation Sparsity Quantized Neural Network Fault Tolerance Document Flattening

December 28, 2022

Sparse Coding in a Dual Memory System for Lifelong Learning
Fahad Sarfraz, Elahe Arani, Bahram Zonooz
Lifelong Learning Sparse Representation Activation Sparsity Semantic Memory Efficient Continual Learning Sparse Code Dual Memory

October 12, 2022

The Lazy Neuron Phenomenon: On Emergence of Activation Sparsity in Transformers
Zonglin Li, Chong You, Srinadh Bhojanapalli, Daliang Li, Ankit Singh Rawat, Sashank J. Reddi, Ke Ye, Felix Chern, Felix Yu, Ruiqi Guo, Sanjiv Kumar
Transformer Megatron Decepticons Multi Layer Many Sparse Sparsity Increase Path Breaking Emergence Multi Layer Perceptron Activation Sparsity Sparse Activation Dead Neuron

September 7, 2022

The Role Of Biology In Deep Learning
Robert Bain
Deep Learning Convolutional Neural Network Integral Role Activation Sparsity Magnitude Pruning

June 13, 2022

Efficient recurrent architectures through activity sparsity and sparse back-propagation through time
Anand Subramoney, Khaleelulla Khan Nazeer, Mark Schöne, Christian Mayr, David Kappel
Recurrent Neural Network Time Matter Activation Sparsity Energy Efficient Neuromorphic Sparse Backpropagation

Activation Sparsity

Papers

The Impact of Uniform Inputs on Activation Sparsity and Energy-Latency Attacks in Computer Vision

Deep Neural Network Initialization with Sparsity Inducing Activations

ProSparse: Introducing and Enhancing Intrinsic Activation Sparsity within Large Language Models

Learn To be Efficient: Build Structured Sparsity in Large Language Models

From PEFT to DEFT: Parameter Efficient Finetuning for Reducing Activation Density in Transformers

Activity Sparsity Complements Weight Sparsity for Efficient RNN Inference

Harnessing Manycore Processors with Distributed Memory for Accelerated Training of Sparse and Recurrent Models

Emergence of Shape Bias in Convolutional Neural Networks through Activation Sparsity

ReLU Strikes Back: Exploiting Activation Sparsity in Large Language Models

Exploiting Activation Sparsity with Dense to Dynamic-k Mixture-of-Experts Conversion

Accelerating Deep Neural Networks via Semi-Structured Activation Sparsity

A Theoretical Explanation of Activation Sparsity through Flat Minima and Adversarial Robustness

RAMAN: A Re-configurable and Sparse tinyML Accelerator for Inference on Edge

SparseViT: Revisiting Activation Sparsity for Efficient High-Resolution Vision Transformer

SPARLING: Learning Latent Representations with Extremely Sparse Activations

FlatENN: Train Flat for Enhanced Fault Tolerance of Quantized Deep Neural Networks

Sparse Coding in a Dual Memory System for Lifelong Learning

The Lazy Neuron Phenomenon: On Emergence of Activation Sparsity in Transformers

The Role Of Biology In Deep Learning

Efficient recurrent architectures through activity sparsity and sparse back-propagation through time