Dynamic Sparsity

Dynamic sparsity in neural networks focuses on efficiently reducing computational costs by selectively activating only a subset of network parameters during training or inference. Current research explores dynamic sparsity across various architectures, including large language models, vision transformers, and convolutional neural networks, employing techniques like structured and unstructured pruning, dynamic layer routing, and sample-aware fine-tuning to achieve this. This approach offers significant potential for improving the efficiency and scalability of deep learning models, enabling deployment on resource-constrained devices and accelerating training processes while maintaining or even improving performance. The resulting smaller, faster models are particularly impactful for applications in edge computing, low-power devices, and resource-limited settings.

Papers

November 5, 2024

Navigating Extremes: Dynamic Sparsity in Large Output Space
Nasib Ullah, Erik Schultheis, Mike Lasby, Yani Ioannou, Rohit Babbar
Dynamic Sparse Training Extreme Value Output Space Sparse Matrix Multiplication Dynamic Sparsity Sparse Classification

October 21, 2024

MagicPIG: LSH Sampling for Efficient LLM Generation
Zhuoming Chen, Ranajoy Sadhukhan, Zihao Ye, Yang Zhou, Jianyu Zhang, Niklas Nolte, Yuandong Tian, Matthijs Douze, Leon Bottou, Zhihao Jia, Beidi Chen
Large Language Model Attention Computation LLM Generation Locality Sensitive Hashing Efficient Approximation Attention Score Dynamic Sparsity

June 10, 2024

Boosting Robustness in Preference-Based Reinforcement Learning with Dynamic Sparsity
Calarina Muslimani, Bram Grooten, Deepak Ranganatha Sastry Mamillapalli, Mykola Pechenizkiy, Decebal Constantin Mocanu, Matthew E. Taylor
Reinforcement Learning Native Robustness Preference Based Reinforcement Learning Robust Reward Dynamic Sparsity

June 3, 2024

Towards Efficient Deep Spiking Neural Networks Construction with Spiking Activity based Pruning
Yaxin Li, Qi Xu, Jiangrong Shen, Hongming Xu, Long Chen, Gang Pan
Edge Pruning Network Pruning Spiking Neuron Synaptic Plasticity Dynamic Sparsity Deep Spiking Neural Network

April 7, 2024

Radial Networks: Dynamic Layer Routing for High-Performance Large Language Models
Jordan Dotzel, Yash Akhauri, Ahmed S. AbouElhamayed, Carly Jiang, Mohamed Abdelfattah, Zhiru Zhang
Large Language Model Dynamic Routing Dynamic Sparsity Layerwise Sparsity Token Routing Radial Azimuthal Configuration

November 7, 2023

Unified Low-Resource Sequence Labeling by Sample-Aware Dynamic Sparse Finetuning
Sarkar Snigdha Sarathi Das, Ranran Haoran Zhang, Peng Shi, Wenpeng Yin, Rui Zhang
Large Language Model Language Model Sequence to Sequence Sequence Labeling Dynamic Sparsity

October 13, 2023

Dynamic Sparse No Training: Training-Free Fine-tuning for Sparse LLMs
Yuxin Zhang, Lirui Zhao, Mingbao Lin, Yunyun Sun, Yiwu Yao, Xingjia Han, Jared Tanner, Shiwei Liu, Rongrong Ji
Large Language Model Training Data Training Free Dynamic Sparse Training Dynamic Sparsity

May 30, 2023

February 6, 2023

Ten Lessons We Have Learned in the New "Sparseland": A Short Handbook for Sparse Neural Network Researchers
Shiwei Liu, Zhangyang Wang
Critical Lesson Sparse Neural Network Sparse Training Dynamic Sparsity Sparse to Sparse Training Sparse Network Training Post Training Sparsity

January 26, 2023

PIT: Optimization of Dynamic Sparse Deep Learning Models via Permutation Invariant Transformation
Ningxin Zheng, Huiqiang Jiang, Quanlu Zhang, Zhenhua Han, Yuqing Yang, Lingxiao Ma, Fan Yang, Chengruidong Zhang, Lili Qiu, Mao Yang, Lidong Zhou
Optimization Purpose Dynamic Sparse Training Dynamic Sparsity GPU Kernel

October 1, 2022

Diving into Unified Data-Model Sparsity for Class-Imbalanced Graph Representation Learning
Chunhui Zhang, Chao Huang, Yijun Tian, Qianlong Wen, Zhongyu Ouyang, Youhuan Li, Yanfang Ye, Chuxu Zhang
Graph Neural Network Graph Data Sparse Subnetworks DIVeR Identification Dynamic Sparsity Imbalanced Graph

July 31, 2022

DNNShield: Dynamic Randomized Model Sparsification, A Defense Against Adversarial Machine Learning
Mohammad Hossein Samavatian, Saikat Majumdar, Kristin Barber, Radu Teodorescu
Deep Neural Network Adversarial Attack Adversarial Learning Adversarial Input Dynamic Sparsity

July 4, 2022

Dynamic Spatial Sparsification for Efficient Vision Transformers and Convolutional Neural Networks
Yongming Rao, Zuyan Liu, Wenliang Zhao, Jie Zhou, Jiwen Lu
Convolutional Neural Network Vision Transformer Sparse Attention Hierarchical Vision Transformer Dynamic Sparsity

April 8, 2022

Dynamic super-resolution in particle tracking problems
Ping Liu, Habib Ammari
Super Resolution Particle Tracking Reconstruction Algorithm Dynamic Sparsity Dynamic Reconstruction

April 6, 2022

Probing Structured Pruning on Multilingual Pre-trained Models: Settings, Algorithms, and Efficiency
Yanyang Li, Fuli Luo, Runxin Xu, Songfang Huang, Fei Huang, Liwei Wang
High Efficiency Practical Algorithm Structured Pruning Linear Probing Multilingual Pre Trained Language Model Multilingual Pre Trained Model Monolingual Pre Trained Dynamic Sparsity

December 18, 2021

Federated Dynamic Sparse Training: Computing Less, Communicating Less, Yet Learning Better
Sameer Bibikar, Haris Vikalo, Zhangyang Wang, Xiaohan Chen
LeArning Abstract Timely Communication Federated Prompt Cooperation Digital Computing Sparse Network Sparse Subnetworks Dynamic Sparse Training Dynamic Sparsity

Dynamic Sparsity

Papers

Navigating Extremes: Dynamic Sparsity in Large Output Space

MagicPIG: LSH Sampling for Efficient LLM Generation

Boosting Robustness in Preference-Based Reinforcement Learning with Dynamic Sparsity

Towards Efficient Deep Spiking Neural Networks Construction with Spiking Activity based Pruning

Radial Networks: Dynamic Layer Routing for High-Performance Large Language Models

Unified Low-Resource Sequence Labeling by Sample-Aware Dynamic Sparse Finetuning

Dynamic Sparse No Training: Training-Free Fine-tuning for Sparse LLMs

Dynamic Sparsity Is Channel-Level Sparsity Learner

Edge-MoE: Memory-Efficient Multi-Task Vision Transformer Architecture with Task-level Sparsity via Mixture-of-Experts

Ten Lessons We Have Learned in the New "Sparseland": A Short Handbook for Sparse Neural Network Researchers

PIT: Optimization of Dynamic Sparse Deep Learning Models via Permutation Invariant Transformation

Diving into Unified Data-Model Sparsity for Class-Imbalanced Graph Representation Learning

DNNShield: Dynamic Randomized Model Sparsification, A Defense Against Adversarial Machine Learning

Dynamic Spatial Sparsification for Efficient Vision Transformers and Convolutional Neural Networks

Dynamic super-resolution in particle tracking problems

Probing Structured Pruning on Multilingual Pre-trained Models: Settings, Algorithms, and Efficiency

Federated Dynamic Sparse Training: Computing Less, Communicating Less, Yet Learning Better