Post Training Sparsity

Post-training sparsity (PTS) focuses on making neural networks more efficient by removing unnecessary connections *after* the initial training is complete, aiming to reduce computational cost and memory footprint without significant performance loss. Current research emphasizes developing algorithms that efficiently determine the optimal sparsity pattern across different layers, addressing challenges like accuracy degradation at high sparsity levels and achieving fast convergence. This approach holds significant promise for deploying large models on resource-constrained devices and accelerating inference, impacting both the efficiency of machine learning research and its practical applications.

Papers

December 10, 2024

May 29, 2024

UniPTS: A Unified Framework for Proficient Post-Training Sparsity
Jingjing Xie, Yuxin Zhang, Mingbao Lin, Zhihang Lin, Liujuan Cao, Rongrong Ji
Unified Framework Sparse Network Dynamic Sparse Training Network Sparsity Post Training Sparsity

May 9, 2024

Fast and Controllable Post-training Sparsity: Learning Optimal Sparsity Allocation with Global Constraint in Minutes
Ruihao Gong, Yang Yong, Zining Wang, Jinyang Guo, Xiuying Wei, Yuqing Ma, Xianglong Liu
Sparsity Constraint Meeting Minute Parameter Efficient Sparsity Global Constraint Post Training Sparsity

January 26, 2024

SliceGPT: Compress Large Language Models by Deleting Rows and Columns
Saleh Ashkboos, Maximilian L. Croci, Marcelo Gennari do Nascimento, Torsten Hoefler, James Hensman
Large Language Model Language Model Sparsification Method Multiple High Quality Column Post Training Sparsity

February 6, 2023

Ten Lessons We Have Learned in the New "Sparseland": A Short Handbook for Sparse Neural Network Researchers
Shiwei Liu, Zhangyang Wang
Critical Lesson Sparse Neural Network Sparse Training Dynamic Sparsity Sparse to Sparse Training Sparse Network Training Post Training Sparsity

Post Training Sparsity

Papers

PTSBench: A Comprehensive Post-Training Sparsity Benchmark Towards Algorithms and Models

Post-Training Statistical Calibration for Higher Activation Sparsity

UniPTS: A Unified Framework for Proficient Post-Training Sparsity

Fast and Controllable Post-training Sparsity: Learning Optimal Sparsity Allocation with Global Constraint in Minutes

SliceGPT: Compress Large Language Models by Deleting Rows and Columns

Ten Lessons We Have Learned in the New "Sparseland": A Short Handbook for Sparse Neural Network Researchers