Network Compression

Network compression aims to reduce the size and computational cost of deep neural networks (DNNs) without significant performance loss. Current research focuses on techniques like pruning (removing less important connections), quantization (reducing the precision of weights), and low-rank approximations, often applied during training or post-training, and applied to various architectures including CNNs, GANs, and transformers. These advancements are crucial for deploying large-scale DNNs on resource-constrained devices and improving the efficiency of training and inference, impacting both scientific understanding of DNNs and their practical applications across diverse fields.

Papers

May 17, 2022

May 13, 2022

Fast Conditional Network Compression Using Bayesian HyperNetworks
Phuoc Nguyen, Truyen Tran, Ky Le, Sunil Gupta, Santu Rana, Dang Nguyen, Trong Nguyen, Shannon Ryan, Svetha Venkatesh
Bayesian Neural Network Network Compression Efficient Bayesian Inference Group Sparsity

April 12, 2022

Compact Model Training by Low-Rank Projection with Energy Transfer
Kailing Guo, Zhenquan Lin, Xiaofen Xing, Fang Liu, Xiangmin Xu
Low Dimensional Manifold Projection Bias Network Compression Projection Matrix Low Rank Compression Heat Transfer

February 16, 2022

Practical Network Acceleration with Tiny Sets
Guo-Hua Wang, Jianxin Wu
Training Data Training Image ImageNet 1k Tiny Set Network Compression Parameter Pruning

January 30, 2022

Win the Lottery Ticket via Fourier Analysis: Frequencies Guided Network Pruning
Yuzhang Shang, Bin Duan, Ziliang Zong, Liqiang Nie, Yan Yan
Lottery Ticket Network Pruning Network Compression Fourier Analysis Magnitude Based Pruning

January 25, 2022

Bit-serial Weight Pools: Compression and Arbitrary Precision Execution of Neural Networks on Resource Constrained Processors
Shurui Li, Puneet Gupta
Neural Network Linear Compression Network Compression Bit Weight

January 17, 2022

UWC: Unit-wise Calibration Towards Rapid Network Compression
Chen Lin, Zheyang Li, Bo Peng, Haoji Hu, Wenming Tan, Ye Ren, Shiliang Pu
Post Training Quantization Multiplier Free Quantization Quantization Error Network Compression Post Training Feature Reconstruction Optimal Calibration

December 19, 2021

Controlling the Quality of Distillation in Response-Based Network Compression
Vibhas Vats, David Crandall
Neural Network Knowledge Distillation Mutual Distillation Quality Issue Network Compression

December 10, 2021

Network Compression via Central Filter
Yuanzhi Duan, Xiaofang Hu, Yue Zhou, Qiang Liu, Shukai Duan
Neural Network Pruning Feature Redundancy Network Compression Max Filter

November 10, 2021

Self-Compression in Bayesian Neural Networks
Giuseppina Carannante, Dimah Dera, Ghulam Rasool, Nidhal C. Bouaynaya
Machine Learning Model Bayesian Neural Network High Compression Network Compression