the latest in aiBeta

Quantization Robust Parameter

Quantization robust parameters aim to create neural network models that maintain accuracy even when their parameters are reduced to lower precision (e.g., 8-bit or even 2-bit integers), crucial for deploying models on resource-constrained devices. Current research focuses on developing methods to predict these robust parameters, often employing graph hypernetworks or incorporating quantization-aware training strategies to improve model resilience. This work is significant because it addresses the trade-off between model size/speed and accuracy, enabling efficient deployment of deep learning in various applications while mitigating the vulnerabilities introduced by quantization.

8papers

Papers

February 1, 2025

Oscillations Make Neural Networks Robust to Quantization
Jonathan Wenshøj, Bob Pepin, Raghavendra Selvan
Quantization Robust Parameter Weight Quantization Quantization Operator Non Converging Artificial Oscillation Neural Network Robustness

September 24, 2023

GHN-QAT: Training Graph Hypernetworks to Predict Quantization-Robust Parameters of Unseen Limited Precision Neural Networks
Stone Yun, Alexander Wong
Quantization Aware Training Graph Hypernetworks Low Precision Quantization Robust Parameter

August 4, 2023

RobustMQ: Benchmarking Robustness of Quantized Models
Yisong Xiao, Aishan Liu, Tianyuan Zhang, Haotong Qin, Jinyang Guo, Xianglong Liu
Quantization Robust Parameter Quantization Model Native Robustness Adversarial Robustness Intrinsic Robustness

April 8, 2023

Benchmarking the Robustness of Quantized Models
Yisong Xiao, Tianyuan Zhang, Shunchang Liu, Haotong Qin
Quantization Robust Parameter Quantization Model Native Robustness Adversarial Attack Quantization Operator

October 17, 2022

ODG-Q: Robust Quantization via Online Domain Generalization
Chaofan Tao, Ngai Wong
Quantization Error Adversarial Attack Domain Generalization Quantization Robust Parameter

August 26, 2022

GHN-Q: Parameter Prediction for Unseen Quantized Convolutional Architectures via Graph Hypernetworks
Stone Yun, Alexander Wong
Quantization Robust Parameter Graph Hypernetworks Convolutional Neural Network Architecture Model Prediction

July 31, 2022

Symmetry Regularization and Saturating Nonlinearity for Robust Quantization
Sein Park, Yeongsang Jang, Eunhyeok Park
Quantization Aware Training Native Robustness Quantization Error Post Training Quantization Saturation Effect Learned Symmetry Quantization Robust Parameter

March 11, 2022

Wireless Quantized Federated Learning: A Joint Computation and Communication Design
Pavlos S. Bouzinis, Panagiotis D. Diamantoulakis, George K. Karagiannidis
Faster Convergence Quantization Error Convergence Time Stochastic Quantization Wireless System Joint Distribution Adaptation Quantization Robust Parameter

January 19, 2022

Q-ViT: Fully Differentiable Quantization for Vision Transformer
Zhexin Li, Tong Yang, Peisong Wang, Jian Cheng
Uniform Quantization Vision Transformer Quantization Robust Parameter Vision Transformer Quantization