the latest in aiBeta

Bit Vision Transformer

Bit vision transformers (BitViTs) aim to reduce the computational cost and memory footprint of vision transformers (ViTs) by representing their weights and activations using fewer bits, thereby enabling efficient deployment on resource-constrained devices. Current research focuses on developing novel quantization techniques, such as those employing learnable scaling factors or softmax-aware binarization, to minimize accuracy loss during this compression. These advancements, applied to architectures like DeiT and Swin, are improving the performance of low-bit ViTs, with some methods even achieving accuracy comparable to or exceeding full-precision models, and others facilitating automated hardware acceleration for real-time applications.

5papers

Papers

December 21, 2024

Semantics Prompting Data-Free Quantization for Low-Bit Vision Transformers
Yunshan Zhong, Yuyao Zhou, Yuxin Zhang, Shen Li, Yong Li, Fei Chao, Zhanpeng Zeng, Rongrong Ji
Transformer Megatron Decepticons Soft Label Bit Vision Transformer Semantics Surfaced Data Free Quantization Model Quantization Vision Transformer

March 11, 2024

COMQ: A Backpropagation-Free Algorithm for Post-Training Quantization
Aozhong Zhang, Zi Yang, Naigang Wang, Yingyong Qi, Jack Xin, Xin Li, Penghang Yin
Integer Quantization Bit Quantization Backpropagation Free Bit Vision Transformer Post Training Quantization Quantization Operator

February 4, 2023

Oscillation-free Quantization for Low-bit Vision Transformers
Shih-Yang Liu, Zechun Liu, Kwang-Ting Cheng
Scaling Factor Weight Monitoring Bit Vision Transformer Quantization Aware Training Quantization Technique Weight Only Quantization

November 14, 2022

BiViT: Extremely Compressed Binary Vision Transformer
Yefei He, Zhenyu Lou, Luoming Zhang, Jing Liu, Weijia Wu, Hong Zhou, Bohan Zhuang
Bit Vision Transformer Vision Transformer Compression Vision Transformer Binary Vision Transformer Binarization Method Layer Binarization

October 13, 2022

Q-ViT: Accurate and Fully Quantized Low-bit Vision Transformer
Yanjing Li, Sheng Xu, Baochang Zhang, Xianbin Cao, Peng Gao, Guodong Guo
Vision Transformer Bit Vision Transformer Multiplier Free Quantization Pre Trained Vision Transformer Self Attention Layer

January 17, 2022

VAQF: Fully Automatic Software-Hardware Co-Design Framework for Low-Bit Vision Transformer
Mengshu Sun, Haoyu Ma, Guoliang Kang, Yifan Jiang, Tianlong Chen, Xiaolong Ma, Zhangyang Wang, Yanzhi Wang
Activation Quantization Bit Vision Transformer Co Design Vision Transformer Quantization Loss