BERT Pruning

BERT pruning aims to reduce the size and computational cost of BERT-based language models while preserving accuracy. Current research focuses on developing efficient pruning algorithms, such as gradual magnitude pruning, and optimizing the pruning process through techniques like knowledge distillation and task-adaptive pre-training, often targeting specific model components like embeddings. These efforts are driven by the need to deploy large language models on resource-constrained devices and improve the efficiency of training and inference, impacting both edge AI applications and federated learning scenarios.

Papers

December 21, 2023

How to Prune Your Language Model: Recovering Accuracy on the "Sparsity May Cry'' Benchmark
Eldar Kurtic, Torsten Hoefler, Dan Alistarh
Large Language Model Language Model New Benchmark Edge Pruning Pruning Method Model Pruning High Sparsity BERT Pruning

June 9, 2023

COVER: A Heuristic Greedy Adversarial Attack on Prompt-based Learning in Language Models
Zihao Tan, Qingliang Chen, Wenbin Zhu, Yongjian Huang
Language Model Pre Trained Language Model Adversarial Prompt Prompt Based Learning Cover Text BERT Pruning

May 3, 2023

Exploring Linguistic Properties of Monolingual BERTs with Typological Classification among Languages
Elena Sofia Ruzzetti, Federico Ranaldi, Felicia Logozzo, Michele Mastromattei, Leonardo Ranaldi, Fabio Massimo Zanzotto
Domain Adaptation Unknown Language Monolingual Model Typological Exploration Monolingual BERT Model Linguistic Property BERT Pruning

September 26, 2022

Towards Simple and Efficient Task-Adaptive Pre-training for Text Classification
Arnav Ladkat, Aamir Miyajiwala, Samiksha Jagadale, Rekha Kulkarni, Raviraj Joshi
Language Model Text Classification Task Specific Domain Adaptive Task Adaptive BERT Pruning

June 21, 2022

An Automatic and Efficient BERT Pruning for Edge AI Systems
Shaoyi Huang, Ning Liu, Yueying Liang, Hongwu Peng, Hongjia Li, Dongkuan Xu, Mimi Xie, Caiwen Ding
BERT Based Edge AI Code BERT Efficient BERT BERT Pruning BERT Base

May 26, 2022

Federated Split BERT for Heterogeneous Text Classification
Zhengyang Li, Shijing Si, Jianzong Wang, Jing Xiao
Ticket BERT Pre Trained BERT BERT Pruning

April 10, 2022

Fake news detection using parallel BERT deep neural networks
Mahmood Farokhian, Vahid Rafe, Hadi Veisi
Deep Neural Network BERT Model Fake News BERT Based BERT Pruning

January 10, 2022

BERT for Sentiment Analysis: Pre-trained and Fine-Tuned Alternatives
Frederico Souza, João Filho
Sentiment Analysis BERT Model Ticket BERT Tf Idf Sentiment Analysis Task Fine Tuning Approach BERT Pruning