Hierarchical Pruning

Hierarchical pruning is a network compression technique aiming to reduce the computational cost and memory footprint of large neural networks, such as large language models and diffusion models, without significant performance degradation. Current research focuses on developing efficient algorithms that prune networks at multiple levels (e.g., channels, heads, layers), often employing optimization-based methods or leveraging metrics like focal diversity to guide the pruning process. These advancements are significant because they enable deployment of complex models on resource-constrained devices and improve the efficiency of training and inference, impacting various applications from image generation to natural language processing.

Papers

January 5, 2025

Swift Cross-Dataset Pruning: Enhancing Fine-Tuning Efficiency in Natural Language Understanding
Binh-Nguyen Nguyen, Yang He
Language Understanding Diverse Datasets Visual Naturalness Dataset Pruning Hierarchical Pruning

June 17, 2024

Not All Prompts Are Made Equal: Prompt-based Pruning of Text-to-Image Diffusion Models
Alireza Ganjdanesh, Reza Shirkavand, Shangqian Gao, Heng Huang
Text to Image Diffusion Model Complex Prompt Model Pruning Hierarchical Pruning

June 15, 2024

Bypass Back-propagation: Optimization-based Structural Pruning for Large Language Models via Policy Gradient
Yuan Gao, Zujing Liu, Weizhong Zhang, Bo Du, Gui-Song Xia
Large Language Model Back Propagation Structural Pruning Pruning Mask Hierarchical Pruning

April 5, 2024

Robust Few-Shot Ensemble Learning with Focal Diversity-Based Pruning
Selim Furkan Tekin, Fatih Ilhan, Tiansheng Huang, Sihao Hu, Ka-Ho Chow, Margaret L. Loper, Ling Liu
Shot Learning Robust Version Ensemble Learning Ensemble Diversity Focal Information Hierarchical Pruning Cascade Ensemble

March 19, 2024

HCPM: Hierarchical Candidates Pruning for Efficient Detector-Free Matching
Ying Chen, Yong Liu, Kai Wu, Qiang Nie, Shang Xu, Huifang Ma, Bing Wang, Chengjie Wang
Computer Vision Image Matching Detector Free Hierarchical Pruning

December 23, 2023

Hardware-Aware DNN Compression via Diverse Pruning and Mixed-Precision Quantization
Konstantinos Balaskas, Andreas Karatzas, Christos Sad, Kostas Siozios, Iraklis Anagnostopoulos, Georgios Zervakis, Jörg Henkel
Deep Neural Network DNN Accelerator Mixed Precision Quantization DNN Architecture Energy Efficient Inference DNN Compression Hierarchical Pruning Pruning Quantization

November 17, 2023

Hierarchical Pruning of Deep Ensembles with Focal Diversity
Yanzhao Wu, Ka-Ho Chow, Wenqi Wei, Ling Liu
Deep Ensemble Compositional Diversity Hierarchical Pruning Ensemble Pruning

June 7, 2022

Neural Network Compression via Effective Filter Analysis and Hierarchical Pruning
Ziqi Zhou, Li Lian, Yilong Yin, Ze Wang
Deep Network Neural Network Compression Network Pruning Network Compression Hierarchical Pruning

Hierarchical Pruning

Papers

Swift Cross-Dataset Pruning: Enhancing Fine-Tuning Efficiency in Natural Language Understanding

Not All Prompts Are Made Equal: Prompt-based Pruning of Text-to-Image Diffusion Models

Bypass Back-propagation: Optimization-based Structural Pruning for Large Language Models via Policy Gradient

Robust Few-Shot Ensemble Learning with Focal Diversity-Based Pruning

HCPM: Hierarchical Candidates Pruning for Efficient Detector-Free Matching

Hardware-Aware DNN Compression via Diverse Pruning and Mixed-Precision Quantization

Hierarchical Pruning of Deep Ensembles with Focal Diversity

Neural Network Compression via Effective Filter Analysis and Hierarchical Pruning