Context Pruning

Context pruning is a technique used to optimize large language models (LLMs) by selectively removing less important information from the input context, thereby improving efficiency and performance. Current research focuses on developing algorithms that intelligently identify and prune irrelevant information, employing methods like hierarchical pruning for code completion, contrastive learning for debiasing, and reinforcement learning for enhanced reasoning. These advancements aim to reduce computational costs and memory requirements of LLMs while maintaining or even improving accuracy on various downstream tasks, leading to more efficient and resource-friendly AI systems.

Papers

October 25, 2024

Rethinking Visual Dependency in Long-Context Reasoning for Large Vision-Language Models
Yucheng Zhou, Zhi Rao, Jun Wan, Jianbing Shen
Vision Language Model Large Vision Language Model Long Context Token Pruning Context Pruning

June 26, 2024

Hierarchical Context Pruning: Optimizing Real-World Code Completion with Repository-Level Pretrained Code LLMs
Lei Zhang, Yunshui Li, Jiaming Li, Xiaobo Xia, Jiaxi Yang, Run Luo, Minzheng Wang, Longze Chen, Junhao Liu, Min Yang
Source Code Code Completion Code LLM Repository Level Code Completion Repository Level Context Pruning

December 20, 2023

Mini-GPTs: Efficient Large Language Models through Contextual Pruning
Tim Valicenti, Justice Vidal, Ritik Patnaik
Artificial Intelligence Research Domain Specific Large Language Model Efficient Large Language Model Context Pruning

December 14, 2023

Fewer is More: Boosting LLM Reasoning with Reinforced Context Pruning
Xijie Huang, Li Lyna Zhang, Kwang-Ting Cheng, Fan Yang, Mao Yang
Reinforcement Learning Mathematical Reasoning LLM Reasoning Context Pruning

May 25, 2023

Dynamic Context Pruning for Efficient and Interpretable Autoregressive Transformers
Sotiris Anagnostidis, Dario Pavllo, Luca Biggio, Lorenzo Noci, Aurelien Lucchi, Thomas Hofmann
High Efficiency Pre Trained Model Attention Layer Inference Cost Autoregressive Transformer Context Pruning

March 6, 2023

Contrastive variational information bottleneck for aspect-based sentiment analysis
Mingshan Chang, Min Yang, Qingshan Jiang, Ruifeng Xu
Contrastive Learning Aspect Based Sentiment Analysis Variational Information Bottleneck Context Pruning

October 11, 2022

Training Debiased Subnetworks with Contrastive Weight Pruning
Geon Yeong Park, Sangmin Lee, Sang Wan Lee, Jong Chul Ye
Training Data Debiasing Method Biased Training Context Pruning

December 14, 2021

From Dense to Sparse: Contrastive Pruning for Better Pre-trained Language Model Compression
Runxin Xu, Fuli Luo, Chengyu Wang, Baobao Chang, Jun Huang, Songfang Huang, Fei Huang
Pre Trained Language Model Pre Trained Model Model Pruning Good Better Unstructured Pruning Context Pruning

Context Pruning

Papers

Rethinking Visual Dependency in Long-Context Reasoning for Large Vision-Language Models

Hierarchical Context Pruning: Optimizing Real-World Code Completion with Repository-Level Pretrained Code LLMs

Mini-GPTs: Efficient Large Language Models through Contextual Pruning

Fewer is More: Boosting LLM Reasoning with Reinforced Context Pruning

Dynamic Context Pruning for Efficient and Interpretable Autoregressive Transformers

Contrastive variational information bottleneck for aspect-based sentiment analysis

Training Debiased Subnetworks with Contrastive Weight Pruning

From Dense to Sparse: Contrastive Pruning for Better Pre-trained Language Model Compression