Prompt Compression

Prompt compression aims to reduce the length of input prompts for large language models (LLMs) to improve computational efficiency and reduce costs without sacrificing performance. Research focuses on developing methods that selectively retain crucial information, employing techniques like extractive compression, summarization, and reinforcement learning to optimize compression ratios while preserving semantic meaning. These advancements are significant because they address the growing challenge of LLM resource consumption, enabling faster and more cost-effective deployment of these powerful models across various applications.

Papers

February 28, 2024

Learning to Compress Prompt in Natural Language Formats
Yu-Neng Chuang, Tianwei Xing, Chia-Yuan Chang, Zirui Liu, Xun Chen, Xia Hu
Large Language Model LeArning Abstract Natural Language Complex Prompt Prompt Compression Context Prompt Compress Prompt

February 25, 2024

Say More with Less: Understanding Prompt Learning Behaviors through Gist Compression
Xinze Li, Zhenghao Liu, Chenyan Xiong, Shi Yu, Yukun Yan, Shuo Wang, Ge Yu
Prompt Learning Prompt Compression Structure Guided Prompt

October 10, 2023

LongLLMLingua: Accelerating and Enhancing LLMs in Long Context Scenarios via Prompt Compression
Huiqiang Jiang, Qianhui Wu, Xufang Luo, Dongsheng Li, Chin-Yew Lin, Yuqing Yang, Lili Qiu
Large Language Model Shot Learning Multiple Choice Prompt Compression Long Context Scenario

October 9, 2023

LLMLingua: Compressing Prompts for Accelerated Inference of Large Language Models
Huiqiang Jiang, Qianhui Wu, Chin-Yew Lin, Yuqing Yang, Lili Qiu
Large Language Model Language Model Complex Prompt Model Inference Prompt Compression Token Compression

August 17, 2023

Discrete Prompt Compression with Reinforcement Learning
Hoyoun Jung, Kyung-Joong Kim
Language Model Reinforcement Learning Prompt Compression

May 4, 2023

Prompt-ICM: A Unified Framework towards Image Coding for Machines with Task-driven Prompts
Ruoyu Feng, Jinming Liu, Xin Jin, Xiaohan Pan, Heming Sun, Zhibo Chen
New Machine Unified Framework Adaptive Prompt Image Coding Prompt Compression Traditional Codecs Bit Allocation

April 17, 2023

Learning to Compress Prompts with Gist Tokens
Jesse Mu, Xiang Lisa Li, Noah Goodman
Language Model LeArning Abstract Structured Summary Prompt Compression Compress Prompt

October 6, 2022

Prompt Compression and Contrastive Conditioning for Controllability and Toxicity Reduction in Language Models
David Wingate, Mohammad Shoeybi, Taylor Sorensen
Language Model Complex Prompt Controllability Condition Contrastive Training Prompt Compression Language Model Generation Gated Toxicity Avoidance

Prompt Compression

Papers

Learning to Compress Prompt in Natural Language Formats

Say More with Less: Understanding Prompt Learning Behaviors through Gist Compression

LongLLMLingua: Accelerating and Enhancing LLMs in Long Context Scenarios via Prompt Compression

LLMLingua: Compressing Prompts for Accelerated Inference of Large Language Models

Discrete Prompt Compression with Reinforcement Learning

Prompt-ICM: A Unified Framework towards Image Coding for Machines with Task-driven Prompts

Learning to Compress Prompts with Gist Tokens

Prompt Compression and Contrastive Conditioning for Controllability and Toxicity Reduction in Language Models