Long Context Large Language Model

Long-context large language models (LLMs) aim to overcome the limitations of traditional LLMs by processing significantly longer input sequences, enabling more comprehensive understanding and generation of text. Current research focuses on improving efficiency through techniques like sparse attention mechanisms, optimized memory management (e.g., KV cache compression), and efficient training strategies, as well as developing robust evaluation benchmarks that assess performance on diverse, realistic long-context tasks. This field is crucial for advancing natural language processing capabilities in applications requiring deep understanding of extensive documents, such as multi-document summarization, question answering, and complex reasoning tasks across various domains.

Papers

March 29, 2024

ELITR-Bench: A Meeting Assistant Benchmark for Long-Context Language Models
Thibaut Thonet, Jos Rozen, Laurent Besacier
Long Context Long Document MT Bench Long Context Large Language Model Long Context Language

March 18, 2024

March 6, 2024

CLongEval: A Chinese Benchmark for Evaluating Long-Context Large Language Models
Zexuan Qiu, Jingjing Li, Shijue Huang, Xiaoqi Jiao, Wanjun Zhong, Irwin King
Long Context Long Context Large Language Model Chinese Benchmark

February 27, 2024

Evaluating Very Long-Term Conversational Memory of LLM Agents
Adyasha Maharana, Dong-Ho Lee, Sergey Tulyakov, Mohit Bansal, Francesco Barbieri, Yuwei Fang
Long Term LLM Agent Open Domain Dialogue Long Context Large Language Model

February 21, 2024

$\infty$Bench: Extending Long Context Evaluation Beyond 100K Tokens
Xinrong Zhang, Yingfa Chen, Shengding Hu, Zihang Xu, Junhao Chen, Moo Khai Hao, Xu Han, Zhen Leng Thai, Shuo Wang, Zhiyuan Liu, Maosong Sun
Long Context K TOKEN Long Context Large Language Model

February 6, 2024

LV-Eval: A Balanced Long-Context Benchmark with 5 Length Levels Up to 256K
Tao Yuan, Xuefei Ning, Dong Zhou, Zhijie Yang, Shiyao Li, Minghui Zhuang, Zheyue Tan, Zhuyu Yao, Dahua Lin, Boxun Li, Guohao Dai, Shengen Yan, Yu Wang
Large Language Model Context Length Long Context Large Language Model K Content Long Context Benchmark Crown Rump Length

February 5, 2024

December 28, 2023

Structured Packing in LLM Training Improves Long Context Utilization
Konrad Staniszewski, Szymon Tworkowski, Sebastian Jaszczur, Yu Zhao, Henryk Michalewski, Łukasz Kuciński, Piotr Miłoś
Long Context Long Context Large Language Model LLM Training Long Context Task Input Context Online Packing Context Utilization

November 21, 2023

Advancing Transformer Architecture in Long-Context Large Language Models: A Comprehensive Survey
Yunpeng Huang, Jingwei Xu, Junyu Lai, Zixu Jiang, Taolue Chen, Zenan Li, Yuan Yao, Xiaoxing Ma, Lijuan Yang, Hao Chen, Shupeng Li, Penghao Zhao
Comprehensive Survey Long Context Large Language Model Transformer Based LLM Long Input Context

November 8, 2023

LooGLE: Can Long-Context Language Models Understand Long Contexts?
Jiaqi Li, Mengmeng Wang, Zilong Zheng, Muhan Zhang
Large Language Model Long Context Large Language Model Long Context Language Long Context Understanding

October 5, 2023

DISTFLASHATTN: Distributed Memory-efficient Attention for Long-context LLMs Training
Dacheng Li, Rulin Shao, Anze Xie, Eric P. Xing, Xuezhe Ma, Ion Stoica, Joseph E. Gonzalez, Hao Zhang
Transformer Based Large Language Model Long Context Large Language Model Memory Efficient Attention DeepSpeed Ulysses

October 4, 2023

Retrieval meets Long Context Large Language Models
Peng Xu, Wei Ping, Xianchao Wu, Lawrence McAfee, Chen Zhu, Zihan Liu, Sandeep Subramanian, Evelina Bakhturina, Mohammad Shoeybi, Bryan Catanzaro
Large Language Model App to App Retrieval Retrieval Augmentation Long Context Large Language Model Long Range Context Retrieval Augmented LLM

September 21, 2023

LongLoRA: Efficient Fine-tuning of Long-Context Large Language Models
Yukang Chen, Shengju Qian, Haotian Tang, Xin Lai, Zhijian Liu, Song Han, Jiaya Jia
Supervised Fine Tuning Pre Trained Large Language Model Sparse Attention Efficient Fine Tuning Long Context Large Language Model Context Size

May 24, 2023

Enabling Large Language Models to Generate Text with Citations
Tianyu Gao, Howard Yen, Jiatong Yu, Danqi Chen
Large Language Model Text Modality Large Corpus Long Context Large Language Model Software Citation Citation Pattern