Long Text Modeling

Long text modeling focuses on developing techniques that allow large language models (LLMs) to effectively process and understand documents exceeding the typical length limitations of current architectures. Research currently emphasizes methods to overcome the computational challenges of long sequences, such as employing external memory mechanisms, chunking strategies combined with recurrent or attention-based architectures, and high-resolution processing of visual documents. These advancements are crucial for improving performance in tasks like question answering, summarization, and code generation, ultimately impacting various fields requiring analysis of extensive textual data.

Papers

September 10, 2024

E2LLM: Encoder Elongated Large Language Models for Long-Context Understanding and Reasoning
Zihan Liao, Jun Wang, Hang Yu, Lingxiao Wei, Jianguo Li, Jun Wang, Wei Zhang
Complex Reasoning Long Context Long Context Understanding Long Context Scenario Long Text Modeling

August 30, 2024

MemLong: Memory-Augmented Retrieval for Long Text Modeling
Weijie Liu, Zecheng Tang, Juntao Li, Kehai Chen, Min Zhang
Text Generation App to App Retrieval Long Context Language Input Context Long Text Modeling Historical Document Retrieval

April 10, 2024

HRVDA: High-Resolution Visual Document Assistant
Chaohu Liu, Kun Yin, Haoyu Cao, Xinghua Jiang, Xin Li, Yinsong Liu, Deqiang Jiang, Xing Sun, Linli Xu
Document Understanding Visually Rich Document Visual Expert Long Text Modeling

September 23, 2023

BAMBOO: A Comprehensive Benchmark for Evaluating Long Text Modeling Capacities of Large Language Models
Zican Dong, Tianyi Tang, Junyi Li, Wayne Xin Zhao, Ji-Rong Wen
Long Context Comprehensive Benchmark Long Text Modeling

June 12, 2023

Recurrent Attention Networks for Long-text Modeling
Xianming Li, Zongxi Li, Xiaotian Luo, Haoran Xie, Xing Lee, Yingbin Zhao, Fu Lee Wang, Qing Li
Long Document Long Text Data Recurrent Attention Long Text Modeling

May 3, 2023

AttenWalker: Unsupervised Long-Document Question Answering via Attention-based Graph Walking
Yuxiang Nie, Heyan Huang, Wei Wei, Xian-Ling Mao
Question Answering Question Answer Pair Attention Graph Long Form Question Long Text Modeling

February 28, 2023

A Survey on Long Text Modeling with Transformers
Zican Dong, Tianyi Tang, Lunyi Li, Wayne Xin Zhao
Natural Language Processing Timely Survey Transformer Megatron Decepticons Transformer Model Long Text Textual Model Long Text Modeling