the latest in aiBeta

Long Range Context

Long-range context modeling aims to enable artificial intelligence systems to effectively process and utilize information spanning extensive temporal or spatial scales, improving performance on tasks requiring holistic understanding. Current research focuses on enhancing existing architectures like transformers and graph convolutional networks, often incorporating techniques such as sparse attention, cascading KV caches, and novel attention mechanisms to efficiently handle long sequences. This research is crucial for advancing various applications, including natural language processing, medical image analysis, and video understanding, by enabling more accurate and nuanced interpretations of complex data.

30papers

Papers

May 6, 2025

Recall with Reasoning: Chain-of-Thought Distillation for Mamba's Long-Context Memory and Extrapolation
Junyu Ma, Tianqing Fang, Zhisong Zhang, Hongming Zhang, Haitao Mi, Dong Yu
Tencent AI Lab
Long Range Context Long Context Recall Initiator Complex Reasoning Chain of Thought Extrapolation Framework

April 26, 2025

Effective Length Extrapolation via Dimension-Wise Positional Embeddings Manipulation
Yi Lu, Wanxu Zhao, Xin Zhou, Chenxin An, Chenglong Wang, Shuo Li, Yuming Yang, Jun Zhao, Tao Ji, Tao Gui, Qi Zhang, Xuanjing Huang
Fudan University●The University of Hong Kong●Northeastern University
Strategic Manipulation Position Prediction Length Extrapolation Long Context Long Range Context Position Embeddings

March 19, 2025

A Dual-Directional Context-Aware Test-Time Learning for Text Classification
Dong Xu, ZhengLin Lai, MengYao Liao, Xueliang Li, Junkai Ji
Shenzhen University
Bi Attention Contextual Representation Attention Network Bidirectional Generation Attention Based Bidirectional Long Range Context Recurrent Neural Network

March 10, 2025

TiGer: Self-Supervised Purification for Time-evolving Graphs
Hyeonsoo Jo, Jongha Lee, Fanchen Bu, Kijung Shin
KAIST
Evolving Graph Graph Purification Node Classification Dynamic Graph Long Range Context

February 27, 2025

LongRoPE2: Near-Lossless LLM Context Window Scaling
Ning Shang, Li Lyna Zhang, Siyuan Wang, Gaokai Zhang, Gilsinia Lopez, Fan Yang, Weizhu Chen, Mao Yang
Microsoft●Shanghai Jiao Tong University●Zhejiang University
Context Length Long Range Context Long Context Context Sequence Pre Trained Large Language Model Context Learning

February 23, 2025

WildLong: Synthesizing Realistic Long-Context Instruction Data at Scale
Jiaxi Li, Xingxing Zhang, Xun Wang, Xiaolong Huang, Li Dong, Liang Wang, Si-Qing Chen, Wei Lu, Furu Wei
Singapore University of Technology and Design●Microsoft Research
Large Language Model Instruction Datasets Visual Analogue Scale Long Range Context Context Dataset Long Context

February 18, 2025

HeadInfer: Memory-Efficient LLM Inference by Head-wise Offloading
Cheng Luo, Zefan Cai, Hanshi Sun, Jinqi Xiao, Bo Yuan, Wen Xiao, Junjie Hu, Jiawei Zhao, Beidi Chen, Anima Anandkumar
California Institute of Technology●University of Wisconsin-Madison●Carnegie Mellon University●Rutgers University●Microsoft
Prediction Head Long Range Context GPU Memory LLM Inference Transformer Based Large Language Model

January 22, 2025

NExtLong: Toward Effective Long-Context Training without Long Documents
Chaochen Gao, Xing Wu, Zijia Lin, Debing Zhang, Songlin Hu
Long Context Large Language Model Long Document Next DiT Long Range Dependency Long Range Context

January 20, 2025

Zep: A Temporal Knowledge Graph Architecture for Agent Memory
Preston Rasmussen, Pavlo Paliychuk, Travis Beauvais, Jack Ryan, Daniel Chalef
Memory Less Agent Temporal Knowledge Graph Long Range Context Memory Retrieval

January 15, 2025

Information Entropy Invariance: Enhancing Length Extrapolation in Attention Mechanisms
Kewei Li, Yanwen Kong, Yiping Xu, Lan Huang, Ruochi Zhang, Fengfeng Zhou
Shannon Entropy Attention Mechanism Long Range Context Dot Product Attention Length Extrapolation

December 18, 2024

October 31, 2024

Biotic Browser: Applying StreamingLLM as a Persistent Web Browsing Co-Pilot
Kevin F. Dunnell, Andrew P. Stoddard
Artificial Intelligence Continual Task Long Range Context AI Assistant Artificial Life

October 23, 2024

LongRAG: A Dual-Perspective Retrieval-Augmented Generation Paradigm for Long-Context Question Answering
Qingfei Zhao, Ruobing Wang, Yukuo Cen, Daren Zha, Shicheng Tan, Yuxiao Dong, Jie Tang
Long Range Context Question Answering Long Context Large Language Model Generation Model Long Context Multiple View

October 16, 2024

Real-time Stereo-based 3D Object Detection for Streaming Perception
Changcai Li, Zonghua Gu, Gang Chen, Libo Huang, Wei Zhang, Huihui Zhou
3D Object Detection Based 3D Real Time Long Range Context Accurate Perception Streaming Perception

October 14, 2024

DuoAttention: Efficient Long-Context LLM Inference with Retrieval and Streaming Heads
Guangxuan Xiao, Jiaming Tang, Jingwei Zuo, Junxian Guo, Shang Yang, Haotian Tang, Yao Fu, Song Han
Long Context Large Language Model Long Context LLM Long Range Context App to App Retrieval

October 5, 2024

LongGenBench: Long-context Generation Benchmark
Xiang Liu, Peijie Dong, Xuming Hu, Xiaowen Chu
Long Context Benchmark Long Range Context

September 19, 2024

MambaRecon: MRI Reconstruction with Structured State Space Models
Yilmaz Korkmaz, Vishal M. Patel
State Space Model Long Range Context Brain MRI

August 28, 2024

Dolphin: Long Context as a New Modality for Energy-Efficient On-Device Language Models
Wei Chen, Zhiyuan Li, Shuo Xin, Yihao Wang
Long Range Context Language Model Long Context Input Sequence

August 20, 2024

MagicDec: Breaking the Latency-Throughput Tradeoff for Long Context Generation with Speculative Decoding
Ranajoy Sadhukhan, Jian Chen, Zhuoming Chen, Vashisth Tiwari, Ruihang Lai, Jinyuan Shi, Ian En-Hsu Yen, Avner May, Tianqi Chen, Beidi Chen
Speculative Decoding Long Range Context