Retrieval Augmentation

Retrieval augmentation enhances large language models (LLMs) by incorporating external knowledge sources to improve accuracy, address hallucinations, and handle long contexts. Current research focuses on optimizing retrieval methods (e.g., k-NN, dense retrieval), integrating retrieved information effectively into LLMs (e.g., through modality fusion), and developing frameworks for managing and utilizing this external knowledge (e.g., dynamic retrieval based on model confidence). This approach is proving valuable across diverse applications, including question answering, text summarization, code generation, and even medical diagnosis, by improving factual accuracy and mitigating the limitations of LLMs trained solely on parametric knowledge.

Papers

October 24, 2023

TCRA-LLM: Token Compression Retrieval Augmented Large Language Model for Inference Cost Reduction
Junyi Liu, Liangzhi Li, Tong Xiang, Bowen Wang, Yiming Qian
Large Language Model Retrieval Augmentation Inference Cost Commercial Large Language Model Semantic Compression Token Compression LLM RBMT

October 19, 2023

ReEval: Automatic Hallucination Evaluation for Retrieval-Augmented Large Language Models via Transferable Adversarial Attacks
Xiaodong Yu, Hao Cheng, Xiaodong Liu, Dan Roth, Jianfeng Gao
Large Language Model Adversarial Example Retrieval Augmentation Transferable Adversarial Attack Hallucination Evaluation

October 18, 2023

Understanding Retrieval Augmentation for Long-Form Question Answering
Hung-Ting Chen, Fangyuan Xu, Shane Arora, Eunsol Choi
Question Answering Retrieval Augmentation Retrieval Augmented Language Model Long Form Answer

October 10, 2023

Crossing the Threshold: Idiomatic Machine Translation through Retrieval Augmentation and Loss Weighting
Emmy Liu, Aditi Chaudhary, Graham Neubig
Retrieval Augmentation Machine Translation Model Machine Translation System Adaptive Loss Canonical Threshold Idiom Processing

October 8, 2023

Self-Knowledge Guided Retrieval Augmentation for Large Language Models
Yile Wang, Peng Li, Maosong Sun, Yang Liu
Large Language Model Retrieval Augmentation Retrieval Method

October 4, 2023

Retrieval meets Long Context Large Language Models
Peng Xu, Wei Ping, Xianchao Wu, Lawrence McAfee, Chen Zhu, Zihan Liu, Sandeep Subramanian, Evelina Bakhturina, Mohammad Shoeybi, Bryan Catanzaro
Large Language Model App to App Retrieval Retrieval Augmentation Long Context Large Language Model Long Range Context Retrieval Augmented LLM

October 2, 2023

August 28, 2023

MEMORY-VQ: Compression for Tractable Internet-Scale Memory
Yury Zemlyanskiy, Michiel de Jong, Luke Vilnis, Santiago Ontañón, William W. Cohen, Sumit Sanghai, Joshua Ainslie
Large Corpus Linear Compression Retrieval Augmentation Memory Augmented Unified Memory

August 18, 2023

Differentiable Retrieval Augmentation via Generative Language Modeling for E-commerce Query Intent Classification
Chenyu Zhao, Yunjiang Jiang, Yiming Qiu, Han Zhang, Wen-Yun Yang
NLP Task Generative Language Model Retrieval Augmentation Many Natural Language Processing Query Classification

August 8, 2023

Hybrid-RACA: Hybrid Retrieval-Augmented Composition Assistance for Real-time Text Prediction
Menglin Xia, Xuchao Zhang, Camille Couturier, Guoqing Zheng, Saravan Rajmohan, Victor Ruhle
Large Language Model Retrieval Augmented Generation Efficient Hybrid Retrieval Augmentation Memory Augmentation Algorithmic Composition

July 20, 2023

Investigating the Factual Knowledge Boundary of Large Language Models with Retrieval Augmentation
Ruiyang Ren, Yuhao Wang, Yingqi Qu, Wayne Xin Zhao, Jing Liu, Hao Tian, Hua Wu, Ji-Rong Wen, Haifeng Wang
Retrieval Augmentation Knowledge Intensive Task Knowledge Boundary

July 6, 2023

Improving Retrieval-Augmented Large Language Models via Data Importance Learning
Xiaozhong Lyu, Stefan Grafberger, Samantha Biegel, Shaopeng Wei, Meng Cao, Sebastian Schelter, Ce Zhang
Large Language Model Large Corpus Retrieval Augmented Retrieval Augmentation

May 28, 2023

Prompt-Guided Retrieval Augmentation for Non-Knowledge-Intensive Tasks
Zhicheng Guo, Sijie Cheng, Yile Wang, Peng Li, Yang Liu
Retrieval Augmented Task Specific Retrieval Augmentation Knowledge Intensive Task Relevance Modeling Task Specific Retriever

May 27, 2023

Augmentation-Adapted Retriever Improves Generalization of Language Models as Generic Plug-In
Zichun Yu, Chenyan Xiong, Shi Yu, Zhiyuan Liu
Language Model Strong Generalization Retrieval Augmentation Generic Plugin

May 26, 2023

Improving accuracy of GPT-3/4 results on biomedical data using a retrieval-augmented language model
David Soong, Sriram Sridhar, Han Si, Jan-Samuel Wagner, Ana Caroline Costa Sá, Christina Y Yu, Kubra Karagoz, Meijian Guan, Hisham Hamadeh, Brandon W Higgs
Large Language Model State of the Art GPT 4 Retrieval Augmentation Retrieval Augmented Language Model Diverse Corpus

May 25, 2023

Landmark Attention: Random-Access Infinite Context Length for Transformers
Amirkeivan Mohtashami, Martin Jaggi
Transformer Megatron Decepticons Retrieval Augmentation Long Term Memory Context Length Context Retrieval Landmark Attention

May 22, 2023

Retrieval Augmentation

Papers

TCRA-LLM: Token Compression Retrieval Augmented Large Language Model for Inference Cost Reduction

ReEval: Automatic Hallucination Evaluation for Retrieval-Augmented Large Language Models via Transferable Adversarial Attacks

Understanding Retrieval Augmentation for Long-Form Question Answering

Crossing the Threshold: Idiomatic Machine Translation through Retrieval Augmentation and Loss Weighting

Self-Knowledge Guided Retrieval Augmentation for Large Language Models

Retrieval meets Long Context Large Language Models

Making Retrieval-Augmented Language Models Robust to Irrelevant Context

RA-DIT: Retrieval-Augmented Dual Instruction Tuning

BTR: Binary Token Representations for Efficient Retrieval Augmented Language Models

MEMORY-VQ: Compression for Tractable Internet-Scale Memory

Differentiable Retrieval Augmentation via Generative Language Modeling for E-commerce Query Intent Classification

Hybrid-RACA: Hybrid Retrieval-Augmented Composition Assistance for Real-time Text Prediction

Investigating the Factual Knowledge Boundary of Large Language Models with Retrieval Augmentation

Improving Retrieval-Augmented Large Language Models via Data Importance Learning

Prompt-Guided Retrieval Augmentation for Non-Knowledge-Intensive Tasks

Augmentation-Adapted Retriever Improves Generalization of Language Models as Generic Plug-In

Improving accuracy of GPT-3/4 results on biomedical data using a retrieval-augmented language model

Landmark Attention: Random-Access Infinite Context Length for Transformers

Adaptive Chameleon or Stubborn Sloth: Revealing the Behavior of Large Language Models in Knowledge Conflicts

Retrieval-augmented Multi-label Text Classification