LLM dCache

LLM-dCache focuses on optimizing the efficiency of large language models (LLMs) when interacting with external data sources, particularly in scenarios involving numerous API calls and large datasets. Current research emphasizes techniques like prompt engineering to enable LLMs to autonomously manage data caching, thereby reducing computational overhead and improving response times. This work is significant because it addresses a critical scalability bottleneck for LLMs, paving the way for more efficient and practical applications in areas such as personalized recommendations, named entity recognition, and robotic task planning.

Papers

December 6, 2024

Ltri-LLM: Streaming Long Context Inference for LLMs with Training-Free Dynamic Triangular Attention Pattern
Hongyin Tang, Di Xiu, Lanrui Wang, Xiurui Geng, Jingang Wang, Xunliang Cai
Large Language Model Long Context Sparse Attention Text Benchmark Streaming Inference LLM dCache

September 26, 2024

AER-LLM: Ambiguity-aware Emotion Recognition Leveraging Large Language Models
Xin Hong, Yuan Gong, Vidhyasaharan Sethu, Ting Dang
Discrete Emotion Empathetic AI LLM dCache

September 16, 2024

LLM-DER:A Named Entity Recognition Method Based on Large Language Models for Chinese Coal Chemical Domain
Le Xiao, Yunfei Xu, Jing Zhao
Entity Recognition Named Entity Recognition Chemical Domain LLM dCache

June 10, 2024

LLM-dCache: Improving Tool-Augmented LLMs with GPT-Driven Localized Data Caching
Simranjit Singh, Michael Fore, Andreas Karatzas, Chaehong Lee, Yanan Jian, Longfei Shangguan, Fuxun Yu, Iraklis Anagnostopoulos, Dimitrios Stamoulis
Large Language Model Caching Strategy Function Calling LLM dCache

May 9, 2024

LLMC: Benchmarking Large Language Model Quantization with a Versatile Compression Toolkit
Ruihao Gong, Yang Yong, Shiqiao Gu, Yushi Huang, Chengtao Lv, Yunchen Zhang, Xianglong Liu, Dacheng Tao
Large Language Model New Benchmark Post Training Quantization Best Practice Quantization Technique LLM dCache

July 24, 2023

LLM-Rec: Personalized Recommendation via Prompting Large Language Models
Hanjia Lyu, Song Jiang, Hanqing Zeng, Yinglong Xia, Qifan Wang, Si Zhang, Ren Chen, Christopher Leung, Jiajie Tang, Jiebo Luo
Personalized Recommendation Recommendation Quality Text Aware LLM dCache

May 5, 2023

LLM-RM at SemEval-2023 Task 2: Multilingual Complex NER using XLM-RoBERTa
Rahul Mehta, Vasudeva Varma
Named Entity Recognition SemEval 2022 Task Multilingual Scenario Cross Lingual Representation Cross Lingual NER LLM dCache XLM RoBERTa

March 10, 2023

Task and Motion Planning with Large Language Models for Object Rearrangement
Yan Ding, Xiaohan Zhang, Chris Paxton, Shiqi Zhang
Motion Planning Related Task Commonsense Reasoning Object Rearrangement Natural Language Command Multi Object Rearrangement LLM dCache