Memory Efficient Fine Tuning

Memory-efficient fine-tuning focuses on adapting large pre-trained language and vision models to specific downstream tasks while minimizing the computational resources and memory required. Current research emphasizes techniques like low-rank adaptation (LoRA), quantization (e.g., 2-bit, 4-bit), and selective parameter updates (e.g., freezing layers, using adapters), often combined with strategies like reversible networks or approximate backpropagation. These advancements are crucial for deploying large models on resource-constrained devices and making advanced AI accessible to a wider range of users and applications, reducing both the financial and environmental costs of training and inference.

Papers

May 24, 2023

May 23, 2023

Memory-Efficient Fine-Tuning of Compressed Large Language Models via sub-4-bit Integer Quantization
Jeonghoon Kim, Jung Hyun Lee, Sungdong Kim, Joonsuk Park, Kang Min Yoo, Se Jung Kwon, Dongsoo Lee
Large Language Model Parameter Efficient Fine Tuning Memory Efficient Fine Tuning

May 22, 2023

EMEF: Ensemble Multi-Exposure Image Fusion
Renshuai Liu, Chengyang Li, Haitao Cao, Yinglin Zheng, Ming Zeng, Xuan Cheng
Memory Efficient Fine Tuning Multi Exposure Image Fusion Robust Fusion

May 8, 2023

CrAFT: Compression-Aware Fine-Tuning for Efficient Visual Task Adaptation
Jung Hwan Heo, Seyedarmin Azizi, Arash Fayyazi, Massoud Pedram
Fine Tuning Transfer Learning Task Adaptation Memory Efficient Fine Tuning Traditional CrAFT Visual Adaptation

May 2, 2023

Distill or Annotate? Cost-Efficient Fine-Tuning of Compact Models
Junmo Kang, Wei Xu, Alan Ritter
Knowledge Distillation Large Model Inference Cost Manual Annotation Memory Efficient Fine Tuning Compact Model Annotation Cost

March 5, 2022

Unfreeze with Care: Space-Efficient Fine-Tuning of Semantic Parsing Models
Weiqi Sun, Haidar Khan, Nicolas Guenon des Mesnards, Melanie Rubino, Konstantine Arkoudas
Language Model NLP Task Semantic Parsing CaRE SD Memory Efficient Fine Tuning