LLM Fine Tuning

Fine-tuning large language models (LLMs) adapts pre-trained models to specific tasks using smaller datasets, improving performance and efficiency compared to training from scratch. Current research emphasizes parameter-efficient methods like LoRA and techniques to mitigate issues such as catastrophic forgetting and training data imbalance, often employing optimization algorithms like DPO and SVRG, and exploring diverse model architectures including Mixture-of-Experts. This area is crucial for deploying LLMs in real-world applications, enabling customization for various domains while addressing resource constraints and safety concerns.

Papers

July 15, 2024

Learning Dynamics of LLM Finetuning
Yi Ren, Danica J. Sutherland
Large Language Model Instruction Tuning Learning Dynamic LLM Fine Tuning Deep Learning System

July 8, 2024

BoRA: Bayesian Hierarchical Low-Rank Adaption for Multi-task Large Language Models
Simen Eide, Arnoldo Frigessi
Multi Task Adaptation Concern Low Rank Adaptation LLM Fine Tuning Hierarchical Bayesian Model Global Normality

July 6, 2024

Code Less, Align More: Efficient LLM Fine-tuning for Code Generation with Data Pruning
Yun-Da Tsai, Mingjie Liu, Haoxing Ren
Large Language Model Code Generation Real World Code LLM Fine Tuning LD Align Synthetic Training Data Data Pruning Synthetic Instruction

July 1, 2024

June 28, 2024

LLM Critics Help Catch LLM Bugs
Nat McAleese, Rai Michael Pokorny, Juan Felipe Ceron Uribe, Evgenia Nitishinskaya, Maja Trebacz, Jan Leike
Human Feedback LLM Fine Tuning LLM Reasoning LLM Evaluation Critic Model Model Criticism

June 27, 2024

AutoPureData: Automated Filtering of Web Data for LLM Fine-tuning
Praneeth Vadlapati
Language Model Training Data Raw Data Artificial Intelligence Model LLM Fine Tuning Online Filtering

June 25, 2024

June 22, 2024

EDGE-LLM: Enabling Efficient Large Language Model Adaptation on Edge Devices via Layerwise Unified Compression and Adaptive Layer Tuning and Voting
Zhongzhi Yu, Zheng Wang, Yuhan Li, Haoran You, Ruijie Gao, Xiaoya Zhou, Sreenidhi Reedy Bommu, Yang Katie Zhao, Yingyan Celine Lin
Large Language Model Edge Device LLM Fine Tuning LLM Adaptation Layer Selection Edge Association

June 21, 2024

Inference Time Alignment with Reward-Guided Tree Search
Chia-Yu Hung, Navonil Majumder, Ambuj Mehrish, Soujanya Poria
Preference Optimization LLM Fine Tuning Reward Shaping Cognitive Heuristic Decoding Time

June 17, 2024

A Semantic-based Layer Freezing Approach to Efficient Fine-Tuning of Language Models
Jian Gu, Aldeida Aleti, Chunyang Chen, Hongyu Zhang
Language Model Fine Tuning LLM Inference LLM Fine Tuning Parameter Efficient Finetuning Layer Freezing

June 14, 2024

Practical offloading for fine-tuning LLM on commodity GPU via learned subspace projectors
Siyuan Chen, Zelong Guan, Yudong Liu, Phillip B. Gibbons
Large Language Model Medical LLM LLM Fine Tuning Task Offloading Efficient Sparse Offloading Robot Functionality Subspace Projection

June 13, 2024

MiLoRA: Harnessing Minor Singular Components for Parameter-Efficient LLM Finetuning
Hanqing Wang, Yixia Li, Shuo Wang, Guanhua Chen, Yun Chen
Large Language Model Fine Tuning Low Rank LLM Fine Tuning Deep Subspace Low Rank Matrix

June 7, 2024

May 30, 2024

Robo-Instruct: Simulator-Augmented Instruction Alignment For Finetuning CodeLLMs
Zichao Hu, Junyi Jessy Li, Arjun Guha, Joydeep Biswas
LLM Fine Tuning Robot Programming Graph Based Robotic Instruction Decomposer Robotic Interface

May 28, 2024

May 27, 2024

Safe LoRA: the Silver Lining of Reducing Safety Risks when Fine-tuning Large Language Models
Chia-Yi Hsu, Yu-Lin Tsai, Chih-Hsun Lin, Pin-Yu Chen, Chia-Mu Yu, Chun-Ying Huang
Large Language Model LLM Fine Tuning Safe LoRA LoRa Network Enhancing Safety

LLM Fine Tuning

Papers

Learning Dynamics of LLM Finetuning

BoRA: Bayesian Hierarchical Low-Rank Adaption for Multi-task Large Language Models

Code Less, Align More: Efficient LLM Fine-tuning for Code Generation with Data Pruning

Badllama 3: removing safety finetuning from Llama 3 in minutes

SplitLoRA: A Split Parameter-Efficient Fine-Tuning Framework for Large Language Models

LLM Critics Help Catch LLM Bugs

AutoPureData: Automated Filtering of Web Data for LLM Fine-tuning

PAFT: A Parallel Training Paradigm for Effective LLM Fine-Tuning

FedBiOT: LLM Local Fine-tuning in Federated Learning without Full Model

EDGE-LLM: Enabling Efficient Large Language Model Adaptation on Edge Devices via Layerwise Unified Compression and Adaptive Layer Tuning and Voting

Inference Time Alignment with Reward-Guided Tree Search

A Semantic-based Layer Freezing Approach to Efficient Fine-Tuning of Language Models

Practical offloading for fine-tuning LLM on commodity GPU via learned subspace projectors

MiLoRA: Harnessing Minor Singular Components for Parameter-Efficient LLM Finetuning

Through the Thicket: A Study of Number-Oriented LLMs derived from Random Forest Models

Key-Element-Informed sLLM Tuning for Document Summarization

Robo-Instruct: Simulator-Augmented Instruction Alignment For Finetuning CodeLLMs

OwLore: Outlier-weighed Layerwise Sampled Low-Rank Projection for Memory-Efficient LLM Fine-tuning

Pipette: Automatic Fine-grained Large Language Model Training Configurator for Real-World Clusters

Safe LoRA: the Silver Lining of Reducing Safety Risks when Fine-tuning Large Language Models