Instruction Fine Tuning

Instruction fine-tuning (IFT) adapts pre-trained large language models (LLMs) to follow instructions more effectively, enhancing their performance on diverse downstream tasks. Current research focuses on improving the robustness and safety of IFT, addressing issues like data contamination and security vulnerabilities, while also exploring efficient methods like parameter-efficient fine-tuning and data selection strategies to reduce computational costs. This area is significant because it enables the development of more reliable and versatile LLMs for various applications, ranging from code generation and medical diagnosis to robotics and product information processing, while simultaneously mitigating potential risks associated with their deployment.

Papers

June 27, 2024

Alignment For Performance Improvement in Conversation Bots
Raghav Garg, Kapil Sharma, Shrey Singla
Alignment Problem Conversational Agent Performance Improvement Instruction Fine Tuning Alignment Approach Conversational Chatbots

June 11, 2024

CoEvol: Constructing Better Responses for Instruction Finetuning through Multi-Agent Cooperation
Renhao Li, Minghuan Tan, Derek F. Wong, Min Yang
Human Instruction Instruction Following Instruction Fine Tuning Multi Agent Cooperation Multi Agent Debate Response Quality

June 1, 2024

Phased Instruction Fine-Tuning for Large Language Models
Wei Pang, Chuan Zhou, Xiao-Hua Zhou, Xiaojie Wang
Pre Trained Language Model Instruction Following Instruction Data Instruction Fine Tuning

May 30, 2024

April 23, 2024

SHED: Shapley-Based Automated Dataset Refinement for Instruction Fine-Tuning
Yexiao He, Ziyao Wang, Zheyu Shen, Guoheng Sun, Yucong Dai, Yongkai Wu, Hongyi Wang, Ang Li
Pre Trained Large Language Model Instruction Fine Tuning Dataset Refinement

April 18, 2024

OpenBezoar: Small, Cost-Effective and Open Models Trained on Mixes of Instruction Data
Chandeepa Dissanayake, Lahiru Lowe, Sachith Gunasekara, Yasiru Ratnayake
Fine Tuning Instruction Data Instruction Fine Tuning Cost Effective Fine Tuned LLM Synthetic Instruction Open Model

February 28, 2024

Learning or Self-aligning? Rethinking Instruction Fine-tuning
Mengjie Ren, Boxi Cao, Hongyu Lin, Cao Liu, Xianpei Han, Ke Zeng, Guanglu Wan, Xunliang Cai, Le Sun
Large Language Model LeArning Abstract Instruction Fine Tuning Self Alignment

February 12, 2024

Grounding Data Science Code Generation with Input-Output Specifications
Yeming Wen, Pengcheng Yin, Kensen Shi, Henryk Michalewski, Swarat Chaudhuri, Alex Polozov
Large Language Model Code Generation Instruction Fine Tuning Execution Based Input Output Data Programming Data Science Code Generation

February 8, 2024

Exploring Learning Complexity for Efficient Downstream Dataset Pruning
Wenyu Jiang, Zhenlong Liu, Zejian Xie, Songxin Zhang, Bingyi Jing, Hongxin Wei
Neural Network Fine Tuning Instruction Fine Tuning Learning Complexity

February 7, 2024

Long Is More for Alignment: A Simple but Tough-to-Beat Baseline for Instruction Fine-Tuning
Hao Zhao, Maksym Andriushchenko, Francesco Croce, Nicolas Flammarion
Fine Tuning Alignment Problem Long Span LLM Benchmark Instruction Fine Tuning Fine Tuned LLM New Baseline

January 31, 2024

LongAlign: A Recipe for Long Context Alignment of Large Language Models
Yushi Bai, Xin Lv, Jiajie Zhang, Yuze He, Ji Qi, Lei Hou, Jie Tang, Yuxiao Dong, Juanzi Li
Large Language Model Long Context Instruction Following Complete Recipe Instruction Fine Tuning Long Context Task

January 24, 2024

Instruction Fine-Tuning: Does Prompt Loss Matter?
Mathew Huerta-Enochian, Seung Yong Ko
Instruction Fine Tuning Generation Benchmark

January 15, 2024

Your Instructions Are Not Always Helpful: Assessing the Efficacy of Instruction Fine-tuning for Software Vulnerability Detection
Imam Nur Bani Yusuf, Lingxiao Jiang
Deep Learning Human Instruction Instruction Fine Tuning Inherent Vulnerability

December 22, 2023

Aurora:Activating Chinese chat capability for Mixtral-8x7B sparse Mixture-of-Experts through Instruction-Tuning
Rongsheng Wang, Haoming Chen, Ruizhe Zhou, Yaofei Duan, Kunyan Cai, Han Ma, Jiaxi Cui, Jian Li, Patrick Cheong-Iao Pang, Yapeng Wang, Tao Tan
Instruction Following Instruction Fine Tuning Sparse Mixture of Expert Sparse Expert

December 9, 2023

PILLOW: Enhancing Efficient Instruction Fine-tuning via Prompt Matching
Zhenting Qi, Xiaoyu Tan, Shaojie Shi, Chao Qu, Yinghui Xu, Yuan Qi
Instruction Fine Tuning Prompting Based Structured Prompt BED Turnaround Time Prompt Pool

October 21, 2023

Revisiting Instruction Fine-tuned Model Evaluation to Guide Industrial Applications
Manuel Faysse, Gautier Viaud, Céline Hudelot, Pierre Colombo
Zero Shot Instruction Tuned Model Instruction Fine Tuning Industrial Application Task Specialization LLM Based Metric

September 6, 2023

GRASS: Unified Generation Model for Speech-to-Semantic Tasks
Aobo Xia, Shuyu Lei, Yushu Yang, Xiang Guo, Hua Chai
Instruction Fine Tuning Instruction Dataset Generation Model Grass Growth Non Semantic Speech Task

August 28, 2023

Evaluating the Robustness to Instructions of Large Language Models
Yuansheng Ni, Sichao Jiang, Xinyu wu, Hui Shen, Yuli Zhou
Native Robustness Human Instruction Instruction Fine Tuning Instruction Tuned Large Language Model Task Instruction

June 20, 2023

Evaluating the Zero-shot Robustness of Instruction-tuned Language Models
Jiuding Sun, Chantal Shaib, Byron C. Wallace
Instruction Tuned Model Instruction Fine Tuning Instruction Tuned Language Model Zero Shot Adversarial Robustness Instruction Phrasing