Instruction Finetuning

Instruction finetuning enhances large language models (LLMs) by training them on diverse instruction-following datasets, improving their ability to perform a wider range of tasks and generalize to unseen prompts. Current research focuses on optimizing this process through techniques like coreset selection to reduce computational costs, developing methods for selecting high-quality and diverse instruction data, and exploring personalized and federated approaches for collaborative model training. This technique significantly improves LLMs' performance across various domains, from scientific research (e.g., materials science, biomedical relation extraction) to practical applications like automated leaderboard generation and sentiment analysis, ultimately advancing both the capabilities and accessibility of LLMs.

Papers

October 14, 2024

Context-Parametric Inversion: Why Instruction Finetuning May Not Actually Improve Context Reliance
Sachin Goyal, Christina Baek, J. Zico Kolter, Aditi Raghunathan
Instruction Tuning Context Dependent Instruction Finetuning Latent Inversion

October 7, 2024

On Instruction-Finetuning Neural Machine Translation Models
Vikas Raunak, Roman Grundkiewicz, Marcin Junczys-Dowmunt
Neural Machine Translation Neural Machine Translation Model Instruction Finetuning

August 19, 2024

Instruction Finetuning for Leaderboard Generation from Empirical AI Research
Salomon Kabongo, Jennifer D'Souza
Artificial Intelligence Research Generative LLM Instruction Finetuning

August 7, 2024

In2Core: Leveraging Influence Functions for Coreset Selection in Instruction Finetuning of Large Language Models
Ayrton San Joaquin, Bin Wang, Zhengyuan Liu, Nicholas Asher, Brian Lim, Philippe Muller, Nancy F. Chen
Fine Tuning Many Parameter Model Generalization Influence Function Instruction Finetuning

June 17, 2024

Generative Visual Instruction Tuning
Jefferson Hernandez, Ruben Villegas, Vicente Ordonez
Instruction Tuning Large Multimodal Model Instruction Following High Quality Instruction Data Instruction Finetuning

May 21, 2024

G-DIG: Towards Gradient-based Diverse and High-quality Instruction Data Selection for Machine Translation
Xingyuan Pan, Luyang Huang, Liyan Kang, Zhicheng Liu, Yu Lu, Shanbo Cheng
Training Data Machine Translation Diverse Set Instruction Finetuning Context Aware Instruction Instruction Data Selection

February 26, 2024

Personalized Federated Instruction Tuning via Neural Architecture Search
Pengyu Zhang, Yingbo Zhou, Ming Hu, Junxian Feng, Jiawen Weng, Mingsong Chen
Neural Architecture Search Instruction Tuned Model Instruction Finetuning Federated Instruction Tuning

February 21, 2024

How Important is Domain Specificity in Language Models and Instruction Finetuning for Biomedical Relation Extraction?
Aviv Brokman, Ramakanth Kavuluru
Language Model Biomedical Relation Extraction Biomedical NLP Task Instruction Finetuning Domain Specificity

October 20, 2023

Enhancing Zero-Shot Crypto Sentiment with Fine-tuned Language Model and Prompt Engineering
Rahman S M Wahidur, Ishmam Tashdeed, Manjit Kaur, Heung-No-Lee
Sentiment Analysis Instruction Tuning Prompt Engineering Fine Tuned Language Model Instruction Finetuning

October 12, 2023

HoneyBee: Progressive Instruction Finetuning of Large Language Models for Materials Science
Yu Song, Santiago Miret, Huan Zhang, Bang Liu
Large Language Model Language Model NLP Field Material SCIence Material Science Natural Language Processing Benchmark Instruction Finetuning

July 3, 2023

SCITUNE: Aligning Large Language Models with Scientific Multimodal Instructions
Sameera Horawalavithana, Sai Munikoti, Ian Stewart, Henry Kvinge
Large Language Model Large Multimodal Model Multimodal Instruction Instruction Finetuning

May 22, 2023

GPT-SW3: An Autoregressive Language Model for the Nordic Languages
Ariel Ekgren, Amaru Cuba Gyllensten, Felix Stollenwerk, Joey Öhman, Tim Isbister, Evangelia Gogoulou, Fredrik Carlsson, Alice Heiman, Judit Casademont, Magnus Sahlgren
Autoregressive Language Model GPT 3 Large Generative Model Instruction Finetuning

October 20, 2022

Scaling Instruction-Finetuned Language Models
Hyung Won Chung, Le Hou, Shayne Longpre, Barret Zoph, Yi Tay, William Fedus, Yunxuan Li, Xuezhi Wang, Mostafa Dehghani, Siddhartha Brahma, Albert Webson, Shixiang Shane Gu, Zhuyun Dai, Mirac Suzgun, Xinyun Chen, Aakanksha Chowdhery, Alex Castro-Ros, Marie Pellat, Kevin Robinson, Dasha Valter, Sharan Narang, Gaurav Mishra, Adams Yu, Vincent Zhao, Yanping Huang, Andrew Dai, Hongkun Yu, Slav Petrov, Ed H. Chi, Jeff Dean, Jacob Devlin, Adam Roberts, Denny Zhou, Quoc V. Le, Jason Wei
Language Model Pretrained Language Model Model Performance Multiplicative Size Scaling Instruction Finetuning