Preference Alignment

October 9, 2024

Preference Fine-Tuning for Factuality in Chest X-Ray Interpretation Models Without Human Feedback
Dennis Hein, Zhihong Chen, Sophie Ostmeier, Justin Xu, Maya Varma, Eduardo Pontes Reis, Arne Edward Michalson, Christian Bluethgen, Hyun Joo Shin, Curtis Langlotz, Akshay S Chaudhari
Vision Language Model Medical Image Human Feedback Factual Claim Preference Alignment Preference Fine Tuning
Uncovering Factor Level Preferences to Improve Human-Model Alignment
Juhyun Oh, Eunsu Kim, Jiseon Kim, Wenda Xu, Inha Cha, William Yang Wang, Alice Oh
Large Language Model Preference Alignment Model Alignment

October 8, 2024

Training-free Diffusion Model Alignment with Sampling Demons
Po-Hung Yeh, Kuang-Huei Lee, Jun-Cheng Chen
Diffusion Model Text to Image Generation Visual Language Model Preference Alignment Differentiable Reward Diffusion Alignment

October 7, 2024

SparsePO: Controlling Preference Alignment of LLMs via Sparse Token Masks
Fenia Christopoulou, Ronald Cardenas, Gerasimos Lampouras, Haitham Bou-Ammar, Jun Wang
Language Model Medical LLM Sentiment Polarity Preference Optimization Preference Alignment Sparse Mask Offline Preference

October 6, 2024

TIS-DPO: Token-level Importance Sampling for Direct Preference Optimization With Estimated Weights
Aiwei Liu, Haoping Bai, Zhiyun Lu, Yanchao Sun, Xiang Kong, Simon Wang, Jiulong Shan, Albin Madappally Jose, Xiaojiang Liu, Lijie Wen, Philip S. Yu, Meng Cao
Direct Preference Optimization Importance Sampling Preference Alignment Weight Estimation Token Importance

October 1, 2024

FlipGuard: Defending Preference Alignment against Update Regression with Constrained Optimization
Mingye Zhu, Yi Liu, Quan Wang, Junbo Guo, Zhendong Mao
Constrained Optimization Regression Task Preference Alignment Alignment Approach

September 30, 2024

Is Preference Alignment Always the Best Option to Enhance LLM-Based Translation? An Empirical Analysis
Hippolyte Gisserot-Boukhlef, Ricardo Rei, Emmanuel Malherbe, Céline Hudelot, Pierre Colombo, Nuno M. Guerreiro
Machine Translation View Translation Translation Quality Empirical Analysis Preference Alignment Continuous Option Contrastive Preference

September 26, 2024

September 19, 2024

Preference Alignment Improves Language Model-Based TTS
Jinchuan Tian, Chunlei Zhang, Jiatong Shi, Hao Zhang, Jianwei Yu, Shinji Watanabe, Dong Yu
Human Language Direct Preference Optimization Text to Speech Model Preference Alignment

September 18, 2024

Systematic Characterization of the Effectiveness of Alignment in Large Language Models for Categorical Decisions
Isaac Kohane
Decision Making Alignment Problem Preference Alignment Alignment Approach Alignment Objective Quantitative Characterization Binary Decision

September 4, 2024

Towards a Unified View of Preference Learning for Large Language Models: A Survey
Bofei Gao, Feifan Song, Yibo Miao, Zefan Cai, Zhe Yang, Liang Chen, Helan Hu, Runxin Xu, Qingxiu Dong, Ce Zheng, Shanghaoran Quan, Wen Xiao, Ge Zhang, Daoguang Zan, Keming Lu, Bowen Yu, Dayiheng Liu, Zeyu Cui, Jian Yang, Lei Sha, Houfeng Wang, Zhifang Sui, Peiyi Wang, Tianyu Liu, Baobao Chang
Timely Survey Preference Learning Unified View Preference Alignment Alignment Approach Alignment Algorithm

August 12, 2024

Med42-v2: A Suite of Clinical LLMs
Clément Christophe, Praveen K Kanithi, Tathagata Raha, Shadab Khan, Marco AF Pimentel
Large Language Model Preference Alignment Software Suite Generic Model

August 2, 2024

Mission Impossible: A Statistical Perspective on Jailbreaking LLMs
Jingtong Su, Julia Kempe, Karen Ullrich
Large Language Model Training Corpus Preference Alignment Optimal Alignment

July 3, 2024

Improving Conversational Abilities of Quantized Large Language Models via Direct Preference Alignment
Janghwan Lee, Seongmin Park, Sukjin Hong, Minsoo Kim, Du-Seong Chang, Jungwook Choi
Large Language Model Direct Preference Optimization Preference Alignment Instruction Tuned Large Language Model Conversational Large Language Model Conversational Capability Conversational Chatbots

July 2, 2024

June 26, 2024

Understand What LLM Needs: Dual Preference Alignment for Retrieval-Augmented Generation
Guanting Dong, Yutao Zhu, Chenghao Zhang, Zechen Wang, Zhicheng Dou, Ji-Rong Wen
Medical LLM Retrieval Augmented Generation Human Understanding Preference Alignment Query Augmentation

June 25, 2024

Papers

Preference Fine-Tuning for Factuality in Chest X-Ray Interpretation Models Without Human Feedback

Uncovering Factor Level Preferences to Improve Human-Model Alignment

Training-free Diffusion Model Alignment with Sampling Demons

SparsePO: Controlling Preference Alignment of LLMs via Sparse Token Masks

TIS-DPO: Token-level Importance Sampling for Direct Preference Optimization With Estimated Weights

FlipGuard: Defending Preference Alignment against Update Regression with Constrained Optimization

Is Preference Alignment Always the Best Option to Enhance LLM-Based Translation? An Empirical Analysis

Cross-lingual Human-Preference Alignment for Neural Machine Translation with Direct Quality Optimization

Modulated Intervention Preference Optimization (MIPO): Keey the Easy, Refine the Difficult

Preference Alignment Improves Language Model-Based TTS

Systematic Characterization of the Effectiveness of Alignment in Large Language Models for Categorical Decisions

Towards a Unified View of Preference Learning for Large Language Models: A Survey

Med42-v2: A Suite of Clinical LLMs

Mission Impossible: A Statistical Perspective on Jailbreaking LLMs

Improving Conversational Abilities of Quantized Large Language Models via Direct Preference Alignment

Understanding Alignment in Multimodal LLMs: A Comprehensive Study

RLHF Can Speak Many Languages: Unlocking Multilingual Preference Optimization for LLMs

Understand What LLM Needs: Dual Preference Alignment for Retrieval-Augmented Generation

PAFT: A Parallel Training Paradigm for Effective LLM Fine-Tuning

Aligning Diffusion Models with Noise-Conditioned Perception