Preference Feedback

Preference feedback, the use of human-provided comparisons to guide machine learning model training and evaluation, aims to align AI systems with human values and preferences. Current research focuses on improving the efficiency and effectiveness of preference learning, exploring various model architectures like Bradley-Terry and regression models, Direct Preference Optimization (DPO), and generative judges, often incorporating response times and contextual information to enhance the richness of feedback. This field is crucial for mitigating biases and ensuring AI systems are safe, reliable, and beneficial, impacting diverse applications from language model alignment to personalized recommendations and robot navigation.

Papers

October 24, 2024

Inference time LLM alignment in single and multidomain preference spectrum
Sadat Shahriar, Zheng Qi, Nikolaos Pappas, Srikanth Doss, Monica Sunkara, Kishaloy Halder, Manuel Mager, Yassine Benajiba
Preference Feedback Preference Alignment Alignment Approach Large Language Model Alignment Time to Spectrum Alignment Algorithm Aligned Model

October 23, 2024

Optimizing Travel Itineraries with AI Algorithms in a Microservices Architecture: Balancing Cost, Time, Preferences, and Sustainability
Biman Barua, M. Shamim Kaiser
Preference Feedback Artificial Intelligence Algorithm Microservice Architecture Travel Planning Balancing Market

October 20, 2024

Mitigating Forgetting in LLM Supervised Fine-Tuning and Preference Learning
Heshan Fernando, Han Shen, Parikshit Ram, Yi Zhou, Horst Samulowitz, Nathalie Baracaldo, Tianyi Chen
LeArning Abstract Anti Forgetting Preference Feedback Preference Learning LLM Fine Tuning Sequential Learning

October 14, 2024

October 11, 2024

October 8, 2024

PREDICT: Preference Reasoning by Evaluating Decomposed preferences Inferred from Candidate Trajectories
Stephane Aroca-Ouellette, Natalie Mackraz, Barry-John Theobald, Katherine Metcalf
Preference Feedback Human Preference Handwritten Trajectory Persian Natural Language Processing Preference Inference Preference Specification

October 7, 2024

DOPL: Direct Online Preference Learning for Restless Bandits with Preference Feedback
Guojun Xiong, Ujwal Dinesha, Debajoy Mukherjee, Jian Li, Srinivas Shakkottai
Multi Armed Bandit Preference Feedback Sequential Decision Sublinear Regret Preference Learning Restless Bandit

October 5, 2024

Reward Learning From Preference With Ties
Jinsong Liu, Dongdong Ge, Ruihao Zhu
Preference Feedback Reward Learning Preference Rating Synthetic Preference Preference Modeling Tie KD Preference Based

October 4, 2024

Can Language Models Reason about Individualistic Human Values and Preferences?
Liwei Jiang, Taylor Sorensen, Sydney Levine, Yejin Choi
Preference Feedback Human Value Personalized Alignment

October 2, 2024

HelpSteer2-Preference: Complementing Ratings with Preferences
Zhilin Wang, Alexander Bukharin, Olivier Delalleau, Daniel Egert, Gerald Shen, Jiaqi Zeng, Oleksii Kuchaiev, Yi Dong
Reward Model Preference Feedback Human Rating Regression via Classification

October 1, 2024

Beyond Scalar Reward Model: Learning Generative Judge from Preference Data
Ziyi Ye, Xiangsheng Li, Qiuchi Li, Qingyao Ai, Yujia Zhou, Wei Shen, Dong Yan, Yiqun Liu
Direct Preference Optimization Preference Feedback Preference Pair Fine Tuned Judge Model Self Contrastive Scalar Reward

September 18, 2024

Decoding Style: Efficient Fine-Tuning of LLMs for Image-Guided Outfit Recommendation with Preference
Najmeh Forouzandehmehr, Nima Farrokhsiar, Ramin Giahi, Evren Korpeoglu, Kannan Achan
Large Language Model Preference Feedback Fashion Image Outfit Completion Fashion Recommendation Outfit Generation

September 16, 2024

Aligning Robot Navigation Behaviors with Human Intentions and Preferences
Haresh Karnan
Autonomous Navigation Robot Navigation Preference Feedback Human Intention Navigation Behavior

September 15, 2024

Generalizing Alignment Paradigm of Text-to-Image Generation with Preferences through $f$-divergence Minimization
Haoyuan Sun, Bo Xia, Yongzhe Chang, Xueqian Wang
Text to Image Generation Direct Preference Optimization Preference Feedback Kullback Leibler Divergence Divergence Regularization

September 9, 2024

Enhancing Preference-based Linear Bandits via Human Response Time
Shen Li, Yuyang Zhang, Zhaolin Ren, Claire Liang, Na Li, Julie A. Shah
Preference Feedback Linear Bandit Preference Rating Response Time

September 7, 2024

Centralized Selection with Preferences in the Presence of Biases
L. Elisa Celis, Amit Kumar, Nisheeth K. Vishnoi, Andrew Xu
Speech Presence Preference Feedback Group Fairness Task Utility Topic Bias Distributional Assumption Utility Assessment

September 4, 2024

AlignGroup: Learning and Aligning Group Consensus with Member Preferences for Group Recommendation
Jinfeng Xu, Zheyu Chen, Jinze Li, Shuo Yang, Hewei Wang, Edith C.-H. Ngai
LeArning Abstract Fine Grained Preference Feedback LD Align Group Consensus Specific Preference Group Recommendation

August 19, 2024

CLIP-DPO: Vision-Language Models as a Source of Preference for Fixing Hallucinations in LVLMs
Yassine Ouali, Adrian Bulat, Brais Martinez, Georgios Tzimiropoulos
Vision Language Model Large Vision Language Model Preference Feedback Mitigating Hallucination LLM Hallucination Pre Trained Vision Reducing Hallucination U CLIP Update