Preference Learning

Preference learning aims to align artificial intelligence models, particularly large language models, with human preferences by learning from human feedback on model outputs. Current research focuses on developing efficient algorithms, such as direct preference optimization and reinforcement learning from human feedback, often incorporating advanced model architectures like diffusion models and variational autoencoders to handle complex preference structures, including intransitivity. This field is crucial for building trustworthy and beneficial AI systems, improving their performance on various tasks and ensuring alignment with human values in diverse applications ranging from robotics to natural language processing.

Papers

June 29, 2024

Advancing Process Verification for Large Language Models via Tree-Based Preference Learning
Mingqian He, Yongliang Shen, Wenqi Zhang, Zeqi Tan, Weiming Lu
Preference Learning Reasoning Path Commonsense Reasoning Task Efficient Verification Tree Structure Reasoning schEmA

June 18, 2024

BPO: Staying Close to the Behavior LLM Creates Better Online LLM Alignment
Wenda Xu, Jiachen Li, William Yang Wang, Lei Li
Large Language Model Preference Optimization Preference Learning Service Provider Proximity Search LLM Behavior Offline Preference

June 17, 2024

A Survey on Human Preference Learning for Large Language Models
Ruili Jiang, Kehai Chen, Xuefeng Bai, Zhixuan He, Juntao Li, Muyun Yang, Tiejun Zhao, Liqiang Nie, Min Zhang
Timely Survey Preference Feedback Human Preference Preference Learning Alignment Objective

June 13, 2024

ContraSolver: Self-Alignment of Language Models by Resolving Internal Preference Contradictions
Xu Zhang, Xunjian Yin, Xiaojun Wan
Large Language Model Language Model Direct Preference Optimization Preference Learning Self Alignment

June 11, 2024

June 6, 2024

UltraMedical: Building Specialized Generalists in Biomedicine
Kaiyan Zhang, Sihang Zeng, Ermo Hua, Ning Ding, Zhang-Ren Chen, Zhiyuan Ma, Haoxin Li, Ganqu Cui, Biqing Qi, Xuekai Zhu, Xingtai Lv, Hu Jinfang, Zhiyuan Liu, Bowen Zhou
Reward Model Direct Preference Optimization Supervised Fine Tuning Preference Learning Biomedical Research Generalist Learner

May 29, 2024

Preference Learning Algorithms Do Not Learn Preference Rankings
Angelica Chen, Sadhika Malladi, Lily H. Zhang, Xinyi Chen, Qiuyi Zhang, Rajesh Ranganath, Kyunghyun Cho
Preference Learning Preference Datasets Preference Rating Preference Dataset Ranking Consistency

May 28, 2024

Getting More Juice Out of the SFT Data: Reward Learning from Human Demonstration Improves SFT for LLM Alignment
Jiaxiang Li, Siliang Zeng, Hoi-To Wai, Chenliang Li, Alfredo Garcia, Mingyi Hong
Reinforcement Learning Preference Learning Reward Learning Human Demonstration LLM Alignment

May 18, 2024

Double Correction Framework for Denoising Recommendation
Zhuangzhuang He, Yifan Wang, Yonghui Yang, Peijie Sun, Le Wu, Haoyue Bai, Jinqi Gong, Richang Hong, Min Zhang
Preference Learning Implicit Feedback Noisy Sample Recommendation Denoising

May 1, 2024

Self-Play Preference Optimization for Language Model Alignment
Yue Wu, Zhiqing Sun, Huizhuo Yuan, Kaixuan Ji, Yiming Yang, Quanquan Gu
Direct Preference Optimization Preference Learning Traditional Reinforcement Learning Language Model Alignment

April 15, 2024

Exploring Text-to-Motion Generation with Human Preference
Jenny Sheng, Matthieu Lin, Andrew Zhao, Kevin Pruvost, Yu-Hui Wen, Yangguang Li, Gao Huang, Yong-Jin Liu
Motion Information Human Preference Preference Learning Preference Pair Text to Motion Generation

April 12, 2024

April 9, 2024

Feel-Good Thompson Sampling for Contextual Dueling Bandits
Xuheng Li, Heyang Zhao, Quanquan Gu
Contextual Bandit Thompson Sampling Posterior Sampling Preference Learning Minimax Regret Dueling Bandit

March 28, 2024

Learning Human Preferences Over Robot Behavior as Soft Planning Constraints
Austin Narcomey, Nathan Tsoi, Ruta Desai, Marynel Vázquez
Preference Learning Robot Behavior Soft Constraint Adaptive Planning

March 27, 2024

Improving Attributed Text Generation of Large Language Models via Preference Learning
Dongfang Li, Zetian Sun, Baotian Hu, Zhenyu Liu, Xinshuo Hu, Xuebo Liu, Min Zhang
Large Language Model Text Generation Preference Learning Attribution Method Attribution Score Software Citation Attribution Analysis

March 25, 2024

Synapse: Learning Preferential Concepts from Visual Demonstrations
Sadanand Modak, Noah Patton, Isil Dillig, Joydeep Biswas
Neuro Symbolic Preference Learning Video Demonstration Neuro Symbolic Approach User Preference

March 22, 2024

Risk and Response in Large Language Models: Evaluating Key Threat Categories
Bahareh Harandizadeh, Abel Salinas, Fred Morstatter
Reward Model High Quality Risk Description Preference Learning Non Negative Textual Response Artificial Intelligence Safety

March 18, 2024

A tutorial on learning from preferences and choices with Gaussian Processes
Alessio Benavoli, Dario Azzimonti
Gaussian Process Preference Feedback Tutorial Review Preference Learning Value Laden Choice Decision Theory Preference Label Random Utility