Preference Feedback

Preference feedback, the use of human-provided comparisons to guide machine learning model training and evaluation, aims to align AI systems with human values and preferences. Current research focuses on improving the efficiency and effectiveness of preference learning, exploring various model architectures like Bradley-Terry and regression models, Direct Preference Optimization (DPO), and generative judges, often incorporating response times and contextual information to enhance the richness of feedback. This field is crucial for mitigating biases and ensuring AI systems are safe, reliable, and beneficial, impacting diverse applications from language model alignment to personalized recommendations and robot navigation.

Papers

May 27, 2024

Prompt Optimization with Human Feedback
Xiaoqiang Lin, Zhongxiang Dai, Arun Verma, See-Kiong Ng, Patrick Jaillet, Bryan Kian Hsiang Low
Large Language Model Human Feedback Preference Feedback Prompt Optimization

May 25, 2024

Retrieval-Augmented Conversational Recommendation with Prompt-based Semi-Structured Natural Language State Tracking
Sara Kemper, Justin Cui, Kai Dicarlantonio, Kathy Lin, Danjie Tang, Anton Korikov, Scott Sanner
Large Language Model Preference Feedback Dialogue State Tracking Conversational Recommendation Dialogue State Conversational Recommender System Preference Understanding

May 24, 2024

Belief-State Query Policies for Planning With Preferences Under Partial Observability
Daniel Bramblett, Siddharth Srivastava
Markov Decision Process Preference Feedback Belief State Partial Observability GPT 4v

May 23, 2024

Multi-turn Reinforcement Learning from Preference Human Feedback
Lior Shani, Aviv Rosenberg, Asaf Cassel, Oran Lang, Daniele Calandriello, Avital Zipori, Hila Noga, Orgad Keller, Bilal Piot, Idan Szpektor, Avinatan Hassidim, Yossi Matias, Rémi Munos
Reinforcement Learning Deep Reinforcement Learning Preference Feedback Multi Turn Conversation

May 15, 2024

Word Alignment as Preference for Machine Translation
Qiyu Wu, Masaaki Nagata, Zhongtao Miao, Yoshimasa Tsuruoka
Large Language Model Machine Translation Preference Feedback Word Alignment

May 4, 2024

The Role of AI in Peer Support for Young People: A Study of Preferences for Human- and AI-Generated Responses
Jordyn Young, Laala M Jawara, Diep N Nguyen, Brian Daly, Jina Huh-Yoo, Afsaneh Razi
Artificial Intelligence Generative Artificial Intelligence Preference Feedback Non Negative Textual Response Social Support

May 2, 2024

Bayesian Optimization with LLM-Based Acquisition Functions for Natural Language Preference Elicitation
David Eric Austin, Anton Korikov, Armin Toroghi, Scott Sanner
Bayesian Optimization Preference Feedback Conversational Recommendation Acquisition Function Preference Elicitation Preference Inference

April 4, 2024

Direct Nash Optimization: Teaching Language Models to Self-Improve with General Preferences
Corby Rosset, Ching-An Cheng, Arindam Mitra, Michael Santacroce, Ahmed Awadallah, Tengyang Xie
Language Model Reinforcement Learning Nash Equilibrium Preference Feedback Reward Learning Reward Maximization

March 29, 2024

Using LLMs to Model the Beliefs and Preferences of Targeted Populations
Keiichi Namikoshi, Alex Filipowicz, David A. Shamma, Rumen Iliev, Candice L. Hogan, Nikos Arechiga
Large Language Model Medical LLM Model Performance Preference Feedback Belief State Target Population Population Data

March 22, 2024

DP-Dueling: Learning from Preference Feedback without Compromising User Privacy
Aadirupa Saha, Hilal Asi
Differential Privacy Preference Feedback Bandit Algorithm Simple Regret Near Optimal Privacy Breach

March 21, 2024

An Analysis of the Preferences of Distribution Indicators in Evolutionary Multi-Objective Optimization
Jesús Guillermo Falcón-Cardona, Mahboubeh Nezhadmoghaddam, Emilio Bernal-Zubieta
General Analysis Multi Objective Optimization Preference Feedback Multi Objective Evolutionary Algorithm Distributional Assumption Vector Valued Pareto Frontier Preference Prediction

March 18, 2024

A tutorial on learning from preferences and choices with Gaussian Processes
Alessio Benavoli, Dario Azzimonti
Gaussian Process Preference Feedback Tutorial Review Preference Learning Value Laden Choice Decision Theory Random Utility Preference Label

March 1, 2024

Provably Robust DPO: Aligning Language Models with Noisy Feedback
Sayak Ray Chowdhury, Anush Kini, Nagarajan Natarajan
Language Model Direct Preference Optimization Preference Feedback Preference Change Noisy Feedback Noisy Preference Robust Preference

February 29, 2024

Stop Relying on No-Choice and Do not Repeat the Moves: Optimal, Efficient and Practical Algorithms for Assortment Optimization
Aadirupa Saha, Pierre Gaillard
High Efficiency Practical Algorithm Preference Feedback Regret Minimization Value Laden Choice Utility Maximization Assortment Optimization

February 23, 2024

PREDILECT: Preferences Delineated with Zero-Shot Language-based Reasoning in Reinforcement Learning
Simon Holk, Daniel Marta, Iolanda Leite
Reinforcement Learning Robot Learning Preference Feedback Robot Behavior Social Navigation Natural Language Reasoning

February 22, 2024

February 19, 2024

Ask Optimal Questions: Aligning Large Language Models with Retriever's Preference in Conversational Search
Chanwoong Yoon, Gangwoo Kim, Byeongguk Jeon, Sungdong Kim, Yohan Jo, Jaewoo Kang
Preference Feedback Retrieval Performance Conversational Search Efficient Retrieval Hybrid Retriever Conversational Search Benchmark Query Rewrite

February 13, 2024

A Dense Reward View on Aligning Text-to-Image Diffusion with Preference
Shentao Yang, Tianqi Chen, Mingyuan Zhou
Text to Image Diffusion Model Preference Feedback Preference Alignment Text to Image Diffusion Dense Reward

February 8, 2024

Principled Preferential Bayesian Optimization
Wenjie Xu, Wenbin Wang, Yuning Jiang, Bratislav Svetozarevic, Colin N. Jones
Regret Bound Preference Feedback Optimistic Algorithm Preferential Bayesian Optimization

Preference Feedback

Papers

Prompt Optimization with Human Feedback

Retrieval-Augmented Conversational Recommendation with Prompt-based Semi-Structured Natural Language State Tracking

Belief-State Query Policies for Planning With Preferences Under Partial Observability

Multi-turn Reinforcement Learning from Preference Human Feedback

Word Alignment as Preference for Machine Translation

The Role of AI in Peer Support for Young People: A Study of Preferences for Human- and AI-Generated Responses

Bayesian Optimization with LLM-Based Acquisition Functions for Natural Language Preference Elicitation

Direct Nash Optimization: Teaching Language Models to Self-Improve with General Preferences

Using LLMs to Model the Beliefs and Preferences of Targeted Populations

DP-Dueling: Learning from Preference Feedback without Compromising User Privacy

An Analysis of the Preferences of Distribution Indicators in Evolutionary Multi-Objective Optimization

A tutorial on learning from preferences and choices with Gaussian Processes

Provably Robust DPO: Aligning Language Models with Noisy Feedback

Stop Relying on No-Choice and Do not Repeat the Moves: Optimal, Efficient and Practical Algorithms for Assortment Optimization

PREDILECT: Preferences Delineated with Zero-Shot Language-based Reasoning in Reinforcement Learning

Generalizing Reward Modeling for Out-of-Distribution Preference Learning

Enhancing Robotic Manipulation with AI Feedback from Multimodal Large Language Models

Ask Optimal Questions: Aligning Large Language Models with Retriever's Preference in Conversational Search

A Dense Reward View on Aligning Text-to-Image Diffusion with Preference

Principled Preferential Bayesian Optimization