Preference Feedback

Preference feedback, the use of human-provided comparisons to guide machine learning model training and evaluation, aims to align AI systems with human values and preferences. Current research focuses on improving the efficiency and effectiveness of preference learning, exploring various model architectures like Bradley-Terry and regression models, Direct Preference Optimization (DPO), and generative judges, often incorporating response times and contextual information to enhance the richness of feedback. This field is crucial for mitigating biases and ensuring AI systems are safe, reliable, and beneficial, impacting diverse applications from language model alignment to personalized recommendations and robot navigation.

Papers

March 9, 2023

Revisiting the relevance of traditional genres: a network analysis of fiction readers' preferences
Taom Sakal, Stephen Proulx
Preference Feedback Relative Relevance Genre Classification Read V Network Analysis

March 7, 2023

Controlled Diversity with Preference : Towards Learning a Diverse Set of Desired Skills
Maxence Hussonnois, Thommen George Karimpanal, Santu Rana
Reinforcement Learning Preference Feedback Diverse Set Human Machine Robust Skill Diverse Behavior

February 17, 2023

Data Driven Reward Initialization for Preference based Reinforcement Learning
Mudit Verma, Subbarao Kambhampati
Reinforcement Learning Preference Feedback Preference Based Reinforcement Learning

February 16, 2023

Aligning Language Models with Preferences through f-divergence Minimization
Dongyoung Go, Tomasz Korbak, Germán Kruszewski, Jos Rozen, Nahyeon Ryu, Marc Dymetman
Preference Feedback Target Distribution Divergence Regularization Distributional Policy Gradient Divergence Optimization Generative Control

December 30, 2022

E-commerce users' preferences for delivery options
Yuki Oyama, Daisuke Fukuda, Naoto Imura, Katsuhiro Nishinari
E Commerce Preference Feedback Choice Data Delivery Related Task

December 7, 2022

Metric Elicitation; Moving from Theory to Practice
Safinah Ali, Sohini Upadhyay, Gaurush Hiranandani, Elena L. Glassman, Oluwasanmi Koyejo
Theoretical Understanding Preference Feedback Classification Metric Various Metric Classifier Performance

December 3, 2022

CoP: Factual Inconsistency Detection by Controlling the Preference
Shuaijie She, Xiang Geng, Shujian Huang, Jiajun Chen
Abstractive Summarization Preference Feedback Factual Consistency Police Public Interaction Entity Level Factual Factual Inconsistency Detection

October 27, 2022

Towards customizable reinforcement learning agents: Enabling preference specification through online vocabulary expansion
Utkarsh Soni, Nupur Thakur, Sarath Sreedharan, Lin Guan, Mudit Verma, Matthew Marquez, Subbarao Kambhampati
Agent Smith Preference Feedback Causal Relationship Knowledge Acquisition Vocabulary Expansion Preference Specification

October 26, 2022

One Arrow, Two Kills: An Unified Framework for Achieving Optimal Regret Guarantees in Sleeping Bandits
Pierre Gaillard, Aadirupa Saha, Soham Dan
Unified Framework Preference Feedback Regret Guarantee Low Regret

October 17, 2022

Symbol Guided Hindsight Priors for Reward Learning from Human Preferences
Mudit Verma, Katherine Metcalf
Reward Function Preference Feedback Human Preference Reward Learning Hindsight Instruction

October 13, 2022

Spontaneous Emerging Preference in Two-tower Language Model
Zhengqi He, Taro Toyoizumi
Language Model Natural Language Preference Feedback Language Processing Foundation Language Model

September 27, 2022

Dueling Convex Optimization with General Preferences
Aadirupa Saha, Tomer Koren, Yishay Mansour
Convex Optimization Preference Feedback Objective Function Convex Function Transfer Function

September 26, 2022

Truth and Preferences -- A Game Approach for Qualitative Choice Logic
Robert Freiman, Michael Bernreiter
Preference Feedback Propositional Logic Great Truth

September 14, 2022

Solutions to preference manipulation in recommender systems require knowledge of meta-preferences
Hal Ashton, Matija Franklin
Recommender System Knowledge Based Solution Path Movie Recommendation Preference Feedback Preference Fine Tuning

July 7, 2022

Unified Learning from Demonstrations, Corrections, and Preferences during Physical Human-Robot Interaction
Shaunak A. Mehta, Dylan P. Losey
Reward Model Manipulation Task Preference Feedback Noisy Demonstration Language Correction Physical Human Robot Interaction Robot Arm Unified Learning

June 15, 2022

From Outcome-Based to Language-Based Preferences
Valerio Capraro, Joseph Y. Halpern, Matjaz Perc
Preference Feedback Human Behavior Normal Form Game Behavioral Economics

May 29, 2022

2-Dimensional Euclidean Preferences
Laurent Bulteau, Jiehua Chen
Preference Feedback Voter Participation Euclidean Distance Euclidean Preference

May 26, 2022

Explaining Preferences with Shapley Values
Robert Hu, Siu Lun Chau, Jaime Ferrando Huertas, Dino Sejdinovic
Shapley Value Preference Feedback Pairwise Comparison Preference Model

May 18, 2022

Exploring Children's Preferences for Taking Care of a Social Robot
Bengisu Cagiltay, Joseph Michaelis, Sarah Sebo, Bilge Mutlu
Non Humanoid Robot Robot Person Preference Feedback Social Robot Nine Year Old Child CaRE SD Child Robot Interaction Interaction Design

April 28, 2022

The Effect of Preferences in Abstract Argumentation Under a Claim-Centric View
Michael Bernreiter, Wolfgang Dvorak, Anna Rapberger, Stefan Woltran
Mixed Effect Preference Feedback Argument Quality Abstract Argumentation Semantic Property Probabilistic Argumentation