Preference Datasets

Preference datasets are collections of human judgments comparing different outputs generated by large language models (LLMs), used to align these models with human values and preferences. Current research focuses on improving the efficiency and quality of these datasets, exploring methods like auction mechanisms for cost-effective data collection, metrics for dataset comparison, and techniques to reduce noise and bias. This work is crucial for developing more reliable and ethically aligned LLMs, impacting both the advancement of AI research and the development of safer, more user-friendly AI applications.

Papers

July 10, 2024

Towards Robust Alignment of Language Models: Distributionally Robustifying Direct Preference Optimization
Junkang Wu, Yuexiang Xie, Zhengyi Yang, Jiancan Wu, Jiawei Chen, Jinyang Gao, Bolin Ding, Xiang Wang, Xiangnan He
Language Model Native Robustness Direct Preference Optimization Distributionally Robust Optimization Preference Datasets Aware Alignment

July 3, 2024

On the Client Preference of LLM Fine-tuning in Federated Learning
Feijie Wu, Xiaoze Liu, Haoyu Wang, Xingchen Wang, Jing Gao
Large Language Model Reinforcement Learning Preference Feedback Human Preference Preference Datasets Model Completion

June 27, 2024

EmPO: Emotion Grounding for Empathetic Response Generation through Preference Optimization
Ondrej Sotolar, Vojtech Formanek, Alok Debnath, Allison Lahnala, Charles Welch, Lucie FLek
Preference Optimization Empathetic Dialogue Empathetic Response Generation Preference Datasets

June 12, 2024

June 3, 2024

Towards Transparency: Exploring LLM Trainings Datasets through Visual Topic Modeling and Semantic Frame
Charles de Dampierre, Andrei Mogoutov, Nicolas Baumard
Transparency Index Topic Modeling Text Datasets LLM Training Preference Datasets Semantic Frame

May 29, 2024

May 24, 2024

Inverse-RLignment: Inverse Reinforcement Learning from Demonstrations for LLM Alignment
Hao Sun, Mihaela van der Schaar
Inverse Reinforcement Learning Noisy Demonstration LLM Alignment Preference Datasets Inverse Task Demonstration Data

May 22, 2024

Annotation-Efficient Preference Optimization for Language Model Alignment
Yuu Jinnai, Ukyo Honda
Preference Optimization Language Model Alignment Preference Datasets Preference Dataset Preference Annotation

May 19, 2024

Hummer: Towards Limited Competitive Preference Dataset
Li Jiang, Yusen Wu, Junwu Xiong, Jingqing Ruan, Yichuan Ding, Qingpei Guo, Zujie Wen, Jun Zhou, Xiaotie Deng
Preference Pair Alignment Objective Preference Datasets

March 27, 2024

Understanding the Learning Dynamics of Alignment with Human Feedback
Shawn Im, Yixuan Li
Large Language Model Human Feedback Alignment Problem Learning Dynamic Preference Datasets Alignment Task

March 7, 2024

Preference optimization of protein language models as a multi-objective binder design paradigm
Pouria Mistani, Venkatesh Mysore
Language Model Direct Preference Optimization Preference Optimization Protein Language Model Preference Datasets

March 5, 2024

CURATRON: Complete and Robust Preference Data for Rigorous Alignment of Large Language Models
Son The Nguyen, Niranjan Uma Naresh, Theja Tulabandhula
Large Language Model Preference Learning Unobserved Variable Preference Datasets Robust Recovery Aware Alignment Robust Preference

February 7, 2024

Direct Language Model Alignment from Online AI Feedback
Shangmin Guo, Biao Zhang, Tianlin Liu, Tianqi Liu, Misha Khalman, Felipe Llinares, Alexandre Rame, Thomas Mesnard, Yao Zhao, Bilal Piot, Johan Ferret, Mathieu Blondel
Reinforcement Learning Human Feedback AI Feedback Language Model Alignment Preference Datasets

September 6, 2023

Everyone Deserves A Reward: Learning Customized Human Preferences
Pengyu Cheng, Jiawen Xie, Ke Bai, Yong Dai, Nan Du
Preference Learning Reward Report User Preference Preference Datasets Iterative Preference Learning Specific Preference

April 18, 2022

Time Series Clustering for Grouping Products Based on Price and Sales Patterns
Aysun Bozanta, Sean Berry, Mucahit Cevik, Beste Bulut, Deniz Yigit, Fahrettin F. Gonen, Ayşe Başar
Curious Price Preference Datasets Time Series Clustering State of the Art Clustering Product Classification Extreme Price Sale Pattern

April 16, 2022

Approaching sales forecasting using recurrent neural networks and transformers
Iván Vallés-Pérez, Emilio Soria-Olivas, Marcelino Martínez-Sober, Antonio J. Serrano-López, Juan Gómez-Sanchís, Fernando Mateo
Strong Generalization Transformer Megatron Decepticons Recurrent Neural Network Supply Chain Demand Prediction Preference Datasets Kaggle Competition Sale Forecasting