Alignment Performance

Alignment performance in large language models (LLMs) and other AI systems focuses on ensuring model outputs align with human intentions and values, encompassing safety, fairness, and adherence to social norms. Current research emphasizes improving alignment through techniques like reinforcement learning from human feedback (RLHF), direct preference optimization (DPO), and in-context learning (ICL), often employing novel model architectures and algorithms to enhance efficiency and robustness. These advancements are crucial for responsible AI development, mitigating risks associated with harmful outputs and enabling safer and more beneficial deployment of LLMs across various applications.

Papers

March 12, 2024

Curry-DPO: Enhancing Alignment using Curriculum Learning & Ranked Preferences
Pulkit Pattnaik, Rishabh Maheshwary, Kelechi Ogueji, Vikas Yadav, Sathwik Tejaswi Madhusudhan
Curriculum Learning Direct Preference Optimization Preference Pair Alignment Performance Preference Rating

March 7, 2024

On the Essence and Prospect: An Investigation of Alignment Approaches for Big Models
Xinpeng Wang, Shitong Duan, Xiaoyuan Yi, Jing Yao, Shanlin Zhou, Zhihua Wei, Peng Zhang, Dongkuan Xu, Maosong Sun, Xing Xie
Large Model Comprehensive Investigation Visionary ProSpect Value Alignment Alignment Approach Alignment Performance Alignment Objective Optimal Alignment Alignment Algorithm

February 27, 2024

Robustly Learning Single-Index Models via Alignment Sharpness
Nikos Zarifis, Puqian Wang, Ilias Diakonikolas, Jelena Diakonikolas
Efficient Learning Agnostic Learning Alignment Performance Constant Factor Approximation Single Index Model Agnostic Model

February 14, 2024

ICDPO: Effectively Borrowing Alignment Capability of Others via In-context Direct Preference Optimization
Feifan Song, Yuxuan Fan, Xin Zhang, Peiyi Wang, Houfeng Wang
Context Learning Direct Preference Optimization Supervised Baseline Alignment Performance

December 8, 2023

Fine Dense Alignment of Image Bursts through Camera Pose and Depth Estimation
Bruno Lecouat, Yann Dubois de Mont-Marin, Théo Bodrito, Julien Mairal, Jean Ponce
Optical Flow Depth Estimation Camera Motion Alignment Performance Consecutive Frame Dense Alignment

October 14, 2023

Large Language Model Unlearning
Yuanshun Yao, Xiaojun Xu, Yang Liu
Large Language Model Harmful Unlearning Negative Sample Alignment Performance LLM Unlearning

October 6, 2023

Perfect Alignment May be Poisonous to Graph Contrastive Learning
Jingyu Liu, Huayi Tang, Yong Liu
Contrastive Learning Contrastive Loss Graph Based Learning Alignment Performance

October 1, 2023

GeRA: Label-Efficient Geometrically Regularized Alignment
Dustin Klebe, Tal Shnitzer, Mikhail Yurochkin, Leonid Karlinsky, Justin Solomon
Multi Modal Alignment Performance Unimodal Encoders Geometric Regularization Alignment Regularization

September 4, 2023

MultiWay-Adapater: Adapting large-scale multi-modal models for scalable image-text retrieval
Zijun Long, George Killick, Richard McCreadie, Gerardo Aragon Camarasa
Multimodal Large Language Model Cross Modal Alignment Image Text Retrieval Alignment Performance Large Multi Modal Model Efficient Adaptation Multiway Fusion

August 10, 2023

Trustworthy LLMs: a Survey and Guideline for Evaluating Large Language Models' Alignment
Yang Liu, Yuanshun Yao, Jean-Francois Ton, Xiaoying Zhang, Ruocheng Guo, Hao Cheng, Yegor Klochkov, Muhammad Faaiz Taufiq, Hang Li
Language Model Timely Survey Alignment Problem LLM Alignment State Aware Guideline Alignment Performance LLM Truthfulness

March 5, 2023

Finding Alignments Between Interpretable Causal Variables and Distributed Neural Representations
Atticus Geiger, Zhengxuan Wu, Christopher Potts, Thomas Icard, Noah D. Goodman
Explainable AI Neural Representation Alignment Performance Causal Abstraction Interpretable Causal

February 15, 2023

Meeting the Needs of Low-Resource Languages: The Value of Automatic Alignments via Pretrained Models
Abteen Ebrahimi, Arya D. McCarthy, Arturo Oncevay, Luis Chiruzzo, John E. Ortega, Gustavo A. Giménez-Lugo, Rolando Coto-Solano, Katharina Kann
Entity Recognition Low Resource Language Multilingual Model Community Need Alignment Performance Meeting Minute Word Alignment Automatic Alignment

August 18, 2022

Efficient Signed Graph Sampling via Balancing & Gershgorin Disc Perfect Alignment
Chinthaka Dinesh, Gene Cheung, Saghar Bagheri, Ivan V. Bajic
High Efficiency Balancing Strategy Fast Sampling Graph Signal Processing Graph Laplacian Graph Filter Alignment Performance Graph Sampling Graph Frequency

May 30, 2022

Unbalanced CO-Optimal Transport
Quang Huy Tran, Hicham Janati, Nicolas Courty, Rémi Flamary, Ievgen Redko, Pinar Demetci, Ritambhara Singh
Optimal Transport Alignment Performance Forced Alignment Heterogeneous Domain Adaptation

May 17, 2022

Measuring Alignment Bias in Neural Seq2Seq Semantic Parsers
Davide Locatelli, Ariadna Quattoni
Semantic Parsing Seq2seq Model Sequence to Sequence Model Alignment Performance Neural Semantic

May 5, 2022

LUNA: Learning Slot-Turn Alignment for Dialogue State Tracking
Yifan Wang, Jing Zhao, Junwei Bao, Chaoqun Duan, Youzheng Wu, Xiaodong He
Dialogue Utterance Dialogue State Tracking Alignment Performance Dialogue History Task Oriented Dialogue Datasets

April 10, 2022

A New Framework for Fast Automated Phonological Reconstruction Using Trimmed Alignments and Sound Correspondence Patterns
Johann-Mattis List, Robert Forkel, Nathan W. Hill
New Framework Alignment Performance Historical Linguistics Phoneme Alignment Phonological Reconstruction Sequence Similarity