Token Alignment

Token alignment in machine learning focuses on improving model performance by ensuring consistent and meaningful relationships between input tokens (e.g., words, image patches, genetic sequences) and their corresponding labels or representations. Current research emphasizes aligning tokens across different modalities (e.g., text and images, genes and language), hierarchical structures (e.g., in text classification), and domains (e.g., in cross-domain named entity recognition), often leveraging large language models and contrastive learning techniques. These advancements are improving the accuracy and interpretability of models in diverse applications, ranging from gene expression prediction and medical code classification to image-text understanding and text generation. The ultimate goal is to create more robust and reliable models by addressing issues like token uniformity and label conflicts.

Papers

October 18, 2024

SudoLM: Learning Access Control of Parametric Knowledge with Authorization Alignment
Qin Liu, Fei Wang, Chaowei Xiao, Muhao Chen
Large Language Model Preference Alignment Parametric Knowledge Forced Alignment Token Alignment

October 7, 2024

A Strategy for Label Alignment in Deep Neural Networks
Xuanrui Zeng
Deep Neural Network Representation Learning Unsupervised Domain Adaptation Strategy Logic Token Alignment

October 2, 2024

Long-range gene expression prediction with token alignment of large language model
Edouardo Honig, Huixin Zhan, Ying Nian Wu, Zijun Frank Zhang
Large Language Model Token Level Gene Expression Prediction Token Alignment

September 1, 2024

Modeling Text-Label Alignment for Hierarchical Text Classification
Ashish Kumar, Durga Toshniwal
Label Embeddings Label Hierarchy Hierarchical Text Classification Token Alignment

July 24, 2024

Label Alignment and Reassignment with Generalist Large Language Model for Enhanced Cross-Domain Named Entity Recognition
Ke Bao, Chonghuan Yang
Entity Recognition Cross Domain MAESTRO Dataset NLP Community Token Alignment Cross Domain NER

June 18, 2024

Not Everything is All You Need: Toward Low-Redundant Optimization for Large Language Model Alignment
Zhipeng Chen, Kun Zhou, Wayne Xin Zhao, Jingyuan Wang, Ji-Rong Wen
Large Language Model Large Language Model Alignment Alignment Training Token Alignment

May 29, 2024

Enhancing Vision-Language Model with Unmasked Token Alignment
Jihao Liu, Jinliang Zheng, Boxiao Liu, Yu Liu, Hongsheng Li
Vision Language Model Image Text Pair Contrastive Pre Training Token Alignment Unmasked Token

March 13, 2024

Token Alignment via Character Matching for Subword Completion
Ben Athiwaratkun, Shiqi Wang, Mingyue Shang, Yuchen Tian, Zijian Wang, Sujan Kumar Gonugondla, Sanjay Krishna Gouda, Rob Kwiatowski, Ramesh Nallapati, Bing Xiang
Sub Word Auto Completion Text Matching Token Alignment

December 13, 2023

LAMM: Label Alignment for Multi-Modal Prompt Learning
Jingsheng Gao, Jiacheng Ruan, Suncheng Xiang, Zefang Yu, Ke Ji, Mingye Xie, Ting Liu, Yuzhuo Fu
Prompt Learning Prompt Tuning Morphable Model Pre Trained Vision Token Alignment

May 9, 2023

Effective Medical Code Prediction via Label Internal Alignment
Guodong Liu
Clinical Text Multi View Attention Token Alignment Clinical Code Medical Code Prediction

October 16, 2022

Character-Centric Story Visualization via Visual Planning and Token Alignment
Hong Chen, Rujun Han, Te-Lin Wu, Hideki Nakayama, Nanyun Peng
Story Visualization Visual Planning Token Alignment

October 12, 2022

Token-Label Alignment for Vision Transformers
Han Xiao, Wenzhao Zheng, Zheng Zhu, Jie Zhou, Jiwen Lu
Convolutional Neural Network Vision Transformer Token Level Token Alignment Token Correlation

August 24, 2022

Addressing Token Uniformity in Transformers via Singular Value Transformation
Hanqi Yan, Lin Gui, Wenjie Li, Yulan He
Transformer Megatron Decepticons Transformer Based Model Transformer Based Language Model Semantic Textual Similarity Singular Value Token Alignment