Compound Token

Compound tokens represent a novel approach in various machine learning domains, aiming to improve efficiency and performance by grouping related sub-tokens into single units. Current research focuses on optimizing their use within transformer architectures, exploring methods like autoregressive decoding and dynamic compute allocation to enhance model capabilities while mitigating computational costs. This approach shows promise in improving the efficiency and performance of large language models, vision-language models, and other sequence-based tasks, leading to advancements in areas such as text generation, image synthesis, and human pose estimation.

16papers

Papers

March 27, 2025

Tricking Retrievers with Influential Tokens: An Efficient Black-Box Corpus Poisoning Attack
Cheng Wang, Yiwei Wang, Yujun Cai, Bryan Hooi
National University of Singapore●University of California●University of Queensland
Hybrid Retriever Compound Token Adversarial Text Retrieval Augmented Generation Data Poisoning Attack Large Language Model

March 11, 2025

February 16, 2025

FELLE: Autoregressive Speech Synthesis with Token-Wise Coarse-to-Fine Flow Matching
Hui Wang, Shujie Liu, Lingwei Meng, Jinyu Li, Yifan Yang, Shiwan Zhao, Haiyang Sun, Yanqing Liu, Haoqin Sun, Jiaming Zhou, Yan Lu, Yong Qin
Flow Matching Speech Synthesis Language Model Compound Token Token Representation

January 24, 2025

VarDrop: Enhancing Training Efficiency by Reducing Variate Redundancy in Periodic Time Series Forecasting
Junhyeok Kang, Yooju Shin, Jae-Gil Lee
Sparse Attention Time Series Forecasting Feature Redundancy Compound Token

December 19, 2024

How to Synthesize Text Data without Model Collapse?
Xuekai Zhu, Daixuan Cheng, Hengli Li, Kaiyan Zhang, Ermo Hua, Xingtai Lv, Ning Ding, Zhouhan Lin, Zilong Zheng, Bowen Zhou
Synthetic Data Language Model Data Synthesis Compound Token Model Collapse

October 16, 2024

Interpreting token compositionality in LLMs: A robustness analysis
Nura Aljaafari, Danilo S. Carvalho, André Freitas
Robustness Analysis Large Language Model Compositional Nature Compound Token

August 2, 2024

Nested Music Transformer: Sequentially Decoding Compound Tokens in Symbolic Music and Audio Generation
Jiwoo Ryu, Hao-Wen Dong, Jongmin Jung, Dasaem Jeong
Audio Generation Music Transformer Symbolic Music Compound Token Audio Token

June 12, 2024

A Critical Look At Tokenwise Reward-Guided Text Generation
Ahmad Rashid, Ruotian Wu, Julia Grosse, Agustinus Kristiadi, Pascal Poupart
Critical Review Reward Model Compound Token Text Generation Reinforcement Learning Large Language Model

May 20, 2024

Unveiling and Manipulating Prompt Influence in Large Language Models
Zijian Feng, Hanzhang Zhou, Zixiao Zhu, Junlang Qian, Kezhi Mao
Sentiment Polarity Compound Token Prompt Extraction Benchmark

April 30, 2024

Octopus v4: Graph of language models
Wei Chen, Zhiyuan Li
Language Model Octopus V2 Open Source Model Graph Drawing Compound Token Smaller Language Model

April 2, 2024

Mixture-of-Depths: Dynamically allocating compute in transformer-based language models
David Raposo, Sam Ritter, Blake Richards, Timothy Lillicrap, Peter Conway Humphreys, Adam Santoro
Input Sequence Compound Token Transformer Based Language Model Depth Anything

March 17, 2024

Tokensome: Towards a Genetic Vision-Language GPT for Explainable and Cognitive Karyotyping
Haoxi Zhang, Xinxu Zhang, Yuanxin Lin, Maiqi Wang, Yi Lai, Yu Wang, Linfeng Yu, Yufeng Xu, Ran Cheng, Edward Szczerbicki
Reliable Chromosome Classification Compound Token

December 6, 2023

TokenCompose: Text-to-Image Diffusion with Token-level Supervision
Zirui Wang, Zhizhou Sha, Zheng Ding, Yilin Wang, Zhuowen Tu
Latent Diffusion Model Text to Image Diffusion Token Level Text to Image Generation Diffusion Model Compound Token

October 25, 2023

Controlled Decoding from Language Models
Sidharth Mudgal, Jong Lee, Harish Ganapathy, YaGuang Li, Tao Wang, Yanping Huang, Zhifeng Chen, Heng-Tze Cheng, Michael Collins+4
Language Model Reinforcement Learning Objective Compound Token Reinforcement Learning Regularized Reinforcement Learning

October 15, 2023

Merging Experts into One: Improving Computational Efficiency of Mixture of Experts
Shwai He, Run-Ze Fan, Liang Ding, Li Shen, Tianyi Zhou, Dacheng Tao
Computational Efficiency Merging Expert Sparse Mixture Multiple Expert Mixture Component Language Model Compound Token Expert Knowledge

June 26, 2023

LongCoder: A Long-Range Pre-trained Language Model for Code Completion
Daya Guo, Canwen Xu, Nan Duan, Jian Yin, Julian McAuley
Sparse Transformer Code Completion Compound Token Long Range Language Automatic Coding

May 25, 2023

Scan and Snap: Understanding Training Dynamics and Token Composition in 1-layer Transformer
Yuandong Tian, Yiping Wang, Beidi Chen, Simon Du
Decoder Layer Next Token Prediction Snap Video Self Attention Layer Compound Token Transformer Architecture Transformer Based Training Dynamic

March 21, 2023

Human Pose as Compositional Tokens
Zigang Geng, Chunyu Wang, Yixuan Wei, Ze Liu, Houqiang Li, Han Hu
Pose Estimate Structured Representation Human Pose Compound Token

March 1, 2023

Capturing the motion of every joint: 3D human pose and shape estimation with independent tokens
Sen Yang, Wen Heng, Gang Liu, Guozhong Luo, Wankou Yang, Gang Yu
Monocular Video Joint Angle Motion Information Compound Token Shape Estimation Human Pose 3D Human Pose Single Frame Joint Framework

Compound Token

Papers

Tricking Retrievers with Influential Tokens: An Efficient Black-Box Corpus Poisoning Attack

QuoTA: Query-oriented Token Assignment via CoT Query Decouple for Long Video Comprehension

Multi-Cue Adaptive Visual Token Pruning for Large Vision-Language Models

FELLE: Autoregressive Speech Synthesis with Token-Wise Coarse-to-Fine Flow Matching

VarDrop: Enhancing Training Efficiency by Reducing Variate Redundancy in Periodic Time Series Forecasting

How to Synthesize Text Data without Model Collapse?

Interpreting token compositionality in LLMs: A robustness analysis

Nested Music Transformer: Sequentially Decoding Compound Tokens in Symbolic Music and Audio Generation

A Critical Look At Tokenwise Reward-Guided Text Generation

Unveiling and Manipulating Prompt Influence in Large Language Models

Octopus v4: Graph of language models

Mixture-of-Depths: Dynamically allocating compute in transformer-based language models

Tokensome: Towards a Genetic Vision-Language GPT for Explainable and Cognitive Karyotyping

TokenCompose: Text-to-Image Diffusion with Token-level Supervision

Controlled Decoding from Language Models

Merging Experts into One: Improving Computational Efficiency of Mixture of Experts

LongCoder: A Long-Range Pre-trained Language Model for Code Completion

Scan and Snap: Understanding Training Dynamics and Token Composition in 1-layer Transformer

Human Pose as Compositional Tokens

Capturing the motion of every joint: 3D human pose and shape estimation with independent tokens