Easy to Learn Token

Research on "easy-to-learn tokens" focuses on addressing the imbalance in the learning process of language models, where frequent tokens are over-represented while infrequent ones are under-represented. Current efforts utilize transformer architectures and novel loss functions, such as those incorporating information entropy to dynamically weight training based on token difficulty, to improve model performance and efficiency by mitigating this bias. This work is significant because it enhances the robustness and generalization capabilities of large language models, leading to improved performance on downstream tasks and a deeper understanding of how these models process information.

Papers

December 24, 2024

Weak Scaling Capability in Token Space: An Observation from Large Vision Language Model
Tenghui Li, Guoxu Zhou, Xuyang Zhao, Qibin Zhao
Language Model Vision Language Model Vision Language Vision Paper Visual Token Strong Scaling Observation Centric Easy to Learn Token

November 26, 2024

Enhancing Character-Level Understanding in LLMs through Token Internal Structure Learning
Zhu Xu, Zhiqiang Zhao, Zihan Zhang, Yuchi Liu, Quanwei Shen, Fei Liu, Yu Kuang, Jian He, Conglin Liu
Large Language Model K TOKEN Structure Learning Character Understanding Easy to Learn Token

May 24, 2024

Expert-Token Resonance: Redefining MoE Routing through Affinity-Driven Active Selection
Jing Li, Zhijie Sun, Dachao Lin, Xuan He, Yi Lin, Binfan Zheng, Li Zeng, Rongqian Zhao, Xin Chen
Large Language Model Pre Trained Model Convergence Enhanced Network Easy to Learn Token

April 11, 2024

Token Space: A Category Theory Framework for AI Computations
Wuming Pan
Deep Learning Model Artificial Intelligence Research Intelligent System Category Theory Categorical Structure Easy to Learn Token

November 5, 2023

TokenMotion: Motion-Guided Vision Transformer for Video Camouflaged Object Detection Via Learnable Token Selection
Zifan Yu, Erfan Bank Tavakoli, Meida Chen, Suya You, Raghuveer Rao, Sanjeev Agarwal, Fengbo Ren
Computer Vision Camera Motion Camouflaged Object Detection Motion Feature Easy to Learn Token Motion Aware Transformer

October 30, 2023

MiLe Loss: a New Loss for Mitigating the Bias of Learning Difficulties in Generative Language Models
Zhenpeng Su, Xing Wu, Xue Bai, Zijia Lin, Hui Chen, Guiguang Ding, Wei Zhou, Songlin Hu
Language Model Absolute Stance Bias Generative Language Model Interest Loss Weighted Loss Easy to Learn Token

June 5, 2023

DecompX: Explaining Transformers Decisions by Propagating Token Decomposition
Ali Modarressi, Mohsen Fayyaz, Ehsan Aghazadeh, Yadollah Yaghoobzadeh, Mohammad Taher Pilehvar
Transformer Based Model Multi Layer Aggregation Function Explanation Faithfulness Easy to Learn Token

January 22, 2023

Learning Open-vocabulary Semantic Segmentation Models From Natural Language Supervision
Jilan Xu, Junlin Hou, Yuejie Zhang, Rui Feng, Yi Wang, Yu Qiao, Weidi Xie
Fine Grained Segmentation Performance Open Vocabulary Semantic Segmentation Language Supervision Mask Annotation Easy to Learn Token

December 15, 2022

Improve Text Classification Accuracy with Intent Information
Yifeng Xie
Text Classification Task Oriented Dialogue System Label Information Intent Assurance Easy to Learn Token

Easy to Learn Token

Papers

Weak Scaling Capability in Token Space: An Observation from Large Vision Language Model

Enhancing Character-Level Understanding in LLMs through Token Internal Structure Learning

Expert-Token Resonance: Redefining MoE Routing through Affinity-Driven Active Selection

Token Space: A Category Theory Framework for AI Computations

TokenMotion: Motion-Guided Vision Transformer for Video Camouflaged Object Detection Via Learnable Token Selection

MiLe Loss: a New Loss for Mitigating the Bias of Learning Difficulties in Generative Language Models

DecompX: Explaining Transformers Decisions by Propagating Token Decomposition

Learning Open-vocabulary Semantic Segmentation Models From Natural Language Supervision

Improve Text Classification Accuracy with Intent Information