Online Distillation

Online distillation is a machine learning technique that improves the efficiency and performance of student models by leveraging knowledge from a teacher model during concurrent training. Current research focuses on applying online distillation to diverse architectures, including transformers and graph neural networks, and explores strategies to enhance stability, address class imbalance (long-tailed distributions), and improve efficiency through techniques like parameter-efficient adaptations and adaptive sampling. This approach offers significant potential for accelerating model training, reducing computational costs, and improving the generalization ability of models across various domains, impacting fields like computer vision, natural language processing, and autonomous driving.

Papers

June 12, 2024

UDON: Universal Dynamic Online distillatioN for generic image representations
Nikolaos-Antonios Ypsilantis, Kaifeng Chen, André Araujo, Ondřej Chum
Online Distillation Multi Teacher Distillation Generic Representation Instance Level Recognition

June 9, 2024

OD-DETR: Online Distillation for Stabilizing Training of Detection Transformer
Shengjian Wu, Li Sun, Qingli Li
Training Data Detection Transformer CNN Based Detector Online Distillation Training Instability

December 18, 2023

Decoupled Knowledge with Ensemble Learning for Online Distillation
Baitan Shao, Ying Chen
Ensemble Learning Knowledge Based Collaborative Learning Mutual Learning Online Knowledge Distillation Online Distillation Semantic Reconstruction

December 13, 2023

SpeedUpNet: A Plug-and-Play Adapter Network for Accelerating Text-to-Image Diffusion Models
Weilong Chai, DanDan Zheng, Jiajiong Cao, Zhiquan Chen, Changbao Wang, Chenguang Ma
Text to Image Diffusion Model Stable Diffusion Plug and Play Stable Diffusion Model Online Distillation

December 1, 2023

Agglomerative Federated Learning: Empowering Larger Model Training via End-Edge-Cloud Collaboration
Zhiyuan Wu, Sheng Sun, Yuwei Wang, Min Liu, Bo Gao, Quyang Pan, Tianliu He, Xuefeng Jiang
Federated Learning Model Training Hierarchical Federated Learning Online Distillation Edge Cloud Collaboration

September 19, 2023

Interactive Distillation of Large Single-Topic Corpora of Scientific Papers
Nicholas Solovyev, Ryan Barron, Manish Bhattarai, Maksim E. Eren, Kim O. Rasmussen, Boian S. Alexandrov
Data Set Large Corpus Text Embeddings Topic Modeling Scientific Paper Citation Network Online Distillation

September 4, 2023

On the Query Strategies for Efficient Online Active Distillation
Michele Boldo, Enrico Martini, Mirco De Marchi, Stefano Aldegheri, Nicola Bombieri
Deep Learning Knowledge Distillation Active Learning Human Pose Estimation Real Time Adaptation Online Distillation Query Strategy

June 16, 2023

Online Distillation for Pseudo-Relevance Feedback
Sean MacAvaney, Xi Wang
Dense Retrieval Model Distillation Online Distillation Neural Search Pseudo Relevance Feedback

May 5, 2023

Towards Effective Collaborative Learning in Long-Tailed Recognition
Zhengzhuo Xu, Zenghao Chai, Chengyin Xu, Chun Yuan, Haiqin Yang
Class Imbalance Collaborative Learning Long Tailed Recognition Distillation Loss Class Distribution Online Distillation Feature Based Distillation

April 22, 2023

LiDAR2Map: In Defense of LiDAR-Based Semantic Map Construction Using Online Camera Distillation
Song Wang, Wentong Li, Wenyu Liu, Xiaolu Liu, Jianke Zhu
Semantic Map Online Distillation LiDAR Mapping LiDAR Distillation

April 3, 2023

Online Distillation with Continual Learning for Cyclic Domain Shifts
Joachim Houyon, Anthony Cioppa, Yasir Ghunaim, Motasem Alfarra, Anaïs Halin, Maxim Henry, Bernard Ghanem, Marc Van Droogenbroeck
Continual LEArning Catastrophic Forgetting Continual Learning Domain Shift State of the Art Continual Online Distillation

January 28, 2023

Supervision Complexity and its Role in Knowledge Distillation
Hrayr Harutyunyan, Ankit Singh Rawat, Aditya Krishna Menon, Seungyeon Kim, Sanjiv Kumar
Knowledge Distillation Integral Role Online Distillation Generalization Behavior Co Supervision Explicit Supervision

December 28, 2022

OVO: One-shot Vision Transformer Search with Online distillation
Zimian Wei, Hengyue Pan, Xin Niu, Dongsheng Li
Supervised ImageNet Domain Sample Pure Transformer Online Distillation

December 25, 2022

BD-KD: Balancing the Divergences for Online Knowledge Distillation
Ibtihel Amara, Nazanin Sepahvand, Brett H. Meyer, Warren J. Gross, James J. Clark
Knowledge Distillation Inverse Divergence Distillation Loss Online Knowledge Distillation Online Distillation

June 24, 2022

Mixed Sample Augmentation for Online Distillation
Yiqing Shen, Liwu Xu, Yuzhe Yang, Yaqian Li, Yandong Guo
Knowledge Distillation Online Knowledge Distillation Online Distillation Mixed Sample Data Augmentation

May 28, 2022

Parameter-Efficient and Student-Friendly Knowledge Distillation
Jun Rao, Xv Meng, Liang Ding, Shuhan Qi, Dacheng Tao
Knowledge Distillation Online Distillation

March 29, 2022

Nested Collaborative Learning for Long-Tailed Visual Recognition
Jun Li, Zichang Tan, Jun Wan, Zhen Lei, Guodong Guo
Self Supervision Long Tailed Learning Online Distillation Nested Collaborative Learning

December 28, 2021

Online Adversarial Distillation for Graph Neural Networks
Can Wang, Zhe Wang, Defang Chen, Sheng Zhou, Yan Feng, Chun Chen
Graph Neural Network Generative Adversarial Network Knowledge Distillation Adversarial Distillation Online Distillation