Continual Training

Continual training aims to enable machine learning models, particularly large language and vision models, to adapt to new data streams without catastrophic forgetting of previously learned information. Current research focuses on developing efficient algorithms and architectures, such as parameter-efficient fine-tuning methods and replay strategies, to address this challenge across various model types, including transformers and recurrent neural networks. This field is crucial for developing more sustainable and adaptable AI systems, improving their performance in dynamic real-world environments and reducing the environmental impact of frequent retraining.

Papers

September 26, 2023

Applications of Sequential Learning for Medical Image Classification
Sohaib Naim, Brian Caffo, Haris I Sair, Craig K Jones
Financial Application Medical Image Classification Sequential Learning Medical Image Data Continual Training Traditional CNNs Retrospective Learning

September 18, 2023

Des-q: a quantum algorithm to provably speedup retraining of decision trees
Niraj Kumar, Romina Yalovetzky, Changhao Li, Pierre Minssen, Marco Pistoia
Decision Tree Quantum Algorithm Continual Training Retraining Method Quantum K Mean

March 12, 2023

Preventing Zero-Shot Transfer Degradation in Continual Learning of Vision-Language Models
Zangwei Zheng, Mingyuan Ma, Kai Wang, Ziheng Qin, Xiangyu Yue, Yang You
Vision Language Model Continual LEArning Incremental Learning Pre Trained Vision Language Model Continual Training Negative Transfer

March 11, 2023

Knowledge Distillation for Efficient Sequences of Training Runs
Xingyu Liu, Alex Leonardi, Lu Yu, Chris Gilmer-Hill, Matthew Leavitt, Jonathan Frankle
Knowledge Distillation Hyperparameter Optimization Pareto Set Continual Training Training Run

February 7, 2023

Continual Pre-training of Language Models
Zixuan Ke, Yijia Shao, Haowei Lin, Tatsuya Konishi, Gyuhak Kim, Bing Liu
Language Model Continual Pre Training Continual Training Domain Corpus Domain Specific Continual Pre Training

October 13, 2022

Is It Worth the (Environmental) Cost? Limited Evidence for Temporal Adaptation via Continuous Training
Giuseppe Attanasio, Debora Nozza, Federico Bianchi, Dirk Hovy
Language Model Hidden CoST Social Medium Data Continual Training Temporal Adaptation Temporal Graph Benchmark Uncertain Evidence

October 11, 2022

Continual Training of Language Models for Few-Shot Learning
Zixuan Ke, Haowei Lin, Yijia Shao, Hu Xu, Lei Shu, Bing Liu
Large Language Model Language Model LeArning Abstract Continual Training Unlabeled Corpus

September 30, 2022

Efficient LSTM Training with Eligibility Traces
Michael Hoyer, Shahram Eivazi, Sebastian Otte
Long Short Term Memory Back Propagation Deep Q Learning Continual Training

May 24, 2022

Towards a Defense Against Federated Backdoor Attacks Under Continuous Training
Shuaiqi Wang, Jonathan Hayase, Giulia Fanti, Sewoong Oh
Federated Learning Backdoor Attack Continual Training Shadow Model Active Shadowing

December 31, 2021

Relational Experience Replay: Continual Learning by Adaptively Tuning Task-wise Relationship
Quanziang Wang, Renzhen Wang, Yuexiang Li, Dong Wei, Kai Ma, Yefeng Zheng, Deyu Meng
Continual LEArning Catastrophic Forgetting Experience Replay Continual Training Task Relationship Rehearsal Based

December 6, 2021

CSG0: Continual Urban Scene Generation with Zero Forgetting
Himalaya Jain, Tuan-Hung Vu, Patrick Pérez, Matthieu Cord
Generative Adversarial Network Anti Forgetting Continual Training Synthetic Scene Urban Scene Generation CSG Model