Post Training

Post-training techniques aim to improve or adapt pre-trained machine learning models without requiring extensive retraining, offering significant computational and time savings. Current research focuses on diverse methods including quantization (e.g., using algorithms like GPTQ and CDQuant) to reduce model size and computational cost, adaptive inference strategies (like early exiting and input-dependent compression) to optimize resource usage, and techniques to enhance model alignment and mitigate issues like unintended sophistry in large language models. These advancements are crucial for deploying large models on resource-constrained devices and improving the efficiency and reliability of AI systems across various applications.

Papers

February 3, 2024

Universal Post-Training Reverse-Engineering Defense Against Backdoors in Deep Neural Networks
Xi Li, Hang Wang, David J. Miller, George Kesidis
Deep Neural Network Backdoor Attack Reverse Engineering Post Training

January 29, 2024

Tradeoffs Between Alignment and Helpfulness in Language Models with Representation Engineering
Yotam Wolf, Noam Wies, Dorin Shteyman, Binyamin Rothberg, Yoav Levine, Amnon Shashua
Language Model Alignment Problem Language Model Alignment Post Training Representation Engineering Helpfulness Score

January 23, 2024

Post-Training Embedding Alignment for Decoupling Enrollment and Runtime Speaker Recognition Models
Chenyang Gao, Brecht Desplanques, Chelsea J. -T. Ju, Aman Chadha, Andreas Stolcke
Alignment Problem Speaker Identification Post Training Speaker Label Speaker Recognition Model Enrollment Utterance Enrollment Prediction

January 4, 2024

LLaMA Pro: Progressive LLaMA with Block Expansion
Chengyue Wu, Yukang Gan, Yixiao Ge, Zeyu Lu, Jiahao Wang, Ye Feng, Ying Shan, Ping Luo
Instruction Following Language Agent Post Training Whispering Llama LLaMA 3

December 12, 2023

AI capabilities can be significantly improved without expensive retraining
Tom Davidson, Jean-Stanislas Denain, Pablo Villalobos, Guillem Bas
Model Training Post Training Retraining Method AI Capability Training Compute

November 16, 2023

Adaptive Optimization Algorithms for Machine Learning
Slavomír Hanzely
Machine Learning Convergence Guarantee Better Optimizers Post Training Adaptive Optimization Method Second Order Method

October 30, 2023

Harvest Video Foundation Models via Efficient Post-Pretraining
Yizhuo Li, Kunchang Li, Yinan He, Yi Wang, Yali Wang, Limin Wang, Yu Qiao, Ping Luo
Video Question Answering Post Training Video Foundation Model

September 4, 2023

A Post-Training Approach for Mitigating Overfitting in Quantum Convolutional Neural Networks
Aakash Ravindra Shinde, Charu Jain, Amir Kalev
Quantum Physic Quantum Computer Model Overfitting Quantum Convolutional Neural Network Post Training

August 25, 2023

OmniQuant: Omnidirectionally Calibrated Quantization for Large Language Models
Wenqi Shao, Mengzhao Chen, Zhaoyang Zhang, Peng Xu, Lirui Zhao, Zhiqian Li, Kaipeng Zhang, Peng Gao, Yu Qiao, Ping Luo
Large Language Model Quantization Operator Activation Quantization Post Training Different Quantization

August 8, 2023

Quantization Aware Factorization for Deep Neural Network Compression
Daria Cherniuk, Stanislav Abukhovich, Anh-Huy Phan, Ivan Oseledets, Andrzej Cichocki, Julia Gusak
Tensor Decomposition Post Training Quantization Step Tensor Approximation Low Rank Quantization

July 2, 2023

SSP: Self-Supervised Post-training for Conversational Search
Quan Tu, Shen Gao, Xiaolong Wu, Zhao Cao, Ji-Rong Wen, Rui Yan
Conversational Search Post Training Conversational Model

May 10, 2023

Post-training Model Quantization Using GANs for Synthetic Data Generation
Athanasios Masouris, Mansi Sharma, Adrian Boguszewski, Alexander Kozlov, Zhuo Wu, Raymond Lo
Generative Adversarial Network Synthetic Data GAN Model Synthetic Data Generation Post Training Product Quantization Model Re Quantization

April 11, 2023

Survey on Leveraging Uncertainty Estimation Towards Trustworthy Deep Neural Networks: The Case of Reject Option and Post-training Processing
Mehedi Hasan, Moloud Abdar, Abbas Khosravi, Uwe Aickelin, Pietro Lio', Ibrahim Hossain, Ashikur Rahman, Saeid Nahavandi
Neural Network Deep Neural Network Timely Survey Deep Learning Model Loss Function Uncertainty Estimation Post Training Selective Classification Trustworthy Deep Learning Reject Option

January 16, 2023

Post-Train Adaptive U-Net for Image Segmentation
Kostiantyn Khabarlak
Image Segmentation Neural Network Architecture Post Training Adaptive Neural Segmentation Dice

January 6, 2023

Using External Off-Policy Speech-To-Text Mappings in Contextual End-To-End Automated Speech Recognition
David M. Chan, Shalini Ghosh, Ariya Rastrow, Björn Hoffmeister
Speech Recognition Automatic Speech Recognition Model Audio Embeddings Post Training

July 27, 2022

Post-Train Adaptive MobileNet for Fast Anti-Spoofing
Kostiantyn Khabarlak
Convolutional Neural Network Face Anti Spoofing Anti Spoofing Post Training L MobileNet

March 2, 2022

Engineering the Neural Automatic Passenger Counter
Nico Jahn, Michael Siebert
Gradient Method Position Engineering Post Training Aggregation Method Automatic Passenger Counting

January 20, 2022

Post-Training Detection of Backdoor Attacks for Two-Class and Multi-Attack Scenarios
Zhen Xiang, David J. Miller, George Kesidis
Backdoor Attack Reverse Engineering Multi Class Post Training Multiple Attack

January 17, 2022

UWC: Unit-wise Calibration Towards Rapid Network Compression
Chen Lin, Zheyang Li, Bo Peng, Haoji Hu, Wenming Tan, Ye Ren, Shiliang Pu
Post Training Quantization Multiplier Free Quantization Quantization Error Network Compression Post Training Feature Reconstruction Optimal Calibration

November 25, 2021

Neuronal Learning Analysis using Cycle-Consistent Adversarial Networks
Bryan M. Li, Theoklitos Amvrosiadis, Nathalie Rochefort, Arno Onken
Neural Activity Neural Process Neural Circuit Post Training Cycle Consistent Adversarial Network Neural Adaptation