Large Pre Trained Model

Large pre-trained models (LPMs) are massive neural networks trained on enormous datasets, aiming to achieve strong generalization across diverse downstream tasks with minimal further training. Current research emphasizes efficient fine-tuning techniques, such as prompt engineering, low-rank adaptation (e.g., LoRA, SVFit), and sparse parameter updates, to reduce computational costs and improve model adaptability while addressing issues like overfitting and catastrophic forgetting. This field is significant due to LPMs' transformative impact on various applications, from natural language processing and computer vision to robotics and education, driving advancements in both theoretical understanding and practical deployment of AI systems.

Papers

September 14, 2024

AI-Driven Virtual Teacher for Enhanced Educational Efficiency: Leveraging Large Pretrain Models for Autonomous Error Analysis and Correction
Tianlong Xu, Yi-Fan Zhang, Zhendong Chu, Shen Wang, Qingsong Wen
Prompt Engineering Large Pre Trained Model Language Correction Error Correction Error Analysis Strong Learner Learning With Error Virtual Teaching Assistant

September 10, 2024

SaRA: High-Efficient Diffusion Model Fine-tuning with Progressive Sparse Low-Rank Adaptation
Teng Hu, Jiangning Zhang, Ran Yi, Hongrui Huang, Yabiao Wang, Lizhuang Ma
Diffusion Model Pre Trained Model Adaptation Concern Pre Trained Diffusion Model Large Pre Trained Model Efficient Fine Tuning Adaptive Sparsity

September 9, 2024

SVFit: Parameter-Efficient Fine-Tuning of Large Pre-Trained Models Using Singular Values
Chengwei Sun, Jiwei Wei, Yujia Wu, Yiming Shi, Shiyuan He, Zeyu Ma, Ning Xie, Yang Yang
Parameter Efficient Fine Tuning Large Pre Trained Model Pre Trained Convolutional Neural Network Low Rank Matrix Singular Value

August 20, 2024

Where to Fetch: Extracting Visual Scene Representation from Large Pre-Trained Models for Robotic Goal Navigation
Yu Li, Dayou Li, Chenkun Zhao, Ruifeng Wang, Ran Song, Wei Zhang
Visual Language Model Large Pre Trained Model Scene Representation Navigation Task Context Aware Navigation Robot Goal

August 6, 2024

SARA: Singular-Value Based Adaptive Low-Rank Adaption
Jihao Gu, Shuai Chen, Zelin Wang, Yibo Zhang, Ping Gong
Fine Tuning Adaptive Importance Parameter Efficient Fine Tuning Adaptation Concern Large Pre Trained Model Low Rank Matrix LoRA Fine Tuning

August 5, 2024

Boosting Memory Efficiency in Transfer Learning for High-Resolution Medical Image Classification
Yijin Huang, Pujin Cheng, Roger Tam, Xiaoying Tang
Pre Trained Model Many Parameter Large Pre Trained Model Large Scale Pre Trained Model Efficient Transfer Learning

August 1, 2024

Scaling Backwards: Minimal Synthetic Pre-training?
Ryo Nakamura, Ryu Tadokoro, Ryosuke Yamada, Yuki M. Asano, Iro Laina, Christian Rupprecht, Nakamasa Inoue, Rio Yokota, Hirokatsu Kataoka
Real World Synthetic Image Large Pre Trained Model Inverse Scaling Synthetic Pre Training

July 24, 2024

SFPrompt: Communication-Efficient Split Federated Fine-Tuning for Large Pre-Trained Models over Resource-Limited Devices
Linxiao Cao, Yifei Zhu, Wei Gong
Fine Tuning Large Pre Trained Model Smart Device Fine Tuning Approach

July 22, 2024

Reconstructing Training Data From Real World Models Trained with Transfer Learning
Yakir Oz, Gilad Yehudai, Gal Vardi, Itai Antebi, Michal Irani, Niv Haim
Training Data Transfer Learning Large Pre Trained Model Image Embeddings Accurate Model Reconstructed Image Data Reconstruction

July 16, 2024

Enhancing Parameter Efficiency and Generalization in Large-Scale Models: A Regularized and Masked Low-Rank Adaptation Approach
Yuzhu Mao, Siqi Ping, Zihao Zhao, Yang Liu, Wenbo Ding
Large Language Model Strong Generalization Large Pre Trained Model Low Rank Adaptation Parameter Efficient Large Scale Model Gradient Masking

July 15, 2024

Quantized Prompt for Efficient Generalization of Vision-Language Models
Tianxiang Hao, Xiaohan Ding, Juexiao Feng, Yuhong Yang, Hui Chen, Guiguang Ding
Vision Language Model Pre Trained Vision Language Model Style PROMPT Large Pre Trained Model Regularization Method

July 13, 2024

Building pre-train LLM Dataset for the INDIC Languages: a case study on Hindi
Shantipriya Parida, Shakshi Panwar, Kusum Lata, Sanskruti Mishra, Sambit Sekhar
Large Language Model Case Study Pre Trained Low Resource Language Indian Language Large Pre Trained Model

July 10, 2024

SHERL: Synthesizing High Accuracy and Efficient Memory for Resource-Limited Transfer Learning
Haiwen Diao, Bo Wan, Xu Jia, Yunzhi Zhuge, Ying Zhang, Huchuan Lu, Long Chen
Pre Trained Model Large Pre Trained Model Memory Efficient Parameter Efficient Transfer High Accuracy Memory Efficiency

June 25, 2024

CDQuant: Greedy Coordinate Descent for Accurate LLM Quantization
Pranav Ajit Nair, Arun Sai Suggala
Large Language Model Quantization Operator Post Training Quantization Large Pre Trained Model Post Training Quantization Level Greedy Coordinate INT4 Quantization

May 25, 2024

Feature Protection For Out-of-distribution Generalization
Lu Tan, Huei Zhou, Yinxiang Huang, Zeming Zheng, Yujiu Yang
Fine Tuning Distribution Generalization Large Pre Trained Model Fine Tuned Model

May 7, 2024

Adapting WavLM for Speech Emotion Recognition
Daria Diatlova, Anton Udalov, Vitalii Shutov, Egor Spirin
Speech Emotion Recognition Large Pre Trained Model Self Supervised Model WavLM Speech Encoder Podcast Dataset

May 3, 2024

Training-Free Deepfake Voice Recognition by Leveraging Large-Scale Pre-Trained Models
Alessandro Pianese, Davide Cozzolino, Giovanni Poggi, Luisa Verdoliva
Speaker Verification Large Pre Trained Model Large Scale Pre Trained Model Audio Deepfake Detection Deepfake Speech Detection

April 27, 2024

The Simpler The Better: An Entropy-Based Importance Metric To Reduce Neural Networks' Depth
Victor Quétu, Zhu Liao, Enzo Tartaglione
Neural Network Deep Neural Network Large Depth Large Pre Trained Model

April 23, 2024

FL-TAC: Enhanced Fine-Tuning in Federated Learning via Low-Rank, Task-Specific Adapter Clustering
Siqi Ping, Yuzhu Mao, Yang Liu, Xiao-Ping Zhang, Wenbo Ding
Fine Tuning Low Rank Large Pre Trained Model Large Scale Pre Trained Model Task Specific Adapter

April 9, 2024

Audio-Visual Generalized Zero-Shot Learning using Pre-Trained Large Multi-Modal Models
David Kurzendörfer, Otniel-Bogdan Mercea, A. Sophia Koepke, Zeynep Akata
Large Pre Trained Model Classification Model Large Multi Modal Model Audio Visual Generalized Zero Shot

Large Pre Trained Model

Papers

AI-Driven Virtual Teacher for Enhanced Educational Efficiency: Leveraging Large Pretrain Models for Autonomous Error Analysis and Correction

SaRA: High-Efficient Diffusion Model Fine-tuning with Progressive Sparse Low-Rank Adaptation

SVFit: Parameter-Efficient Fine-Tuning of Large Pre-Trained Models Using Singular Values

Where to Fetch: Extracting Visual Scene Representation from Large Pre-Trained Models for Robotic Goal Navigation

SARA: Singular-Value Based Adaptive Low-Rank Adaption

Boosting Memory Efficiency in Transfer Learning for High-Resolution Medical Image Classification

Scaling Backwards: Minimal Synthetic Pre-training?

SFPrompt: Communication-Efficient Split Federated Fine-Tuning for Large Pre-Trained Models over Resource-Limited Devices

Reconstructing Training Data From Real World Models Trained with Transfer Learning

Enhancing Parameter Efficiency and Generalization in Large-Scale Models: A Regularized and Masked Low-Rank Adaptation Approach

Quantized Prompt for Efficient Generalization of Vision-Language Models

Building pre-train LLM Dataset for the INDIC Languages: a case study on Hindi

SHERL: Synthesizing High Accuracy and Efficient Memory for Resource-Limited Transfer Learning

CDQuant: Greedy Coordinate Descent for Accurate LLM Quantization

Feature Protection For Out-of-distribution Generalization

Adapting WavLM for Speech Emotion Recognition

Training-Free Deepfake Voice Recognition by Leveraging Large-Scale Pre-Trained Models

The Simpler The Better: An Entropy-Based Importance Metric To Reduce Neural Networks' Depth

FL-TAC: Enhanced Fine-Tuning in Federated Learning via Low-Rank, Task-Specific Adapter Clustering

Audio-Visual Generalized Zero-Shot Learning using Pre-Trained Large Multi-Modal Models