Task Specific Model

Task-specific models aim to optimize performance on individual tasks by tailoring model architectures and training data to specific needs, rather than relying on general-purpose models. Current research focuses on improving efficiency and generalization through techniques like model merging (combining multiple task-specific models), instruction tuning (adapting models via natural language instructions), and the use of Mixture-of-Experts (MoE) architectures for handling diverse data. This work is significant because it addresses the limitations of general-purpose models in specialized domains and offers more efficient and adaptable solutions for various applications, including natural language processing, computer vision, and robotics.

Papers

July 9, 2024

AutoTask: Task Aware Multi-Faceted Single Model for Multi-Task Ads Relevance
Shouchang Guo, Sonam Damani, Keng-hao Chang
Multi Task Task Specific Model Single Model Task Representation Task Aware Relevance Map Multi Attention

June 18, 2024

From Instance Training to Instruction Learning: Task Adapters Generation from Instructions
Huanxuan Liao, Shizhu He, Yao Xu, Yuanzhe Zhang, Yanchao Hao, Shengping Liu, Kang Liu, Jun Zhao
Human Instruction Task Specific Model Task Generalization Cross Task Generalization Task Specific Adapter Instruction Learning

June 17, 2024

May 16, 2024

PyTorch-IE: Fast and Reproducible Prototyping for Information Extraction
Arne Binder, Leonhard Hennig, Christoph Alt
Information Extraction Task Specific Model Semi Structured

May 7, 2024

DocRes: A Generalist Model Toward Unifying Document Image Restoration Tasks
Jiaxin Zhang, Dezhi Peng, Chongyu Liu, Peirong Zhang, Lianwen Jin
Task Specific Model Document AI Restoration Task Document Restoration

March 25, 2024

Task-Agnostic Detector for Insertion-Based Backdoor Attacks
Weimin Lyu, Xiao Lin, Songzhu Zheng, Lu Pang, Haibin Ling, Susmit Jha, Chao Chen
Task Specific Model Backdoor Detection Textual Backdoor Attack Insertion Based Agnostic Detection

March 23, 2024

Leveraging Zero-Shot Prompting for Efficient Language Model Distillation
Lukas Vöge, Vincent Gurgul, Stefan Lessmann
Efficient Training Task Specific Model Language Model Distillation

March 20, 2024

Arcee's MergeKit: A Toolkit for Merging Large Language Models
Charles Goddard, Shamane Siriwardhana, Malikeh Ehghaghi, Luke Meyers, Vlad Karpukhin, Brian Benedict, Mark McQuade, Jacob Solawetz
Task Specific Model Model Merging Easy to Use Toolkit Model Checkpoint Open Source Language Model Multitask Model

March 14, 2024

March 2, 2024

DMoERM: Recipes of Mixture-of-Experts for Effective Reward Modeling
Shanghaoran Quan
Large Language Model Mixture of Expert Task Specific Model Alignment Tuning

February 29, 2024

UniTS: A Unified Multi-Task Time Series Model
Shanghua Gao, Teddy Koker, Owen Queen, Thomas Hartvigsen, Theodoros Tsiligkaridis, Marinka Zitnik
Task Specific Model Basic UniT Time Series Model Generative Time Series

February 26, 2024

StructLM: Towards Building Generalist Models for Structured Knowledge Grounding
Alex Zhuang, Ge Zhang, Tianyu Zheng, Xinrun Du, Junjie Wang, Weiming Ren, Stephen W. Huang, Jie Fu, Xiang Yue, Wenhu Chen
Large Language Model Structured Data Task Specific Model Semi Structured Generalist Model Knowledge Grounding

February 10, 2024

A Thorough Examination of Decoding Methods in the Era of LLMs
Chufan Shi, Haoran Yang, Deng Cai, Zhisong Zhang, Yifan Wang, Yujiu Yang, Wai Lam
Large Language Model Language Model New Era Hyperparameter Tuning Task Specific Model Next Token Prediction Decoding Method

February 5, 2024

Delving into Multi-modal Multi-task Foundation Models for Road Scene Understanding: From Learning Paradigm Perspectives
Sheng Luo, Wei Chen, Wanxin Tian, Rui Liu, Luanxuan Hou, Xiubao Zhang, Haifeng Shen, Ruiqi Wu, Shuyi Geng, Yi Zhou, Ling Shao, Yi Yang, Bojun Gao, Qun Li, Guobin Wu
Multi Task Multi Modal Model Task Specific Model Visual Understanding Learning Paradigm Multi TASK

December 29, 2023

Jatmo: Prompt Injection Defense by Task-Specific Finetuning
Julien Piet, Maha Alrashed, Chawin Sitawarin, Sizhe Chen, Zeming Wei, Elizabeth Sun, Basel Alomair, David Wagner
Instruction Tuning Task Specific Instruction Following Task Specific Model Prompt Injection Attack Prompt Injection

December 14, 2023

Toward General-Purpose Robots via Foundation Models: A Survey and Meta-Analysis
Yafei Hu, Quanting Xie, Vidhi Jain, Jonathan Francis, Jay Patrikar, Nikhil Keetha, Seungchan Kim, Yaqi Xie, Tianyi Zhang, Hao-Shu Fang, Shibo Zhao, Shayegan Omidshafiei, Dong-Ki Kim, Ali-akbar Agha-mohammadi, Katia Sycara, Matthew Johnson-Roberson, Dhruv Batra, Xiaolong Wang, Sebastian Scherer, Chen Wang, Zsolt Kira, Fei Xia, Yonatan Bisk
Timely Survey Foundation Model Robotics Domain Task Specific Model Meta Analysis General Purpose

December 11, 2023

Concrete Subspace Learning based Interference Elimination for Multi-task Model Fusion
Anke Tang, Li Shen, Yong Luo, Liang Ding, Han Hu, Bo Du, Dacheng Tao
Task Specific Model Model Merging Multi Task Model Subspace Learning Interference Cancellation Signal Subspace