Multi Task Model

Multi-task models aim to train a single model capable of performing multiple tasks simultaneously, improving efficiency and generalization compared to training separate models for each task. Current research focuses on developing effective architectures and algorithms, including transformer-based models, mixture-of-experts, and various model merging techniques like task arithmetic and weight averaging, to address challenges such as catastrophic forgetting and representation bias. This field is significant because it offers improved resource utilization and enhanced performance across diverse applications, ranging from medical image analysis and natural language processing to robotics and recommender systems.

Papers

April 28, 2023

An Empirical Study of Multimodal Model Merging
Yi-Lin Sung, Linjie Li, Kevin Lin, Zhe Gan, Mohit Bansal, Lijuan Wang
Empirical Study Modality Specific Model Merging Multi Task Model Cross Modal Transformer

April 17, 2023

Leveraging sparse and shared feature activations for disentangled representation learning
Marco Fumero, Florian Wenzel, Luca Zancato, Alessandro Achille, Emanuele Rodolà, Stefano Soatto, Bernhard Schölkopf, Francesco Locatello
Representation Learning Meaningful Representation Many Sparse Targeted Activation Penalty Latent Factor Multi Task Model Self Supervised Objective

March 14, 2023

February 21, 2023

Device Tuning for Multi-Task Large Model
Penghao Jiang, Xuanchen Hou, Yinsi Zhou
Deep Learning Model Multi Task Learning Self Attention Multi Task Model Smart Device

February 17, 2023

Improving Training Stability for Multitask Ranking Models in Recommender Systems
Jiaxi Tang, Yoel Drori, Daryl Chang, Maheswaran Sathiamoorthy, Justin Gilmer, Li Wei, Xinyang Yi, Lichan Hong, Ed H. Chi
Recommender System Recommendation Model Multi Task Model Stable Training Training Instability

November 29, 2022

Compressing Cross-Lingual Multi-Task Models at Qualtrics
Daniel Campos, Daniel Perry, Samir Joshi, Yashmeet Gambhir, Wei Du, Zhengzheng Xing, Aaron Colak
eXperience Report Multi Task Model Experience Pool Online Questionnaire

November 7, 2022

A Multi-task Model for Sentiment Aided Stance Detection of Climate Change Tweets
Apoorva Upadhyaya, Marco Fisichella, Wolfgang Nejdl
Sentiment Analysis Stance Detection Multi Task Model Climate Misinformation Climate Change Tweet

October 20, 2022

Entire Space Counterfactual Learning: Tuning, Analytical Properties and Industrial Applications
Hao Wang, Zhichao Chen, Jiajun Fan, Yuxin Huang, Weiming Liu, Xinggao Liu
Multi Task Model Hyper Tune CTC Based Industrial Application Counterfactual Learning Conversion Rate

October 13, 2022

Multi-Task Meta Learning: learn how to adapt to unseen tasks
Richa Upadhyay, Prakash Chandra Chhipa, Ronald Phlypo, Rajkumar Saini, Marcus Liwicki
Multi Task Model Unseen Task Multi Task Learning Framework

June 17, 2022

DenseMTL: Cross-task Attention Mechanism for Dense Multi-task Learning
Ivan Lopes, Tuan-Hung Vu, Raoul de Charette
Semantic Segmentation Multi Task Learning Multi Task Model Multi Task Dense Prediction Attention Based Correlation Module Cross Task Attention

May 25, 2022

Eliciting and Understanding Cross-Task Skills with Task-Level Mixture-of-Experts
Qinyuan Ye, Juan Zha, Xiang Ren
Transformer Model NLP Task Mixture of Expert Multi Task Model Cross Task

May 6, 2022

Explaining the Effectiveness of Multi-Task Learning for Efficient Knowledge Extraction from Spine MRI Reports
Arijit Sehanobish, McCullen Sandora, Nabila Abraham, Jayashri Pawar, Danielle Torres, Anasuya Das, Murray Becker, Richard Herzog, Benjamin Odry, Ron Vianu
Multi Task Learning Knowledge Extraction Multi Task Model Spinal X Ray Radiology Report Datasets Multi Tasking Model

April 27, 2022

Human-Centered Prior-Guided and Task-Dependent Multi-Task Representation Learning for Action Recognition Pre-Training
Guanhong Wang, Keyu Lu, Yang Zhou, Zhanhao He, Gaoang Wang
Action Recognition Multi Task Model Multi Task Representation Self Supervised Action

April 17, 2022

Unsupervised Cross-Task Generalization via Retrieval Augmentation
Bill Yuchen Lin, Kangmin Tan, Chris Miller, Beiwen Tian, Xiang Ren
Multi Task Retrieval Augmentation Better Generalization Multi Task Model Cross Task Generalization

April 16, 2022

Sparsely Activated Mixture-of-Experts are Robust Multi-Task Learners
Shashank Gupta, Subhabrata Mukherjee, Krishan Subudhi, Eduardo Gonzalez, Damien Jose, Ahmed H. Awadallah, Jianfeng Gao
Multi Task Learning Multi Task Mixture of Expert Sparse Network Multi Task Model

April 9, 2022

Efficient Extraction of Pathologies from C-Spine Radiology Reports using Multi-Task Learning
Arijit Sehanobish, Nathaniel Brown, Ishita Daga, Jayashri Pawar, Danielle Torres, Anasuya Das, Murray Becker, Richard Herzog, Benjamin Odry, Ron Vianu
Multi Task Learning NLP Field Multitask Learning Multi Task Model Spinal X Ray Pathological Feature Efficient Extraction

April 3, 2022

ESCM$^2$: Entire Space Counterfactual Multi-Task Model for Post-Click Conversion Rate Estimation
Hao Wang, Tai-Wei Chang, Tianqiao Liu, Jianmin Huang, Zhichao Chen, Chao Yu, Ruopeng Li, Wei Chu
Multi Task Model CTC Based Estimation Bias Post Click

March 28, 2022

Decoupled Multi-task Learning with Cyclical Self-Regulation for Face Parsing
Qingping Zheng, Jiankang Deng, Zheng Zhu, Ying Li, Stefanos Zafeiriou
Multi Task Learning Deep Convolutional Neural Network Human Face Multi Task Model Self Ensemble

March 24, 2022

Multitask Emotion Recognition Model with Knowledge Distillation and Task Discriminator
Euiseok Jeong, Geesung Oh, Sejoon Lim
Deep Learning Knowledge Distillation Multi Task Emotion Recognition Human Emotion Multi Task Model

Multi Task Model

Papers

An Empirical Study of Multimodal Model Merging

Leveraging sparse and shared feature activations for disentangled representation learning

Relational Multi-Task Learning: Modeling Relations between Data and Tasks

Merging Decision Transformers: Weight Averaging for Forming Multi-Task Policies

Device Tuning for Multi-Task Large Model

Improving Training Stability for Multitask Ranking Models in Recommender Systems

Compressing Cross-Lingual Multi-Task Models at Qualtrics

A Multi-task Model for Sentiment Aided Stance Detection of Climate Change Tweets

Entire Space Counterfactual Learning: Tuning, Analytical Properties and Industrial Applications

Multi-Task Meta Learning: learn how to adapt to unseen tasks

DenseMTL: Cross-task Attention Mechanism for Dense Multi-task Learning

Eliciting and Understanding Cross-Task Skills with Task-Level Mixture-of-Experts

Explaining the Effectiveness of Multi-Task Learning for Efficient Knowledge Extraction from Spine MRI Reports

Human-Centered Prior-Guided and Task-Dependent Multi-Task Representation Learning for Action Recognition Pre-Training

Unsupervised Cross-Task Generalization via Retrieval Augmentation

Sparsely Activated Mixture-of-Experts are Robust Multi-Task Learners

Efficient Extraction of Pathologies from C-Spine Radiology Reports using Multi-Task Learning

ESCM$^2$: Entire Space Counterfactual Multi-Task Model for Post-Click Conversion Rate Estimation

Decoupled Multi-task Learning with Cyclical Self-Regulation for Face Parsing

Multitask Emotion Recognition Model with Knowledge Distillation and Task Discriminator