Multi Task Training

Multi-task training aims to improve the efficiency and generalization of machine learning models by training a single model to perform multiple related tasks simultaneously. Current research focuses on optimizing training strategies, including exploring the impact of optimization trajectories and developing methods like dynamic pipeline scheduling for efficient training of large models, as well as investigating the role of model architectures such as transformers and mixtures of experts. This approach offers significant potential for improving model performance, reducing computational costs, and enhancing the ability of models to generalize to new, unseen tasks across diverse domains, from natural language processing and speech recognition to computer vision and reinforcement learning.

Papers

March 3, 2023

Hitachi at SemEval-2023 Task 3: Exploring Cross-lingual Multi-task Strategies for Genre and Framing Detection in Online News
Yuta Koreeda, Ken-ichi Yokote, Hiroaki Ozaki, Atsuki Yamaguchi, Masaya Tsunokake, Yasuhiro Sogawa
Language Model SemEval 2022 Task Genre Classification Multilingual Scenario Multi Task Training Online Newspaper

January 9, 2023

ERNIE 3.0 Tiny: Frustratingly Simple Method to Improve Task-Agnostic Distillation Generalization
Weixin Liu, Xuyi Chen, Jiaxiang Liu, Shikun Feng, Yu Sun, Hao Tian, Hua Wu
Multi Task Learning Multi Task Training Simple Method Task Agnostic Distillation ERNIE ViLG

December 19, 2022

MIGA: A Unified Multi-task Generation Framework for Conversational Text-to-SQL
Yingwen Fu, Wenjie Ou, Zhou Yu, Yue Lin
Text to SQL Generation Task Multi Task Training

December 8, 2022

OFASys: A Multi-Modal Multi-Task Learning System for Building Generalist Models
Jinze Bai, Rui Men, Hao Yang, Xuancheng Ren, Kai Dang, Yichang Zhang, Xiaohuan Zhou, Peng Wang, Sinan Tan, An Yang, Zeyu Cui, Yu Han, Shuai Bai, Wenbin Ge, Jianxin Ma, Junyang Lin, Jingren Zhou, Chang Zhou
Multi Task Multi Task Training Generalist Model Multi Modal Task Task Scaling

November 7, 2022

Multi-Head Adapter Routing for Cross-Task Generalization
Lucas Caccia, Edoardo Ponti, Zhan Su, Matheus Pereira, Nicolas Le Roux, Alessandro Sordoni
Multi Task Multi Task Training Cross Task Generalization Adapter Learning Adapter Based

October 26, 2022

MOCHA: A Multi-Task Training Approach for Coherent Text Generation from Cognitive Perspective
Zhe Hu, Hou Pong Chan, Lifu Huang
Text Generation Cognitive Science Story Generation Multi Task Training Open Ended Generation Argument Generation

October 24, 2022

Brouhaha: multi-task training for voice activity detection, speech-to-noise ratio, and C50 room acoustics estimation
Marvin Lavechin, Marianne Métais, Hadrien Titeux, Alodie Boissonnet, Jade Copet, Morgane Rivière, Elika Bergelson, Alejandrina Cristia, Emmanuel Dupoux, Hervé Bredin
Signal to Noise Ratio Voice Activity Detection Multi Task Training Room Acoustic Noisy Reverberant Reverberant Speech

October 8, 2022

Improving End-to-End Text Image Translation From the Auxiliary Text Translation Task
Cong Ma, Yaping Zhang, Mei Tu, Xu Han, Linghui Wu, Yang Zhao, Yu Zhou
Multi Task Learning Image Translation Human Translation Multi Task Training Image Machine Translation

August 3, 2022

GPPF: A General Perception Pre-training Framework via Sparsely Activated Multi-Task Learning
Benyuan Sun, Jin Dai, Zihao Liang, Congying Liu, Yi Yang, Bo Bai
New Framework Multi Task Learning State of the Art Vision Task Task Oriented Multi Task Training Pre Training Task

July 21, 2022

UFO: Unified Feature Optimization
Teng Xi, Yifan Sun, Deli Yu, Bi Li, Nan Peng, Gang Zhang, Xinyu Zhang, Zhigang Wang, Jinwen Chen, Jian Wang, Lufei Liu, Haocheng Feng, Junyu Han, Jingtuo Liu, Errui Ding, Jingdong Wang
Deep Model Unified Model Multi Task Training Large Scale Pretraining Unified Feature Optimization

July 8, 2022

Tandem Multitask Training of Speaker Diarisation and Speech Recognition for Meeting Transcription
Xianrui Zheng, Chao Zhang, Philip C. Woodland
Speech Recognition Wav2vec U Multi Task Training Meeting Transcript

July 7, 2022

Multi-Task Retrieval-Augmented Text Generation with Relevance Sampling
Sebastian Hofstätter, Jiecao Chen, Karthik Raman, Hamed Zamani
Retrieval Augmented Generation Knowledge Intensive Task Multi Task Training Relevance Label Retrieval Augmented Text Generation Knowledge Intensive Generation

May 24, 2022

ATTEMPT: Parameter-Efficient Multi-task Tuning via Attentional Mixtures of Soft Prompts
Akari Asai, Mohammadreza Salehi, Matthew E. Peters, Hannaneh Hajishirzi
Prompt Tuning Soft Prompt Multi Task Training Manual Effort Mixture of Attention

April 23, 2022

Exploring the Role of Task Transferability in Large-Scale Multi-Task Learning
Vishakh Padmakumar, Leonard Lausen, Miguel Ballesteros, Sheng Zha, He He, George Karypis
Multi Task Learning Integral Role Task Transferability Multi Task Training Multi Task Representation

April 8, 2022

Engagement Detection with Multi-Task Training in E-Learning Environments
Onur Copur, Mert Nakıp, Simone Scardapane, Jürgen Slowack
Multi Task Training Educational Technology User Interaction Engagement Behavior Engagement Detection

February 14, 2022

ASC me to Do Anything: Multi-task Training for Embodied AI
Jiasen Lu, Jordi Salvador, Roozbeh Mottaghi, Aniruddha Kembhavi
Training Data Embodied AI Multi Task Training Multi Task Agent Atomic Skill

November 29, 2021

Learning Multiple Dense Prediction Tasks from Partially Annotated Data
Wei-Hong Li, Xialei Liu, Hakan Bilen
Semi Supervised Learning Multi Task Learning Multi Task Annotated Dataset Multi Task Training Multi Task Dense Prediction