Multilingual Neural Machine Translation

Multilingual neural machine translation (MNMT) aims to build single models capable of translating between numerous language pairs, improving efficiency and resource allocation compared to training separate bilingual models. Current research focuses on optimizing model architectures (like Mixture-of-Experts) and training strategies to address challenges such as parameter inefficiency, negative interactions between languages during fine-tuning, and the "off-target" problem (incorrect language output). These advancements are significant because they enable more efficient and effective translation for low-resource languages and improve the overall quality and robustness of machine translation systems.

Papers

February 19, 2023

Scaling Laws for Multilingual Neural Machine Translation
Patrick Fernandes, Behrooz Ghorbani, Xavier Garcia, Markus Freitag, Orhan Firat
Multilingual Model Scaling Law Multilingual Neural Machine Translation Language Similarity

December 20, 2022

Lego-MT: Learning Detachable Models for Massively Multilingual Machine Translation
Fei Yuan, Yinquan Lu, WenHao Zhu, Lingpeng Kong, Lei Li, Yu Qiao, Jingjing Xu
Multilingual Machine Translation Multilingual Neural Machine Translation Translation Benchmark Effective Model

December 19, 2022

Memory-efficient NLLB-200: Language-specific Expert Pruning of a Massively Multilingual Machine Translation Model
Yeskendir Koishekenov, Alexandre Berard, Vassilina Nikoulina
LLM Based Language Pair Multilingual Machine Translation Pruning Method Multilingual Neural Machine Translation Language Specific Pruning Metric

December 6, 2022

Life-long Learning for Multilingual Neural Machine Translation with Knowledge Distillation
Yang Zhao, Junnan Zhu, Lu Xiang, Jiajun Zhang, Yu Zhou, Feifei Zhai, Chengqing Zong
Knowledge Distillation Lifelong Learning Translation Task Multilingual Neural Machine Translation

December 5, 2022

Impact of Domain-Adapted Multilingual Neural Machine Translation in the Medical Domain
Miguel Rios, Raluca-Maria Chereji, Alina Secara, Dragos Ciobanu
Global Impact Neural Machine Translation Translation Quality Medical Domain Multilingual Neural Machine Translation

November 2, 2022

Learning an Artificial Language for Knowledge-Sharing in Multilingual Translation
Danni Liu, Jan Niehues
LeArning Abstract Latent Space Multilingual Model Multilingual Neural Machine Translation Multilingual Translation Continuous Latent Space

October 26, 2022

Robust Domain Adaptation for Pre-trained Multilingual Neural Machine Translation Models
Mathieu Grosso, Pirashanth Ratnamogan, Alexis Mathey, William Vanhuffel, Michael Fotso Fotso
Domain Adaptation Language Pair Multilingual Neural Machine Translation Pre Trained Neural Machine Translation Robust Domain Adaptation Pre Trained Multilingual

October 21, 2022

$m^4Adapter$: Multilingual Multi-Domain Adaptation for Machine Translation with a Meta-Adapter
Wen Lai, Alexandra Chronopoulou, Alexander Fraser
Machine Translation Domain Shift Language Pair Multilingual Neural Machine Translation

October 20, 2022

Can Domains Be Transferred Across Languages in Multi-Domain Multilingual Neural Machine Translation?
Thuy-Trang Vu, Shahram Khadivi, Xuanli He, Dinh Phung, Gholamreza Haffari
Neural Machine Translation Unknown Language Multilingual Neural Machine Translation Domain Name Zero Shot Translation

October 18, 2022

Tencent's Multilingual Machine Translation System for WMT22 Large-Scale African Languages
Wenxiang Jiao, Zhaopeng Tu, Jiarui Li, Wenxuan Wang, Jen-tse Huang, Shuming Shi
Multilingual Machine Translation Multilingual Neural Machine Translation Machine Translation Evaluation Resource Language Pair

October 11, 2022

Checks and Strategies for Enabling Code-Switched Machine Translation
Thamme Gowda, Mozhdeh Gheini, Jonathan May
General Strategy Neural Machine Translation Model Multilingual Neural Machine Translation Code Switched Check Worthiness

September 28, 2022

Revamping Multilingual Agreement Bidirectionally via Switched Back-translation for Multilingual Neural Machine Translation
Hongyuan Lu, Haoyang Huang, Shuming Ma, Dongdong Zhang, Furu Wei, Wai Lam
Language Pair Back Translation Multilingual Neural Machine Translation Pre Trained Multilingual

September 27, 2022

Improving Multilingual Neural Machine Translation System for Indic Languages
Sudhansu Bala Das, Atharv Biradar, Tapas Kumar Mishra, Bidyut Kumar Patra
Low Resource Indian Language Multilingual Neural Machine Translation Machine Translation Model Machine Translation System Efficient Translation

September 9, 2022

Adapting to Non-Centered Languages for Zero-shot Multilingual Translation
Zhi Qu, Taro Watanabe
Multilingual Neural Machine Translation Language Specific Zero Shot Translation Low Resource Language Pair Zero Shot Multilingual

September 4, 2022

Informative Language Representation Learning for Massively Multilingual Neural Machine Translation
Renren Jin, Deyi Xiong
Language Representation Multilingual Neural Machine Translation Attention Head

August 14, 2022

Fast Vocabulary Projection Method via Clustering for Multilingual Machine Translation on GPU
Hossam Amer, Young Jin Kim, Mohamed Afify, Hitokazu Matsushita, Hany Hassan Awadallah
Single GPU Multilingual Machine Translation Multilingual Neural Machine Translation Multilingual Transformer

July 11, 2022

June 30, 2022

Building Multilingual Machine Translation Systems That Serve Arbitrary X-Y Translations
Akiko Eriguchi, Shufang Xie, Tao Qin, Hany Hassan Awadalla
Multilingual Machine Translation Translation Task Multilingual Neural Machine Translation Bilingual Model Nonlinear Transformation Pivot Translation

June 5, 2022

Multilingual Neural Machine Translation with Deep Encoder and Multiple Shallow Decoders
Xiang Kong, Adithya Renduchintala, James Cross, Yuqing Tang, Jiatao Gu, Xian Li
Multilingual Neural Machine Translation Multilingual Translation Many to Many Deep Encoder Shallow Decoder

Multilingual Neural Machine Translation

Papers

Scaling Laws for Multilingual Neural Machine Translation

Lego-MT: Learning Detachable Models for Massively Multilingual Machine Translation

Memory-efficient NLLB-200: Language-specific Expert Pruning of a Massively Multilingual Machine Translation Model

Life-long Learning for Multilingual Neural Machine Translation with Knowledge Distillation

Impact of Domain-Adapted Multilingual Neural Machine Translation in the Medical Domain

Learning an Artificial Language for Knowledge-Sharing in Multilingual Translation

Robust Domain Adaptation for Pre-trained Multilingual Neural Machine Translation Models

$m^4Adapter$: Multilingual Multi-Domain Adaptation for Machine Translation with a Meta-Adapter

Can Domains Be Transferred Across Languages in Multi-Domain Multilingual Neural Machine Translation?

Tencent's Multilingual Machine Translation System for WMT22 Large-Scale African Languages

Checks and Strategies for Enabling Code-Switched Machine Translation

Revamping Multilingual Agreement Bidirectionally via Switched Back-translation for Multilingual Neural Machine Translation

Improving Multilingual Neural Machine Translation System for Indic Languages

Adapting to Non-Centered Languages for Zero-shot Multilingual Translation

Informative Language Representation Learning for Massively Multilingual Neural Machine Translation

Fast Vocabulary Projection Method via Clustering for Multilingual Machine Translation on GPU

HLT-MT: High-resource Language-specific Training for Multilingual Neural Machine Translation

UM4: Unified Multilingual Multiple Teacher-Student Model for Zero-Resource Neural Machine Translation

Building Multilingual Machine Translation Systems That Serve Arbitrary X-Y Translations

Multilingual Neural Machine Translation with Deep Encoder and Multiple Shallow Decoders