Unsupervised NMT

Unsupervised neural machine translation (UNMT) aims to train machine translation models without relying on parallel corpora, focusing instead on leveraging monolingual data and pre-trained multilingual models. Current research emphasizes addressing challenges like the "copying problem" (where the model simply replicates parts of the input) through techniques such as incorporating language discriminator losses and refined training schedules, and improving performance on low-resource languages via intermediate task fine-tuning and back-translation. These advancements, along with explorations of novel architectures like flow-adapters and the integration of emergent communication frameworks, are pushing the boundaries of UNMT, potentially enabling translation between language pairs with limited or no parallel data available.

Papers

June 2, 2023

Leveraging Auxiliary Domain Parallel Data in Intermediate Task Fine-tuning for Low-resource Translation
Shravan Nayak, Surangika Ranathunga, Sarubi Thillainathan, Rikki Hung, Anthony Rinaldi, Yining Wang, Jonah Mackey, Andrew Ho, En-Shiun Annie Lee
Low Resource Task Specific NMT Model Parallel Data Domain Variation Multilingual Sequence to Sequence Unsupervised NMT

May 26, 2023

On the Copying Problem of Unsupervised NMT: A Training Schedule with a Language Discriminator Loss
Yihong Liu, Alexandra Chronopoulou, Hinrich Schütze, Alexander Fraser
Neural Machine Translation Language Pair Back Translation Training Time Language Modeling Loss Data Copying Unsupervised NMT

October 12, 2022

Investigating Massive Multilingual Pre-Trained Machine Translation Models for Clinical Domain via Transfer Learning
Lifeng Han, Gleb Erofeev, Irina Sorokina, Serge Gladkoff, Goran Nenadic
Transfer Learning Clinical Text Multilingual Pre Trained Language Model Pre Training Corpus Pre Trained Multilingual Unsupervised NMT

September 6, 2022

Multilingual Bidirectional Unsupervised Translation Through Multilingual Finetuning and Back-Translation
Bryan Li, Mohammad Sadegh Rasooli, Ajay Patel, Chris Callison-Burch
Fine Tuning Back Translation Zero Shot Translation NMT Model Unsupervised NMT

July 14, 2022

Learning to translate by learning to communicate
C. M. Downey, Xuhui Zhou, Leo Z. Liu, Shane Steinert-Threlkeld
LeArning Abstract Multilingual Model Cross Lingual Emergent Communication Pre Trained Multilingual Model Unsupervised NMT

May 18, 2022

Exploiting Social Media Content for Self-Supervised Style Transfer
Dana Ruiter, Thomas Kleinbauer, Cristina España-Bonet, Josef van Genabith, Dietrich Klakow
Machine Translation Social Medium Style Transfer Style Transfer Model Unsupervised NMT

April 26, 2022

Flow-Adapter Architecture for Unsupervised Machine Translation
Yihong Liu, Haris Jabbar, Hinrich Schütze
Machine Translation Latent Representation Sentence Level Unsupervised NMT

Unsupervised NMT

Papers

Leveraging Auxiliary Domain Parallel Data in Intermediate Task Fine-tuning for Low-resource Translation

On the Copying Problem of Unsupervised NMT: A Training Schedule with a Language Discriminator Loss

Investigating Massive Multilingual Pre-Trained Machine Translation Models for Clinical Domain via Transfer Learning

Multilingual Bidirectional Unsupervised Translation Through Multilingual Finetuning and Back-Translation

Learning to translate by learning to communicate

Exploiting Social Media Content for Self-Supervised Style Transfer

Flow-Adapter Architecture for Unsupervised Machine Translation