Zero Shot Cross Lingual Transfer

Zero-shot cross-lingual transfer aims to enable language models trained on one language to perform tasks in other languages without additional training data. Current research focuses on improving this transfer by enhancing multilingual alignment within pre-trained models (like mBERT, XLM-R, and Whisper), employing techniques such as layer swapping, data augmentation (e.g., back-parsing), and parameter-efficient fine-tuning. These advancements are significant because they address the scarcity of labeled data in many languages, facilitating the development of multilingual NLP applications and furthering our understanding of cross-lingual knowledge representation within large language models.

Papers

May 26, 2023

Towards a Common Understanding of Contributing Factors for Cross-Lingual Transfer in Multilingual Language Models: A Review
Fred Philippy, Siwen Guo, Shohreh Haddadan
Narrative Review Cross Lingual Transfer Cross Lingual Multilingual Language Model Key Factor Multilingual Pre Trained Language Model Zero Shot Cross Lingual Transfer Common Ground

May 25, 2023

Revisiting non-English Text Simplification: A Unified Multilingual Benchmark
Michael J. Ryan, Tarek Naous, Wei Xu
Text Simplification Multilingual Benchmark Multilingual Pre Trained Language Model Zero Shot Cross Lingual Transfer Multilingual Text Simplification

May 23, 2023

mPLM-Sim: Better Cross-Lingual Similarity and Transfer in Multilingual Pretrained Language Models
Peiqin Lin, Chengzhi Hu, Zheyu Zhang, André F. T. Martins, Hinrich Schütze
Cross Lingual Transfer Cross Lingual Formality Transfer Multilingual Pre Trained Language Model Zero Shot Cross Lingual Zero Shot Cross Lingual Transfer Language Similarity

May 22, 2023

How do languages influence each other? Studying cross-lingual data sharing during LM fine-tuning
Rochelle Choenni, Dan Garrette, Ekaterina Shutova
Fine Tuning Unknown Language Multilingual Large Language Model LLM Fine Tuning Zero Shot Cross Lingual Transfer

April 18, 2023

Transfer to a Low-Resource Language via Close Relatives: The Case Study on Faroese
Vésteinn Snæbjarnarson, Annika Simonsen, Goran Glavaš, Ivan Vulić
Natural Language Processing Case Study Low Resource Language Cross Lingual Transfer Formality Transfer Multilingual Language Model High Resource Language Zero Shot Cross Lingual Transfer

March 30, 2023

Fine-Tuning BERT with Character-Level Noise for Zero-Shot Transfer to Dialects and Closely-Related Languages
Aarohi Srivastava, David Chiang
Cross Lingual Transfer Unknown Language Zero Shot Cross Lingual Transfer Fine Tuned BERT Regional Dialect

November 15, 2022

ALIGN-MLM: Word Embedding Alignment is Crucial for Multilingual Pre-training
Henry Tang, Ameet Deshpande, Karthik Narasimhan
Multilingual Model Word Embeddings Alignment Problem LD Align Real Text Word Zero Shot Cross Lingual Transfer Multilingual Pretraining Multilingual Pre Trained Model Similar Embeddings

October 22, 2022

Prompt-Tuning Can Be Much Better Than Fine-Tuning on Cross-lingual Understanding With Multilingual Language Models
Lifu Tu, Caiming Xiong, Yingbo Zhou
Fine Tuning Multilingual Language Model Zero Shot Cross Lingual Zero Shot Cross Lingual Transfer Multilingual Evaluation Cross Lingual Understanding

October 18, 2022

A Simple and Effective Method to Improve Zero-Shot Cross-Lingual Transfer Learning
Kunbo Ding, Weijie Liu, Yuejian Fang, Weiquan Mao, Zhe Zhao, Tao Zhu, Haoyan Liu, Rong Tian, Yiren Chen
Multilingual Model Zero Shot Cross Lingual Zero Shot Cross Lingual Transfer Cross Lingual Transfer Learning Effective Method Cross Lingual Transferability

July 12, 2022

Zero-shot Cross-lingual Transfer is Under-specified Optimization
Shijie Wu, Benjamin Van Durme, Mark Dredze
Zero Shot Cross Lingual Transfer Generalization Error Zero Shot Cross Lingual Transfer Bilingual Model Multilingual Encoders Linguistic Generalization Explicit Optimization

June 8, 2022

Realistic Zero-Shot Cross-Lingual Transfer in Legal Topic Classification
Stratos Xenouleas, Alexia Tsoukara, Giannis Panagiotakis, Ilias Chalkidis, Ion Androutsopoulos
Fine Tuning Real World Cross Lingual Transfer Multilingual Dataset Zero Shot Cross Lingual Transfer

June 1, 2022

Cross-View Language Modeling: Towards Unified Cross-Lingual Cross-Modal Pre-training
Yan Zeng, Wangchunshu Zhou, Ao Luo, Ziming Cheng, Xinsong Zhang
Language Model Zero Shot Cross Lingual Transfer Multi Modal Language Model Cross Lingual Cross Modal

May 23, 2022

The Importance of Being Parameters: An Intra-Distillation Method for Serious Gains
Haoran Xu, Philipp Koehn, Kenton Murray
Generalization Performance Importance Aware Many Parameter Big Gain Zero Shot Cross Lingual Transfer Model Sensitivity

May 17, 2022

Feature Aggregation in Zero-Shot Cross-Lingual Transfer Using Multilingual BERT
Beiduo Chen, Wu Guo, Quan Liu, Kun Tao
Cross Lingual Transfer Downstream Task Feature Aggregation Multilingual BERT Zero Shot Cross Lingual Transfer

April 13, 2022

Adapting Pre-trained Language Models to African Languages via Multilingual Adaptive Fine-Tuning
Jesujoba O. Alabi, David Ifeoluwa Adelani, Marius Mosbach, Dietrich Klakow
Fine Tuning Pre Trained Language Model Cross Lingual Transfer African Language Multilingual Pre Trained Language Model Zero Shot Cross Lingual Transfer

March 18, 2022

March 3, 2022

Overlap-based Vocabulary Generation Improves Cross-lingual Transfer Among Related Languages
Vaidehi Patil, Partha Talukdar, Sunita Sarawagi
Low Resource Language Cross Lingual Transfer Multilingual Language Model Zero Shot Cross Lingual Transfer Different Language Monolingual Corpus Low Resourced Language Tongue Twister

November 28, 2021

Zero-Shot Cross-Lingual Transfer in Legal Domain Using Transformer Models
Zein Shaheen, Gerhard Wohlgenannt, Dmitry Mouromtsev
Transformer Model Cross Lingual Transfer Zero Shot Cross Lingual Transfer

Zero Shot Cross Lingual Transfer

Papers

Towards a Common Understanding of Contributing Factors for Cross-Lingual Transfer in Multilingual Language Models: A Review

Revisiting non-English Text Simplification: A Unified Multilingual Benchmark

mPLM-Sim: Better Cross-Lingual Similarity and Transfer in Multilingual Pretrained Language Models

How do languages influence each other? Studying cross-lingual data sharing during LM fine-tuning

Transfer to a Low-Resource Language via Close Relatives: The Case Study on Faroese

Fine-Tuning BERT with Character-Level Noise for Zero-Shot Transfer to Dialects and Closely-Related Languages

ALIGN-MLM: Word Embedding Alignment is Crucial for Multilingual Pre-training

Prompt-Tuning Can Be Much Better Than Fine-Tuning on Cross-lingual Understanding With Multilingual Language Models

A Simple and Effective Method to Improve Zero-Shot Cross-Lingual Transfer Learning

Zero-shot Cross-lingual Transfer is Under-specified Optimization

Realistic Zero-Shot Cross-Lingual Transfer in Legal Topic Classification

Cross-View Language Modeling: Towards Unified Cross-Lingual Cross-Modal Pre-training

The Importance of Being Parameters: An Intra-Distillation Method for Serious Gains

Feature Aggregation in Zero-Shot Cross-Lingual Transfer Using Multilingual BERT

Adapting Pre-trained Language Models to African Languages via Multilingual Adaptive Fine-Tuning

CrossAligner & Co: Zero-Shot Transfer Methods for Task-Oriented Cross-lingual Natural Language Understanding

Do Multilingual Language Models Capture Differing Moral Norms?

Overlap-based Vocabulary Generation Improves Cross-lingual Transfer Among Related Languages

Zero-Shot Cross-Lingual Transfer in Legal Domain Using Transformer Models