Cross Lingual Transfer

Cross-lingual transfer aims to leverage knowledge learned from high-resource languages to improve performance on low-resource languages in natural language processing tasks. Current research focuses on adapting large language models (LLMs) for cross-lingual transfer, employing techniques like model merging, data augmentation (including synthetic data generation and transliteration), and innovative training strategies such as in-context learning and continual pre-training. This research is crucial for expanding the reach of NLP to a wider range of languages, enabling applications like multilingual question answering, sentiment analysis, and code generation to benefit diverse communities globally.

Papers

September 13, 2022

Data-adaptive Transfer Learning for Translation: A Case Study in Haitian and Jamaican
Nathaniel R. Robinson, Cameron J. Hogan, Nancy Fulda, David R. Mortensen
Case Study Cross Lingual Transfer Cross Lingual View Translation Back Translation Low Resource Machine Translation Adaptive Transfer Learning

September 7, 2022

Improving the Cross-Lingual Generalisation in Visual Question Answering
Farhad Nooralahzadeh, Rico Sennrich
Visual Question Answering Cross Lingual Transfer Pre Trained Vision Language Model Multilingual Vision Cross Lingual Generalisation

July 28, 2022

Few-shot News Recommendation via Cross-lingual Transfer
Taicheng Guo, Lu Yu, Basem Shihada, Xiangliang Zhang
Cross Lingual Transfer

July 12, 2022

June 14, 2022

FreeTransfer-X: Safe and Label-Free Cross-Lingual Transfer from Off-the-Shelf Models
Yinpeng Guo, Liangyou Li, Xin Jiang, Qun Liu
Knowledge Transfer Cross Lingual Transfer Multilingual Pre Trained Language Model Multilingual Corpus Shelf Model

June 8, 2022

Realistic Zero-Shot Cross-Lingual Transfer in Legal Topic Classification
Stratos Xenouleas, Alexia Tsoukara, Giannis Panagiotakis, Ilias Chalkidis, Ion Androutsopoulos
Fine Tuning Real World Cross Lingual Transfer Multilingual Dataset Zero Shot Cross Lingual Transfer

June 2, 2022

Transfer Language Selection for Zero-Shot Cross-Lingual Abusive Language Detection
Juuso Eronen, Michal Ptaszynski, Fumito Masui, Masaki Arata, Gniewosz Leliwa, Michal Wroczynski
Cross Lingual Transfer Abusive Language Detection Transfer Optimization

May 31, 2022

Don't Forget Cheap Training Signals Before Building Unsupervised Bilingual Word Embeddings
Silvia Severini, Viktor Hangya, Masoud Jalili Sabet, Alexander Fraser, Hinrich Schütze
Cross Lingual Transfer Monolingual Corpus Training Signal

May 25, 2022

May 24, 2022

May 20, 2022

Multi2WOZ: A Robust Multilingual Dataset and Conversational Pretraining for Task-Oriented Dialog
Chia-Chien Hung, Anne Lauscher, Ivan Vulić, Simone Paolo Ponzetto, Goran Glavaš
Cross Lingual Transfer Task Oriented Multilingual Dataset English Dataset Task Oriented Dialog Shot Cross Lingual

May 17, 2022

May 9, 2022

April 29, 2022

Por Qu\'e N\~ao Utiliser Alla Spr{\aa}k? Mixed Training with Gradient Optimization in Few-Shot Cross-Lingual Transfer
Haoran Xu, Kenton Murray
NLP Task Cross Lingual Transfer Gradient Based Optimization Language Specific Target Language Training Time Shot Cross Lingual Mixed Supervised Learning

Cross Lingual Transfer

Papers

Data-adaptive Transfer Learning for Translation: A Case Study in Haitian and Jamaican

Improving the Cross-Lingual Generalisation in Visual Question Answering

Few-shot News Recommendation via Cross-lingual Transfer

How Do Multilingual Encoders Learn Cross-lingual Representation?

Zero-shot Cross-lingual Transfer is Under-specified Optimization

FreeTransfer-X: Safe and Label-Free Cross-Lingual Transfer from Off-the-Shelf Models

Realistic Zero-Shot Cross-Lingual Transfer in Legal Topic Classification

Transfer Language Selection for Zero-Shot Cross-Lingual Abusive Language Detection

Don't Forget Cheap Training Signals Before Building Unsupervised Bilingual Word Embeddings

Discovering Language-neutral Sub-networks in Multilingual Language Models

Bitext Mining Using Distilled Sentence Representations for Low-Resource Languages

Overcoming Catastrophic Forgetting in Zero-Shot Cross-Lingual Generation

Hyper-X: A Unified Hypernetwork for Multi-Task Multilingual Transfer

Analyzing the Mono- and Cross-Lingual Pretraining Dynamics of Multilingual Language Models

Multi2WOZ: A Robust Multilingual Dataset and Conversational Pretraining for Task-Oriented Dialog

OneAligner: Zero-shot Cross-lingual Transfer with One Rich-Resource Language Pair for Low-Resource Sentence Retrieval

Feature Aggregation in Zero-Shot Cross-Lingual Transfer Using Multilingual BERT

Enhancing Cross-lingual Transfer by Manifold Mixup

A Balanced Data Approach for Evaluating Cross-Lingual Transfer: Mapping the Linguistic Blood Bank

Por Qu\'e N\~ao Utiliser Alla Spr{\aa}k? Mixed Training with Gradient Optimization in Few-Shot Cross-Lingual Transfer