Cross Lingual Transfer

Cross-lingual transfer aims to leverage knowledge learned from high-resource languages to improve performance on low-resource languages in natural language processing tasks. Current research focuses on adapting large language models (LLMs) for cross-lingual transfer, employing techniques like model merging, data augmentation (including synthetic data generation and transliteration), and innovative training strategies such as in-context learning and continual pre-training. This research is crucial for expanding the reach of NLP to a wider range of languages, enabling applications like multilingual question answering, sentiment analysis, and code generation to benefit diverse communities globally.

Papers

May 12, 2023

Prompt Learning to Mitigate Catastrophic Forgetting in Cross-lingual Transfer for Open-domain Dialogue Generation
Lei Liu, Jimmy Xiangji Huang
Catastrophic Forgetting Prompt Learning Dialogue System Cross Lingual Transfer Multitask Learning Multilingual Pre Trained Language Model Open Domain Dialogue Generation Shot Cross Lingual

May 9, 2023

CharSpan: Utilizing Lexical Similarity to Enable Zero-Shot Machine Translation for Extremely Low-resource Languages
Kaushal Kumar Maurya, Rahul Kejriwal, Maunendra Sankar Desarkar, Anoop Kunchukuttan
Machine Translation Cross Lingual Transfer Low Resource Multilingual Large Language Model Lexical Similarity

May 3, 2023

Identifying the Correlation Between Language Distance and Cross-Lingual Transfer in a Multilingual Representation Space
Fred Philippy, Siwen Guo, Shohreh Haddadan
Cross Lingual Transfer Multilingual Language Model Language Representation Total Correlation Linguistic Feature Lingual Alignment Multilingual Representation Linguistic Distance

May 2, 2023

Parameter-Efficient Cross-lingual Transfer of Vision and Language Models via Translation-based Alignment
Zhen Zhang, Jialu Wang, Xin Eric Wang
Language Model Vision Paper Cross Lingual Transfer

April 20, 2023

Does Manipulating Tokenization Aid Cross-Lingual Transfer? A Study on POS Tagging for Non-Standardized Languages
Verena Blaschke, Hinrich Schütze, Barbara Plank
Language Model Study Feature Cross Lingual Transfer Part of Speech Online Tokenizer Language Similarity Po Tagging

April 18, 2023

April 6, 2023

Bridging the Language Gap: Knowledge Injected Multilingual Question Answering
Zhichao Duan, Xiuxing Li, Zhengyan Zhang, Zhenyu Li, Ning Liu, Jianyong Wang
Question Answering Cross Lingual Transfer Extractive Question Answering Multilingual Knowledge Multilingual Question Answering

April 3, 2023

Efficiently Aligned Cross-Lingual Transfer Learning for Conversational Tasks using Prompt-Tuning
Lifu Tu, Jin Qu, Semih Yavuz, Shafiq Joty, Wenhao Liu, Caiming Xiong, Yingbo Zhou
Cross Lingual Transfer Cross Lingual Transfer Learning Cross Lingual Generalization Cross Lingual Representation Conversational Task

March 30, 2023

Fine-Tuning BERT with Character-Level Noise for Zero-Shot Transfer to Dialects and Closely-Related Languages
Aarohi Srivastava, David Chiang
Cross Lingual Transfer Unknown Language Zero Shot Cross Lingual Transfer Fine Tuned BERT Regional Dialect

March 27, 2023

Mutually-paced Knowledge Distillation for Cross-lingual Temporal Knowledge Graph Reasoning
Ruijie Wang, Zheng Li, Jingfeng Yang, Tianyu Cao, Chao Zhang, Bing Yin, Tarek Abdelzaher
Knowledge Distillation Cross Lingual Transfer Temporal Knowledge Graph

March 4, 2023

DiTTO: A Feature Representation Imitation Approach for Improving Cross-Lingual Transfer
Shanu Kumar, Abbaraju Soujanya, Sandipan Dandapat, Sunayana Sitaram, Monojit Choudhury
Cross Lingual Transfer Feature Imitation Zero Shot Transfer Multilingual Pre Trained Transformer

March 3, 2023

Investigating the Translation Performance of a Large Multilingual Language Model: the Case of BLOOM
Rachel Bawden, François Yvon
Large Language Model Cross Lingual Transfer Case Relevance NLP Community Language Pair Translation Performance Open Science Open Access Multilingual Machine Translation Performance

March 2, 2023

UZH_CLyp at SemEval-2023 Task 9: Head-First Fine-Tuning and ChatGPT Data Generation for Cross-Lingual Learning in Tweet Intimacy Prediction
Andrianos Michail, Stefanos Konstantinou, Simon Clematide
Domain Adaptation Parameter Efficient Fine Tuning Cross Lingual Transfer SemEval 2022 Task Human Labeled Cross Lingual Learning ChatGPT Advanced Data Analysis INTimacy Analysis

February 24, 2023

Cross-Lingual Transfer of Cognitive Processing Complexity
Charlotte Pouw, Nora Hollenstein, Lisa Beinborn
Cross Lingual Transfer Multilingual Language Model Multilingual Model XLM Complex Cognitive

February 10, 2023

Language-Aware Multilingual Machine Translation with Self-Supervised Learning
Haoran Xu, Jean Maillard, Vedanuj Goswami
Self Supervised Learning Cross Lingual Transfer Multilingual Machine Translation Monolingual Data

January 31, 2023

Zero-shot cross-lingual transfer language selection using linguistic similarity
Juuso Eronen, Michal Ptaszynski, Fumito Masui
Zero Shot Cross Lingual Transfer Language Similarity Transfer Optimization

January 23, 2023

Efficient Language Model Training through Cross-Lingual and Progressive Transfer Learning
Malte Ostendorff, Georg Rehm
Cross Lingual Transfer Model Training Token Embeddings Progressive Learning

January 13, 2023

FUN with Fisher: Improving Generalization of Adapter-Based Cross-lingual Transfer with Scheduled Unfreezing
Chen Cecilia Liu, Jonas Pfeiffer, Ivan Vulić, Iryna Gurevych
Strong Generalization Transfer Learning Cross Lingual Transfer Generating User Activity Fisher Weighted Gradual Unfreezing

December 21, 2022

Cross-Linguistic Syntactic Difference in Multilingual BERT: How Good is It and How Does It Affect Transfer?
Ningyu Xu, Tao Gui, Ruotian Ma, Qi Zhang, Jingting Ye, Menghan Zhang, Xuanjing Huang
Cross Lingual Transfer Formality Transfer Multilingual BERT Zero Shot Cross Lingual Morphosyntactic Analysis Cross Lingual Ability

Cross Lingual Transfer

Papers

Prompt Learning to Mitigate Catastrophic Forgetting in Cross-lingual Transfer for Open-domain Dialogue Generation

CharSpan: Utilizing Lexical Similarity to Enable Zero-Shot Machine Translation for Extremely Low-resource Languages

Identifying the Correlation Between Language Distance and Cross-Lingual Transfer in a Multilingual Representation Space

Parameter-Efficient Cross-lingual Transfer of Vision and Language Models via Translation-based Alignment

Does Manipulating Tokenization Aid Cross-Lingual Transfer? A Study on POS Tagging for Non-Standardized Languages

Romanization-based Large-scale Adaptation of Multilingual Language Models

Transfer to a Low-Resource Language via Close Relatives: The Case Study on Faroese

Bridging the Language Gap: Knowledge Injected Multilingual Question Answering

Efficiently Aligned Cross-Lingual Transfer Learning for Conversational Tasks using Prompt-Tuning

Fine-Tuning BERT with Character-Level Noise for Zero-Shot Transfer to Dialects and Closely-Related Languages

Mutually-paced Knowledge Distillation for Cross-lingual Temporal Knowledge Graph Reasoning

DiTTO: A Feature Representation Imitation Approach for Improving Cross-Lingual Transfer

Investigating the Translation Performance of a Large Multilingual Language Model: the Case of BLOOM

UZH_CLyp at SemEval-2023 Task 9: Head-First Fine-Tuning and ChatGPT Data Generation for Cross-Lingual Learning in Tweet Intimacy Prediction

Cross-Lingual Transfer of Cognitive Processing Complexity

Language-Aware Multilingual Machine Translation with Self-Supervised Learning

Zero-shot cross-lingual transfer language selection using linguistic similarity

Efficient Language Model Training through Cross-Lingual and Progressive Transfer Learning

FUN with Fisher: Improving Generalization of Adapter-Based Cross-lingual Transfer with Scheduled Unfreezing

Cross-Linguistic Syntactic Difference in Multilingual BERT: How Good is It and How Does It Affect Transfer?