English Code Switching

English code-switching speech recognition (CSR) focuses on accurately transcribing speech containing spontaneous switches between English and another language, primarily Mandarin in recent research. Current efforts concentrate on improving the performance of models like kNN-CTC and transformer-transducer architectures, often incorporating techniques such as dual monolingual datastores, language-specific acoustic boundary learning, and data augmentation strategies to address the challenges posed by language mixing. These advancements are significant because accurate CSR is crucial for applications requiring real-time transcription of multilingual conversations, such as language learning tools and cross-cultural communication platforms.

Papers

June 6, 2024

Improving Zero-Shot Chinese-English Code-Switching ASR with kNN-CTC and Gated Monolingual Datastores
Jiaming Zhou, Shiwan Zhao, Hui Wang, Tian-Hao Zhang, Haoqin Sun, Xuechen Wang, Yong Qin
Connectionist Temporal Classification Code Switching Automatic Speech Recognition Monolingual Automatic Speech Recognition English Code Switching

December 30, 2023

Investigating Zero-Shot Generalizability on Mandarin-English Code-Switched ASR and Speech-to-text Translation of Recent Foundation Models with Self-Supervision and Weak Supervision
Chih-Kai Yang, Kuan-Po Huang, Ke-Han Lu, Chun-Yi Kuan, Chi-Yuan Hsiao, Hung-yi Lee
Self Supervised Weak Supervision Self Supervision Stronger Generalizability Self Supervised Model Code Switching English Code Switching

June 8, 2023

Language-specific Acoustic Boundary Learning for Mandarin-English Code-switching Speech Recognition
Zhiyun Fan, Linhao Dong, Chen Shen, Zhenlin Liang, Jun Zhang, Lu Lu, Zejun Ma
Code Switching Speaker Change Detection English Code Switching

March 20, 2023

Code-Switching Text Generation and Injection in Mandarin-English ASR
Haibin Yu, Yuxuan Hu, Yao Qian, Ma Jin, Linquan Liu, Shujie Liu, Yu Shi, Yanmin Qian, Edward Lin, Michael Zeng
Speech Recognition Speech to Text Code Switching Injection Drug Use English Code Switching

October 26, 2022

Pronunciation Generation for Foreign Language Words in Intra-Sentential Code-Switching Speech Recognition
Wei Wang, Chao Zhang, Xiaopei Wu
Different Language Code Switching Speech Recognition English Code Switching Code Switching Data

October 12, 2022

Summary on the ISCSLP 2022 Chinese-English Code-Switching ASR Challenge
Shuhao Deng, Chengfei Li, Jinfeng Bai, Qingqing Zhang, Wei-Qiang Zhang, Runyan Yang, Gaofeng Cheng, Pengyuan Zhang, Yonghong Yan
Code Switching Automatic Speech Recognition English Code Switching

June 27, 2022

TALCS: An Open-Source Mandarin-English Code-Switching Corpus and a Speech Recognition Baseline
Chengfei Li, Shuhao Deng, Yaoping Wang, Guangjing Wang, Yaguang Gong, Changbin Chen, Jinfeng Bai
Speech Processing Code Switching Speech Recognition Salt Detection English Code Switching Mandarin English Code Switching

English Code Switching

Papers

Improving Zero-Shot Chinese-English Code-Switching ASR with kNN-CTC and Gated Monolingual Datastores

Investigating Zero-Shot Generalizability on Mandarin-English Code-Switched ASR and Speech-to-text Translation of Recent Foundation Models with Self-Supervision and Weak Supervision

Language-specific Acoustic Boundary Learning for Mandarin-English Code-switching Speech Recognition

Code-Switching Text Generation and Injection in Mandarin-English ASR

Pronunciation Generation for Foreign Language Words in Intra-Sentential Code-Switching Speech Recognition

Summary on the ISCSLP 2022 Chinese-English Code-Switching ASR Challenge

TALCS: An Open-Source Mandarin-English Code-Switching Corpus and a Speech Recognition Baseline