Level Pronunciation

Level pronunciation research focuses on automatically assessing the accuracy of spoken language, providing detailed feedback at various granularities (phoneme, word, utterance) and across multiple aspects (accuracy, fluency, completeness). Current research emphasizes the development of deep learning models, often employing transformer architectures and attention mechanisms, to analyze acoustic features and compare them against reference pronunciations, sometimes leveraging phone embeddings and multi-source information. These advancements aim to improve the accuracy and efficiency of computer-assisted pronunciation training systems, ultimately benefiting language learners and researchers alike by providing more effective and nuanced feedback on pronunciation.

Papers

February 21, 2023

Leveraging phone-level linguistic-acoustic similarity for utterance-level pronunciation scoring
Wei Liu, Kaiqi Fu, Xiaohai Tian, Shuju Shi, Wei Li, Zejun Ma, Tan Lee
Language Similarity Automatic Pronunciation Assessment Pronunciation Assessment Level Pronunciation

December 8, 2022

DDSupport: Language Learning Support System that Displays Differences and Distances from Model Speech
Kazuki Kawamura, Jun Rekimoto
Speech Data Speech Processing Customer Service Speech Model Qualitative Difference Language Learning Distance Information Mispronunciation Detection Pronunciation Training Level Pronunciation

November 15, 2022

Hierarchical Pronunciation Assessment with Multi-Aspect Attention
Heejin Do, Yunsu Kim, Gary Geunbae Lee
Automatic Pronunciation Assessment Pronunciation Training Multi Attention Level Pronunciation

September 8, 2022

Goodness of Pronunciation Pipelines for OOV Problem
Ankit Grover
ASR Model ASR System Processing Pipeline Geographic Feature Pronunciation Level Pronunciation

March 1, 2022

Improving Non-native Word-level Pronunciation Scoring with Phone-level Mixup Data Augmentation and Multi-source Information
Kaiqi Fu, Shaojun Gao, Kai Wang, Wei Li, Xiaohai Tian, Zejun Ma
Data Augmentation Effective Data Augmentation Multiple Knowledge Source Automatic Pronunciation Assessment Level Pronunciation

November 16, 2021

CoCA-MDD: A Coupled Cross-Attention based Framework for Streaming Mispronunciation Detection and Diagnosis
Nianzu Zheng, Liqun Deng, Wenyong Huang, Yu Ting Yeung, Baohua Xu, Yuanyuan Guo, Yasheng Wang, Xiao Chen, Xin Jiang, Qun Liu
New Framework Medical Diagnosis Mispronunciation Detection Pronunciation Training Level Pronunciation

Level Pronunciation

Papers

Leveraging phone-level linguistic-acoustic similarity for utterance-level pronunciation scoring

DDSupport: Language Learning Support System that Displays Differences and Distances from Model Speech

Hierarchical Pronunciation Assessment with Multi-Aspect Attention

Goodness of Pronunciation Pipelines for OOV Problem

Improving Non-native Word-level Pronunciation Scoring with Phone-level Mixup Data Augmentation and Multi-source Information

CoCA-MDD: A Coupled Cross-Attention based Framework for Streaming Mispronunciation Detection and Diagnosis