Automatic Lyric Transcription

Automatic lyric transcription (ALT) aims to accurately and comprehensively transcribe song lyrics from audio, going beyond simple word recognition to capture punctuation, formatting, and structural elements crucial for readability and conveying artistic intent. Current research emphasizes improving transcription accuracy using various approaches, including adapting pre-trained speech models (like Whisper), employing self-supervised learning and semi-supervised techniques to address data scarcity, and integrating multimodal data (audio, video, IMU) for enhanced robustness. These advancements hold significant potential for improving user experiences in music applications like karaoke, live captioning, and music information retrieval systems, as well as furthering our understanding of music-related information processing.

Papers

July 30, 2024

Lyrics Transcription for Humans: A Readability-Aware Benchmark
Ondřej Cífka, Hendrik Schreiber, Luke Miner, Fabian-Robert Stöter
Real Human Musical Structure Automatic Lyric Transcription Lyric Transcription

November 23, 2023

Jam-ALT: A Formatting-Aware Lyrics Transcription Benchmark
Ondřej Cífka, Constantinos Dimitriou, Cheng-i Wang, Hendrik Schreiber, Luke Miner, Fabian-Robert Stöter
Lyric Alignment Automatic Lyric Transcription

November 21, 2023

Adapting pretrained speech model for Mandarin lyrics transcription and alignment
Jun-You Wang, Chon-In Leong, Yu-Chen Lin, Li Su, Jyh-Shing Roger Jang
Alignment Problem Speech Model Singing Voice Automatic Lyric Transcription Lyric Transcription

October 17, 2023

Lyricist-Singer Entropy Affects Lyric-Lyricist Classification Performance
Mitsuki Morita, Masato Kikuchi, Tadachika Ozono
Audio Processing Automatic Lyric Transcription

August 9, 2023

Sudowoodo: a Chinese Lyric Imitation System with Source Lyrics
Yongzhu Chang, Rongsheng Zhang, Lin Jiang, Qihang Chen, Le Zhang, Jiashu Pu
Song Lyric Lyric Generation Lyric Alignment Automatic Lyric Transcription Chinese Lyric

June 29, 2023

LyricWhiz: Robust Multilingual Zero-shot Lyrics Transcription by Whispering to ChatGPT
Le Zhuo, Ruibin Yuan, Jiahao Pan, Yinghao Ma, Yizhi LI, Ge Zhang, Si Liu, Roger Dannenberg, Jie Fu, Chenghua Lin, Emmanouil Benetos, Wenhu Chen, Wei Xue, Yike Guo
Speech Recognition Song Lyric Automatic Lyric Transcription Multilingual Automatic Lyric Transcription

November 18, 2022

Self-Transriber: Few-shot Lyrics Transcription with Self-training
Xiaoxue Gao, Xianghu Yue, Haizhou Li
Semi Supervised Learning Self Training Speech Transcription Automatic Lyric Transcription Lyric Transcription

September 26, 2022

End-to-End Lyrics Recognition with Self-supervised Learning
Xiangyu Zhang, Shuyue Stella Li, Zhanhong He, Roberto Togneri, Leibny Paola Garcia
Self Supervised Learning Self Supervised Model Music Datasets Automatic Lyric Transcription

July 20, 2022

Transfer Learning of wav2vec 2.0 for Automatic Lyric Transcription
Longshen Ou, Xiangming Gu, Ye Wang
Automatic Speech Recognition Transfer Learning Speech Supervised Learning Model Automatic Lyric Transcription

July 15, 2022

PoLyScriber: Integrated Fine-tuning of Extractor and Lyrics Transcriber for Polyphonic Music
Xiaoxue Gao, Chitralekha Gupta, Haizhou Li
Fine Tuning Feature Extraction Target Extraction Automatic Lyric Transcription Lyric Transcription

July 13, 2022

MM-ALT: A Multimodal Automatic Lyric Transcription System
Xiangming Gu, Longshen Ou, Danielle Ong, Ye Wang
Automatic Speech Recognition Voice Activity Detection Automatic Lyric Transcription Multilingual Automatic Lyric Transcription

April 7, 2022

Genre-conditioned Acoustic Models for Automatic Lyrics Transcription of Polyphonic Music
Xiaoxue Gao, Chitralekha Gupta, Haizhou Li
Speech Intelligibility Acoustic Model Genre Classification Automatic Lyric Transcription Lyric Transcription