Lyric Transcription

Lyric transcription, the automated process of converting song lyrics from audio recordings into text, is a rapidly evolving field focusing on improving accuracy and readability. Current research emphasizes developing robust models, often adapting pre-trained speech models like Whisper or employing novel architectures such as genre-conditioned networks, to handle challenges posed by polyphonic music and diverse languages. This work is driven by the need for more accurate and comprehensive lyrics datasets for benchmarking and training, and has implications for music information retrieval, emotion recognition in music, and the creation of more accessible music archives.

Papers

December 5, 2024

Aligned Music Notation and Lyrics Transcription
Eliseo Fuentes-Martínez, Antonio Ríos-Vila, Juan C. Martinez-Sevilla, David Rizo, Jorge Calvo-Zaragoza
Alignment Algorithm Optical Music Recognition Lyric Transcription

July 30, 2024

Lyrics Transcription for Humans: A Readability-Aware Benchmark
Ondřej Cífka, Hendrik Schreiber, Luke Miner, Fabian-Robert Stöter
Real Human Musical Structure Automatic Lyric Transcription Lyric Transcription

June 6, 2024

Innovations in Cover Song Detection: A Lyrics-Based Approach
Maximilian Balluff, Peter Mandl, Christian Wolff
Digital Innovation Song Dataset Lyric Transcription Cover Song Illegal Song Cover

November 21, 2023

Adapting pretrained speech model for Mandarin lyrics transcription and alignment
Jun-You Wang, Chon-In Leong, Yu-Chen Lin, Li Su, Jyh-Shing Roger Jang
Alignment Problem Speech Model Singing Voice Automatic Lyric Transcription Lyric Transcription

March 16, 2023

Tollywood Emotions: Annotation of Valence-Arousal in Telugu Song Lyrics
R Guru Ravi Shanker, B Manikanta Gupta, BV Koushik, Vinoo Alluri
Emotion Recognition Target Emotion Annotation Rather Discrete Emotion Arousal Label Music Emotion Recognition Lyric Transcription

November 18, 2022

Self-Transriber: Few-shot Lyrics Transcription with Self-training
Xiaoxue Gao, Xianghu Yue, Haizhou Li
Semi Supervised Learning Self Training Speech Transcription Automatic Lyric Transcription Lyric Transcription

August 24, 2022

Interpreting Song Lyrics with an Audio-Informed Pre-trained Language Model
Yixiao Zhang, Junyan Jiang, Gus Xia, Simon Dixon
Audio Representation Song Dataset Lyric Alignment Cross Modal Music Lyric Transcription

July 15, 2022

PoLyScriber: Integrated Fine-tuning of Extractor and Lyrics Transcriber for Polyphonic Music
Xiaoxue Gao, Chitralekha Gupta, Haizhou Li
Fine Tuning Feature Extraction Target Extraction Automatic Lyric Transcription Lyric Transcription

April 7, 2022

Genre-conditioned Acoustic Models for Automatic Lyrics Transcription of Polyphonic Music
Xiaoxue Gao, Chitralekha Gupta, Haizhou Li
Speech Intelligibility Acoustic Model Genre Classification Automatic Lyric Transcription Lyric Transcription