Far Field Speaker Verification

Far-field speaker verification (FFSV) aims to reliably identify speakers from recordings made at a distance, a challenging task due to increased noise and reverberation. Current research focuses on improving robustness by incorporating phonetic information into speaker embeddings, employing multi-channel signal processing and deep neural network (DNN) architectures like ResNets and RepVGGS, and developing sophisticated training strategies such as transfer learning and self-supervised learning with large-scale datasets to mitigate data scarcity and overfitting. These advancements are crucial for enhancing the accuracy and reliability of speaker recognition in real-world applications like voice assistants and security systems.

Papers

February 13, 2024

Channel-Combination Algorithms for Robust Distant Voice Activity and Overlapped Speech Detection
Théo Mariotte, Anthony Larcher, Silvio Montrésor, Jean-Hugh Thomas
Speaker Diarization Voice Activity Detection Channel Selection Invariant Loss Overlapped Speech Detection Far Field Speaker Verification

November 27, 2023

Phonetic-aware speaker embedding for far-field speaker verification
Zezhong Jin, Youzhi Tu, Man-Wai Mak
Speaker Verification Speaker Embeddings Speaker Recognition Phonetic Information Joint Audio Robust Speaker Representation Far Field Speaker Verification

March 1, 2023

Distance-based Weight Transfer from Near-field to Far-field Speaker Verification
Li Zhang, Qing Wang, Hongji Wang, Yue Li, Wei Rao, Yannan Wang, Lei Xie
Far Field Weight Regularization Near Field Far Field Speaker Verification Weight Transfer

November 9, 2022

Speech separation with large-scale self-supervised learning
Zhuo Chen, Naoyuki Kanda, Jian Wu, Yu Wu, Xiaofei Wang, Takuya Yoshioka, Jinyu Li, Sunit Sivasankaran, Sefik Emre Eskimez
Self Supervised Speech Separation Large Scale Self Supervised Far Field Speaker Verification

October 17, 2022

How to Leverage DNN-based speech enhancement for multi-channel speaker verification?
Sandipana Dowerah, Romain Serizel, Denis Jouvet, Mohammad Mohammadamini, Driss Matrouf
Speech Enhancement Speaker Verification Signal Processing Leverage Score Far Field Speaker Verification Multi Channel Speaker Verification

September 23, 2022

The SpeakIn Speaker Verification System for Far-Field Speaker Verification Challenge 2022
Yu Zheng, Jinghan Peng, Yihao Chen, Yajun Zhang, Jialong Wang, Min Liu, Minqiang Xu
Speaker Verification Far Field Speaker Verification

August 17, 2022

Disentangled Speaker Representation Learning via Mutual Information Minimization
Sung Hwan Mun, Min Hyun Han, Minchan Kim, Dongjune Lee, Nam Soo Kim
Mutual Information Speaker Embeddings Disentangled Representation Speaker Recognition Speech Feature Disentanglement Framework Far Field Speaker Verification

Far Field Speaker Verification

Papers

Channel-Combination Algorithms for Robust Distant Voice Activity and Overlapped Speech Detection

Phonetic-aware speaker embedding for far-field speaker verification

Distance-based Weight Transfer from Near-field to Far-field Speaker Verification

Speech separation with large-scale self-supervised learning

How to Leverage DNN-based speech enhancement for multi-channel speaker verification?

The SpeakIn Speaker Verification System for Far-Field Speaker Verification Challenge 2022

Disentangled Speaker Representation Learning via Mutual Information Minimization