Prosodic Feature

Prosodic features, encompassing aspects of speech like pitch, intensity, and rhythm, are crucial for conveying meaning and emotion beyond the literal words spoken. Current research focuses on accurately modeling and manipulating these features in applications such as speech synthesis, editing, and voice conversion, often employing deep learning models like diffusion models, variational autoencoders, and actor-critic reinforcement learning. This work is significant for improving the naturalness and expressiveness of synthetic speech, enhancing accessibility for individuals with communication disorders, and advancing our understanding of human communication itself.

Papers

July 3, 2024

Prosody-Driven Privacy-Preserving Dementia Detection
Dominika Woszczyk, Ranya Aloufi, Soteris Demetriou
Speaker Embeddings Prosodic Feature Dementia Detection

June 19, 2024

Automatic Voice Classification Of Autistic Subjects
Jessica Vacca, Natascia Brondino, Fabio Dell'Acqua, Anna Vizziello, Pietro Savazzi
Prosodic Feature Autism Spectrum Disorder Anomalous Sound Detection Speech Classification

June 11, 2024

Multimodal Belief Prediction
John Murzaku, Adil Soubki, Owen Rambow
Prosodic Feature Belief Prediction

June 9, 2024

Towards Expressive Zero-Shot Speech Synthesis with Hierarchical Prosody Modeling
Yuepeng Jiang, Tao Li, Fengyu Yang, Lei Xie, Meng Meng, Yujun Wang
Zero Shot Speech Synthesis Prosodic Feature Prosody Modeling Timbre Descriptor

June 8, 2024

Mmm whatcha say? Uncovering distal and proximal context effects in first and second-language word perception using psychophysical reverse correlation
Paige Tuttösí, H. Henny Yeung, Yue Wang, Fenqi Wang, Guillaume Denis, Jean-Julien Aucouturier, Angelica Lim
Prosodic Feature Speech Perception Acoustic Context Context Effect Psychophysical Task

May 29, 2024

Deep Learning for Assessment of Oral Reading Fluency
Mithilesh Vaidya, Binaya Kumar Sahoo, Preeti Rao
Deep Learning Direct Assessment Prosodic Feature Fluency Assessment Oral Reading

May 23, 2024

CrossVoice: Crosslingual Prosody Preserving Cascade-S2ST using Transfer Learning
Medha Hira, Arnav Goel, Anubha Gupta
Transfer Learning Prosodic Feature

May 18, 2024

Exploring speech style spaces with language models: Emotional TTS without emotion labels
Shreeram Suresh Chandra, Zongyang Du, Berrak Sisman
Language Model Prosodic Feature Emotion Label Emotion Annotation Emotional Text to Speech

May 15, 2024

Hierarchical Emotion Prediction and Control in Text-to-Speech Synthesis
Sho Inoue, Kun Zhou, Shuai Wang, Haizhou Li
External Control Prosodic Feature Emotional Speech Text to Speech Model Emotion Prediction Text to Speech Synthesis

May 2, 2024

April 27, 2024

Usefulness of Emotional Prosody in Neural Machine Translation
Charles Brazier, Jean-Luc Rouas
Neural Machine Translation Speech Emotion Recognition Prosodic Feature Neural Machine Translation Model Automatic Usefulness Prediction

April 26, 2024

Metronome: tracing variation in poetic meters via local sequence alignment
Ben Nagy, Artjoms Šeļa, Mirella De Sisto, Petr Plecháč
Prosodic Feature Category Wise Variation Contrastive Alignment Poetry Domain

April 16, 2024

Language Proficiency and F0 Entrainment: A Study of L2 English Imitation in Italian, French, and Slovak Speakers
Zheng Yuan, Štefan Beňuš, Alessandro D'Ausilio
Prosodic Feature Italian Language Language Proficiency F0 Entrainment Pitch Variation

March 21, 2024

A Collection of Pragmatic-Similarity Judgments over Spoken Dialog Utterances
Nigel G. Ward, Divette Marco
High Similarity Semantic Similarity Prosodic Feature Golden Collection Sentence Pair Spoken Dialogue Pragmatic Inference

March 13, 2024

Prosody for Intuitive Robotic Interface Design: It's Not What You Said, It's How You Said It
Elaheh Sanoubari, Atil Iscen, Leila Takayama, Stefano Saliceti, Corbin Cunningham, Ken Caluwaerts
Human Robot Interaction Prosodic Feature Multimodal Signal Intuitive Human Robot

March 6, 2024

Non-verbal information in spontaneous speech -- towards a new framework of analysis
Tirza Biron, Moshe Barboy, Eran Ben-Artzy, Alona Golubchik, Yanir Marmor, Smadar Szekely, Yaron Winter, David Harel
General Analysis New Framework Prosodic Feature Spontaneous Speech Speaker Information

March 3, 2024

PAVITS: Exploring Prosody-aware VITS for End-to-End Emotional Voice Conversion
Tianhua Qi, Wenming Zheng, Cheng Lu, Yuan Zong, Hailun Lian
Voice Conversion Prosodic Feature

February 22, 2024

Daisy-TTS: Simulating Wider Spectrum of Emotions via Prosody Embedding Decomposition
Rendi Chevi, Alham Fikri Aji
Text to Speech Prosodic Feature Experienced Emotion Microbial Decomposition Speech Naturalness Prosody Encoder

February 20, 2024

Autism Detection in Speech -- A Survey
Nadine Probol, Margot Mieskes
Timely Survey Speech Analysis Prosodic Feature Autism Spectrum Disorder NLP Research Acoustic Cue