Syntactic Multi Modality

Syntactic multi-modality focuses on how to effectively combine and interpret information from different sources, such as speech and text, to understand the underlying syntactic structure and meaning. Current research emphasizes developing robust models, often employing multi-headed attention mechanisms or advanced loss functions like Connectionist Temporal Classification (CTC) and Order-Agnostic Cross Entropy (OAXE), to address challenges posed by the inherent variability in expressing the same meaning across modalities. This research is significant for improving the accuracy and efficiency of tasks like machine translation and emotion recognition, leading to more sophisticated and nuanced human-computer interaction.

Papers

December 10, 2023

Speech and Text-Based Emotion Recognizer
Varun Sharma
Speech Analysis Speech Emotion Recognition Affective Computing Emotion Label Text Based Emotion Detection Speech Data Augmentation Syntactic Multi Modality

July 9, 2022

A Study of Syntactic Multi-Modality in Non-Autoregressive Machine Translation
Kexun Zhang, Rui Wang, Xu Tan, Junliang Guo, Yi Ren, Tao Qin, Tie-Yan Liu
Study Feature Non Autoregressive Machine Translation Multimodal Corpus Syntactic Multi Modality

April 20, 2022

Cross-stitched Multi-modal Encoders
Karan Singla, Daniel Pressel, Ryan Price, Bhargav Srinivas Chinnari, Yeon-Jun Kim, Srinivas Bangalore
Multi Modal Utterance Classification Syntactic Multi Modality

Syntactic Multi Modality

Papers

Speech and Text-Based Emotion Recognizer

A Study of Syntactic Multi-Modality in Non-Autoregressive Machine Translation

Cross-stitched Multi-modal Encoders