Multimodal Signal

Multimodal signal processing focuses on integrating information from diverse sources, such as audio, video, text, and physiological data, to achieve more robust and comprehensive analyses than using any single modality alone. Current research emphasizes developing models, including transformers, diffusion models, and neural networks like LSTMs, to effectively fuse these heterogeneous data types for tasks ranging from emotion recognition and human-robot interaction to medical image synthesis and automated driving. This field is significant because it enables more accurate and nuanced understanding of complex systems and behaviors, leading to advancements in various applications including healthcare, robotics, and autonomous systems.

Papers

November 27, 2022

Unified Discrete Diffusion for Simultaneous Vision-Language Generation
Minghui Hu, Chuanxia Zheng, Heliang Zheng, Tat-Jen Cham, Chaoyue Wang, Zuopeng Yang, Dacheng Tao, Ponnuthurai N. Suganthan
Language Generation Multimodal Generation Multi Modal Generation Multimodal Signal Diffusion Based Framework

November 20, 2022

Contrastive Regularization for Multimodal Emotion Recognition Using Audio and Text
Fan Qian, Jiqing Han
Text Modality Emotion Recognition Speech Emotion Recognition Audio Driven Multimodal Emotion Recognition Multimodal Signal Contrastive Regularization

October 31, 2022

Latent Multimodal Functional Graphical Model Estimation
Katherine Tsai, Boxin Zhao, Sanmi Koyejo, Mladen Kolar
Multimodal Data Functional Connectivity Multimodal Signal

September 21, 2022

Identification of Adaptive Driving Style Preference through Implicit Inputs in SAE L2 Vehicles
Zhaobo K. Zheng, Kumar Akash, Teruhisa Misu, Vidya Krishmoorthy, Miaomiao Dong, Yuni Lee, Gaojian Huang
Person Identification Multimodal Signal Driving Style

Multimodal Signal

Papers

Unified Discrete Diffusion for Simultaneous Vision-Language Generation

Contrastive Regularization for Multimodal Emotion Recognition Using Audio and Text

Latent Multimodal Functional Graphical Model Estimation

Identification of Adaptive Driving Style Preference through Implicit Inputs in SAE L2 Vehicles