Modality Model

Modality models aim to integrate information from multiple data sources (modalities), such as images, text, and sensor readings, to create richer and more comprehensive representations than single-modality approaches allow. Current research focuses on developing effective architectures, often employing contrastive learning and masked autoencoders, to handle the challenges of modality disparities and limited labeled data, particularly within federated learning settings where data is distributed across multiple devices. These advancements hold significant promise for improving performance in diverse applications, including medical image analysis (e.g., brain tumor segmentation, ECG interpretation) and multimodal understanding tasks, by leveraging the synergistic power of combined data streams.

Papers

October 3, 2024

C-MELT: Contrastive Enhanced Masked Auto-Encoders for ECG-Language Pre-Training
Manh Pham, Aaqib Saeed, Dong Ma
Cross Modal Electrocardiogram Signal Multi Modal Representation Cross Modal Representation Learning Contrastive Masked Modality Model

August 18, 2024

MedMAP: Promoting Incomplete Multi-modal Brain Tumor Segmentation with Alignment
Tianyi Liu, Zhaorui Tan, Muyin Chen, Xi Yang, Haochuan Jiang, Kaizhu Huang
Alignment Problem Tumor Segmentation Brain Tumor Segmentation Latent Feature Modality Gap Modality Model

January 30, 2024

Communication-Efficient Multimodal Federated Learning: Joint Modality and Client Selection
Liangqi Yuan, Dong-Jun Han, Su Wang, Devesh Upadhyay, Christopher G. Brinton
Federated Learning Multimodal Phenomenon Client Selection Modality Model

October 10, 2023

FedMFS: Federated Multimodal Fusion Learning with Selective Modality Communication
Liangqi Yuan, Dong-Jun Han, Vishnu Pandi Chellapandi, Stanislaw H. Żak, Christopher G. Brinton
Federated Learning Multimodal Phenomenon Modality Selection Modality Model

May 3, 2022

i-Code: An Integrative and Composable Multimodal Learning Framework
Ziyi Yang, Yuwei Fang, Chenguang Zhu, Reid Pryzant, Dongdong Chen, Yu Shi, Yichong Xu, Yao Qian, Mei Gao, Yi-Ling Chen, Liyang Lu, Yujia Xie, Robert Gmyr, Noel Codella, Naoyuki Kanda, Bin Xiao, Lu Yuan, Takuya Yoshioka, Michael Zeng, Xuedong Huang
Multimodal Learning Multi Modal Data Cross Modality Modality Specific Multimodal Pre Jim Code Modality Model

Modality Model

Papers

C-MELT: Contrastive Enhanced Masked Auto-Encoders for ECG-Language Pre-Training

MedMAP: Promoting Incomplete Multi-modal Brain Tumor Segmentation with Alignment

Communication-Efficient Multimodal Federated Learning: Joint Modality and Client Selection

FedMFS: Federated Multimodal Fusion Learning with Selective Modality Communication

i-Code: An Integrative and Composable Multimodal Learning Framework