Modality Data

Modality data research focuses on leveraging information from multiple data sources (e.g., images, text, audio) to improve the performance of machine learning models. Current research emphasizes developing robust models that handle missing or incomplete data, often employing techniques like multimodal masked autoencoders, diffusion models, and transformer-based architectures with attention mechanisms to effectively fuse and learn from diverse data types. This field is crucial for advancing applications across various domains, including medical imaging, recommendation systems, and multimedia quality assessment, by enabling more accurate and comprehensive analyses than single-modality approaches.

21papers

Papers

April 23, 2025

Disentangling and Generating Modalities for Recommendation in Missing Modality Scenarios
Jiwan Kim, Hongseok Kang, Sein Kim, Kibum Kim, Chanyoung Park
KAIST
Cross Modal Retrieval Effective Recommendation Modality Specific Modality Data Disentangle Content Modality Invariant Multi Modal

March 11, 2025

Towards All-in-One Medical Image Re-Identification
Yuan Tian, Kaiyuan Ji, Rongzhao Zhang, Yankai Jiang, Chunyi Li, Xiaosong Wang, Guangtao Zhai
Shanghai AI Laboratory●East China Normal University●Shanghai Jiao Tong Unversity
Modality Representation Modality Data Whistleblower Re Identification

February 27, 2025

Knowledge Bridger: Towards Training-free Missing Multi-modality Completion
Guanzhou Ke, Shengfeng He, Xiao Li Wang, Bo Wang, Guoqing Chao, Yuanyang Zhang, Yi Xie, HeXing Su
Beijing Jiaotong University●Singapore Management University●Nanjing University of Science and Technology●Chinese Academy of Sciences●Har...+4
Modality Data Missing Modality Multi Modality Modality Completion Large Multimodal Model

August 26, 2024

Surprisingly Fragile: Assessing and Addressing Prompt Instability in Multimodal Foundation Models
Ian Stewart, Sameera Horawalavithana, Brendan Kennedy, Sai Munikoti, Karl Pazdernik
Modality Data Multimodal Foundation Model Brittle Fracture

July 29, 2024

UNQA: Unified No-Reference Quality Assessment for Audio, Image, Video, and Audio-Visual Content
Yuqin Cao, Xiongkuo Min, Yixuan Gao, Wei Sun, Weisi Lin, Guangtao Zhai
Large Scale Video Modality Data Audio Visual Reference Quality Assessment Multi Modal Training Single Modality Source Video Audio Driven

July 20, 2024

PASSION: Towards Effective Incomplete Multi-Modal Medical Image Segmentation with Imbalanced Missing Rates
Junjie Shi, Caozhi Shang, Zhaobin Sun, Li Yu, Xin Yang, Zengqiang Yan
Modality Imbalance Imbalanced Classification Multi Modal Modality Data

July 17, 2024

GUME: Graphs and User Modalities Enhancement for Long-Tail Multimodal Recommendation
Guojiao Lin, Zhen Meng, Dongjie Wang, Qingqing Long, Yuanchun Zhou, Meng Xiao
Multimodal Recommender System Modality Invariant Modality Data Graph Drawing Item Representation

June 13, 2024

Enhancing Cross-Modal Fine-Tuning with Gradually Intermediate Modality Generation
Lincan Cai, Shuang Li, Wenxuan Ma, Jingxuan Kang, Binhui Xie, Zixun Sun, Chengwei Zhu
Multi Modal Modal Fine Tuning Modality Data

June 4, 2024

Dealing with All-stage Missing Modality: Towards A Universal Model with Robust Reconstruction and Personalization
Yunpeng Zhao, Cheng Chen, Qing You Pang, Quanzheng Li, Carol Tang, Beng-Ti Ang, Yueming Jin
Universal Model Missing Modality Data Modality Data Modal Reconstruction Robust Reconstruction

March 14, 2024

Borrowing Treasures from Neighbors: In-Context Learning for Multimodal Learning with Missing Modalities and Data Scarcity
Zhuo Zhi, Ziquan Liu, Moe Elbadawi, Adam Daneshmend, Mine Orlu, Abdul Basit, Andreas Demosthenous, Miguel Rodrigues
Treasure Trove Modality Data Multimodal Learning Different Context Multi Task Data Scarcity Missing Modality Missing Modality Data

February 9, 2024

Multimodal Clinical Trial Outcome Prediction with Large Language Models
Wenhao Zheng, Liaoyaqi Wang, Dongshen Peng, Hongxia Xu, Yun Li, Hongtu Zhu, Tianfan Fu, Huaxiu Yao
Modality Data Trial Outcome Prediction Mixture of Expert

January 16, 2024

Connect, Collapse, Corrupt: Learning Cross-Modal Tasks with Uni-Modal Data
Yuhui Zhang, Elaine Sui, Serena Yeung-Levy
Cross Modal Task Cross Modal Modality Gap Event Collapse Multi Modal Contrastive Representation Modality Data New Connection

January 10, 2024

Source-Free Cross-Modal Knowledge Transfer by Unleashing the Potential of Task-Irrelevant Data
Jinjing Zhu, Yucheng Chen, Lin Wang
Knowledge Transfer Modality Data Cross Task Knowledge Full Potential Task Irrelevant Cross Modal

November 30, 2023

CoDi-2: In-Context, Interleaved, and Interactive Any-to-Any Generation
Zineng Tang, Ziyi Yang, Mahmoud Khademi, Yang Liu, Chenguang Zhu, Mohit Bansal
Modality Data Multimodal Large Language Model Interleaved Multimodal Multimodal Generation Interleaving Method Multimodal Instruction Different Context

November 29, 2023

Continual Self-supervised Learning: Towards Universal Multi-modal Medical Data Representation Learning
Yiwen Ye, Yutong Xie, Jianpeng Zhang, Ziyang Chen, Qi Wu, Yong Xia
Modality Data Multi Modal Self Supervised Learning

October 6, 2023

VI-Diff: Unpaired Visible-Infrared Translation Diffusion Model for Single Modality Labeled Visible-Infrared Person Re-identification
Han Huang, Yan Huang, Liang Wang
Single Modality Image Translation Visible Infrared Person Re Identification Unpaired Image to Image Translation Modality Data

October 4, 2023

MedPrompt: Cross-Modal Prompting for Multi-Task Medical Image Translation
Xuhang Chen, Chi-Man Pun, Shuqiang Wang
Medical Image Modality Data Multi Modal Image Translation Prompt Learning

September 21, 2023

2DDATA: 2D Detection Annotations Transmittable Aggregation for Semantic Segmentation on Point Cloud
Guan-Cheng Lee
Bounding Box Annotation Modality Data 2 Dimensional Object Detection Multi Modality Multi Modal Model Point Cloud Semantic Segmentation

August 23, 2023

SUMMIT: Source-Free Adaptation of Uni-Modal Models to Multi-Modal Targets
Cody Simons, Dripta S. Raychaudhuri, Sk Miraj Ahmed, Suya You, Konstantinos Karydis, Amit K. Roy-Chowdhury
Multi Modal Data Adaptation Concern Modal Regression Pre Trained Uni Modal Modality Data Target Modality Multimodal Data Theoretical Peak Performance Analysis

August 20, 2023

Federated Pseudo Modality Generation for Incomplete Multi-Modal MRI Reconstruction
Yunlu Yan, Chun-Mei Feng, Yuexiang Li, Rick Siow Mong Goh, Lei Zhu
Modality Data Multi Modal Data Modality Alignment

Modality Data

Papers

Disentangling and Generating Modalities for Recommendation in Missing Modality Scenarios

Towards All-in-One Medical Image Re-Identification

Knowledge Bridger: Towards Training-free Missing Multi-modality Completion

Surprisingly Fragile: Assessing and Addressing Prompt Instability in Multimodal Foundation Models

UNQA: Unified No-Reference Quality Assessment for Audio, Image, Video, and Audio-Visual Content

PASSION: Towards Effective Incomplete Multi-Modal Medical Image Segmentation with Imbalanced Missing Rates

GUME: Graphs and User Modalities Enhancement for Long-Tail Multimodal Recommendation

Enhancing Cross-Modal Fine-Tuning with Gradually Intermediate Modality Generation

Dealing with All-stage Missing Modality: Towards A Universal Model with Robust Reconstruction and Personalization

Borrowing Treasures from Neighbors: In-Context Learning for Multimodal Learning with Missing Modalities and Data Scarcity

Multimodal Clinical Trial Outcome Prediction with Large Language Models

Connect, Collapse, Corrupt: Learning Cross-Modal Tasks with Uni-Modal Data

Source-Free Cross-Modal Knowledge Transfer by Unleashing the Potential of Task-Irrelevant Data

CoDi-2: In-Context, Interleaved, and Interactive Any-to-Any Generation

Continual Self-supervised Learning: Towards Universal Multi-modal Medical Data Representation Learning

VI-Diff: Unpaired Visible-Infrared Translation Diffusion Model for Single Modality Labeled Visible-Infrared Person Re-identification

MedPrompt: Cross-Modal Prompting for Multi-Task Medical Image Translation

2DDATA: 2D Detection Annotations Transmittable Aggregation for Semantic Segmentation on Point Cloud

SUMMIT: Source-Free Adaptation of Uni-Modal Models to Multi-Modal Targets

Federated Pseudo Modality Generation for Incomplete Multi-Modal MRI Reconstruction