MMA Diffusion Leverage

Diffusion models are rapidly advancing multi-modal generation and inference capabilities. Current research focuses on improving the fidelity and consistency of generated images and videos across multiple views or subjects, often leveraging novel attention mechanisms and architectures like U-Nets within a diffusion framework. These advancements are impacting diverse fields, from personalized image creation and 3D object reconstruction to cosmological parameter inference and robust image classification through test-time adaptation. The ability to generate and analyze multi-modal data with high accuracy holds significant promise for various scientific and practical applications.

Papers

June 11, 2024

MS-Diffusion: Multi-subject Zero-shot Image Personalization with Layout Guidance
X. Wang, Siming Fu, Qihan Huang, Wanggui He, Hao Jiang
Text to Image Cross Attention Optimal Layout Text to Image Generation Model Personalized Text to Image Image Personalization MMA Diffusion Leverage

May 8, 2024

Diffusion-HMC: Parameter Inference with Diffusion Model driven Hamiltonian Monte Carlo
Nayantara Mudur, Carolina Cuesta-Lazaro, Douglas P. Finkbeiner
Diffusion Model Generative Model Astronomical Data Hamiltonian Monte Carlo Parameter Inference Cosmological Analysis Dark Matter MMA Diffusion Leverage

February 20, 2024

MVDiffusion++: A Dense High-resolution Multi-view Diffusion Model for Single or Sparse-view 3D Object Reconstruction
Shitao Tang, Jiacheng Chen, Dilin Wang, Chengzhou Tang, Fuyang Zhang, Yuchen Fan, Vikas Chandra, Yasutaka Furukawa, Rakesh Ranjan
Novel View Synthesis View Synthesis Sparse View Object Reconstruction Multi View Diffusion MMA Diffusion Leverage Reconstruction Metric

December 14, 2023

Diffusion-C: Unveiling the Generative Challenges of Diffusion Models through Corrupted Data
Keywoong Bae, Suan Lee, Wookey Lee
Diffusion Model Generative Model GAN Model Corruption Emulation MMA Diffusion Leverage Generative AI Challenge

November 29, 2023

MMA-Diffusion: MultiModal Attack on Diffusion Models
Yijun Yang, Ruiyuan Gao, Xiaosen Wang, Tsung-Yi Ho, Nan Xu, Qiang Xu
Diffusion Model Text to Image Security Vulnerability Open Source Model Multimodal Attack MMA Diffusion Leverage

November 27, 2023

Diffusion-TTA: Test-time Adaptation of Discriminative Models via Generative Feedback
Mihir Prabhudesai, Tsung-Wei Ke, Alexander C. Li, Deepak Pathak, Katerina Fragkiadaki
Generative Model Generative Modeling Test Time Adaptation Discriminative Model MMA Diffusion Leverage

July 3, 2023

MVDiffusion: Enabling Holistic Multi-view Image Generation with Correspondence-Aware Diffusion
Shitao Tang, Fuyang Zhang, Jiacheng Chen, Peng Wang, Yasutaka Furukawa
Text to Image Diffusion Model Multi View Image Panorama Generation Multi View Consistent Multi View Depth Multi View Image Generation MMA Diffusion Leverage

December 19, 2022

MM-Diffusion: Learning Multi-Modal Diffusion Models for Joint Audio and Video Generation
Ludan Ruan, Yiyang Ma, Huan Yang, Huiguo He, Bei Liu, Jianlong Fu, Nicholas Jing Yuan, Qin Jin, Baining Guo
Video Generation Modal Diffusion Joint Audio Audio Visual Generation MMA Diffusion Leverage

MMA Diffusion Leverage

Papers

MS-Diffusion: Multi-subject Zero-shot Image Personalization with Layout Guidance

Diffusion-HMC: Parameter Inference with Diffusion Model driven Hamiltonian Monte Carlo

MVDiffusion++: A Dense High-resolution Multi-view Diffusion Model for Single or Sparse-view 3D Object Reconstruction

Diffusion-C: Unveiling the Generative Challenges of Diffusion Models through Corrupted Data

MMA-Diffusion: MultiModal Attack on Diffusion Models

Diffusion-TTA: Test-time Adaptation of Discriminative Models via Generative Feedback

MVDiffusion: Enabling Holistic Multi-view Image Generation with Correspondence-Aware Diffusion

MM-Diffusion: Learning Multi-Modal Diffusion Models for Joint Audio and Video Generation