the latest in aiBeta

Video LDM

Video Latent Diffusion Models (LDMs) are a class of generative models aiming to create high-quality videos, often conditioned on text or other modalities, by leveraging the efficiency of diffusion processes in a compressed latent space. Current research focuses on improving temporal coherence, incorporating multi-modal information (e.g., audio, text), and adapting pre-trained image LDMs for video editing and generation tasks. These advancements are significant for applications ranging from realistic video synthesis and editing to data augmentation for scientific simulations and medical image enhancement, offering improvements in both speed and quality compared to previous methods.

13papers

Papers

February 14, 2025

SWA-LDM: Toward Stealthy Watermarks for Latent Diffusion Models
Zhonghao Yang, Linye Lyu, Xuanhang Chang, Daojing He, YU LI
Imperceptible Watermark Watermark Attack Robust Watermark Invisible Watermark Watermarking Method Video LDM Latent Diffusion Model

February 12, 2025

Revisiting 3D LLM Benchmarks: Are We Really Testing 3D Capabilities?
Jiahe Jin, Yanheng He, Mingyan Yang
LLM Benchmark LLM Based Evaluation 3D Feature Video LDM 3D Understanding

December 31, 2024

SAT-LDM: Provably Generalizable Image Watermarking for Latent Diffusion Models with Self-Augmented Training
Lu Zhang, Liang Zeng
Video LDM Watermarking Method Agnostic Watermarking Full Model Latent Diffusion

December 20, 2024

BS-LDM: Effective Bone Suppression in High-Resolution Chest X-Ray Images with Conditional Latent Diffusion Models
Yifei Sun, Zhanghao Chen, Hao Zheng, Ruiquan Ge, Jin Liu, Wenwen Min, Ahmed Elazab, Xiang Wan, Changmiao Wang
Bone Suppression Video LDM X Ray Image Soft Tissue Conditional Latent Diffusion

October 8, 2024

AP-LDM: Attentive and Progressive Latent Diffusion Model for Training-Free High-Resolution Image Generation
Boyuan Cao, Jiaxin Ye, Yujie Wei, Hongming Shan
Training Image Iterative Denoising Video LDM High Resolution Image Synthesis Latent Diffusion Model Domain Diffusion

October 2, 2024

MM-LDM: Multi-Modal Latent Diffusion Model for Sounding Video Generation
Mingzhen Sun, Weining Wang, Yanyuan Qiao, Jiahui Sun, Zihan Qin, Longteng Guo, Xinxin Zhu, Jing Liu
Cross Modal Video Generation Video LDM

August 27, 2024

On latent dynamics learning in nonlinear reduced order modeling
Nicola Farenga, Stefania Fresca, Simone Brivio, Andrea Manzoni
Video LDM Latent Dynamic Neural ODE Reduced Order

March 15, 2024

ST-LDM: A Universal Framework for Text-Grounded Object Generation in Real Images
Xiangtian Xue, Jiasong Wu, Youyong Kong, Lotfi Senhadji, Huazhong Shu
Multimodal Transformer Scene Comprehension Latent Diffusion Model Real Image Video LDM Universal Model

December 13, 2023

LD-SDM: Language-Driven Hierarchical Species Distribution Modeling
Srikumar Sastry, Xin Xing, Aayush Dhakal, Subash Khanal, Adeel Ahmad, Nathan Jacobs
Specie Distribution Specie Range Video LDM Specie Complex Population Based Search

December 2, 2023

LDM-ISP: Enhancing Neural ISP for Low Light with Latent Diffusion Models
Qiang Wen, Yazhou Xing, Zhefan Rao, Qifeng Chen
Latent Diffusion Model Video LDM Low Light Image Low Light Image Enhancement Task Low Light

October 25, 2023

Fuse Your Latents: Video Editing with Multi-source Latent Diffusion Models
Tianyi Lu, Xing Zhang, Jiaxi Gu, Renjing Pei, Songcen Xu, Xingjun Ma, Hang Xu, Zuxuan Wu
Latent Diffusion Model Latent Diffusion Situated Latents Video LDM Video Editing Video Diffusion Model

September 25, 2023

Free-Bloom: Zero-Shot Text-to-Video Generator with LLM Director and LDM Animator
Hanzhuo Huang, Yufan Feng, Cheng Shi, Lan Xu, Jingyi Yu, Sibei Yang
Text to Video Bloom Filter Zero Shot Video LDM Frame Semantic

August 23, 2023

InverseSR: 3D Brain MRI Super-Resolution Using a Latent Diffusion Model
Jueqi Wang, Jacob Levman, Walter Hugo Lopez Pinaya, Petru-Daniel Tudosiu, M. Jorge Cardoso, Razvan Marinescu
Latent Diffusion Model Inverse Task LLM Brain Video LDM

April 18, 2023

Align your Latents: High-Resolution Video Synthesis with Latent Diffusion Models
Andreas Blattmann, Robin Rombach, Huan Ling, Tim Dockhorn, Seung Wook Kim, Sanja Fidler, Karsten Kreis
Video Generation Text to Video LD Align Situated Latents High Resolution Image Synthesis Video LDM Latent Space Diffusion Latent Diffusion Model

December 1, 2022

3D-LDM: Neural Implicit 3D Shape Generation with Latent Diffusion Models
Gimin Nam, Mariem Khlifi, Andrew Rodriguez, Alberto Tono, Linqi Zhou, Paul Guerrero
Image to 3D Latent Diffusion Model Video LDM Text to 3D Generation Voxel Representation Neural Implicit Representation 3D Shape

November 20, 2022

Synthesizing Coherent Story with Auto-Regressive Latent Diffusion Models
Xichen Pan, Pengda Qin, Yuhong Li, Hui Xue, Wenhu Chen
Story Visualization Auto Regressive Diffusion Text to Image Synthesis Latent Diffusion Model Video LDM

November 24, 2021

LDDMM meets GANs: Generative Adversarial Networks for diffeomorphic registration
Ubaldo Ramon, Monica Hernandez, Elvira Mayordomo
GAN Model Video LDM Deformable Image Registration Diffeomorphic Image Registration Generative Adversarial Network