the latest in aiBeta

Video Generation

Video generation research focuses on creating realistic and controllable videos from various inputs like text, images, or other videos. Current efforts center on improving model architectures, such as diffusion models and diffusion transformers, to enhance video quality, temporal consistency, and controllability, often incorporating techniques like vector quantization for efficiency. This field is crucial for advancing multimedia applications, including content creation, simulation, and autonomous driving, by providing tools to generate high-quality, diverse, and easily manipulated video data. Furthermore, ongoing research is addressing the limitations of existing evaluation metrics to better align assessments with human perception.

295papers

Papers - Page 5

February 4, 2025

VideoJAM: Joint Appearance-Motion Representations for Enhanced Motion Generation in Video Models
Hila Chefer, Uriel Singer, Amit Zohar, Yuval Kirstain, Adam Polyak, Yaniv Taigman, Lior Wolf, Shelly Sheynin
Faithful Generation Video Generation Spatial Coherence Video Generative Motion Prediction Video Model

February 3, 2025

February 2, 2025

HuViDPO:Enhancing Video Generation through Direct Preference Optimization for Human-Centric Alignment
Lifan Jiang, Boxi Wu, Jiahui Zhang, Xiaotong Guan, Shuang Chen
Video Generation Optimization Purpose Preference Feedback Direct Preference Optimization Model Training Human Alignment Generated Video Human Preference

February 1, 2025

January 31, 2025

Inference-Time Text-to-Video Alignment with Diffusion Latent Beam Search
Yuta Oshima, Masahiro Suzuki, Yutaka Matsuo, Hiroki Furuta
Video Text Alignment Video Perception Text to Video Diffusion Model Beam Search Video Generation

January 30, 2025

Every Image Listens, Every Image Dances: Music-Driven Image Animation
Zhikang Dong, Weituo Hao, Ju-Chiang Wang, Peng Zhang, Pawel Polak
Multimodal Analysis Driven Portrait Animation Video Generation

January 28, 2025

CascadeV: An Implementation of Wurstchen Architecture for Video Generation
Wenfeng Lin, Jiangchuan Wei, Boyuan Liu, Yichen Zhang, Shiyue Yan, Mingyu Guo
Text to Video TF Cascade Text to Image Practical Implementation Latent Diffusion Model Source Video High Resolution Video Video Generation Faithful Generation

January 23, 2025

January 21, 2025

Taming Teacher Forcing for Masked Autoregressive Video Generation
Deyu Zhou, Quan Sun, Yuang Peng, Kun Yan, Runpei Dong, Duomin Wang, Zheng Ge, Nan Duan, Xiangyu Zhang, Lionel M. Ni, Heung-Yeung Shum
Good Teacher Video Generation Autoregressive Image Autoregressive Generation

January 20, 2025

GenVidBench: A Challenging Benchmark for Detecting AI-Generated Video
Zhenliang Ni, Qiangyu Yan, Mouxiao Huang, Tianning Yuan, Yehui Tang, Hailin Hu, Xinghao Chen, Yunhe Wang
Video Detection Data Detection Source Video Video Generation Challenging Benchmark

January 17, 2025

DiffuEraser: A Diffusion Model for Video Inpainting
Xiaowen Li, Haolan Xue, Peiran Ren, Liefeng Bo
Group Propagation Optical Flow Source Video Video Diffusion Model Vision Transformer Video Generation Diffusion Model

January 15, 2025

January 14, 2025