Text to Motion Generation

Text-to-motion generation aims to create realistic human or camera movements from textual descriptions, impacting fields like animation and robotics. Current research heavily utilizes diffusion models and transformers, often incorporating techniques like bidirectional autoregression, local action guidance, and hierarchical diffusion to improve motion coherence, detail, and controllability, addressing challenges such as long-sequence generation and multi-person interactions. This rapidly advancing field is driven by the need for more efficient and versatile methods, particularly those capable of handling open-vocabulary prompts and generating highly detailed, physically plausible motions.

Papers

March 28, 2024

BAMM: Bidirectional Autoregressive Motion Model
Ekkasit Pinyoanuntapong, Muhammad Usama Saleem, Pu Wang, Minwoo Lee, Srijan Das, Chen Chen
Text to Motion Generation High Quality Motion Generation

March 27, 2024

ParCo: Part-Coordinating Text-to-Motion Synthesis
Qiran Zou, Shangyuan Yuan, Shian Du, Yu Wang, Chang Liu, Yi Xu, Jie Chen, Xiangyang Ji
Motion Synthesis Fine Grained Motion Text to Motion Generation

March 26, 2024

Move as You Say, Interact as You Can: Language-guided Human Motion Generation with Scene Affordance
Zan Wang, Yixin Chen, Baoxiong Jia, Puhao Li, Jinlu Zhang, Jingze Zhang, Tengyu Liu, Yixin Zhu, Wei Liang, Siyuan Huang
Human Motion Affordance Learning Text to Motion Generation Digital Action MOVE Brilliance

December 22, 2023

Plan, Posture and Go: Towards Open-World Text-to-Motion Generation
Jinpeng Liu, Wenxun Dai, Chunyu Wang, Yiji Cheng, Yansong Tang, Xin Tong
Human Motion Motion Generation High Level Plan Text to Motion Text to Motion Generation Motion Language Sitting POSTURE

December 18, 2023

Towards Detailed Text-to-Motion Synthesis via Basic-to-Advanced Hierarchical Diffusion Model
Zhenyu Xie, Yang Wu, Xuehao Gao, Zhongqian Sun, Wei Yang, Xiaodan Liang
Video Text Motion Synthesis Text to Motion Generation

December 14, 2023

OMG: Towards Open-vocabulary Motion Generation via Mixture of Controllers
Han Liang, Jiacheng Bao, Ruichi Zhang, Sihan Ren, Yuecheng Xu, Sibei Yang, Xin Chen, Jingyi Yu, Lan Xu
Zero Shot Mixture Component Motion Generation M$ Base Controller Text to Motion Generation Zero Shot Open Vocabulary

December 6, 2023

MMM: Generative Masked Motion Model
Ekkasit Pinyoanuntapong, Pu Wang, Minwoo Lee, Chen Chen
Text to Motion Generation Masked Motion

August 28, 2023

Priority-Centric Human Motion Generation in Discrete Latent Space
Hanyang Kong, Kehong Gong, Dongze Lian, Michael Bi Mi, Xinchao Wang
Human Motion Generation Motion Representation Text to Motion Generation Motion Diffusion Model Future Motion

August 3, 2023

Synthesizing Long-Term Human Motions with Diffusion Models via Coherent Sampling
Zhao Yang, Bing Su, Ji-Rong Wen
Diffusion Model Long Term Human Motion Text to Motion Generation Continuous Motion Text Stream

May 16, 2023

Make-An-Animation: Large-Scale Text-conditional 3D Human Motion Generation
Samaneh Azadi, Akbar Shah, Thomas Hayes, Devi Parikh, Sonal Gupta
Motion Generation Motion Capture Human Motion Generation Text to Motion Generation

October 28, 2022

Being Comes from Not-being: Open-vocabulary Text-to-Motion Generation with Wordless Training
Junfan Lin, Jianlong Chang, Lingbo Liu, Guanbin Li, Liang Lin, Qi Tian, Chang Wen Chen
Training Free Text to Motion Generation Pose Generation