Motion State Alignment

Motion state alignment focuses on harmonizing different representations of movement and visual information within videos and other dynamic data. Current research emphasizes aligning motion features with corresponding visual or textual descriptions using various techniques, including diffusion models, transformers, and autoencoders, often incorporating multi-level or progressive alignment strategies to capture both local and global context. This work is crucial for improving the accuracy and efficiency of tasks such as video generation, action recognition, anomaly detection, and protein structure prediction, where understanding the relationship between motion and other modalities is paramount. The resulting advancements have significant implications for computer vision, bioinformatics, and other fields relying on the analysis of dynamic data.

Papers

September 27, 2024

Exploring Token Pruning in Vision State Space Models
Zheng Zhan, Zhenglun Kong, Yifan Gong, Yushu Wu, Zichong Meng, Hangyu Zheng, Xuan Shen, Stratis Ioannidis, Wei Niu, Pu Zhao, Yanzhi Wang
Vision Transformer Vision Model Token Pruning Visual State Space Model Motion State Alignment

September 23, 2024

S$^2$AG-Vid: Enhancing Multi-Motion Alignment in Video Diffusion Models via Spatial and Syntactic Attention-Based Guidance
Yuanhang Li, Qi Mao, Lan Chen, Zhen Fang, Lei Tian, Xinyan Xiao, Libiao Jin, Hua Wu
Motion Information Cross Attention Video Diffusion Model Text to Video Spatial Domain Video Text Alignment Motion State Alignment

August 22, 2024

AlphaFolding: 4D Diffusion for Dynamic Protein Structure Prediction with Reference and Motion Guidance
Kaihui Cheng, Ce Liu, Qingkun Su, Jun Wang, Liwei Zhang, Yining Tang, Yao Yao, Siyu Zhu, Yuan Qi
Structure Prediction Protein Structure Prediction 3D Protein Motion State Alignment

July 22, 2024

Chronologically Accurate Retrieval for Temporal Grounding of Motion-Language Models
Kent Fujiwara, Mikihiro Tanaka, Qing Yu
Latent Space Retrieval Performance Motion Representation Temporal Grounding Motion Language Motion State Alignment

July 11, 2024

WalkTheDog: Cross-Morphology Motion Alignment via Phase Manifolds
Peizhuo Li, Sebastian Starke, Yuting Ye, Olga Sorkine-Hornung
Human Motion Latent State Periodic Phenomenon Phase Space Motion Retrieval Motion State Alignment Periodic Activation Function

May 6, 2024

LGTM: Local-to-Global Text-Driven Human Motion Diffusion Model
Haowen Sun, Ruikun Zheng, Haibin Huang, Chongyang Ma, Hui Huang, Ruizhen Hu
Motion Generation Good Teacher Text to Motion Generation Motion State Alignment

May 3, 2024

MVP-Shot: Multi-Velocity Progressive-Alignment Framework for Few-Shot Action Recognition
Hongyu Qu, Rui Yan, Xiangbo Shu, Hailiang Gao, Peng Huang, Guo-Sen Xie
Action Recognition Feature Alignment Shot Action Recognition Motion Feature Motion State Alignment

September 1, 2023

Fine-Grained Spatiotemporal Motion Alignment for Contrastive Video Representation Learning
Minghao Zhu, Xiao Lin, Ronghao Dang, Chengju Liu, Qijun Chen
Contrastive Learning Contrastive Representation Learning Fine Grained Motion Motion State Alignment Pixel Level Supervision

April 20, 2023

High-Fidelity and Freely Controllable Talking Head Video Generation
Yue Gao, Yuan Zhou, Jinglu Wang, Xiao Li, Xiang Ming, Yan Lu
High Fidelity Head Generation Landmark Detection Motion State Alignment Head Video

April 18, 2023

Motion-state Alignment for Video Semantic Segmentation
Jinming Su, Ruihong Yin, Shuaibin Zhang, Junfeng Luo
Semantic Segmentation Pixel Level Video Semantic Segmentation Motion State Alignment

March 9, 2023

December 17, 2022

Improving Unsupervised Video Object Segmentation with Motion-Appearance Synergy
Long Lian, Zhirong Wu, Stella X. Yu
Object Discovery Unsupervised Video Object Segmentation Poor Segmentation Motion State Alignment

July 18, 2022

Hierarchical Feature Alignment Network for Unsupervised Video Object Segmentation
Gensheng Pei, Fumin Shen, Yazhou Yao, Guo-Sen Xie, Zhenmin Tang, Jinhui Tang
Optical Flow Motion Feature Unsupervised Video Object Segmentation Motion State Alignment

April 8, 2022

A Video Anomaly Detection Framework based on Appearance-Motion Semantics Representation Consistency
Xiangyu Huang, Caidan Zhao, Yilin Wang, Zhiqiang Wu
Video Anomaly Detection Video Sequence Motion Feature Motion State Alignment

Motion State Alignment

Papers

Exploring Token Pruning in Vision State Space Models

S$^2$AG-Vid: Enhancing Multi-Motion Alignment in Video Diffusion Models via Spatial and Syntactic Attention-Based Guidance

AlphaFolding: 4D Diffusion for Dynamic Protein Structure Prediction with Reference and Motion Guidance

Chronologically Accurate Retrieval for Temporal Grounding of Motion-Language Models

WalkTheDog: Cross-Morphology Motion Alignment via Phase Manifolds

LGTM: Local-to-Global Text-Driven Human Motion Diffusion Model

MVP-Shot: Multi-Velocity Progressive-Alignment Framework for Few-Shot Action Recognition

Fine-Grained Spatiotemporal Motion Alignment for Contrastive Video Representation Learning

High-Fidelity and Freely Controllable Talking Head Video Generation

Motion-state Alignment for Video Semantic Segmentation

Multi-level Memory-augmented Appearance-Motion Correspondence Framework for Video Anomaly Detection

Updated version: A Video Anomaly Detection Framework based on Appearance-Motion Semantics Representation Consistency

Improving Unsupervised Video Object Segmentation with Motion-Appearance Synergy

Hierarchical Feature Alignment Network for Unsupervised Video Object Segmentation

A Video Anomaly Detection Framework based on Appearance-Motion Semantics Representation Consistency