Action Annotation

Action annotation focuses on automatically labeling actions within videos, aiming to improve the accuracy and efficiency of video understanding systems. Current research emphasizes developing robust methods for annotating actions in egocentric videos and complex procedural activities, often employing large language models, multi-temporal scale feature extraction, and multi-modal approaches incorporating audio information to reduce reliance on expensive manual annotation. These advancements are crucial for building intelligent assistants capable of understanding and responding to human actions in real-world scenarios, as well as for improving the performance of video analysis tools across various applications.

Papers

November 13, 2024

EgoVid-5M: A Large-Scale Video-Action Dataset for Egocentric Video Generation
Xiaofeng Wang, Kang Zhao, Feng Liu, Jiayu Wang, Guosheng Zhao, Xiaoyi Bao, Zheng Zhu, Yingya Zhang, Xingang Wang
Faithful Generation Video Generation Egocentric Video Action Datasets Action Annotation

June 14, 2024

PARSE-Ego4D: Personal Action Recommendation Suggestions for Egocentric Videos
Steven Abreu, Tiffany D. Do, Karan Ahuja, Eric J. Gonzalez, Lee Payne, Daniel McDuff, Mar Gonzalez-Franco
Egocentric Video Context Aware Ego4D AudioVisual Action Annotation Action Recommendation

December 22, 2023

CaptainCook4D: A Dataset for Understanding Errors in Procedural Activities
Rohith Peddi, Shivvrat Arya, Bharath Challa, Likhitha Pallapothula, Akshay Vyas, Bhavya Gouripeddi, Jikai Wang, Qifan Zhang, Vasundhara Komaragiri, Eric Ragan, Nicholas Ruozzi, Yu Xiang, Vibhav Gogate
Data Set Error Feedback Procedural Activity Step by Step Procedure Learning Action Annotation Sequential Annotation

July 31, 2023

Every Mistake Counts in Assembly
Guodong Ding, Fadime Sener, Shugao Ma, Angela Yao
Assembly Task AI Assistant Spatial Understanding Action Annotation Probabilistic Inference Algorithm

August 16, 2022

Temporal Action Localization with Multi-temporal Scales
Zan Gao, Xinglei Cui, Tao Zhuo, Zhiyong Cheng, An-An Liu, Meng Wang, Shenyong Chen
Temporal Feature Temporal Transformer Temporal Action Localization Action Classification Time Scale Action Annotation

July 24, 2022

Weakly-Supervised Temporal Action Detection for Fine-Grained Videos with Hierarchical Atomic Actions
Zhi Li, Lu He, Huijuan Xu
Fine Grained Temporal Action Detection Action Detection Atomic Action Action Annotation

July 5, 2022

MVP: Robust Multi-View Practice for Driving Action Localization
Jingjie Shang, Kunchang Li, Kaibin Tian, Haisheng Su, Yangguang Li
Multi View Practice Mode Video Dataset Action Localization AI City Challenge Action Annotation

May 12, 2022

Weakly-Supervised Action Detection Guided by Audio Narration
Keren Ye, Adriana Kovashka
Action Detection Multimodal Feature Video Detection Video Recognition Benchmark Action Annotation