Action Anticipation

Action anticipation, the prediction of future actions from observed video sequences, aims to build systems capable of understanding and responding proactively to human behavior. Current research focuses on improving the accuracy and robustness of anticipation across longer time horizons, employing various deep learning architectures such as transformers, recurrent neural networks (RNNs), and diffusion models, often incorporating multimodal data (e.g., visual, textual, and gaze information) to enhance prediction capabilities. This field is significant for its potential applications in human-robot interaction, autonomous driving, and assistive technologies, driving advancements in video understanding and predictive modeling.

Papers

June 22, 2022

NVIDIA-UNIBZ Submission for EPIC-KITCHENS-100 Action Anticipation Challenge 2022
Tsung-Ming Tai, Oswald Lanz, Giuseppe Fiameni, Yi-Kwan Wong, Sze-Sen Poon, Cheng-Kuang Lee, Ka-Chun Cheung, Simon See
Temporal Transformer Action Anticipation Recurrent Neural Network Architecture NVIDIA Open Model License Agreement

June 2, 2022

Unified Recurrence Modeling for Video Action Anticipation
Tsung-Ming Tai, Giuseppe Fiameni, Cheng-Kuang Lee, Simon See, Oswald Lanz
Computer Vision Model Video Frame Action Anticipation Recurrence Relation Temporal Inference

May 27, 2022

Future Transformer for Long-term Action Anticipation
Dayoung Gong, Joonseok Lee, Manjin Kim, Seong Jong Ha, Minsu Cho
Action Anticipation Attention Framework

April 2, 2022

A-ACT: Action Anticipation through Cycle Transformations
Akash Gupta, Jingen Liu, Liefeng Bo, Amit K. Roy-Chowdhury, Tao Mei
Action Feature Action Prediction Action Anticipation Left Corner Transformation Anticipation Model

February 8, 2022

Untrimmed Action Anticipation
Ivan Rodin, Antonino Furnari, Dimitrios Mavroeidis, Giovanni Maria Farinella
Egocentric Video Temporal Action Detection Action Anticipation Egocentric Action Anticipation

January 20, 2022

MeMViT: Memory-Augmented Multiscale Vision Transformer for Efficient Long-Term Video Recognition
Chao-Yuan Wu, Yanghao Li, Karttikeya Mangalam, Haoqi Fan, Bo Xiong, Jitendra Malik, Christoph Feichtenhofer
Long Term Video Recognition Action Anticipation Video Processing Multiscale Vision Transformer

November 15, 2021

Weakly-Supervised Dense Action Anticipation
Haotong Zhang, Fuhai Chen, Angela Yao
Sequence Labeling Action Anticipation Labeled Data Duration Prediction