Video Level

Video-level analysis focuses on understanding and interpreting video content using only video-level labels, avoiding the costly and time-consuming task of frame-by-frame annotation. Current research emphasizes weakly-supervised learning techniques, employing transformer-based architectures, graph convolutional networks, and attention mechanisms to improve the accuracy of tasks such as action localization, anomaly detection, and event parsing. This approach is significant because it enables the development of scalable and efficient video analysis systems across diverse applications, including surveillance, content moderation, and healthcare. The resulting advancements in weakly-supervised learning contribute to broader progress in computer vision and related fields.

Papers

December 8, 2022

Exploiting Completeness and Uncertainty of Pseudo Labels for Weakly Supervised Video Anomaly Detection
Chen Zhang, Guorong Li, Yuankai Qi, Shuhui Wang, Laiyun Qing, Qingming Huang, Ming-Hsuan Yang
Pseudo Label High Uncertainty Anticipation Video Anomaly Detection Video Level Probabilistic Completeness Weakly Supervised Video Anomaly Detection Iterative Pseudo Labeling

November 24, 2022

Minority-Oriented Vicinity Expansion with Attentive Aggregation for Video Long-Tailed Recognition
WonJun Moon, Hyun Seok Seong, Jae-Pil Heo
Long Tailed Video Level Attention Based Aggregation Visual Agent

September 23, 2022

Weakly Supervised Two-Stage Training Scheme for Deep Video Fight Detection Model
Zhenting Qi, Ruike Zhu, Zheyu Fu, Wenhao Chai, Volodymyr Kindratenko
Video Level Fight Detection

July 14, 2022

Forcing the Whole Video as Background: An Adversarial Learning Strategy for Weakly Temporal Action Localization
Ziqiang Li, Yongxin Ge, Jiaruo Yu, Zhongming Chen
Reinforcement Learning Temporal Action Localization Background Knowledge Action Localization Adversarial Framework Video Level Whole Video

June 22, 2022

Weakly-Supervised Temporal Action Localization by Progressive Complementary Learning
Jia-Run Du, Jia-Chang Feng, Kun-Yu Lin, Fa-Ting Hong, Xiao-Ming Wu, Zhongang Qi, Ying Shan, Wei-Shi Zheng
Temporal Action Localization Video Level Supervised Temporal Action Localization Complementary Learning Complementary Label

June 16, 2022

Scalable Temporal Localization of Sensitive Activities in Movies and TV Episodes
Xiang Hao, Jingxiang Chen, Shixing Chen, Ahmed Saad, Raffay Hamid
Sensitive Data Video Classification Movie Review Temporal Localization TV Show Video Level Sparse Label

June 3, 2022

Anomaly detection in surveillance videos using transformer based attention model
Kapil Deshpande, Narinder Singh Punn, Sanjay Kumar Sonbhadra, Sonali Agarwal
Anomaly Detection Transformer Based Video Anomaly Detection Surveillance Video Video Level Video Feature Frame Level Anomaly

May 1, 2022

Convex Combination Consistency between Neighbors for Weakly-supervised Action Localization
Qinying Liu, Zilei Wang, Ruoxi Chen, Zhilin Li
Temporal Action Localization Thy Neighbor Video Level Supervised Temporal Action Localization Point Supervision Cross Video Convex Combination Temporal Class Activation

April 28, 2022

Tragedy Plus Time: Capturing Unintended Human Activities from Weakly-labeled Videos
Arnav Chakravarthy, Zhiyuan Fang, Yezhou Yang
Time Matter Play Style Video Level Action Understanding Slow Motion Goal Directed Behavior Weakly Labeled Unconstrained Video

March 9, 2022

Part-level Action Parsing via a Pose-guided Coarse-to-Fine Framework
Xiaodong Chen, Xinchen Liu, Wu Liu, Kun Liu, Dong Wu, Yongdong Zhang, Tao Mei
Fine Grained Action Recognition Video Level Action Content Coarse to Fine Localization

March 6, 2022

Weakly Supervised Temporal Action Localization via Representative Snippet Knowledge Propagation
Linjiang Huang, Liang Wang, Hongsheng Li
Pseudo Label Temporal Action Localization Video Level Supervised Temporal Action Localization Snippet Extraction Temporal Class Activation

January 18, 2022

Weakly Supervised Contrastive Learning for Better Severity Scoring of Lung Ultrasound
Gautam Rajendrakumar Gare, Hai V. Tran, Bennett P deBoisblanc, Ricardo Luis Rodriguez, John Michael Galeotti
Severity Prediction Video Level Contrastive Self Supervision Disease Severity Lung Ultrasound

December 21, 2021

ACGNet: Action Complement Graph Network for Weakly-supervised Temporal Action Localization
Zichen Yang, Jie Qin, Di Huang
Temporal Dependency Temporal Action Localization Video Level Supervised Temporal Action Localization Segment Representation

November 4, 2021

Multi-scale 2D Representation Learning for weakly-supervised moment retrieval
Ding Li, Rui Wu, Yongqiang Tang, Zhizhong Zhang, Wensheng Zhang
Temporal Dependency Video Moment Retrieval Video Level Temporal Annotation

Video Level

Papers

Exploiting Completeness and Uncertainty of Pseudo Labels for Weakly Supervised Video Anomaly Detection

Minority-Oriented Vicinity Expansion with Attentive Aggregation for Video Long-Tailed Recognition

Weakly Supervised Two-Stage Training Scheme for Deep Video Fight Detection Model

Forcing the Whole Video as Background: An Adversarial Learning Strategy for Weakly Temporal Action Localization

Weakly-Supervised Temporal Action Localization by Progressive Complementary Learning

Scalable Temporal Localization of Sensitive Activities in Movies and TV Episodes

Anomaly detection in surveillance videos using transformer based attention model

Convex Combination Consistency between Neighbors for Weakly-supervised Action Localization

Tragedy Plus Time: Capturing Unintended Human Activities from Weakly-labeled Videos

Part-level Action Parsing via a Pose-guided Coarse-to-Fine Framework

Weakly Supervised Temporal Action Localization via Representative Snippet Knowledge Propagation

Weakly Supervised Contrastive Learning for Better Severity Scoring of Lung Ultrasound

ACGNet: Action Complement Graph Network for Weakly-supervised Temporal Action Localization

Multi-scale 2D Representation Learning for weakly-supervised moment retrieval