Video Object Detection

Video object detection (VOD) aims to identify and locate objects within video sequences, a task more complex than still-image object detection due to the added temporal dimension. Current research emphasizes efficient algorithms, often based on one-stage detectors like YOLO and improved transformer architectures, that leverage temporal consistency and context across frames to improve accuracy while minimizing computational cost. These advancements are crucial for real-time applications such as autonomous driving, surveillance, and medical image analysis, where efficient and accurate object tracking is essential. Furthermore, research is actively exploring techniques to handle challenging conditions like adverse weather, low light, and limited labeled data.

Papers

August 15, 2023

Identity-Consistent Aggregation for Video Object Detection
Chaorui Deng, Da Chen, Qi Wu
Object Representation Video Object Detection Consistent Aggregation

August 9, 2023

Objects do not disappear: Video object detection by single-frame object location anticipation
Xin Liu, Fatemeh Karimi Nejadasl, Jan C. van Gemert, Olaf Booij, Silvia L. Pintea
Arbitrary Object Video Frame Video Object Detection Object Motion Continuous Motion Large Displacement

August 3, 2023

Erasure-based Interaction Network for RGBT Video Object Detection and A Unified Benchmark
Zhengzheng Tu, Qishun Wang, Hongshun Wang, Kunpeng Wang, Chenglong Li
Object Detection Evaluation Benchmark Thermal Image Video Object Detection Interaction Network RGB Thermal

July 14, 2023

Deteksi Sampah di Permukaan dan Dalam Perairan pada Objek Video dengan Metode Robust and Efficient Post-Processing dan Tubelet-Level Bounding Box Linking
Bryan Tjandra, Made S. N. Negara, Nyoo S. C. Handoko
Object Detection Bounding Box Post Processing Video Object Detection Microplastics Data Robust Method Video Object Recycling Bin

June 26, 2023

Video object detection for privacy-preserving patient monitoring in intensive care
Raphael Emberger, Jens Michael Boss, Daniel Baumann, Marko Seric, Shufan Huo, Lukas Tuggener, Emanuela Keller, Thilo Stadelmann
Object Detector Video Object Detection Improved Detection Intensive Care Diverse Biosignals Patient Monitoring

March 15, 2023

FAQ: Feature Aggregated Queries for Transformer-based Video Object Detectors
Yiming Cui, Linjie Yang
Yes No Question Video Object Detection Video Benchmark Transformer Based Object Query Aggregation

March 6, 2023

Memory Maps for Video Object Detection and Tracking on UAVs
Benjamin Kiefer, Yitong Quan, Andreas Zell
Multi Object Tracking Vision Task Memory Trace Video Object Detection Temporal Image

November 20, 2022

Unifying Tracking and Image-Video Object Detection
Peirong Liu, Rui Wang, Pengchuan Zhang, Omid Poursaeed, Yipin Zhou, Xuefei Cao, Sreya Dutta Roy, Ashish Shah, Ser-Nam Lim
Multi Object Tracking Video Object Detection Video Detection Argument Detection Unified Tracking Model

October 12, 2022

BoxMask: Revisiting Bounding Box Supervision for Video Object Detection
Khurram Azeem Hashmi, Alain Pagani, Didier Stricker, Muhammamd Zeshan Afzal
Pixel Level Video Object Detection Multiple Detector Box Annotation Bounding Box Supervision

October 5, 2022

Spatio-Temporal Learnable Proposals for End-to-End Video Object Detection
Khurram Azeem Hashmi, Didier Stricker, Muhammamd Zeshan Afzal
Video Object Detection Temporal Action Proposal Sparse R CNN

October 2, 2022

DFA: Dynamic Feature Aggregation for Efficient Video Object Detection
Yiming Cui
Computer Vision Feature Aggregation Video Object Detection Video Benchmark

September 6, 2022

PTSEFormer: Progressive Temporal-Spatial Enhanced TransFormer Towards Video Object Detection
Han Wang, Jun Tang, Xiaodong Liu, Shanyan Guan, Rong Xie, Li Song
Temporal Transformer Detection Transformer Feature Aggregation Video Object Detection

August 20, 2022

YOLOV: Making Still Image Object Detectors Great at Video Object Detection
Yuheng Shi, Naiyan Wang, Xiaojie Guo
Object Detection Video Object Detection One Stage Detection Two Stage Detector

August 19, 2022

Real-Time Robust Video Object Detection System Against Physical-World Adversarial Attacks
Husheng Han, Xing Hu, Kaidi Xu, Pucheng Dang, Ying Wang, Yongwei Zhao, Zidong Du, Qi Guo, Yanzhi Yang, Tianshi Chen
Adversarial Attack Adversarial Patch Video Object Detection Adversarial Patch Attack Adversarial Region

July 26, 2022

Graph Neural Network and Spatiotemporal Transformer Attention for 3D Video Object Detection from Point Clouds
Junbo Yin, Jianbing Shen, Xin Gao, David Crandall, Ruigang Yang
Graph Neural Network Point Cloud 3D Object Detection Spatial Attention Video Object Detection Lidar Based 3D Object Detection Point Cloud Video

July 22, 2022

QueryProp: Object Query Propagation for High-Performance Video Object Detection
Fei He, Naiyu Gao, Jian Jia, Xin Zhao, Kaiqi Huang
Video Object Detection Feature Propagation Object Query

April 28, 2022

Representation Recycling for Streaming Video Analysis
Can Ufuk Ertenli, Ramazan Gokberk Cinbis, Emre Akbas
Video Streaming Video Object Detection Frame Wise Representation Per Frame Implicit Layer Conventional Deep

April 5, 2022

SALISA: Saliency-based Input Sampling for Efficient Video Object Detection
Babak Ehteshami Bejnordi, Amirhossein Habibian, Fatih Porikli, Amir Ghodrati
Video Object Detection

January 13, 2022

TransVOD: End-to-End Video Object Detection with Spatial-Temporal Transformers
Qianyu Zhou, Xiangtai Li, Lu He, Yibo Yang, Guangliang Cheng, Yunhai Tong, Lizhuang Ma, Dacheng Tao
Temporal Transformer Detection Transformer Video Object Detection

December 24, 2021

Virtuoso: Video-based Intelligence for real-time tuning on SOCs
Jayoung Lee, PengCheng Wang, Ran Xu, Venkat Dasari, Noah Weston, Yin Li, Saurabh Bagchi, Somali Chaterji
Object Detection Model Vision System Video Object Detection Faster R CNN Automatic Tuning Video Intelligence MM Soc