Unsupervised Visual Tracking

Unsupervised visual tracking aims to automatically follow objects in video sequences without relying on labeled training data, a crucial step towards more robust and adaptable computer vision systems. Recent research focuses on leveraging pre-trained models like Vision Transformers (ViTs) and diffusion models, employing techniques such as self-supervised learning, online prompt updating, and dense temporal token learning to improve tracking accuracy and robustness, particularly in challenging scenarios like long-term occlusions. These advancements are significant because they reduce the reliance on expensive and time-consuming data annotation, paving the way for broader applications in robotics, autonomous driving, and video surveillance.

Papers

November 18, 2024

Learning a Neural Association Network for Self-supervised Multi-Object Tracking
Shuai Li, Michael Burke, Subramanian Ramamoorthy, Juergen Gall
Self Supervised Multi Object Tracking Web Tracking Kalman Filter Fully Supervised Tracking Performance Unsupervised Visual Tracking Associative Thinking

August 26, 2024

Global-Local Distillation Network-Based Audio-Visual Speaker Tracking with Incomplete Modalities
Yidi Li, Yihan Li, Yixin Guo, Bin Ren, Zhenhuan Xu, Hao Guo, Hong Liu, Nicu Sebe
Video to Video Unsupervised Visual Tracking

July 11, 2024

Diff-Tracker: Text-to-Image Diffusion Models are Unsupervised Trackers
Zhengbo Zhang, Li Xu, Duo Peng, Hossein Rahmani, Jun Liu
Text to Image Diffusion Model Pre Trained Diffusion Model Unsupervised Visual Tracking

March 21, 2024

DINO-Tracker: Taming DINO for Self-Supervised Point Tracking in a Single Video
Narek Tumanyan, Assaf Singer, Shai Bagon, Tali Dekel
External Tracker Pre Trained ViT DiNO Mix Single Video Dense Tracking Unsupervised Visual Tracking

January 3, 2024

ODTrack: Online Dense Temporal Token Learning for Visual Tracking
Yaozong Zheng, Bineng Zhong, Qihua Liang, Zhiyi Mo, Shengping Zhang, Xianxian Li
Visual Tracking Inter Frame Token Representation Unsupervised Visual Tracking Spatio Temporal Relationship

October 30, 2023

Exploiting Image-Related Inductive Biases in Single-Branch Visual Tracking
Chuanming Tang, Kai Wang, Joost van de Weijer, Jianlin Zhang, Yongmei Huang
Vision Transformer Transformer Based Inductive Bias Visual Tracking Unsupervised Visual Tracking UNet Encoder

September 16, 2023

Unsupervised Green Object Tracker (GOT) without Offline Pre-training
Zhiruo Zhou, Suya You, C. -C. Jay Kuo
Visual Object Tracking Action Free Offline Single Object Tracking Object Tracker Unsupervised Visual Tracking

August 28, 2023

Learning Visual Tracking and Reaching with Deep Reinforcement Learning on a UR10e Robotic Arm
Colin Bellinger, Laurence Lamarche-Cliche
Reinforcement Learning Deep Reinforcement Learning Deep Q Learning Universal Robot 5 Unsupervised Visual Tracking

July 28, 2023

Uncertainty-aware Unsupervised Multi-Object Tracking
Kai Liu, Sheng Jin, Zhihang Fu, Ze Chen, Rongxin Jiang, Jieping Ye
Multi Object Tracking Multiple Object Tracking Unsupervised Algorithm Object Tracklets Unsupervised Visual Tracking

December 22, 2021

A Discriminative Single-Shot Segmentation Network for Visual Object Tracking
Alan Lukežič, Jiří Matas, Matej Kristan
Visual Object Tracking Single Object Tracking Segmentation Benchmark Siamese Tracker One Shot Segmentation Unsupervised Visual Tracking

December 1, 2021

PreViTS: Contrastive Pretraining with Video Tracking Supervision
Brian Chen, Ramprasaath R. Selvaraju, Shih-Fu Chang, Juan Carlos Niebles, Nikhil Naik
Self Supervised Learning Visual Representation Visual Object Tracking Better Representation Contrastive Pretraining Unsupervised Visual Tracking