Computer Vision Community

The computer vision community focuses on enabling computers to "see" and interpret images and videos, aiming to replicate or surpass human visual capabilities. Current research heavily emphasizes developing and improving model architectures like Vision Transformers (ViTs) and Convolutional Neural Networks (CNNs), often incorporating techniques like knowledge distillation and parameter-efficient fine-tuning for improved efficiency and adaptability across diverse tasks. These advancements are driving progress in applications ranging from autonomous driving and medical image analysis to ecological monitoring and industrial automation, impacting various scientific fields and industries.

Papers

September 26, 2022

TAD: A Large-Scale Benchmark for Traffic Accidents Detection from Video Surveillance
Yajun Xu, Chuwen Huang, Yibing Nan, Shiguo Lian
Computer Vision Computer Vision Community Video Surveillance Traffic Accident Traffic Accident Detection

September 2, 2022

LiteDepth: Digging into Fast and Accurate Depth Estimation on Mobile Devices
Zhenyu Li, Zehui Chen, Jialei Xu, Xianming Liu, Junjun Jiang
Depth Estimation Monocular Depth Estimation Mobile Device Computer Vision Community Device Inference

August 24, 2022

WiCV 2022: The Tenth Women In Computer Vision Workshop
Doris Antensteiner, Silvia Bucci, Arushi Goel, Marah Halawa, Niveditha Kalavakonda, Tejaswi Kasarla, Miaomiao Liu, Nermin Samet, Ivaxi Sheth
Computer Vision Computer Vision Community

August 23, 2022

A First Look at Dataset Bias in License Plate Recognition
Rayson Laroca, Marcelo Santos, Valter Estevam, Eduardo Luz, David Menotti
Computer Vision Community License Plate Dataset Bias

August 7, 2022

Shap-CAM: Visual Explanations for Convolutional Neural Networks based on Shapley Value
Quan Zheng, Ziwei Wang, Jie Zhou, Jiwen Lu
Convolutional Neural Network Deep Convolutional Neural Network Shapley Value Class Activation Visual Explanation Computer Vision Community Fusion SHAP

July 27, 2022

Learning Appearance-motion Normality for Video Anomaly Detection
Yang Liu, Jing Liu, Mengyang Zhao, Dingkang Yang, Xiaoguang Zhu, Liang Song
Adversarial Learning Video Anomaly Detection Computer Vision Community Temporal Memory

July 19, 2022

Don't Stop Learning: Towards Continual Learning for the CLIP Model
Yuxuan Ding, Lingqiao Liu, Chunna Tian, Jingyuan Yang, Haoxuan Ding
LeArning Abstract Continual LEArning Continual Learning Contrastive Language Image Zero Shot Learning Computer Vision Community

July 18, 2022

Automatic universal taxonomies for multi-domain semantic segmentation
Petra Bevandić, Siniša Šegvić
Semantic Segmentation Model Computer Vision Community Cross Domain Semantic Segmentation Data Integration Visual Domain Taxonomy Construction

May 30, 2022

GMML is All you Need
Sara Atito, Muhammad Awais, Josef Kittler
Vision Transformer Self Supervised Learning Self Supervised Computer Vision Community Self Supervised Transformer Masked Generative

May 22, 2022

Recent Advances in Embedding Methods for Multi-Object Tracking: A Survey
Gaoang Wang, Mingli Song, Jenq-Neng Hwang
Timely Survey NCD Method Multi Object Tracking Recent Advance Computer Vision Community Relational Embeddings Patch Embeddings

April 27, 2022

Person Re-Identification
Mustafa Ebrahim Chasmai, Tamajit Banerjee
Computer Vision Community Whistleblower Re Identification Video Surveillance Surveillance Application

April 4, 2022

MaxViT: Multi-Axis Vision Transformer
Zhengzhong Tu, Hossein Talebi, Han Zhang, Feng Yang, Peyman Milanfar, Alan Bovik, Yinxiao Li
Vision Transformer Computer Vision Community Hierarchical Object Detection Scalable Attention Multi Axis Attention

March 11, 2022

WiCV 2021: The Eighth Women In Computer Vision Workshop
Arushi Goel, Niveditha Kalavakonda, Nour Karessli, Tejaswi Kasarla, Kathryn Leonard, Boyi Li, Nermin Samet and, Ghada Zamzmi
Computer Vision Computer Vision Community Research Assistant

February 14, 2022

A Survey of Visual Sensory Anomaly Detection
Xi Jiang, Guoyang Xie, Jinbao Wang, Yong Liu, Chengjie Wang, Feng Zheng, Yaochu Jin
Timely Survey Computer Vision Community Visual Anomaly Detection Semantic Anomaly Detection

January 7, 2022

A Review of Deep Learning Techniques for Markerless Human Motion on Synthetic Datasets
Doan Duy Vo, Russell Butler
Deep Learning Computer Vision Synthetic Data 3D Pose Computer Vision Community Human Motion Analysis Markerless Motion Capture

January 4, 2022

Underwater Object Classification and Detection: first results and open challenges
Andre Jesus, Claudio Zito, Claudio Tortorici, Eloy Roura, Giulia De Masi
Data Detection Object Detector Underwater Environment Preliminary Study Open Challenge Computer Vision Community Underwater Object Detection

December 20, 2021

Fusion and Orthogonal Projection for Improved Face-Voice Association
Muhammad Saad Saeed, Muhammad Haris Khan, Shah Nawaz, Muhammad Haroon Yousaf, Alessio Del Bue
Hybrid Fusion Computer Vision Community Voxceleb2 Dataset Orthogonal prOjection Face Voice Triplet Loss Function

December 17, 2021

Neuromorphic Camera Denoising using Graph Neural Network-driven Transformers
Yusra Alkendi, Rana Azzam, Abdulla Ayyad, Sajid Javed, Lakmal Seneviratne, Yahya Zweiri
Computer Vision Community Neuromorphic Event Neuromorphic Vision Transformer Based Neural Network Graph Aware Transformer

November 28, 2021

NoFADE: Analyzing Diminishing Returns on CO2 Investment
Andre Fu, Justin Tran, Andy Xie, Jonathan Spraggett, Elisa Ding, Chang-Won Lee, Kanav Singla, Mahdi S. Hosseini, Konstantinos N. Plataniotis
Computer Vision Customer Service Computer Vision Community Entropy Based Sustainable Investment

November 25, 2021

NomMer: Nominate Synergistic Context in Vision Transformer for Visual Recognition
Hao Liu, Xinghua Jiang, Xin Li, Zhimin Bao, Deqiang Jiang, Bo Ren
Vision Transformer Visual Recognition Recognition Task Computer Vision Community Synergistic Information