Semantic Aggregation

Semantic aggregation in computer vision focuses on effectively combining information from multiple sources, such as frames in a video or points in a point cloud, to improve the accuracy and efficiency of tasks like video retrieval, semantic segmentation, and video restoration. Current research emphasizes developing novel aggregation methods, often incorporating attention mechanisms or specialized modules (e.g., temporal aggregation networks, excitation-aggregation designs) to handle diverse data types and address challenges like sparsity or computational cost. These advancements are driving improvements in various applications, including automated surgical skill assessment, deepfake detection, and compressed video enhancement, by enabling more robust and informative representations of complex visual data.

Papers

December 11, 2024

Static-Dynamic Class-level Perception Consistency in Video Semantic Segmentation
Zhigang Cen, Ningyan Guo, Wenjing Xu, Zhiyong Feng, Danlan Huang
Semantic Segmentation Segmentation Based Approach Motion Consistency Cross Video Semantic Aggregation

November 20, 2024

VADet: Multi-frame LiDAR 3D Object Detection using Variable Aggregation
Chengjie Huang, Vahdat Abdelzad, Sean Sedwards, Krzysztof Czarnecki
Object Detector Data Aggregation High Precision Lidar Stage Detector Optimal Aggregation Semantic Aggregation

July 13, 2024

TASeg: Temporal Aggregation Network for LiDAR Semantic Segmentation
Xiaopei Wu, Yuenan Hou, Xiaoshui Huang, Binbin Lin, Tong He, Xinge Zhu, Yuexin Ma, Boxi Wu, Haifeng Liu, Deng Cai, Wanli Ouyang
Lidar Semantic Segmentation LiDAR Point LiDAR Segmentation Semantic Aggregation

May 25, 2024

An Empirical Study of Excitation and Aggregation Design Adaptions in CLIP4Clip for Video-Text Retrieval
Xiaolun Jing, Genke Yang, Jian Chu
Empirical Study Video Text Retrieval CLIP Model Active Excitation Aggregation Strategy Semantic Aggregation

March 15, 2024

CPGA: Coding Priors-Guided Aggregation Network for Compressed Video Quality Enhancement
Qiang Zhu, Jinhua Hao, Yukang Ding, Yu Liu, Qiao Mo, Ming Sun, Chao Zhou, Shuyuan Zhu
Multi Scale Video Coding Aggregation Network Video Quality Enhancement Residual Frame Semantic Aggregation

November 20, 2022

MINTIME: Multi-Identity Size-Invariant Video Deepfake Detection
Davide Alessandro Coccomini, Giorgos Kordopatis Zilos, Giuseppe Amato, Roberto Caldelli, Fabrizio Falchi, Symeon Papadopoulos, Claudio Gennaro
Deepfake Detection Temporal Transformer DeepFake Video Detection Semantic Aggregation

August 4, 2022

Surgical Skill Assessment via Video Semantic Aggregation
Zhenqiang Li, Lin Gu, Weimin Wang, Ryosuke Nakamura, Yoichi Sato
CNN LSTM Surgical Skill Assessment Video Based Semantic Aggregation

June 22, 2022

A Simple Baseline for Video Restoration with Grouped Spatial-temporal Shift
Dasong Li, Xiaoyu Shi, Yi Zhang, Ka Chun Cheung, Simon See, Xiaogang Wang, Hongwei Qin, Hongsheng Li
Video Deblurring Deformable Convolution Video Restoration Temporal Shift Video Denoising Semantic Aggregation

January 14, 2022

Unsupervised Temporal Video Grounding with Deep Semantic Clustering
Daizong Liu, Xiaoye Qu, Yinzhen Wang, Xing Di, Kai Zou, Yu Cheng, Zichuan Xu, Pan Zhou
Video Question Temporal Video Grounding Semantic Aggregation