Consistent Visual Attention

Consistent visual attention in computer vision aims to develop models that reliably focus on relevant image features, improving robustness and generalization. Current research explores methods like incorporating proxy attention mechanisms from vision foundation models to enhance existing architectures (e.g., CLIP) and developing novel attention mechanisms such as reversed attention to learn inherent visual dependencies within images. These advancements are crucial for improving the performance of various applications, including image segmentation, object recognition, and autonomous driving, by mitigating the impact of noise, variations in data, and domain shifts. The resulting models exhibit improved accuracy and generalization capabilities across diverse datasets and tasks.

Papers

December 22, 2024

Reversed Attention: On The Gradient Descent Of Attention Layers In GPT
Shahar Katz, Lior Wolf
Gradient Descent Transformer Based Language Model Attention Layer GPT Neo Attention Matrix Consistent Visual Attention

August 9, 2024

ProxyCLIP: Proxy Attention Improves CLIP for Open-Vocabulary Segmentation
Mengcheng Lan, Chaofeng Chen, Yiping Ke, Xinjiang Wang, Litong Feng, Wayne Zhang
Semantic Segmentation Visual Representation Contrastive Language Image Open Vocabulary Semantic Segmentation Open Vocabulary Segmentation Transparent Proxy Server Architecture Consistent Visual Attention

April 6, 2023

Visual Dependency Transformers: Dependency Tree Emerges from Reversed Attention
Mingyu Ding, Yikang Shen, Lijie Fan, Zhenfang Chen, Zitian Chen, Ping Luo, Joshua B. Tenenbaum, Chuang Gan
Vision Transformer Self Attention Dependency Tree Consistent Visual Attention Reverse Attention

April 5, 2023

Learning Stability Attention in Vision-based End-to-end Driving Policies
Tsun-Hsuan Wang, Wei Xiao, Makram Chahine, Alexander Amini, Ramin Hasani, Daniela Rus
Autonomous Driving Control Lyapunov Function End to End Driving Consistent Visual Attention Reality Based Attention Training

February 13, 2023

Federated attention consistent learning models for prostate cancer diagnosis and Gleason grading
Fei Kong, Xiyue Wang, Jinxi Xiang, Sen Yang, Xinran Wang, Meng Yue, Jun Zhang, Junhan Zhao, Xiao Han, Yuhan Dong, Biyue Zhu, Fang Wang, Yueping Liu
Prostate Cancer Pathology Datasets Consistent Visual Attention

November 6, 2022

Node-wise Domain Adaptation Based on Transferable Attention for Recognizing Road Rage via EEG
Gao Xueqi, Xu Chao, Song Yihang, Hu Jing, Xiao Jian, Meng Zhaopeng
Domain Adaptation Multi Channel EEG Consistent Visual Attention Higher Attention Weight

October 16, 2022

Scratching Visual Transformer's Back with Uniform Attention
Nam Hyeon-Woo, Kim Yu-Ji, Byeongho Heo, Dongyoon Han, Seong Joon Oh, Tae-Hyun Oh
Convolutional Neural Network Vision Transformer Attention Map Multi Head Self Attention Visual Transformer Consistent Visual Attention

April 27, 2022

Attention Consistency on Visual Corruptions for Single-Source Domain Generalization
Ilke Cugu, Massimiliano Mancini, Yanbei Chen, Zeynep Akata
Domain Generalization Image Corruption Single Source Domain Generalization Attention Loss Consistent Visual Attention