Visual Attention

Visual attention research investigates how humans and animals selectively process visual information, aiming to understand the mechanisms underlying this crucial cognitive function and replicate it computationally. Current research focuses on developing models that integrate multiple sensory modalities (audio-visual), leverage object-level attention rather than pixel-level, and incorporate human gaze data for improved accuracy and interpretability, often employing transformer networks, spiking neural networks, and other deep learning architectures. These advancements have implications for various fields, including computer vision, human-computer interaction, and medical image analysis, by enabling more efficient and robust systems for tasks such as object tracking, speech recognition, and medical diagnosis.

Papers

September 22, 2022

July 31, 2022

Exploring Attention-Aware Network Resource Allocation for Customized Metaverse Services
Hongyang Du, Jiacheng Wang, Dusit Niyato, Jiawen Kang, Zehui Xiong, Xuemin, Shen, Dong In Kim
Resource Allocation Visual Attention Metaverse Service

July 20, 2022

AudioScopeV2: Audio-Visual Attention Architectures for Calibrated Open-Domain On-Screen Sound Separation
Efthymios Tzinis, Scott Wisdom, Tal Remez, John R. Hershey
Visual Attention Sound Separation Audio Separation Universal Sound Separation

July 8, 2022

Cross-Attention Transformer for Video Interpolation
Hannah Halin Kim, Shuzhi Yu, Shuai Yuan, Carlo Tomasi
Visual Attention Image Feature Residual Neural Network Cross Attention Transformer Video Interpolation Novel Vision Transformer

July 7, 2022

AV-Gaze: A Study on the Effectiveness of Audio Guided Visual Attention Estimation for Non-Profilic Faces
Shreya Ghosh, Abhinav Dhall, Munawar Hayat, Jarrod Knibbe
Study Feature Audio Visual Human Face Visual Attention Provider Gaze Head Pose Estimation

June 21, 2022

Guiding Visual Attention in Deep Convolutional Neural Networks Based on Human Eye Movements
Leonard E. van Dyck, Sebastian J. Denzler, Walter R. Gruber
Deep Convolutional Neural Network Visual Attention Computational Neuroscience Eye Tracking Data Biological Vision Eye Movement

June 3, 2022

Adversarial Attacks on Human Vision
Victor A. Mateescu, Ivan V. Bajić
Adversarial Attack Visual Attention Human Saliency Human Vision Saliency Guided Visual Saliency

May 14, 2022

A Saliency-Guided Street View Image Inpainting Framework for Efficient Last-Meters Wayfinding
Chuanbo Hu, Shan Jia, Fan Zhang, Xin Li
Visual Attention Saliency Guided Image Inpainting Distraction Level

May 8, 2022

Past and Future Motion Guided Network for Audio Visual Event Localization
Tingxiu Chen, Jianqin Yin, Jin Tang
Motion Prediction Visual Attention Deep Motion Audio Visual Event Localization Audio Visual Event

April 23, 2022

Visual Attention Emerges from Recurrent Sparse Reconstruction
Baifeng Shi, Yale Song, Neel Joshi, Trevor Darrell, Xin Wang
Attention Mechanism Visual Attention Robust Perception

April 20, 2022

A Probabilistic Time-Evolving Approach to Scanpath Prediction
Daniel Martin, Diego Gutierrez, Belen Masia
Visual Attention Bayesian Deep Learning Scanpath Prediction Visual Scanpaths

April 19, 2022

Behind the Machine's Gaze: Neural Networks with Biologically-inspired Constraints Exhibit Human-like Visual Attention
Leo Schwinn, Doina Precup, Björn Eskofier, Dario Zanca
Neural Network New Machine Visual Attention Attention Model Visual Task Provider Gaze Biomechanical Constraint Downstream Visual

April 9, 2022

Unbiased Directed Object Attention Graph for Object Navigation
Ronghao Dang, Zhuofan Shi, Liuyi Wang, Zongtao He, Chengju Liu, Qijun Chen
Visual Attention Object Navigation

March 23, 2022

Reclaiming saliency: rhythmic precision-modulated action and perception
Ajith Anil Meera, Filip Novicky, Thomas Parr, Karl Friston, Pablo Lanillos, Noor Sajid
Saliency Map Perception Aware Visual Attention Rhythmic Pattern Salient Entity Sensory Data Human Visual Saliency

March 10, 2022

An Audio-Visual Attention Based Multimodal Network for Fake Talking Face Videos Detection
Ganglai Wang, Peng Zhang, Lei Xie, Wei Huang, Yufei Zha, Yanning Zhang
Visual Attention Fake Speech Face Forgery Face Detection Talking Face Video

March 9, 2022

Human Gaze Guided Attention for Surgical Activity Recognition
Abdishakour Awale, Duygu Sarikaya
Visual Attention Surgical Video Surgical Activity Recognition

February 23, 2022

RadioTransformer: A Cascaded Global-Focal Transformer for Visual Attention-guided Disease Classification
Moinak Bhattacharya, Shubham Jain, Prateek Prasanna
Vision Transformer Attention Mechanism Visual Attention Gaze Data Focal Transformer

February 17, 2022

Visual Attention

Papers

A domain adaptive deep learning solution for scanpath prediction of paintings

A Spatial-channel-temporal-fused Attention for Spiking Neural Networks

Exploring Attention-Aware Network Resource Allocation for Customized Metaverse Services

AudioScopeV2: Audio-Visual Attention Architectures for Calibrated Open-Domain On-Screen Sound Separation

Cross-Attention Transformer for Video Interpolation

AV-Gaze: A Study on the Effectiveness of Audio Guided Visual Attention Estimation for Non-Profilic Faces

Guiding Visual Attention in Deep Convolutional Neural Networks Based on Human Eye Movements

Adversarial Attacks on Human Vision

A Saliency-Guided Street View Image Inpainting Framework for Efficient Last-Meters Wayfinding

Past and Future Motion Guided Network for Audio Visual Event Localization

Visual Attention Emerges from Recurrent Sparse Reconstruction

A Probabilistic Time-Evolving Approach to Scanpath Prediction

Behind the Machine's Gaze: Neural Networks with Biologically-inspired Constraints Exhibit Human-like Visual Attention

Unbiased Directed Object Attention Graph for Object Navigation

Reclaiming saliency: rhythmic precision-modulated action and perception

An Audio-Visual Attention Based Multimodal Network for Fake Talking Face Videos Detection

Human Gaze Guided Attention for Surgical Activity Recognition

RadioTransformer: A Cascaded Global-Focal Transformer for Visual Attention-guided Disease Classification

On Guiding Visual Attention with Language Specification

Visual attention analysis of pathologists examining whole slide images of Prostate cancer