Vision Architecture

Vision architecture research focuses on designing and improving computer vision models to accurately interpret and process visual information. Current efforts concentrate on hybrid models combining convolutional neural networks (CNNs) and vision transformers (ViTs), leveraging the strengths of each architecture, as well as exploring the use of multi-layer perceptrons (MLPs) for 3D object recognition and gaze estimation. These advancements are driving progress in diverse applications, including medical image analysis, human-computer interaction, and urban planning, by improving accuracy, efficiency, and explainability of visual data processing.

Papers

February 13, 2024

CrossGaze: A Strong Method for 3D Gaze Estimation in the Wild
Andy Cătrună, Adrian Cosma, Emilian Rădoi
Wild Challenge Gaze Estimation Gaze Prediction Vision Architecture 3D Gaze Estimation

February 5, 2024

Exploring the Synergies of Hybrid CNNs and ViTs Architectures for Computer Vision: A survey
Haruna Yunusa, Shiyin Qin, Abdulrahman Hamman Adama Chukkol, Abdulganiyu Abdu Yusuf, Isah Bello, Adamu Lawan
Convolutional Neural Network Timely Survey Vision Transformer Computer Vision Hybrid Convolutional Emerging Synergy ViT Architecture Vision Architecture

December 3, 2023

Foveation in the Era of Deep Learning
George Killick, Paul Henderson, Paul Siebert, Gerardo Aragon-Camarasa
Deep Learning Deep Convolutional Neural Network State of the Art New Era Object Recognition Active Vision Vision Architecture

September 9, 2023

Video and Synthetic MRI Pre-training of 3D Vision Architectures for Neuroimage Analysis
Nikhil J. Dhinagar, Amit Singh, Saket Ozarkar, Ketaki Buwa, Sophia I. Thomopoulos, Conor Owens-Walton, Emily Laltoo, Yao-Liang Chen, Philip Cook, Corey McMillan, Chih-Chien Tsai, J-J Wang, Yih-Ru Wu, Paul M. Thompson
Convolutional Neural Network Deep Learning Model Transfer Learning Pre Trained Model Source Video Synthetic MRI Vision Architecture

June 26, 2023

PhD Thesis: Exploring the role of (self-)attention in cognitive and computer vision architecture
Mohit Vaishnav
Self Attention Integral Role Visual Reasoning Cognitive Architecture Spatial Attention Order Derivative Vision Architecture Synthetic Reasoning

November 20, 2022

R2-MLP: Round-Roll MLP for Multi-View 3D Object Recognition
Shuo Chen, Tan Yu, Ping Li
Multi View 3D MLP Architecture MLP Like Model Vision Architecture

August 29, 2022

Explainability of Deep Learning models for Urban Space perception
Ruben Sangers, Jan van Gemert, Sander van Cranenburgh
Convolutional Neural Network Deep Learning Model High Explainability Computer Vision Model Perception Data Vision Architecture Urban Space Perception

November 23, 2021

Using mixup as regularization and tuning hyper-parameters for ResNets
Venkata Bhanu Teja Pallakonda
Data Augmentation Image Classification Regularization Model Hyper Parameter SE SPP DenseNet Vision Architecture