Focal Transformer

Focal Transformers represent a class of vision and language transformers designed to improve efficiency and accuracy by selectively focusing attention on the most relevant parts of the input data. Current research emphasizes developing novel architectures, such as those incorporating Gabor filters or multi-scale token aggregation, to reduce computational costs and enhance performance on tasks like image classification, object detection, and segmentation, particularly with limited data. These advancements are significant because they address limitations of standard transformers in handling high-resolution images and long contexts, leading to more efficient and effective models for various applications.

Papers

October 21, 2024

Focus on BEV: Self-calibrated Cycle View Transformation for Monocular Birds-Eye-View Segmentation
Jiawei Zhao, Qixing Jiang, Xuede Li, Junfeng Luo
Bird'S Eye View Cross View Human Driving Focus Eye View Monocular Image Monocular Vision Perspective Transform Focal Transformer

February 17, 2024

FViT: A Focal Vision Transformer with Gabor Filter
Yulong Shi, Mingwei Sun, Yongshuai Wang, Rui Wang, Hui Sun, Zengqiang Chen
Vision Transformer Gabor Filter Focal Transformer Fast Vision Transformer

January 8, 2024

LF-ViT: Reducing Spatial Redundancy in Vision Transformer for Efficient Image Recognition
Youbing Hu, Yun Cheng, Anqi Lu, Zhiqiang Cao, Dawei Wei, Jie Liu, Zhijun Li
Vision Transformer Image Recognition Low Resolution Image Discriminative Region Temporal Redundancy Focal Transformer

July 6, 2023

Focused Transformer: Contrastive Training for Context Scaling
Szymon Tworkowski, Konrad Staniszewski, Mikołaj Pacek, Yuhuai Wu, Henryk Michalewski, Piotr Miłoś
Large Language Model Long Context Attention Layer Context Length Contrastive Training Focal Transformer

October 25, 2022

Explicitly Increasing Input Information Density for Vision Transformers on Small Datasets
Xiangyu Chen, Ying Qin, Wenju Xu, Andrés M. Bur, Cuncong Zhong, Guanghui Wang
Vision Transformer Small Datasets Tiny ImageNet Information Density Focal Transformer

October 6, 2022

FocalUNETR: A Focal Transformer for Boundary-aware Segmentation of CT Images
Chengyin Li, Yao Qiang, Rafi Ibn Sultan, Hassan Bagher-Ebadian, Prashant Khanduri, Indrin J. Chetty, Dongxiao Zhu
CT Image Prostate Segmentation Boundary Segmentation Focal Transformer

March 22, 2022

Focal Modulation Networks
Jianwei Yang, Chunyuan Li, Xiyang Dai, Lu Yuan, Jianfeng Gao
Focal Modulation Focal Transformer

March 2, 2022

Controlling the Focus of Pretrained Language Generation Models
Jiabao Ji, Yoon Kim, James Glass, Tianxing He
Abstractive Summarization Human Driving Focus Language Generation Model Dialogue Response Generation Focal Transformer

February 23, 2022

RadioTransformer: A Cascaded Global-Focal Transformer for Visual Attention-guided Disease Classification
Moinak Bhattacharya, Shubham Jain, Prateek Prasanna
Vision Transformer Attention Mechanism Visual Attention Gaze Data Focal Transformer

November 30, 2021

Shunted Self-Attention via Multi-Scale Token Aggregation
Sucheng Ren, Daquan Zhou, Shengfeng He, Jiashi Feng, Xinchao Wang
Vision Transformer Self Attention Self Attention Layer Spatial Token Focal Transformer