Hybrid CNN Transformer

Hybrid CNN-Transformer architectures combine the strengths of convolutional neural networks (CNNs) for local feature extraction and transformers for capturing global context, aiming to improve performance in various computer vision and signal processing tasks. Current research focuses on optimizing these hybrid models for efficiency, often employing techniques like lightweight attention mechanisms and efficient fusion strategies within U-Net or similar encoder-decoder structures. These advancements are significantly impacting fields like medical image analysis, remote sensing, and object detection by enabling more accurate and computationally efficient solutions for complex problems.

Papers

January 10, 2022

Swin Transformer coupling CNNs Makes Strong Contextual Encoders for VHR Image Road Extraction
Tao Chen, Yiran Liu, Haoyu Jiang, Ruirui Li
CNN Model Swin Transformer Estimated Team Strength Hybrid CNN Transformer Context Encoder Road Extraction Road Network Representation Geometric Context

December 13, 2021

Hformer: Hybrid CNN-Transformer for Fringe Order Prediction in Phase Unwrapping of Fringe Projection
Xinjun Zhu, Zhiqiang Han, Mengkai Yuan, Qinghua Guo, Hongyi Wang
Hybrid CNN Transformer Fringe Projection Phase Unwrapping

December 2, 2021

SwinTrack: A Simple and Strong Baseline for Transformer Tracking
Liting Lin, Heng Fan, Zhipeng Zhang, Yong Xu, Haibin Ling
Convolutional Neural Network Transformer Architecture Strong Baseline Hybrid CNN Transformer Transformer Tracker Tracking by Attention

November 19, 2021

TransMorph: Transformer for unsupervised medical image registration
Junyu Chen, Eric C. Frey, Yufan He, William P. Segars, Ye Li, Yong Du
Transformer Based Image Registration Medical Image Registration Hybrid CNN Transformer Vision Transformer Architecture Brain MRI Registration

Hybrid CNN Transformer

Papers

Swin Transformer coupling CNNs Makes Strong Contextual Encoders for VHR Image Road Extraction

Hformer: Hybrid CNN-Transformer for Fringe Order Prediction in Phase Unwrapping of Fringe Projection

SwinTrack: A Simple and Strong Baseline for Transformer Tracking

TransMorph: Transformer for unsupervised medical image registration