Vision Mamba

Vision Mamba, a family of models based on state space models (SSMs), aims to improve upon the limitations of convolutional neural networks (CNNs) and transformers in computer vision tasks. Current research focuses on enhancing Vision Mamba architectures through techniques like cross-layer token fusion, sparse connections, and stochastic regularization to improve training efficiency and scalability for various applications, including image classification, segmentation, and object detection. The linear computational complexity of Vision Mamba offers a significant advantage over transformers, particularly for high-resolution images and long sequences, making it a promising alternative for resource-constrained environments and large-scale datasets. Its success across diverse applications, from medical imaging to remote sensing, highlights its potential impact on various scientific fields and practical applications.

Papers

August 30, 2024

Stochastic Layer-Wise Shuffle: A Good Practice to Improve Vision Mamba Training
Zizheng Huang, Haoxing Chen, Jiaqi Li, Jun Lan, Huijia Zhu, Weiqiang Wang, Limin Wang
Vision Transformer Best Practice Vision Mamba Shuffle Model Shuffling Gradient

August 26, 2024

LoG-VMamba: Local-Global Vision Mamba for Medical Image Segmentation
Trung Dinh Quoc Dang, Huy Hoang Nguyen, Aleksei Tiulpin
Convolutional Neural Network Vision Transformer Medical Image Segmentation Segmentation Model Computer Vision Task Vision Mamba Log Message

August 20, 2024

MambaEVT: Event Stream based Visual Object Tracking using State Space Model
Xiao Wang, Chao wang, Shiao Wang, Xixi Wang, Zhicheng Zhao, Lin Zhu, Bo Jiang
State Space Model Object Tracking Visual Object Tracking Vision Mamba Event Stream

August 11, 2024

Neural Architecture Search based Global-local Vision Mamba for Palm-Vein Recognition
Huafeng Qin, Yuming Fu, Jing Chen, Mounim A. El-Yacoubi, Xinbo Gao, Feng Xi
Neural Architecture Search Vision Mamba Global Representation Finger Vein Recognition Palm Vein

July 26, 2024

VSSD: Vision Mamba with Non-Causal State Space Duality
Yuheng Shi, Minjing Dong, Mingjia Li, Chang Xu
Vision Transformer Vision Mamba

July 22, 2024

Mamba meets crack segmentation
Zhili He, Yu-Hsing Wang
Mamba in Mamba Vision Mamba Crack Segmentation Visual Mamba

July 11, 2024

July 10, 2024

MambaVision: A Hybrid Mamba-Transformer Vision Backbone
Ali Hatamizadeh, Jan Kautz
Vision Transformer Vision Mamba Hybrid Transformer Mamba

July 8, 2024

A Mamba-based Siamese Network for Remote Sensing Change Detection
Jay N. Paranjape, Celso de Melo, Vishal M. Patel
Convolutional Neural Network Change Detection Receptive Field Vision Mamba

July 4, 2024

Vision Mamba for Classification of Breast Ultrasound Images
Ali Nasiri-Sarvi, Mahdi S. Hosseini, Hassan Rivaz
Vision Transformer Classification Code Mamba Based Vision Mamba Vision Encoders Breast Ultrasound Traditional Convolutional Mamba Based Model

June 22, 2024

Soft Masked Mamba Diffusion Model for CT to MRI Conversion
Zhenbin Wang, Lei Zhang, Lituan Wang, Zhenwei Zhang
Latent Diffusion Model Computed Tomography Vision Mamba Medical Image Generation Mamba Based Encoder Decoder Diffusion Mamba

June 13, 2024

Q-Mamba: On First Exploration of Vision Mamba for Image Quality Assessment
Fengbin Guan, Xin Li, Zihao Yu, Yiting Lu, Zhibo Chen
Image Quality Assessment Mamba in Mamba Vision Mamba Nr Iqa Mamba Language Model

June 10, 2024

MHS-VM: Multi-Head Scanning in Parallel Subspaces for Vision Mamba
Zhongping Ji
Visual Feature Vision Mamba Head Detection Difference Subspace Routing Attention Dimensional Subspace

June 9, 2024

May 26, 2024

Demystify Mamba in Vision: A Linear Attention Perspective
Dongchen Han, Ziyi Wang, Zhuofan Xia, Yizeng Han, Yifan Pu, Chunjiang Ge, Jun Song, Shiji Song, Bo Zheng, Gao Huang
Vision Paper Mamba in Mamba Linear Attention Vision Mamba Low Rank Attention Linear Attention Transformer

May 23, 2024

May 16, 2024

RSDehamba: Lightweight Vision Mamba for Remote Sensing Satellite Image Dehazing
Huiling Zhou, Xianhao Wu, Hongming Chen, Xiang Chen, Xin He
Image Restoration Image Dehazing Mamba Based Vision Mamba Spatial Dependence Homogeneous Haze Remote Sensing Image Dehazing