Masked Autoencoders

Masked autoencoders (MAEs) are a self-supervised learning technique that learns robust image representations by reconstructing masked portions of an image. Current research focuses on adapting MAEs for various data modalities (images, point clouds, audio, 3D data) and downstream tasks (classification, segmentation, object detection), often incorporating architectural enhancements like Vision Transformers and exploring different masking strategies beyond random masking to improve efficiency and performance. The resulting pre-trained models offer significant advantages in scenarios with limited labeled data, impacting fields like Earth observation, medical image analysis, and robotics through improved accuracy and reduced computational demands.

Papers

October 19, 2023

LoMAE: Low-level Vision Masked Autoencoders for Low-dose CT Denoising
Dayang Wang, Yongshun Xu, Shuo Han, Zhan Wu, Li Zhou, Bahareh Morovati, Hengyong Yu
Supervised Autoencoder Masked Autoencoders Low Dose Low Dose Computed Tomography Label Free

October 17, 2023

Unsupervised Pre-Training Using Masked Autoencoders for ECG Analysis
Guoxin Wang, Qingyuan Wang, Ganesh Neelakanta Iyer, Avishek Nag, Deepu John
Deep Learning Supervised Autoencoder Unsupervised Learning Masked Autoencoders Unsupervised Pre Training Electrocardiogram Analysis

October 10, 2023

October 3, 2023

Understanding Masked Autoencoders From a Local Contrastive Perspective
Xiaoyu Yue, Lei Bai, Meng Wei, Jiangmiao Pang, Xihui Liu, Luping Zhou, Wanli Ouyang
Contrastive Learning Receptive Field Masked Autoencoders Masked AutoEncoder Random Masking Contrastive Masked Local Contrastive

October 2, 2023

Large Scale Masked Autoencoding for Reducing Label Requirements on SAR Data
Matt Allen, Francisco Dorr, Joseph A. Gallego-Mejia, Laura Martínez-Ferrer, Anna Jungbluth, Freddie Kalaitzis, Raúl Ramos-Pollán
Masked Autoencoders Synthetic Aperture Radar Land Cover Synthetic Aperture Radar Data

September 27, 2023

Masked Autoencoders are Scalable Learners of Cellular Morphology
Oren Kraus, Kian Kenyon-Dean, Saber Saberian, Maryam Fallah, Peter McLean, Jess Leung, Vasudev Sharma, Ayla Khan, Jia Balakrishnan, Safiye Celik, Maciej Sypetkowski, Chi Vicky Cheng, Kristen Morse, Maureen Makes, Ben Mabey, Berton Earnshaw
Supervised Autoencoder Masked Autoencoders Microscopy Image Deep Vision Model Scalable Learning Large Scale Self Supervised Cell Morphology

September 25, 2023

Regress Before Construct: Regress Autoencoder for Point Cloud Self-supervised Learning
Yang Liu, Chen Chen, Can Wang, Xulin King, Mengyuan Liu
Masked Autoencoders Encoder Decoder Architecture Structural Construct

August 31, 2023

CL-MAE: Curriculum-Learned Masked Autoencoders
Neelu Madan, Nicolae-Catalin Ristea, Kamal Nasrollahi, Thomas B. Moeslund, Radu Tudor Ionescu
Self Supervised Supervised ImageNet Supervised Autoencoder Masked Autoencoders Mask Estimation Module

August 24, 2023

Masked Autoencoders are Efficient Class Incremental Learners
Jiang-Tian Zhai, Xialei Liu, Andrew D. Bagdanov, Ke Li, Ming-Ming Cheng
Class Incremental Learning Masked Autoencoders Efficient Learning Incremental Learning Framework

August 21, 2023

UniM$^2$AE: Multi-modal Masked Autoencoders with Unified 3D Representation for 3D Perception in Autonomous Driving
Jian Zou, Tianyu Huang, Guanglei Yang, Zhenhua Guo, Tao Luo, Chun-Mei Feng, Wangmeng Zuo
Autonomous Driving 3D Object Detection Masked Autoencoders 3D Perception Multi Modal Feature 3D Representation Multi Modal Masked Autoencoders

August 20, 2023

Improving Adversarial Robustness of Masked Autoencoders via Test-time Frequency-domain Prompting
Qidong Huang, Xiaoyi Dong, Dongdong Chen, Yinpeng Chen, Lu Yuan, Gang Hua, Weiming Zhang, Nenghai Yu
Vision Transformer Adversarial Robustness Adversarial Perturbation Masked Autoencoders Pre Trained BERT Aware Prompting

August 19, 2023

Forecast-MAE: Self-supervised Pre-training for Motion Forecasting with Masked Autoencoders
Jie Cheng, Xiaodong Mei, Ming Liu
Self Supervised Learning Masked Autoencoders Motion Forecasting Forecast Utterance Motion Forecasting Benchmark Mask Autoencoder

August 17, 2023

SRMAE: Masked Image Modeling for Scale-Invariant Deep Representations
Zhiming Wang, Lin Gu, Feng Lu
Super Resolution Masked Autoencoders Image Modeling Masked Image Modeling Scale Invariant Scale Invariance

August 12, 2023

Self-Supervised Pre-Training with Contrastive and Masked Autoencoder Methods for Dealing with Small Datasets in Deep Learning for Medical Imaging
Daniel Wolf, Tristan Payer, Catharina Silvia Lisson, Christoph Gerhard Lisson, Meinrad Beer, Michael Götz, Timo Ropinski
Deep Learning Large Scale Medical Imaging Masked Autoencoders Self Supervised Pre Training Small Datasets Medical Image Classification Task Self Supervised Pre Training Method

July 14, 2023

June 28, 2023

Hybrid Distillation: Connecting Masked Autoencoders with Contrastive Learners
Bowen Shi, Xiaopeng Zhang, Yaoming Wang, Jin Li, Wenrui Dai, Junni Zou, Hongkai Xiong, Qi Tian
Contrastive Learning Representation Learning Masked Autoencoders Masked Image Modeling Token Masking

June 15, 2023

Advancing Volumetric Medical Image Segmentation via Global-Local Masked Autoencoder
Jia-Xin Zhuang, Luyang Luo, Hao Chen
Representation Learning Masked Autoencoders Masked AutoEncoder Consistency Training Volumetric Medical Image Segmentation State of the Art Self

June 8, 2023

R-MAE: Regions Meet Masked Autoencoders
Duy-Kien Nguyen, Vaibhav Aggarwal, Yanghao Li, Martin R. Oswald, Alexander Kirillov, Cees G. M. Snoek, Xinlei Chen
Masked Autoencoders Region Specific Interactive Segmentation Self Supervised Visual Representation Segmentation Benchmark