Masked Autoencoders

Masked autoencoders (MAEs) are a self-supervised learning technique that learns robust image representations by reconstructing masked portions of an image. Current research focuses on adapting MAEs for various data modalities (images, point clouds, audio, 3D data) and downstream tasks (classification, segmentation, object detection), often incorporating architectural enhancements like Vision Transformers and exploring different masking strategies beyond random masking to improve efficiency and performance. The resulting pre-trained models offer significant advantages in scenarios with limited labeled data, impacting fields like Earth observation, medical image analysis, and robotics through improved accuracy and reduced computational demands.

Papers

June 8, 2023

Understanding Masked Autoencoders via Hierarchical Latent Variable Models
Lingjing Kong, Martin Q. Ma, Guangyi Chen, Eric P. Xing, Yuejie Chi, Louis-Philippe Morency, Kun Zhang
Latent Variable Masked Autoencoders Masked AutoEncoder Level Representation Hierarchical Latent Masked Reconstruction

June 6, 2023

Masked Autoencoders are Efficient Continual Federated Learners
Subarnaduti Paul, Lars-Joel Frey, Roshni Kamath, Kristian Kersting, Martin Mundt
Continual LEArning Supervised Autoencoder Unsupervised Learning Knowledge Transfer Masked Autoencoders Federated Continual Learning

June 4, 2023

rPPG-MAE: Self-supervised Pre-training with Masked Autoencoders for Remote Physiological Measurement
Xin Liu, Yuting Zhang, Zitong Yu, Hao Lu, Huanjing Yue, Jingyu Yang
Contrastive Learning Self Supervised Masked Autoencoders Self Supervised Method Physiological Signal Remote Photoplethysmography Remote Physiological Measurement

June 1, 2023

Masked Autoencoders with Multi-Window Local-Global Attention Are Better Audio Learners
Sarthak Yadav, Sergios Theodoridis, Lars Kai Hansen, Zheng-Hua Tan
Masked Autoencoders Audio Representation Masked AutoEncoder Window Attention Linear Feature

May 28, 2023

Reconstructing Sea Surface Temperature Images: A Masked Autoencoder Approach for Cloud Masking and Reconstruction
Angelina Agabin, J. Xavier Prochaska
Remote Sensing Full State Reconstruction Masked Autoencoders Sea Surface Temperature Cloud Masking Numerical Ocean

May 23, 2023

Siamese Masked Autoencoders
Agrim Gupta, Jiajun Wu, Jia Deng, Li Fei-Fei
Masked Autoencoders Object Centric Representation Visual Correspondence Masked Siamese

May 19, 2023

SurgMAE: Masked Autoencoders for Long Surgical Video Analysis
Muhammad Abdullah Jamal, Omid Mohareri
Supervised Autoencoder Masked Autoencoders Surgical Video Self Supervised Paradigm

May 10, 2023

Medical supervised masked autoencoders: Crafting a better masking strategy and efficient fine-tuning schedule for medical image classification
Jiawei Mao, Shujian Guo, Yuanqi Chang, Xuesong Yin, Binling Nie
Fine Tuning Supervised Autoencoder Medical Image Classification Masked Autoencoders Random Masking Medical Semantic Segmentation

April 25, 2023

Img2Vec: A Teacher of High Token-Diversity Helps Masked AutoEncoders
Heng Pan, Chenyang Liu, Wenxiao Wang, Li Yuan, Hongfa Wang, Zhifeng Li, Wei Liu
Supervised ImageNet Masked Autoencoders Image Modeling Deep Feature Good Teacher Masked Image Modeling

April 20, 2023

Contrastive Tuning: A Little Help to Make Masked Autoencoders Forget
Johannes Lehner, Benedikt Alkin, Andreas Fürst, Elisabeth Rumetshofer, Lukas Miklautz, Sepp Hochreiter
Supervised ImageNet Masked Autoencoders Masked Image Modeling Little Help Contrastive Masked Contrastive Tuning Nearest Neighbor Contrastive Learning

April 19, 2023

DCELANM-Net:Medical Image Segmentation based on Dual Channel Efficient Layer Aggregation Network with Learner
Chengzhun Lu, Zhangrun Xia, Krzysztof Przystupa, Orest Kochan, Jun Su
Medical Image Segmentation Masked Autoencoders Self Supervised Method Deeper Network Aggregation Network B Learner

April 14, 2023

3D Feature Prediction for Masked-AutoEncoder-Based Point Cloud Pretraining
Siming Yan, Yuqi Yang, Yuxiao Guo, Hao Pan, Peng-shuai Wang, Xin Tong, Yang Liu, Qixing Huang
Point Cloud Masked Autoencoders 3D Feature Intrinsic Feature Point Cloud Pre Training

April 6, 2023

Diffusion Models as Masked Autoencoders
Chen Wei, Karttikeya Mangalam, Po-Yao Huang, Yanghao Li, Haoqi Fan, Hu Xu, Huiyu Wang, Cihang Xie, Alan Yuille, Christoph Feichtenhofer
Diffusion Model Supervised Autoencoder Masked Autoencoders Pre Trained Representation High Quality Representation Downstream Recognition

March 30, 2023

Masked Autoencoders as Image Processors
Huiyu Duan, Wei Shen, Xiongkuo Min, Danyang Tu, Long Teng, Jia Wang, Guangtao Zhai
Supervised Autoencoder Self Attention Masked Autoencoders Real World Image Denoising Image Signal Processor

March 21, 2023

ViC-MAE: Self-Supervised Representation Learning from Images and Video with Contrastive Masked Autoencoders
Jefferson Hernandez, Ruben Villegas, Vicente Ordonez
Contrastive Learning Visual Representation Source Video Self Supervised Representation Learning Masked Autoencoders Video Benchmark Contrastive Masked Balanced Classification

March 20, 2023

FedMAE: Federated Self-Supervised Learning with One-Block Masked Auto-Encoder
Nan Yang, Xuanyu Chen, Charles Z. Liu, Dong Yuan, Wei Bao, Lizhen Cui
Semi Supervised Masked Autoencoders Federated Self Supervised Learning Pre Trained Classifier Federated Variational

March 14, 2023

PiMAE: Point Cloud and Image Interactive Masked Autoencoders for 3D Object Detection
Anthony Chen, Kevin Zhang, Renrui Zhang, Zihan Wang, Yuheng Lu, Yandong Guo, Shanghang Zhang
Point Cloud 3D Object Detection Masked Autoencoders Cross Modal Interaction RGB D Reconstruction Modal Reconstruction

March 12, 2023

Improving Masked Autoencoders by Learning Where to Mask
Haijian Chen, Wendong Zhang, Yunbo Wang, Xiaokang Yang
Masked Autoencoders Image Modeling Random Masking Adversarial Mask Sampling Mask Mask Based Modeling

March 9, 2023

Mimic before Reconstruct: Enhancing Masked Autoencoders with Feature Mimicking
Peng Gao, Renrui Zhang, Rongyao Fang, Ziyi Lin, Hongyang Li, Hongsheng Li, Qiao Yu
Pre Training Visual Representation Vision Model Masked Autoencoders Novel Mimic Algorithm

March 4, 2023

PixMIM: Rethinking Pixel Reconstruction in Masked Image Modeling
Yuan Liu, Songyang Zhang, Jiacheng Chen, Kai Chen, Dahua Lin
Masked Autoencoders Masked Image Modeling Pixel Reconstruction