Image Modeling

Image modeling aims to learn efficient representations of images, enabling tasks like image generation, recognition, and manipulation. Current research focuses on self-supervised learning techniques, particularly masked image modeling (MIM), which trains models to reconstruct missing image parts, and on improving the interpretability and robustness of these models through methods like generalized integrated gradients. These advancements are significant because they improve the efficiency and effectiveness of computer vision systems, leading to better performance in various applications and a deeper understanding of how these models function.

Papers

February 27, 2023

Scalable precision wide-field imaging in radio interferometry: II. AIRI validated on ASKAP data
Amanda G. Wilber, Arwa Dabbech, Matthieu Terris, Adrian Jackson, Yves Wiaux
Regularization Model Image Modeling Multidimensional Local Precision Rate

February 11, 2023

A novel approach to generate datasets with XAI ground truth to evaluate image models
Miquel Miró-Nicolau, Antoni Jaume-i-Capó, Gabriel Moyà-Alcover
Artificial Intelligence Data Set Ground Truth Novel Approach Image Modeling Model Explanation Artificial Intelligence Decision

February 6, 2023

February 2, 2023

Energy-Inspired Self-Supervised Pretraining for Vision Models
Ze Wang, Jiang Wang, Zicheng Liu, Qiang Qiu
Self Supervised Vision Model Image Modeling

January 3, 2023

TinyMIM: An Empirical Study of Distilling MIM Pre-trained Models
Sucheng Ren, Fangyun Wei, Zheng Zhang, Han Hu
Vision Transformer Pre Trained Model Empirical Study Image Modeling Feature Based Distillation

December 31, 2022

Disjoint Masking with Joint Distillation for Efficient Masked Image Modeling
Xin Ma, Chang Liu, Chunyu Xie, Long Ye, Yafeng Deng, Xiangyang Ji
Self Supervised Learning Image Modeling Masked Image Modeling Masking Strategy Masked Image Joint Distillation

December 14, 2022

Image Compression with Product Quantized Masked Image Modeling
Alaaeldin El-Nouby, Matthew J. Muckley, Karen Ullrich, Ivan Laptev, Jakob Verbeek, Hervé Jégou
Image Compression Image Modeling Vector Quantization Neural Compression Product Attribute Scalar Quantization

December 13, 2022

FastMIM: Expediting Masked Image Modeling Pre-training for Vision
Jianyuan Guo, Kai Han, Han Wu, Yehui Tang, Yunhe Wang, Chang Xu
Vision Paper Image Modeling Resolution Input Vision Backbone

December 3, 2022

BlendGAN: Learning and Blending the Internal Distributions of Single Images by Spatial Image-Identity Conditioning
Idan Kligvasser, Tamar Rott Shaham, Noa Alkobi, Tomer Michaeli
Single Image Generative Approach Image Modeling Image Conditioning Blending Method

November 28, 2022

November 27, 2022

Alignment-Enriched Tuning for Patch-Level Pre-trained Document Image Models
Lei Wang, Jiabang He, Xing Xu, Ning Liu, Hui Liu
Image Modeling Text Encoder Word Alignment Encoder Feature Document Image Classification

November 23, 2022

Self-Supervised Learning based on Heat Equation
Yinpeng Chen, Xiyang Dai, Dongdong Chen, Mengchen Liu, Lu Yuan, Zicheng Liu, Youzuo Lin
Self Supervised Learning Image Classification Supervised ImageNet Image Modeling Heat Equation

November 18, 2022

$\alpha$ DARTS Once More: Enhancing Differentiable Architecture Search by Masked Image Modeling
Bicheng Guo, Shuxuan Guo, Miaojing Shi, Peng Chen, Shibo He, Jiming Chen, Kaicheng Yu
Supervised ImageNet Image Modeling Patch Based Masked Image Modeling Differentiable Architecture Search

November 17, 2022

November 16, 2022

Stare at What You See: Masked Image Modeling without Reconstruction
Hongwei Xue, Peng Gao, Hongyang Li, Yu Qiao, Hao Sun, Houqiang Li, Jiebo Luo
Full State Reconstruction Vision Model Masked Autoencoders Image Modeling Masked Image Modeling Provider Gaze

November 3, 2022

Rethinking Hierarchies in Pre-trained Plain Vision Transformer
Yufei Xu, Jing Zhang, Qiming Zhang, Dacheng Tao
Vision Transformer Supervised ImageNet Self Supervised Pre Training Image Modeling Part Whole Hierarchy Plain Vision Transformer

October 19, 2022

A Unified View of Masked Image Modeling
Zhiliang Peng, Li Dong, Hangbo Bao, Qixiang Ye, Furu Wei
Vision Transformer Semantic Segmentation Image Modeling Masked Image Modeling Unified View