Open Vocabulary Semantic Segmentation

Open-vocabulary semantic segmentation (OVSS) aims to assign semantic labels to image pixels without requiring pre-defined categories, enabling the recognition of objects not seen during training. Current research focuses on adapting vision-language models like CLIP, often in conjunction with other foundation models (e.g., SAM, DINO), to achieve this, employing techniques such as multi-resolution processing, pseudo-mask generation, and contrastive learning to improve accuracy and efficiency. OVSS holds significant promise for advancing various applications, including autonomous driving, remote sensing, and medical image analysis, by enabling more flexible and robust image understanding.

Papers

October 8, 2023

OV-PARTS: Towards Open-Vocabulary Part Segmentation
Meng Wei, Xiaoyu Yue, Wenwei Zhang, Shu Kong, Xihui Liu, Jiangmiao Pang
Arbitrary Object Part Segmentation Open Vocabulary Semantic Segmentation

September 25, 2023

CLIP-DIY: CLIP Dense Inference Yields Open-Vocabulary Semantic Segmentation For-Free
Monika Wysoczańska, Michaël Ramamonjisoa, Tomasz Trzciński, Oriane Siméoni
Single CLIP Open Vocabulary Semantic Segmentation Zero Shot Semantic Segmentation Unsupervised Object Localization CLIP Enhanced Blockwise Classification

September 6, 2023

Diffusion Model is Secretly a Training-free Open Vocabulary Semantic Segmenter
Jinglong Wang, Xiawei Li, Jing Zhang, Qingyuan Xu, Qin Zhou, Qian Yu, Lu Sheng, Dong Xu
Diffusion Model Semantic Segmentation Text to Image Diffusion Model Segmentation Result Open Vocabulary Semantic Segmentation

August 31, 2023

AttrSeg: Open-Vocabulary Semantic Segmentation via Attribute Decomposition-Aggregation
Chaofan Ma, Yuhuan Yang, Chen Ju, Fei Zhang, Ya Zhang, Yanfeng Wang
Semantic Segmentation Open Vocabulary Semantic Segmentation Feature Decomposition

August 4, 2023

Convolutions Die Hard: Open-Vocabulary Segmentation with Single Frozen Convolutional CLIP
Qihang Yu, Ju He, Xueqing Deng, Xiaohui Shen, Liang-Chieh Chen
Direct Convolution Open Vocabulary Open Vocabulary Semantic Segmentation Open Vocabulary Segmentation Frozen Convolutional CLIP

June 1, 2023

Exploring Open-Vocabulary Semantic Segmentation without Human Labels
Jun Chen, Deyao Zhu, Guocheng Qian, Bernard Ghanem, Zhicheng Yan, Chenchen Zhu, Fanyi Xiao, Mohamed Elhoseiny, Sean Chang Culatana
Semantic Segmentation Zero Shot Open Vocabulary Semantic Segmentation Segmentation Benchmark Zero Shot Open Vocabulary Human Label

May 23, 2023

SAD: Segment Any RGBD
Jun Cen, Yizheng Wu, Kewei Wang, Xingyi Li, Jingkang Yang, Yixuan Pei, Lingdong Kong, Ziwei Liu, Qifeng Chen
Semantic Segmentation Segment Anything Model Well Defined Segment Open Vocabulary Semantic Segmentation Planarity Sensible Over Segmentation 3D Panoptic Segmentation

April 15, 2023

TagCLIP: Improving Discrimination Ability of Open-Vocabulary Semantic Segmentation
Jingyao Li, Pengguang Chen, Shengju Qian, Shu Liu, Jiaya Jia
Contrastive Language Image Open Vocabulary Open Vocabulary Semantic Segmentation Semantic Matching Semantic Mask Discrimination Performance

April 14, 2023

MVP-SEG: Multi-View Prompt Learning for Open-Vocabulary Semantic Segmentation
Jie Guo, Qimeng Wang, Yan Gao, Xiaolong Jiang, Xu Tang, Yao Hu, Baochang Zhang
Zero Shot Prompt Learning Contrastive Language Image Open Vocabulary Semantic Segmentation Better Segmentation Adaptive Clipping

April 12, 2023

A Closer Look at the Explainability of Contrastive Language-Image Pre-training
Yi Li, Hualiang Wang, Yiqun Duan, Jiheng Zhang, Xiaomeng Li
Large Multimodal Model Contrastive Language Image Open Vocabulary Feature Enhancement Open Vocabulary Semantic Segmentation Open Vocabulary Segmentation Better Explainability

April 3, 2023

Open-Vocabulary Semantic Segmentation with Decoupled One-Pass Network
Cong Han, Yujie Zhong, Dengjie Li, Kai Han, Lin Ma
Pre Trained Network Programming Visual Language Model Multi Agent Decoupling Coefficient Open Vocabulary Semantic Segmentation Patch Embeddings Image Crop

March 21, 2023

CAT-Seg: Cost Aggregation for Open-Vocabulary Semantic Segmentation
Seokju Cho, Heeseong Shin, Sunghwan Hong, Anurag Arnab, Paul Hongsuck Seo, Seungryong Kim
Semantic Segmentation Text Embeddings Data Aggregation Unseen Class Vision Language Foundation Model Open Vocabulary Semantic Segmentation Cosine Similarity Q Seg

March 20, 2023

Neural Implicit Vision-Language Feature Fields
Kenneth Blomqvist, Francesco Milano, Jen Jen Chung, Lionel Ott, Roland Siegwart
Vision Language Model Volumetric Representation Open Vocabulary Semantic Segmentation

March 16, 2023

Global Knowledge Calibration for Fast Open-Vocabulary Segmentation
Kunyang Han, Yong Liu, Jun Hao Liew, Henghui Ding, Yunchao Wei, Jiajun Liu, Yitong Wang, Yansong Tang, Yujiu Yang, Jiashi Feng, Yao Zhao
Pre Trained Vision Language Model Open Vocabulary Semantic Segmentation Open Vocabulary Segmentation CLIP Vision Encoder Open Vocabulary Image Segmentation Frozen Convolutional CLIP

February 27, 2023

A Language-Guided Benchmark for Weakly Supervised Open Vocabulary Semantic Segmentation
Prashant Pandey, Mustafa Chasmai, Monish Natarajan, Brejesh Lall
Semantic Segmentation Weakly Supervised Semantic Segmentation Open Vocabulary Semantic Segmentation Linguistic Benchmark Language Driven Semantic Segmentation

February 23, 2023

Side Adapter Network for Open-Vocabulary Semantic Segmentation
Mengde Xu, Zheng Zhang, Fangyun Wei, Han Hu, Xiang Bai
Semantic Segmentation Pre Trained Vision Language Model Open Vocabulary Semantic Segmentation Semantic Segmentation Benchmark

January 22, 2023

Learning Open-vocabulary Semantic Segmentation Models From Natural Language Supervision
Jilan Xu, Junlin Hou, Yuejie Zhang, Rui Feng, Yi Wang, Yu Qiao, Weidi Xie
Fine Grained Segmentation Performance Open Vocabulary Semantic Segmentation Language Supervision Mask Annotation Easy to Learn Token

January 18, 2023

Class Enhancement Losses with Pseudo Labels for Zero-shot Semantic Segmentation
Son Duy Dao, Hengcan Shi, Dinh Phung, Jianfei Cai
Zero Shot Pseudo Label Text Embeddings Open Vocabulary Semantic Segmentation Zero Shot Semantic Segmentation Class Loss

December 9, 2022

Open Vocabulary Semantic Segmentation with Patch Aligned Contrastive Learning
Jishnu Mukhoti, Tsung-Yu Lin, Omid Poursaeed, Rui Wang, Ashish Shah, Philip H. S. Torr, Ser-Nam Lim
Contrastive Learning Contrastive Loss Open Vocabulary Semantic Segmentation Single Simple Patch

November 27, 2022

SegCLIP: Patch Aggregation with Learnable Centers for Open-Vocabulary Semantic Segmentation
Huaishao Luo, Junwei Bao, Youzheng Wu, Xiaodong He, Tianrui Li
Contrastive Language Image Patch Based Open Vocabulary Semantic Segmentation CLIP Model Open Vocabulary Segmentation