Open Vocabulary Instance Segmentation

Open-vocabulary instance segmentation aims to automatically identify and delineate objects in images and videos, even those not seen during model training, going beyond the limitations of traditional closed-vocabulary methods. Current research focuses on integrating 2D and 3D data streams, leveraging vision-language models and diffusion techniques to improve accuracy and handle diverse object appearances, including challenging scenarios like camouflage. These advancements are significant for broader applications in scene understanding, robotic perception, and augmented reality, reducing the reliance on extensive manual annotation for new object categories.

Papers

August 16, 2024

Zero-Shot Dual-Path Integration Framework for Open-Vocabulary 3D Instance Segmentation
Tri Ton, Ji Woo Hong, SooHwan Eom, Jun Yeop Shim, Junyeong Kim, Chang D. Yoo
Biological Pathway 3D Pre Training Hierarchical Mask Open Vocabulary Instance Segmentation Open Vocabulary 3D Instance Segmentation

July 1, 2024

PanopticRecon: Leverage Open-vocabulary Instance Segmentation for Zero-shot Panoptic Reconstruction
Xuan Yu, Yili Liu, Chenrui Han, Sitong Mao, Shunbo Zhou, Rong Xiong, Yiyi Liao, Yue Wang
3D Instance Segmentation Zero Shot Segmentation Open Vocabulary Instance Segmentation 3D Panoptic Segmentation

January 30, 2024

YOLO-World: Real-Time Open-Vocabulary Object Detection
Tianheng Cheng, Lin Song, Yixiao Ge, Wenyu Liu, Xinggang Wang, Ying Shan
Vision Language Open Vocabulary Object Detection Open Vocabulary Detection Look Once Algorithm Open Vocabulary Instance Segmentation

December 29, 2023

Leveraging Open-Vocabulary Diffusion to Camouflaged Instance Segmentation
Tuan-Anh Vu, Duc Thanh Nguyen, Qing Guo, Binh-Son Hua, Nhat Minh Chung, Ivor W. Tsang, Sai-Kit Yeung
Instance Segmentation Open Vocabulary Object Segmentation Object Representation Text to Image Diffusion Image Text Model Open Vocabulary Instance Segmentation

December 17, 2023

Open3DIS: Open-Vocabulary 3D Instance Segmentation with 2D Mask Guidance
Phuc D. A. Nguyen, Tuan Duc Ngo, Evangelos Kalogerakis, Chuang Gan, Anh Tran, Cuong Pham, Khoi Nguyen
Object Proposal Open Vocabulary Instance Segmentation Open Vocabulary 3D Instance Segmentation Open Vocabulary Scene Understanding

November 24, 2023

Text and Click inputs for unambiguous open vocabulary instance segmentation
Nikolai Warner, Meera Hahn, Jonathan Huang, Irfan Essa, Vighnesh Birodkar
Text Modality Segmentation Based Approach Segmentation Model Rich Input Open Vocabulary Instance Segmentation Segmentation Style Discovery

September 22, 2023

MosaicFusion: Diffusion Models as Data Augmenters for Large Vocabulary Instance Segmentation
Jiahao Xie, Wei Li, Xiangtai Li, Ziwei Liu, Yew Soon Ong, Chen Change Loy
Diffusion Model Text to Image Diffusion Model Diffusion Based Data Augmentation Open Vocabulary Instance Segmentation

September 1, 2023

OpenIns3D: Snap and Lookup for 3D Open-vocabulary Instance Segmentation
Zhening Huang, Xiaoyang Wu, Xi Chen, Hengshuang Zhao, Lei Zhu, Joan Lasenby
Open Vocabulary Snap Video Open Vocabulary Instance Segmentation Open Vocabulary 3D Instance Segmentation 2 Dimensional Vision Language Model Open Vocabulary Scene

May 26, 2023

OpenVIS: Open-vocabulary Video Instance Segmentation
Pinxue Guo, Tony Huang, Peiyang He, Xuefeng Liu, Tianjun Xiao, Zhaoyu Chen, Wenqiang Zhang
Mask Prediction Open Vocabulary Instance Segmentation Open Vocabulary Video Instance Segmentation

March 29, 2023

Mask-free OVIS: Open-Vocabulary Instance Segmentation without Manual Mask Annotations
Vibashan VS, Ning Yu, Chen Xing, Can Qin, Mingfei Gao, Juan Carlos Niebles, Vishal M. Patel, Ran Xu
Instance Segmentation Pre Trained Vision Language Model Mask Annotation Open Vocabulary Instance Segmentation

January 2, 2023

Betrayed by Captions: Joint Caption Grounding and Generation for Open Vocabulary Instance Segmentation
Jianzong Wu, Xiangtai Li, Henghui Ding, Xia Li, Guangliang Cheng, Yunhai Tong, Chen Change Loy
Faithful Generation Generated Caption COCO Dataset Open Vocabulary Instance Segmentation Class Detection Betrayal Detection

November 24, 2021

Open-Vocabulary Instance Segmentation via Robust Cross-Modal Pseudo-Labeling
Dat Huynh, Jason Kuen, Zhe Lin, Jiuxiang Gu, Ehsan Elhamifar
Captioning Datasets Mask Annotation Pseudo Mask Open Vocabulary Instance Segmentation

November 4, 2021

LVIS Challenge Track Technical Report 1st Place Solution: Distribution Balanced and Boundary Refinement for Large Vocabulary Instance Segmentation
WeiFu Fu, CongChong Nie, Ting Sun, Jun Liu, TianLiang Zhang, Yong Liu
Instance Segmentation Segmentation Quality Mask Refinement Open Vocabulary Instance Segmentation CLVision Challenge Balanced Distribution Boundary Refinement