Text Supervision

Text supervision leverages textual information, such as descriptions or reports, to guide the training of computer vision models, particularly in scenarios with limited or expensive labeled image data. Current research focuses on integrating text supervision into vision-language models (VLMs) like CLIP, employing techniques like prompt learning, knowledge distillation, and contrastive learning to improve model performance on tasks such as image classification, segmentation, and object detection. This approach offers a cost-effective and efficient way to enhance model accuracy and generalization, particularly beneficial in domains like medical imaging and open-vocabulary tasks where labeled data is scarce or expensive to obtain.

Papers

December 11, 2021

Technical Language Supervision for Intelligent Fault Diagnosis in Process Industry
Karl Löwenmark, Cees Taal, Stephan Schnabel, Marcus Liwicki, Fredrik Sandin
Language Supervision Text Supervision Fault Diagnosis Method Intelligent Fault Diagnosis Natural Language Annotation

November 16, 2021

Multi-Vector Models with Textual Guidance for Fine-Grained Scientific Document Similarity
Sheshera Mysore, Arman Cohan, Tom Hope
Fine Grained Large Corpus Cross Lingual Vector Valued Text Guidance Text Supervision Document Similarity

Text Supervision

Papers

Technical Language Supervision for Intelligent Fault Diagnosis in Process Industry

Multi-Vector Models with Textual Guidance for Fine-Grained Scientific Document Similarity