Image Text Retrieval

Image-text retrieval (ITR) aims to find the most relevant images for a given text query, and vice versa, bridging the semantic gap between visual and textual data. Current research emphasizes improving the accuracy and efficiency of ITR, focusing on advancements in vision-language models (VLMs) like CLIP and its variants, exploring techniques such as contrastive learning, fine-grained alignment, and efficient model architectures (e.g., dual-stream, lightweight models). The field is significant for its applications in various domains, including multimedia search, medical image analysis, and remote sensing, driving improvements in information retrieval and cross-modal understanding.

Papers

March 28, 2022

Image-text Retrieval: A Survey on Recent Research and Development
Min Cao, Shiping Li, Juntao Li, Liqiang Nie, Min Zhang
Timely Survey Cross Modal Development Activity Benchmark Datasets Feature Alignment Image Text Retrieval Recent Research

March 10, 2022

LoopITR: Combining Dual and Cross Encoder Architectures for Image-Text Retrieval
Jie Lei, Xinlei Chen, Ning Zhang, Mengjiao Wang, Mohit Bansal, Tamara L. Berg, Licheng Yu
Image Text Retrieval Dual System Cross Encoder Dual Encoders Discriminative Encoder

March 8, 2022

Where Does the Performance Improvement Come From? -- A Reproducibility Concern about Image-Text Retrieval
Jun Rao, Fei Wang, Liang Ding, Shuhan Qi, Yibing Zhan, Weifeng Liu, Dacheng Tao
Performance Improvement Image Text Retrieval Reproducibility Crisis Retrieval Enhanced

November 5, 2021

Negative Sample is Negative in Its Own Way: Tailoring Negative Sentences for Image-Text Retrieval
Zhihao Fan, Zhongyu Wei, Zejun Li, Siyuan Wang, Jianqing Fan
Negative Sampling Negative Sample Image Text Retrieval

Image Text Retrieval

Papers

Image-text Retrieval: A Survey on Recent Research and Development

LoopITR: Combining Dual and Cross Encoder Architectures for Image-Text Retrieval

Where Does the Performance Improvement Come From? -- A Reproducibility Concern about Image-Text Retrieval

Negative Sample is Negative in Its Own Way: Tailoring Negative Sentences for Image-Text Retrieval