Scene Text Recognition Model

Scene text recognition (STR) models aim to automatically extract textual information from images, a crucial task with applications ranging from sports video analysis to document processing. Current research focuses on improving accuracy and efficiency, particularly for low-resource languages and challenging scenarios like occluded text or diverse writing systems, often employing deep learning architectures such as CRNNs and more recent single visual models that bypass traditional sequential processing. These advancements are driven by the development of larger datasets, including synthetic data generation techniques, and the exploration of explainable AI methods to enhance model transparency and trustworthiness.

Papers

September 26, 2024

Text Image Generation for Low-Resource Languages with Dual Translation Learning
Chihiro Noguchi, Shun Fukuda, Shoichiro Mihara, Masao Yamanaka
Low Resource Language Scene Text Recognition Text Image Scene Text Recognition Model Dual Regression

May 22, 2024

A General Framework for Jersey Number Recognition in Sports Video
Maria Koshkina, James H. Elder
General Framework Scene Text Recognition Sport Video Scene Text Recognition Model Jersey Number

December 29, 2023

An Empirical Study of Scaling Law for OCR
Miao Rang, Zhenni Bi, Chuanjian Liu, Yunhe Wang, Kai Han
Empirical Study Optical Character Recognition Scaling Law Text Recognition Character Recognition Scene Text Recognition Model

October 14, 2023

Scene Text Recognition Models Explainability Using Local Features
Mark Vincent Ty, Rowel Atienza
Explainable AI XAI Method Attribution Method Local Feature charactER Representation Scene Text Recognition Model

April 30, 2022

SVTR: Scene Text Recognition with a Single Visual Model
Yongkun Du, Zhineng Chen, Caiyan Jia, Xiaoting Yin, Tianlun Zheng, Chenxia Li, Yuning Du, Yu-Gang Jiang
Scene Text Recognition Visual Model Image Tokenizer Scene Text Recognition Model

January 10, 2022