OCR Model

Optical Character Recognition (OCR) models aim to automatically extract text from images, a crucial task with broad applications. Current research emphasizes developing more robust and versatile OCR models, including those that integrate vision and language models within a unified framework (e.g., transformer-based architectures) or operate without relying on separate OCR engines. These advancements focus on improving accuracy, efficiency, and adaptability across diverse languages, document types, and image qualities, ultimately enhancing accessibility to information in various digital archives and applications.

Papers

November 19, 2024

Arabic-Nougat: Fine-Tuning Vision Transformers for Arabic OCR and Markdown Extraction
Mohamed Rashad
Vision Transformer Character Recognition Arabic Language OCR Model

October 17, 2024

Reference-Based Post-OCR Processing with LLM for Diacritic Languages
Thao Do
Medical LLM Spelling Correction Fine Grained Recognition Post OCR OCR Model

October 8, 2024

Mero Nagarikta: Advanced Nepali Citizenship Data Extractor with Deep Learning-Powered Text Detection and OCR
Sisir Dhakal, Sujan Sigdel, Sandesh Prasad Paudel, Sharad Kumar Ranabhat, Nabin Lamichhane
Text Detection Gallery Style OCR OCR Model Multilingual Text Recognition

July 17, 2024

VisFocus: Prompt-Guided Vision Encoders for OCR-Free Dense Document Understanding
Ofir Abramovich, Niv Nayman, Sharon Fogel, Inbal Lavi, Ron Litman, Shahar Tsiper, Royee Tichauer, Srikar Appalaraju, Shai Mazor, R. Manmatha
Document Understanding Vision Encoders OCR Free OCR Model

December 5, 2023

UPOCR: Towards Unified Pixel-Level OCR Interface
Dezhi Peng, Zhenhua Yang, Jiaxin Zhang, Chongyu Liu, Yongxin Shi, Kai Ding, Fengjun Guo, Lianwen Jin
Optical Character Recognition OCR Model

August 29, 2023

Enhancing OCR Performance through Post-OCR Models: Adopting Glyph Embedding for Improved Correction
Yung-Hsin Chen, Yuli Zhou
Post OCR OCR Model

May 11, 2023

Combining OCR Models for Reading Early Modern Printed Books
Mathias Seuret, Janne van der Loop, Nikolaus Weichselbaumer, Martin Mayr, Janina Molnar, Tatjana Hass, Florian Kordon, Anguelos Nicolau, Vincent Christlein
Fine Grained Recognition Font Style OCR Model

April 5, 2023

Efficient OCR for Building a Diverse Digital History
Jacob Carlson, Tom Bryan, Melissa Dell
Optical Character Recognition Character Recognition Language Vision Model OCR Model

November 25, 2022

Chart-RCNN: Efficient Line Chart Data Extraction from Camera Images
Shufan Li, Congxi Lu, Linkai Li, Haoshuai Zhou
Synthetic Data Character Recognition Chart Related OCR Model Chart Data Extraction Camera Image

May 5, 2022

OCR Synthetic Benchmark Dataset for Indic Languages
Naresh Saini, Promodh Pinto, Aravinth Bheemaraj, Deepak Kumar, Dhiraj Daga, Saurabh Yadav, Srihari Nagaraj
Synthetic Data Indian Language OCR Model

November 30, 2021

OCR-free Document Understanding Transformer
Geewook Kim, Teakgyu Hong, Moonbin Yim, Jeongyeon Nam, Jinyoung Park, Jinyeong Yim, Wonseok Hwang, Sangdoo Yun, Dongyoon Han, Seunghyun Park
OCR Free OCR Model Document transFormer