VQA System

Visual Question Answering (VQA) systems aim to enable computers to answer questions about images or videos using a combination of computer vision and natural language processing. Current research focuses on improving the robustness and consistency of VQA models across diverse data types (images, charts, videos, multi-page documents), addressing biases in training data, and enhancing the accuracy of answers, particularly for complex questions requiring reasoning and external knowledge. These advancements are crucial for applications ranging from medical image analysis and document understanding to robotics and augmented reality, where accurate and reliable interpretation of visual information is paramount.

Papers

August 24, 2022

Symbolic Replay: Scene Graph as Prompt for Continual Learning on VQA Task
Stan Weixian Lei, Difei Gao, Jay Zhangjie Wu, Yuxuan Wang, Wei Liu, Mengmi Zhang, Mike Zheng Shou
Continual LEArning Visual Question Answering Scene Graph Style PROMPT VQA System VQA Task VQA Dataset Symbolic Execution

August 10, 2022

Aesthetic Visual Question Answering of Photographs
Xin Jin, Wu Zhou, Xinghui Zhou, Shuai Cui, Le Zhang, Jianwen Lv, Shu Zhao
Visual Question Answering Aesthetic Attribute VQA System Aesthetic Assessment

May 30, 2022

An Efficient Modern Baseline for FloodNet VQA
Aditya Kane, Sahil Khose
VQA System Efficient Baseline Nr Vqa Text Informed Feature Generation

March 15, 2022

CARETS: A Consistency And Robustness Evaluative Test Suite for VQA
Carlos E. Jimenez, Olga Russakovsky, Karthik Narasimhan
Native Robustness Strong Consistency Question Generation 3d Vqa CaRE SD VQA System VQA Datasets Model Understanding Evaluation Suite

February 15, 2022

Privacy Preserving Visual Question Answering
Cristian-Paul Bara, Qing Ping, Abhinav Mathur, Govind Thattai, Rohith MV, Gaurav S. Sukhatme
Vision Model Privacy Preserving Image VQA System

February 4, 2022

Grounding Answers for Visual Questions Asked by Visually Impaired People
Chongyan Chen, Samreen Anjum, Danna Gurari
Visual Question VQA System Visually Impaired People

December 13, 2021

Improving and Diagnosing Knowledge-Based Visual Question Answering via Entity Enhanced Knowledge Injection
Diego Garcia-Olano, Yasumasa Onoe, Joydeep Ghosh
Knowledge Injection Knowledge Based Visual Question Answering VQA System

November 18, 2021

Blind VQA on 360{\deg} Video via Progressively Learning from Pixels, Frames and Video
Li Yang, Mai Xu, Shengxi Li, Yichen Guo, Zulin Wang
Source Video Tetromino Pixel Indoor Wall Frame Installation VQA System Video Quality Metric Spherical Camera