Open QA Evaluation

Open QA evaluation focuses on accurately assessing the factual correctness and reasoning capabilities of large language models (LLMs) in answering open-ended questions. Current research emphasizes improving automatic evaluation methods, often by leveraging techniques like textual entailment to better align with human judgment and exploring more efficient knowledge utilization within retrieval-augmented generation (RAG) architectures, such as dynamic knowledge reading. These advancements aim to create more reliable benchmarks for LLM performance, ultimately driving the development of more accurate and efficient question-answering systems with broader applications in information retrieval and knowledge-based systems.

Papers

May 26, 2024

Accurate and Nuanced Open-QA Evaluation Through Textual Entailment
Peiran Yao, Denilson Barbosa
Textual Entailment Semantic Understanding Answer Correctness Open QA Evaluation

November 30, 2023

IAG: Induction-Augmented Generation Framework for Answering Reasoning Questions
Zhebin Zhang, Xinyu Zhang, Yuanhang Ren, Saijiang Shi, Meng Han, Yongkang Wu, Ruofei Lai, Zhao Cao
Retrieval Augmented Generation Inductive Reasoning Reasoning Question Augmented Generation Inductive World Open QA Evaluation

May 21, 2023

Evaluating Open-QA Evaluation
Cunxiang Wang, Sirui Cheng, Qipeng Guo, Yuanhao Yue, Bowen Ding, Zhikun Xu, Yidong Wang, Xiangkun Hu, Zheng Zhang, Yue Zhang
Question Answering Open Ended LLM Evaluator QA Model Open QA Evaluation

November 23, 2022

Can Open-Domain QA Reader Utilize External Knowledge Efficiently like Humans?
Neeraj Varshney, Man Luo, Chitta Baral
Real Human Inference Cost Retriever Reader Book Question Answering Open Domain QA Open QA Evaluation

Open QA Evaluation

Papers

Accurate and Nuanced Open-QA Evaluation Through Textual Entailment

IAG: Induction-Augmented Generation Framework for Answering Reasoning Questions

Evaluating Open-QA Evaluation

Can Open-Domain QA Reader Utilize External Knowledge Efficiently like Humans?