Hallucination Detection

Hallucination detection in large language models (LLMs) focuses on identifying instances where models generate plausible-sounding but factually incorrect information. Current research explores various approaches, including analyzing internal model representations (hidden states), leveraging unlabeled data, and employing ensemble methods or smaller, faster models for efficient detection. This is a critical area because accurate and reliable LLM outputs are essential for trustworthy applications across numerous domains, from healthcare and autonomous driving to information retrieval and code generation.

86papers

Papers - Page 3

January 2, 2025

Enhancing Uncertainty Modeling with Semantic Graph for Hallucination Detection
Kedi Chen, Qin Chen, Jie Zhou, Xinqi Tao, Bowen Ding, Jingwen Xie, Mingchen Xie, Peilong Li, Feng Zheng, Liang He
Data Detection Uncertainty Modeling Hallucination Detection Semantic Graph Content Hallucination

December 20, 2024

Toward Robust Hyper-Detailed Image Captioning: A Multiagent Approach and Dual Evaluation Metrics for Factuality and Coverage
Saehyung Lee, Seunghyun Yoon, Trung Bui, Jing Shi, Sungroh Yoon
Evaluation Metric Intrinsic Robustness Image Captioning Factual Claim Multi Agent MLLM Attention Hallucination Detection Multimodal Large Language Model Descriptive Caption

December 17, 2024

ReXTrust: A Model for Fine-Grained Hallucination Detection in AI-Generated Radiology Reports
Romain Hardy, Sung Eun Kim, Du Hyun Ro, Pranav Rajpurkar
Hallucination Detection Medical AI Full Model Medical Information Mart for Intensive Radiology Report Fine Grained Hallucination

November 28, 2024

Beyond Logit Lens: Contextual Embeddings for Robust Hallucination Detection & Grounding in VLMs
Anirudh Phukan, Divyansh, Harshit Kumar Morj, Vaishnavi, Apoorv Saxena, Koustava Goswami
Second Ranked Logits Grounding Network Data Detection Contextual Embeddings Multimodal Model Hallucination Detection Multimodal Understanding Large Multimodal Model Modality Specific

November 27, 2024

DHCP: Detecting Hallucinations by Cross-modal Attention Pattern in Large Vision-Language Models
Yudong Zhang, Ruobing Xie, Jiansheng Chen, Xingwu Sun, Zhanhui kang, Yu Wang
Large Vision Language Model Content Hallucination Cross Modal Attention Vision Language Model Hallucination Detection

November 22, 2024

Detecting Hallucinations in Virtual Histology with Neural Precursors
Ji-Hun Oh, Kianoush Falahkheirkhah, Rohit Bhargava
Hallucination Detection Visual Hallucination

November 18, 2024

VL-Uncertainty: Detecting Hallucination in Large Vision-Language Model via Uncertainty Estimation
Ruiyang Zhang, Hu Zhang, Zhedong Zheng
Hallucination Detection Multimodal LLM Large Vision Language Model High Uncertainty Value Uncertainty Estimation LLM Hallucination

November 16, 2024

ViBe: A Text-to-Video Benchmark for Evaluating Hallucination in Large Multimodal Models
Vipula Rawte, Sarthak Jain, Aarush Sinha, Garv Kaushik, Aman Bansal, Prathiksha Rumale Vishwanath, Samyak Rajesh Jain+5
Hallucination Evaluation Hallucination Detection Video Text Large Multimodal Model Multimodal Model Text to Video

November 12, 2024

Trustful LLMs: Customizing and Grounding Text Generation with Knowledge Bases and Dual Decoders
Xiaofeng Zhu, Jaya Krishna Mandivarapu
Language Model Prompt Customization Hallucination Detection Content Generation Dual Decoder Text Generation Knowledge Based Retrieval Augmented Generation

November 8, 2024

Seeing Through the Fog: A Cost-Effectiveness Analysis of Hallucination Detection Systems
Alexander Thomas, Seth Rosen, Vishnu Vettrivel
Content Hallucination Artificial Intelligence Cost Effective Hallucination Detection Detection System

November 7, 2024

Prompt-Guided Internal States for Hallucination Detection of Large Language Models
Fujie Zhang, Peiqi Yu, Biao Yi, Baolei Zhang, Tong Li, Zheli Liu
Hallucination Detection Internal State Truthful Space Language Model

November 5, 2024

VERITAS: A Unified Approach to Reliability Evaluation
Rajkumar Ramamurthy, Meghana Arakkal Rajeev, Oliver Molenschot, James Zou, Nazneen Rajani
Hallucination Detection Large Language Model Reliability Evaluation Unified Framework Fact Checking Model

November 1, 2024

RadFlag: A Black-Box Hallucination Detection Method for Medical Vision Language Models
Serena Zhang, Sraavya Sambara, Oishi Banerjee, Julian Acosta, L. John Fahrner, Pranav Rajpurkar
Medical Vision Radiology Report Language Model Radiology Report Generation Hallucination Detection

October 29, 2024

Distinguishing Ignorance from Error in LLM Hallucinations
Adi Simhi, Jonathan Herzig, Idan Szpektor, Yonatan Belinkov
LLM Hallucination Error Feedback Book Question Answering Model Hallucination Hallucination Detection Large Language Model

October 17, 2024

October 16, 2024

Controlled Automatic Task-Specific Synthetic Data Generation for Hallucination Detection
Yong Xie, Karan Aggarwal, Aitzaz Ahmad, Stephen Lau
Hallucination Detection Synthetic Data Synthetic Data Generation Content Hallucination

October 15, 2024

October 14, 2024

Medico: Towards Hallucination Detection and Correction with Multi-source Evidence Fusion
Xinping Zhao, Jindi Yu, Zhenyu Liu, Jifang Wang, Dongfang Li, Yibin Chen, Baotian Hu, Min Zhang
Content Hallucination Evidence Fusion Hallucination Detection Language Correction

Hallucination Detection

Papers - Page 3

Enhancing Uncertainty Modeling with Semantic Graph for Hallucination Detection

Toward Robust Hyper-Detailed Image Captioning: A Multiagent Approach and Dual Evaluation Metrics for Factuality and Coverage

ReXTrust: A Model for Fine-Grained Hallucination Detection in AI-Generated Radiology Reports

Beyond Logit Lens: Contextual Embeddings for Robust Hallucination Detection & Grounding in VLMs

DHCP: Detecting Hallucinations by Cross-modal Attention Pattern in Large Vision-Language Models

Detecting Hallucinations in Virtual Histology with Neural Precursors

VL-Uncertainty: Detecting Hallucination in Large Vision-Language Model via Uncertainty Estimation

ViBe: A Text-to-Video Benchmark for Evaluating Hallucination in Large Multimodal Models

Trustful LLMs: Customizing and Grounding Text Generation with Knowledge Bases and Dual Decoders

Seeing Through the Fog: A Cost-Effectiveness Analysis of Hallucination Detection Systems

Prompt-Guided Internal States for Hallucination Detection of Large Language Models

VERITAS: A Unified Approach to Reliability Evaluation

RadFlag: A Black-Box Hallucination Detection Method for Medical Vision Language Models

Distinguishing Ignorance from Error in LLM Hallucinations

ETF: An Entity Tracing Framework for Hallucination Detection in Code Summaries

FaithBench: A Diverse Hallucination Benchmark for Summarization by Modern LLMs

Controlled Automatic Task-Specific Synthetic Data Generation for Hallucination Detection

ReDeEP: Detecting Hallucination in Retrieval-Augmented Generation via Mechanistic Interpretability

Automatically Generating Visual Hallucination Test Cases for Multimodal Large Language Models

Medico: Towards Hallucination Detection and Correction with Multi-source Evidence Fusion