Multi Domain Evaluation

Multi-domain evaluation assesses the performance of machine learning models across diverse datasets and application areas, aiming to improve generalization and robustness beyond single-domain benchmarks. Current research focuses on developing evaluation frameworks and benchmarks that encompass a wider range of domains, including image processing (e.g., super-resolution, geolocalization, semantic segmentation), natural language processing (e.g., dialogue evaluation, document understanding), and exploring techniques like self-training and geometric disentanglement to enhance model performance across these domains. This work is crucial for building more reliable and adaptable AI systems, ultimately leading to more impactful applications in various fields.

Papers

August 18, 2023

GeoDTR+: Toward generic cross-view geolocalization via geometric disentanglement
Xiaohan Zhang, Xingyu Li, Waqas Sultani, Chen Chen, Safwan Wshah
Cross View Geo Tagged Cross View Geo Localization Geometric Layout Multi Domain Evaluation

June 27, 2023

What a MESS: Multi-Domain Evaluation of Zero-Shot Semantic Segmentation
Benedikt Blumenstiel, Johannes Jakubik, Hilde Kühne, Michael Vössing
Semantic Segmentation Zero Shot Zero Shot Semantic Segmentation Cross Domain Semantic Segmentation Multi Domain Evaluation

June 15, 2023

Deep learning techniques for blind image super-resolution: A high-scale multi-domain perspective evaluation
Valdivino Alexandre de Santiago Júnior
Super Resolution Image Super Resolution Barzilai Borwein Technique Reference Image Quality Assessment Blind Image Super Resolution Multi Domain Evaluation

May 15, 2023

Document Understanding Dataset and Evaluation (DUDE)
Jordy Van Landeghem, Rubén Tito, Łukasz Borchmann, Michał Pietruszka, Paweł Józiak, Rafał Powalski, Dawid Jurkiewicz, Mickaël Coustaty, Bertrand Ackaert, Ernest Valveny, Matthew Blaschko, Sien Moens, Tomasz Stanisławek
Data Set Global Evaluation Visually Rich Document Full Length Document Document AI Multi Domain Evaluation

December 14, 2021

MDD-Eval: Self-Training on Augmented Data for Multi-Domain Dialogue Evaluation
Chen Zhang, Luis Fernando D'Haro, Thomas Friedrichs, Haizhou Li
Self Training Open Domain Dialogue Augmented Data Dialogue Evaluation Dialogue Benchmark Multi Domain Evaluation

Multi Domain Evaluation

Papers

GeoDTR+: Toward generic cross-view geolocalization via geometric disentanglement

What a MESS: Multi-Domain Evaluation of Zero-Shot Semantic Segmentation

Deep learning techniques for blind image super-resolution: A high-scale multi-domain perspective evaluation

Document Understanding Dataset and Evaluation (DUDE)

MDD-Eval: Self-Training on Augmented Data for Multi-Domain Dialogue Evaluation