Quantitative Evaluation

Quantitative evaluation in machine learning focuses on developing and applying objective metrics to assess the performance, reliability, and explainability of models across diverse applications. Current research emphasizes the development of novel metrics tailored to specific domains, such as assessing the reliability of medical image classifiers or evaluating the fairness of language models, often employing techniques like adversarial training and information-theoretic measures. This rigorous approach is crucial for building trust in AI systems and ensuring their responsible deployment in various fields, from healthcare and weather forecasting to autonomous vehicles and 3D modeling.

Papers

February 10, 2023

FairPy: A Toolkit for Evaluation of Social Biases and their Mitigation in Large Language Models
Hrishikesh Viswanath, Tianyi Zhang
Language Model Global Evaluation Social Bias Topic Bias Easy to Use Toolkit Quantitative Evaluation

November 4, 2022

Quantitative Assessment of Drought Impacts Using XGBoost based on the Drought Impact Reporter
Beichen Zhang, Fatima K. Abu Salem, Michael J. Hayes, Tsegaye Tadesse
XGBoost Model Quantitative Evaluation Accurate Drought Drought Impact

July 26, 2022

Is Attention Interpretation? A Quantitative Assessment On Sets
Jonathan Haab, Nicolas Deutschmann, Maria Rodríguez Martínez
Attention Mechanism Attention Based Tiny Set Attention Pattern Quantitative Evaluation Attention Based Interpretation

July 25, 2022

ArtFID: Quantitative Evaluation of Neural Style Transfer
Matthias Wright, Björn Ommer
Style Transfer Neural Style Transfer Quantitative Evaluation Style Transfer Model Visual Synthesis

July 6, 2022

Quantitative Assessment of DESIS Hyperspectral Data for Plant Biodiversity Estimation in Australia
Yiqing Guo, Karel Mokany, Cindy Ong, Peyman Moghadam, Simon Ferrier, Shaun R. Levick
Remote Sensing Hyperspectral Data Quantitative Evaluation

April 11, 2022

MONCE Tracking Metrics: a comprehensive quantitative performance evaluation methodology for object tracking
Kenneth Rapko, Wanlin Xie, Andrew Walsh
Multiple Object Tracking State of the Art Tracker Model Development Tracking Accuracy Quantitative Evaluation Tracking Benchmark

March 23, 2022

Quantitative Evaluation Approach for Translation of Perceptual Soundscape Attributes: Initial Application to the Thai Language
Karn N. Watcharasupat, Sureenate Jaratjarungkiat, Bhan Lam, Sujinat Jitwiriyanont, Kanyanut Akaratham, Kenneth Ooi, Zhen-Ting Ong, Titima Suthiwan, Nitipong Pichetpan, Monthita Rojtinnakorn, Woon-Seng Gan
Application Proficiency View Translation Translation Quality Psycholinguistic Research Quantitative Evaluation Soundscape Attribute

March 14, 2022

SKM-TEA: A Dataset for Accelerated MRI Reconstruction with Dense Image Labels for Quantitative Clinical Evaluation
Arjun D Desai, Andrew M Schmidt, Elka B Rubin, Christopher M Sandino, Marianne S Black, Valentina Mazzoli, Kathryn J Stevens, Robert Boutin, Christopher Ré, Garry E Gold, Brian A Hargreaves, Akshay S Chaudhari
Data Set Accelerated MRI Reconstruction Quantitative Evaluation dMRI Reconstruction Dense Label Knee Magnetic Resonance

February 1, 2022

January 20, 2022

From Anecdotal Evidence to Quantitative Evaluation Methods: A Systematic Review on Evaluating Explainable AI
Meike Nauta, Jan Trienes, Shreyasi Pathak, Elisa Nguyen, Michelle Peters, Yasmin Schmitt, Jörg Schlötterer, Maurice van Keulen, Christin Seifert
Inherent Interpretability Explainable AI High Explainability XAI Method Systematic Review Quantitative Evaluation XAI Evaluation

January 10, 2022

Evaluating Bayesian Model Visualisations
Sebastian Stein, John H. Williamson
Probabilistic Model Quantitative Evaluation Model Visualization

Quantitative Evaluation

Papers

FairPy: A Toolkit for Evaluation of Social Biases and their Mitigation in Large Language Models

Quantitative Assessment of Drought Impacts Using XGBoost based on the Drought Impact Reporter

Is Attention Interpretation? A Quantitative Assessment On Sets

ArtFID: Quantitative Evaluation of Neural Style Transfer

Quantitative Assessment of DESIS Hyperspectral Data for Plant Biodiversity Estimation in Australia

MONCE Tracking Metrics: a comprehensive quantitative performance evaluation methodology for object tracking

Quantitative Evaluation Approach for Translation of Perceptual Soundscape Attributes: Initial Application to the Thai Language

SKM-TEA: A Dataset for Accelerated MRI Reconstruction with Dense Image Labels for Quantitative Clinical Evaluation

MoCap-less Quantitative Evaluation of Ego-Pose Estimation Without Ground Truth Measurements

Generalizability of Machine Learning Models: Quantitative Evaluation of Three Methodological Pitfalls

From Anecdotal Evidence to Quantitative Evaluation Methods: A Systematic Review on Evaluating Explainable AI

Evaluating Bayesian Model Visualisations