Performance Score

Performance scores, central to evaluating machine learning models and other systems, are undergoing significant refinement. Research focuses on developing more nuanced scoring methods that go beyond simple accuracy metrics, incorporating aspects like attention weights, retrieval-augmented generation, and even multi-modal feedback. These advancements aim to improve model interpretability, address biases, and provide more reliable assessments of system capabilities across diverse applications, from automated essay grading to generative AI evaluation. The ultimate goal is to create more robust and trustworthy evaluation frameworks that better reflect real-world performance.

Papers

July 15, 2024

Cluster and Separate: a GNN Approach to Voice and Staff Prediction for Score Engraving
Francesco Foscarin, Emmanouil Karystinaios, Eita Nakamura, Gerhard Widmer
Performance Score Human VOICE Symbolic Music Cluster Structure GNN Based Position Prediction

July 10, 2024

What's the score? Automated Denoising Score Matching for Nonlinear Diffusions
Raghav Singhal, Mark Goldstein, Rajesh Ranganath
Generative Model Performance Score Diffusion Process Diffusion Based Generative Denoising Score Matching Nonlinear Diffusion

June 20, 2024

A Practical Diffusion Path for Sampling
Omar Chehab, Anna Korba
Diffusion Model Generative Modeling Langevin Dynamic Performance Score Diffusion Path

June 18, 2024

SCORE: A 1D Reparameterization Technique to Break Bayesian Optimization's Curse of Dimensionality
Joseph Chakar
Bayesian Optimization Surrogate Model Data Dimensionality Performance Score Reversal Curse Reparameterization Method Needle in a Haystack Reparametrization Trick

June 17, 2024

Score-fPINN: Fractional Score-Based Physics-Informed Neural Networks for High-Dimensional Fokker-Planck-Levy Equations
Zheyuan Hu, Zhongqiang Zhang, George Em Karniadakis, Kenji Kawaguchi
High Dimension Performance Score Diverse Equation Fractional Derivative Fokker Planck Equation Score Function

June 13, 2024

Operator-informed score matching for Markov diffusion models
Zheyang Shen, Chris J. Oates
Diffusion Model Performance Score Score Matching Laplacian Kernel

June 3, 2024

May 21, 2024

Score-CDM: Score-Weighted Convolutional Diffusion Model for Multivariate Time Series Imputation
S. Zhang, S. Wang, H. Miao, H. Chen, C. Fan, J. Zhang
Multivariate Time Series Performance Score Time Series Imputation Temporal Convolution Convolutional Module Global Temporal

April 23, 2024

Score matching for sub-Riemannian bridge sampling
Erlend Grong, Karen Habermann, Stefan Sommer
Performance Score Riemannian Manifold Diffusion Process Diffusion Bridge Sub Riemannian

April 22, 2024

ReCAP: Recursive Cross Attention Network for Pseudo-Label Generation in Robotic Surgical Skill Assessment
Julien Quarez, Marc Modat, Sebastien Ourselin, Jonathan Shapey, Alejandro Granados
Performance Score Recurrent Transformer Surgical Skill Assessment

April 10, 2024

Efficient Denoising using Score Embedding in Score-based Diffusion Models
Andrew S. Na, William Gao, Justin W. L. Wan
Diffusion Model Performance Score Score Based Diffusion Model Faster Training Fokker Planck Equation

March 19, 2024

Improving Interpretability of Scores in Anomaly Detection Based on Gaussian-Bernoulli Restricted Boltzmann Machine
Kaiji Sekimoto, Muneki Yasuda
Anomaly Detection Inherent Interpretability Performance Score Anomalous Data Restricted Boltzmann Machine Boltzmann Machine Semi Supervised Anomaly Detection

March 1, 2024

Standardizing the Measurement of Text Diversity: A Tool and a Comparative Analysis of Scores
Chantal Shaib, Joe Barrow, Jiuding Sun, Alexa F. Siu, Byron C. Wallace, Ani Nenkova
Large Language Model Comparative Study BRIO Tool Performance Score Measurement System Human Written Text Diversity Score Text Diversity

February 16, 2024

Model Editing by Standard Fine-Tuning
Govind Gangadhar, Karl Stratos
Fine Tuning Performance Score Model Editing Model Editor

January 12, 2024

Navigating the Metrics Maze: Reconciling Score Magnitudes and Accuracies
Tom Kocmi, Vilém Zouhar, Christian Federmann, Matt Post
Machine Translation Metric Library Performance Score High Accuracy

January 3, 2024

AUPIMO: Redefining Visual Anomaly Detection Benchmarks with High Speed and Low Tolerance
Joao P. C. Bertoldo, Dick Ameln, Ashwin Vaidya, Samet Akçay
Performance Score Visual Anomaly Detection Novel Metric High Speed Anomaly Detection Benchmark

December 18, 2023

Protect Your Score: Contact Tracing With Differential Privacy Guarantees
Rob Romijnders, Christos Louizos, Yuki M. Asano, Max Welling
Differential Privacy Performance Score Fast Contact Contact Tracing

December 15, 2023

Bayesian Estimate of Mean Proper Scores for Diversity-Enhanced Active Learning
Wei Tan, Lan Du, Wray Buntine
Active Learning Deep Ensemble Multiple Meaning Performance Score Acquisition Function Bayesian Estimation

December 14, 2023

Depicting Beyond Scores: Advancing Image Quality Assessment through Multi-modal Language Models
Zhiyuan You, Zheyuan Li, Jinjin Gu, Zhenfei Yin, Tianfan Xue, Chao Dong
Image Quality Image Quality Assessment Performance Score Multi Modal Language Model

Performance Score

Papers

Cluster and Separate: a GNN Approach to Voice and Staff Prediction for Score Engraving

What's the score? Automated Denoising Score Matching for Nonlinear Diffusions

A Practical Diffusion Path for Sampling

SCORE: A 1D Reparameterization Technique to Break Bayesian Optimization's Curse of Dimensionality

Score-fPINN: Fractional Score-Based Physics-Informed Neural Networks for High-Dimensional Fokker-Planck-Levy Equations

Operator-informed score matching for Markov diffusion models

Automatic Essay Multi-dimensional Scoring with Fine-tuning and Multiple Regression

Favi-Score: A Measure for Favoritism in Automated Preference Ratings for Generative AI Evaluation

Score-CDM: Score-Weighted Convolutional Diffusion Model for Multivariate Time Series Imputation

Score matching for sub-Riemannian bridge sampling

ReCAP: Recursive Cross Attention Network for Pseudo-Label Generation in Robotic Surgical Skill Assessment

Efficient Denoising using Score Embedding in Score-based Diffusion Models

Improving Interpretability of Scores in Anomaly Detection Based on Gaussian-Bernoulli Restricted Boltzmann Machine

Standardizing the Measurement of Text Diversity: A Tool and a Comparative Analysis of Scores

Model Editing by Standard Fine-Tuning

Navigating the Metrics Maze: Reconciling Score Magnitudes and Accuracies

AUPIMO: Redefining Visual Anomaly Detection Benchmarks with High Speed and Low Tolerance

Protect Your Score: Contact Tracing With Differential Privacy Guarantees

Bayesian Estimate of Mean Proper Scores for Diversity-Enhanced Active Learning

Depicting Beyond Scores: Advancing Image Quality Assessment through Multi-modal Language Models