Benchmark Dataset

Benchmark datasets are curated collections of data designed to rigorously evaluate the performance of algorithms and models across various scientific domains. Current research focuses on developing datasets for diverse tasks, including multimodal data analysis (e.g., combining image, text, and audio data), challenging scenarios like low-resource languages or complex biological images, and addressing issues like model hallucinations and bias. These datasets are crucial for fostering objective comparisons, identifying limitations in existing methods, and driving advancements in machine learning and related fields, ultimately leading to more robust and reliable applications in diverse sectors.

Papers

December 15, 2023

Deep Unsupervised Domain Adaptation for Time Series Classification: a Benchmark
Hassan Ismail Fawaz, Ganesh Del Grosso, Tanguy Kerdoncuff, Aurelie Boisbunon, Illyyne Saffar
Deep Learning Domain Adaptation New Benchmark Benchmark Dataset Time Series Classification

December 14, 2023

CartoMark: a benchmark dataset for map pattern recognition and 1 map content retrieval with machine intelligence
Xiran Zhou, Yi Wen, Honghao Li, Kaiyuan Li, Zhenfeng Shao, Zhigang Yan, Xiao Xie
Artificial Intelligence Benchmark Dataset Pattern Recognition

December 13, 2023

BESTMVQA: A Benchmark Evaluation System for Medical Visual Question Answering
Xiaojie Hong, Zixin Song, Liangzhi Li, Xiaoli Wang, Feiyan Liu
Benchmark Dataset Benchmark Platform 3d Vqa Medical Visual Question Answering Unstructured Clinical

December 5, 2023

Towards Automatic Power Battery Detection: New Challenge, Benchmark Dataset and Baseline
Xiaoqi Zhao, Youwei Pang, Zhenyu Chen, Qian Yu, Lihe Zhang, Hanqi Liu, Jiaming Zuo, Huchuan Lu
Data Detection Benchmark Dataset Baseline Result X Ray Image Open Challenge

December 3, 2023

NLEBench+NorGLM: A Comprehensive Empirical Analysis and Benchmark Dataset for Generative Language Models in Norwegian
Peng Liu, Lemei Zhang, Terje Farup, Even W. Lauvrak, Jon Espen Ingvaldsen, Simen Eide, Jon Atle Gulla, Zhirong Yang
Language Model Natural Language Processing Language Understanding Empirical Study Language Generation Generative Language Model Benchmark Dataset

November 28, 2023

A Distribution-Based Threshold for Determining Sentence Similarity
Gioele Cadamuro, Marco Gruppo
Benchmark Dataset Semantic Textual Similarity Similar Pair Sentence Similarity Threshold Based Vector Distance

November 18, 2023

Behavior Optimized Image Generation
Varun Khurana, Yaman K Singla, Jayakumar Subramanian, Rajiv Ratn Shah, Changyou Chen, Zhiqiang Xu, Balaji Krishnamurthy
Image Generation Benchmark Dataset Image Conditioning

November 11, 2023

THOS: A Benchmark Dataset for Targeted Hate and Offensive Speech
Saad Almohaimeed, Saleh Almohaimeed, Ashfaq Ali Shafin, Bogdan Carbunar, Ladislau Bölöni
Fine Grained Benchmark Dataset Twitter Resource Hateful Content Offensive Content Character Classifier

October 31, 2023

Assessing and Enhancing Robustness of Deep Learning Models with Corruption Emulation in Digital Pathology
Peixiang Huang, Songtao Zhang, Yulu Gan, Rui Xu, Rongqi Zhu, Wenkang Qin, Limei Guo, Shan Jiang, Lin Luo
Native Robustness Deep Learning Model Benchmark Dataset Digital Pathology Pathological Feature Corruption Emulation

October 28, 2023

MILDSum: A Novel Benchmark Dataset for Multilingual Summarization of Indian Legal Case Judgments
Debtanu Datta, Shubham Soni, Rajdeep Mukherjee, Saptarshi Ghosh
Benchmark Dataset Cross Lingual Summarization Automatic Summarization Indian Legal Multilingual Summarization Legal Corpus

October 25, 2023

DiQAD: A Benchmark Dataset for End-to-End Open-domain Dialogue Assessment
Yukun Zhao, Lingyong Yan, Weiwei Sun, Chong Meng, Shuaiqiang Wang, Zhicong Cheng, Zhaochun Ren, Dawei Yin
Benchmark Dataset Open Domain Dialogue Open Domain Dialogue System Dialogue Quality Dialogue Assessment

October 23, 2023

TeleQnA: A Benchmark Dataset to Assess Large Language Models Telecommunications Knowledge
Ali Maatouk, Fadhel Ayed, Nicola Piovesan, Antonio De Domenico, Merouane Debbah, Zhi-Quan Luo
Benchmark Dataset Question Generation Telecom Domain First Benchmark Dataset

October 17, 2023

Open-Structure: Structural Benchmark Dataset for SLAM Algorithms
Yanyan Li, Zhao Guo, Ze Yang, Yanbiao Sun, Liang Zhao, Federico Tombari
Benchmark Dataset Visual Odometry SLAM Method SLAM Pipeline SLAM Baseline

October 8, 2023

HOD: A Benchmark Dataset for Harmful Object Detection
Eungyeom Ha, Heemook Kim, Sung Chul Hong, Dongbin Na
Benchmark Dataset Content Filtering Harmful Object Detection

September 25, 2023

Bitstream-Corrupted Video Recovery: A Novel Benchmark Dataset and Method
Tianyi Liu, Kejun Wu, Yi Wang, Wenyang Liu, Kim-Hui Yap, Lap-Pui Chau
Practical Method Benchmark Dataset

September 20, 2023

Hyperspectral Benchmark: Bridging the Gap between HSI Applications through Comprehensive Dataset and Pretraining
Hannah Frank, Leon Amadeus Varga, Andreas Zell
Hyperspectral Image Benchmark Dataset Hyperspectral Imaging Hyperspectral Benchmark Spectral Resolution

September 15, 2023

Fin-Fact: A Benchmark Dataset for Multimodal Financial Fact Checking and Explanation Generation
Aman Rangapur, Haoran Wang, Ling Jian, Kai Shu
Fact Checking Benchmark Dataset Explanation Generation Individual Annotator

September 11, 2023

CitDet: A Benchmark Dataset for Citrus Fruit Detection
Jordan A. James, Heather K. Manching, Matthew R. Mattia, Kim D. Bowman, Amanda M. Hulse-Kemp, William J. Beksi
Benchmark Dataset Bounding Box Annotation Fruit Detection Tomato Plant Fruit Mapping

September 3, 2023

FOR-instance: a UAV laser scanning benchmark dataset for semantic and instance segmentation of individual trees
Stefano Puliti, Grant Pearse, Peter Surový, Luke Wallace, Markus Hollaus, Maciej Wielgosz, Rasmus Astrup
Instance Segmentation Benchmark Dataset LiDAR Data Human Instance Scene Segmentation Representative Dataset Wood Specie Individual Tree Forest Dataset

August 24, 2023

Ground-to-Aerial Person Search: Benchmark Dataset and Approach
Shizhou Zhang, Qingchun Yang, De Cheng, Yinghui Xing, Guoqiang Liang, Peng Wang, Yanning Zhang
Constructive Approach Benchmark Dataset Ground Level Aerial Network