Training Point

Training point selection and generation are crucial for optimizing machine learning model performance, particularly when dealing with limited or heterogeneous data. Current research focuses on developing algorithms that intelligently select or synthesize the most informative training points, leveraging techniques like Shapley value-based data valuation, diffusion transformers for synthetic data generation, and adaptive collocation strategies for physics-informed neural networks. These advancements aim to improve model robustness, generalization, and efficiency across diverse applications, from medical image analysis and federated learning to speech recognition and code summarization.

Papers

October 1, 2024

Targeted synthetic data generation for tabular data via hardness characterization
Tommaso Ferracci, Leonie Tabea Goldmann, Anton Hinel, Francesco Sanna Passino
Tabular Data Synthetic Data Generation Hardness Result Synthetic Data Generator Training Point

August 22, 2024

MedDiT: A Knowledge-Controlled Diffusion Transformer Framework for Dynamic Medical Image Generation in Virtual Simulated Patient
Yanzeng Li, Cheng Zeng, Jinchao Zhang, Jie Zhou, Lei Zou
Medical Image Generation Virtual Doctor Training Point Patient Simulation

May 30, 2024

Cross-Training with Multi-View Knowledge Fusion for Heterogenous Federated Learning
Zhuang Qi, Lei Meng, Weihao He, Ruohan Zhang, Yu Wang, Xin Qi, Xiangxu Meng
Heterogeneous Federated Learning Training Point Training Scheme Generalized Knowledge

April 16, 2024

Teaching a Multilingual Large Language Model to Understand Multilingual Speech via Multi-Instructional Training
Pavel Denisov, Ngoc Thang Vu
Spoken Language Understanding Multilingual Large Language Model Multilingual Speech Multilingual Encoders Training Point Multilingual Speech Representation

April 11, 2024

PINNACLE: PINN Adaptive ColLocation and Experimental points selection
Gregory Kang Ruey Lau, Apivich Hemachandra, See-Kiong Ng, Bryan Kian Hsiang Low
Experimental Design Fidelity Reward PINN Model Collocation Point Training Point PINN Training

February 4, 2023

How Many and Which Training Points Would Need to be Removed to Flip this Prediction?
Jinghan Yang, Sarthak Jain, Byron C. Wallace
Native Robustness Training Data Human Prediction Model Prediction Convex Machine Learning Training Point

June 26, 2022

Improving Policy Optimization with Generalist-Specialist Learning
Zhiwei Jia, Xuanlin Li, Zhan Ling, Shuang Liu, Yiran Wu, Hao Su
Deep Reinforcement Learning Strong Generalization Policy Learning Efficient Policy Learning Training Point

June 2, 2022

Learning code summarization from a small and local dataset
Toufique Ahmed, Premkumar Devanbu
Foundation Model Software Engineering Code Summarization Local Datasets Training Point Subject Based Training

March 7, 2022

Improved Search of Relevant Points for Nearest-Neighbor Classification
Alejandro Flores-Velazco
Search Query Nearest Neighbor Structured Output Exceptional Point Border Control Nearest Neighbor Classifier Training Point

February 15, 2022

Multi-style Training for South African Call Centre Audio
Walter Heymans, Marelie H. Davel, Charl van Heerden
Training Data Automatic Speech Recognition Automatic Speech Recognition System DNN HMM Training Point

Training Point

Papers

Targeted synthetic data generation for tabular data via hardness characterization

MedDiT: A Knowledge-Controlled Diffusion Transformer Framework for Dynamic Medical Image Generation in Virtual Simulated Patient

Cross-Training with Multi-View Knowledge Fusion for Heterogenous Federated Learning

Teaching a Multilingual Large Language Model to Understand Multilingual Speech via Multi-Instructional Training

PINNACLE: PINN Adaptive ColLocation and Experimental points selection

How Many and Which Training Points Would Need to be Removed to Flip this Prediction?

Improving Policy Optimization with Generalist-Specialist Learning

Learning code summarization from a small and local dataset

Improved Search of Relevant Points for Nearest-Neighbor Classification

Multi-style Training for South African Call Centre Audio