Heterogeneous Data

Heterogeneous data, encompassing datasets with varying distributions, formats, and qualities across sources, presents a significant challenge in machine learning. Current research focuses on developing robust algorithms and model architectures, such as federated learning with adaptive aggregation and personalized models, to effectively handle this heterogeneity in diverse applications like medical imaging and industrial settings. These efforts aim to improve model accuracy, fairness, and robustness while addressing privacy concerns inherent in decentralized data collection. The successful management of heterogeneous data is crucial for advancing machine learning's applicability to real-world problems where data is inherently diverse and distributed.

Papers

September 4, 2023

Composite federated learning with heterogeneous data
Jiaojiao Zhang, Jiang Hu, Mikael Johansson
LeArning Abstract Heterogeneous Data Novel Algorithm Proximal Operator Nonsmooth Regularization Data Similarity Composite Active Learning

September 3, 2023

A Comparative Evaluation of FedAvg and Per-FedAvg Algorithms for Dirichlet Distributed Heterogeneous Data
Hamza Reguieg, Mohammed El Hanjri, Mohamed El Kamili, Abdellatif Kobbane
Model Training Data Heterogeneity Heterogeneous Data Federated Averaging Comparative Evaluation FedAvg Algorithm FedAvg Converges Ordered Matrix Dirichlet

August 22, 2023

EM for Mixture of Linear Regression with Clustered Data
Amirhossein Reisizadeh, Khashayar Gatmiry, Asuman Ozdaglar
Mixture Component Latent Variable Data Heterogeneity Heterogeneous Data Expectation Maximization Linear Regression

August 4, 2023

Analysis and Optimization of Wireless Federated Learning with Data Heterogeneity
Xuefeng Han, Jun Li, Wen Chen, Zhen Mei, Kang Wei, Ming Ding, H. Vincent Poor
General Analysis Federated Learning Optimization Purpose Resource Allocation Data Heterogeneity Heterogeneous Data Loss Minimization

July 31, 2023

To Classify is to Interpret: Building Taxonomies from Heterogeneous Data through Human-AI Collaboration
Sebastian Meier, Katrin Glinka
Machine Learning Human Ai Collaboration Heterogeneous Data Taxonomy Construction Black Box Machine Learning Model Machine Learning Based System

July 20, 2023

Boosting Federated Learning Convergence with Prototype Regularization
Yu Qiao, Huy Q. Le, Choong Seon Hong
Heterogeneous Data FedAvg Algorithm Global Prototype Prototype Based Regularization Performance Guaranteed Regularization

July 12, 2023

Tackling Computational Heterogeneity in FL: A Few Theoretical Insights
Adnan Ben Mansour, Gaia Carenini, Alexandre Duplessis
Heterogeneous Data Heterogeneous Computing Efficient Aggregation

July 10, 2023

CoactSeg: Learning from Heterogeneous Data for New Multiple Sclerosis Lesion Segmentation
Yicheng Wu, Zhonghua Wu, Hengcan Shi, Bjoern Picker, Winston Chong, Jianfei Cai
Heterogeneous Data Lesion Segmentation Co Segmentation

June 19, 2023

Data-Heterogeneous Hierarchical Federated Learning with Mobility
Tan Chen, Jintao Yan, Yuxuan Sun, Sheng Zhou, Deniz Gunduz, Zhisheng Niu
Convolutional Neural Network Data Heterogeneity Heterogeneous Data Vehicular Network Mobility Management Hierarchical Federated Learning

May 26, 2023

Heterogeneous Value Alignment Evaluation for Large Language Models
Zhaowei Zhang, Ceyao Zhang, Nian Liu, Siyuan Qi, Ziqi Rong, Song-Chun Zhu, Shuguang Cui, Yaodong Yang
Heterogeneous Data Value Alignment Heterogeneous Preference Value Orientation

May 25, 2023

Federated Neural Compression Under Heterogeneous Data
Eric Lei, Hamed Hassani, Shirin Saeedi Bidokhti
Federated Learning Linear Compression Heterogeneous Data Entropy Model Compressor Based Machine Learning Based Compression

May 13, 2023

Understanding and Improving Model Averaging in Federated Learning on Heterogeneous Data
Tailin Zhou, Zehong Lin, Jun Zhang, Danny H. K. Tsang
Human Understanding Heterogeneous Data Loss Landscape Global Model Model Averaging

May 11, 2023

Predictive change point detection for heterogeneous data
Anna-Christina Glock, Florian Sobieczky, Johannes Fürnkranz, Peter Filzmoser, Martin Jech
Human Prediction Heterogeneous Data Change Point Detection Step Prediction Sequential Observation

May 8, 2023

Global Update Tracking: A Decentralized Learning Algorithm for Heterogeneous Data
Sai Aparna Aketi, Abolfazl Hashemi, Kaushik Roy
Deep Learning Model Decentralized Learning Heterogeneous Data State of the Art Tracker

May 2, 2023

HTPS: Heterogeneous Transferring Prediction System for Healthcare Datasets
Jia-Hao Syu, Jerry Chun-Wei Lin, Marcin Fojcik, Rafał Cupek
Task Transferability Heterogeneous Data Healthcare Datasets Heterogeneous Datasets Heterogeneous Transfer Learning

April 19, 2023

Model Pruning Enables Localized and Efficient Federated Learning for Yield Forecasting and Data Sharing
Andy Li, Milan Markovic, Peter Edwards, Georgios Leontidis
Federated Learning Data Heterogeneity Heterogeneous Data Model Pruning Data Sharing Plant Monitoring Yield Prediction

April 9, 2023

Homogenizing Non-IID datasets via In-Distribution Knowledge Distillation for Decentralized Learning
Deepak Ravikumar, Gobinda Saha, Sai Aparna Aketi, Kaushik Roy
Knowledge Distillation Data Set Decentralized Learning Heterogeneous Data Training Data Distribution

April 4, 2023

Learning from data with structured missingness
Robin Mitra, Sarah F. McGough, Tapabrata Chakraborti, Chris Holmes, Ryan Copping, Niels Hagenbuch, Stefanie Biedermann, Jack Noonan, Brieuc Lehmann, Aditi Shenvi, Xuan Vinh Doan, David Leslie, Ginestra Bianconi, Ruben Sanchez-Garcia, Alisha Davies, Maxine Mackintosh, Eleni-Rosalina Andrinopoulou, Anahid Basiri, Chris Harbron, Ben D. MacArthur
LeArning Abstract Raw Data Heterogeneous Data Classification Task Missing Data Missingness Pattern

March 4, 2023

Federated Virtual Learning on Heterogeneous Data with Local-global Distillation
Chun-Yin Huang, Ruinan Jin, Can Zhao, Daguang Xu, Xiaoxiao Li
Dataset Distillation Heterogeneous Data Global Distillation

March 1, 2023

A Unified Momentum-based Paradigm of Decentralized SGD for Non-Convex Models and Heterogeneous Data
Haizhou Du, Chengdong Ni
Heterogeneous Data Decentralized Machine Learning Momentum Based Non Convex Objective Decentralized SGD Convex Model