Device Placement

Device placement in distributed machine learning focuses on optimizing the allocation of computational tasks across multiple devices to minimize training or inference time. Current research emphasizes developing efficient algorithms, often employing integer linear programming, reinforcement learning, or transformer-based architectures, to determine optimal placements considering factors like network topology, hardware heterogeneity, and model sparsity. These advancements aim to significantly improve the scalability and efficiency of training and deploying large-scale machine learning models, impacting both research productivity and real-world applications. The ultimate goal is to achieve near-optimal performance across diverse hardware configurations and model architectures.

Papers

July 18, 2024

Integrated Hardware Architecture and Device Placement Search
Irene Wang, Jakub Tarnawski, Amar Phanishayee, Divya Mahajan
Hardware Accelerator Architecture Search Multi Accelerator Tensor Parallelism Hardware Architecture Device Placement

May 23, 2024

A Structure-Aware Framework for Learning Device Placements on Computation Graphs
Shukai Duan, Heng Ping, Nikos Kanakaris, Xiongye Xiao, Panagiotis Kyriakis, Nesreen K. Ahmed, Peiyu Zhang, Guixiang Ma, Mihai Capota, Shahin Nazarian, Theodore L. Willke, Paul Bogdan
Graph Representation Learning Graph Partitioning Computation Graph Device Placement

December 7, 2023

Moirai: Towards Optimal Placement for Distributed Inference on Heterogeneous Devices
Beibei Zhang, Hongwei Zhu, Feng Gao, Zhihui Yang, Sean Xiaoyang Wang
Deep Neural Network DNN Model Heterogeneous Device Distributed Inference Optimal Placement Device Placement

April 8, 2023

FlexMoE: Scaling Large-scale Sparse Pre-trained Model Training via Dynamic Device Placement
Xiaonan Nie, Xupeng Miao, Zilong Wang, Zichao Yang, Jilong Xue, Lingxiao Ma, Gang Cao, Bin Cui
Mixture of Expert Model Training DNN Framework Sparse Model Large Scale Pre Trained Model Conditional Computation Device Placement

January 20, 2023

Baechi: Fast Device Placement of Machine Learning Graphs
Beomyeol Jeon, Linda Cai, Chirag Shetty, Pallavi Srivastava, Jintao Jiang, Xiaolan Ke, Yitao Meng, Cong Xie, Indranil Gupta
Graph Machine Learning Training Graph Model Parallelism Device Placement Model Placement

May 26, 2022

DevFormer: A Symmetric Transformer for Context-Aware Device Placement
Haeyeon Kim, Minsu Kim, Federico Berto, Joungho Kim, Jinkyoo Park
Design Optimization Offline Contextual Bandit Hardware Design Optimization Device Placement

January 21, 2022

Accelerate Model Parallel Training by Using Efficient Graph Traversal Order in Device Placement
Tianze Wang, Amir H. Payberah, Desta Haileselassie Hagos, Vladimir Vlassov
Neural Network Parallel Training Leader Follower Modern Neural Network Neural Graph Device Placement Efficient Graph Traversal Order

Device Placement

Papers

Integrated Hardware Architecture and Device Placement Search

A Structure-Aware Framework for Learning Device Placements on Computation Graphs

Moirai: Towards Optimal Placement for Distributed Inference on Heterogeneous Devices

FlexMoE: Scaling Large-scale Sparse Pre-trained Model Training via Dynamic Device Placement

Baechi: Fast Device Placement of Machine Learning Graphs

DevFormer: A Symmetric Transformer for Context-Aware Device Placement

Accelerate Model Parallel Training by Using Efficient Graph Traversal Order in Device Placement