Limited Memory

Limited memory in machine learning focuses on developing efficient algorithms and architectures that can operate effectively with constrained memory resources, primarily addressing the challenges posed by increasingly large models like LLMs and deep neural networks. Current research emphasizes techniques such as memory-aware attention mechanisms, adaptive memory management strategies (e.g., dynamic caching, swapping), and model compression methods to reduce memory footprint without significant performance loss. This research is crucial for deploying advanced AI models on resource-constrained devices (e.g., edge devices, mobile phones) and for making large-scale model training more accessible.

Papers

March 8, 2023

Memory-adaptive Depth-wise Heterogenous Federated Learning
Kai Zhang, Yutong Dai, Hongyi Wang, Eric Xing, Xun Chen, Lichao Sun
Heterogeneous Federated Learning Depth Network Limited Memory Heterogeneous Device Learning Depth

October 24, 2022

OLLA: Optimizing the Lifetime and Location of Arrays to Reduce the Memory Usage of Neural Networks
Benoit Steiner, Mostafa Elhoushi, Jacob Kahn, James Hegarty
Neural Network Deep Neural Network Model Pruning Memory Management Limited Memory Multidimensional Array Storage Strategy Integer Linear Programming Solver

May 26, 2022

A Model or 603 Exemplars: Towards Memory-Efficient Class-Incremental Learning
Da-Wei Zhou, Qi-Wei Wang, Han-Jia Ye, De-Chuan Zhan
Full Model Class Incremental Learning Exemplar Image Limited Memory Memory Efficiency

May 2, 2022

A Real Time 1280x720 Object Detection Chip With 585MB/s Memory Traffic
Kuo-Wei Chang, Hsu-Tung Shih, Tian-Sheuan Chang, Shang-Hong Tsai, Chih-Chyau Yang, Chien-Ming Wu, Chun-Ming Huang
Real Time Limited Memory Sub Byte Deep Learning Accelerator High Bandwidth Memory Memory Allocation DRAM Access Energy

January 11, 2022

Learning what to remember
Robi Bhattacharjee, Gaurav Mahajan
LeArning Abstract Online Learning Memory Trace Regret Guarantee Limited Memory Memory Constraint

December 27, 2021

A Multi-channel Training Method Boost the Performance
Yingdong Hu
Deep Convolutional Neural Network System Performance Computer Vision Task Multi Channel Limited Memory

December 1, 2021

A modified limited memory Nesterov's accelerated quasi-Newton
S. Indrapriyadarsini, Shahrzad Mahboubi, Hiroshi Ninomiya, Takeshi Kamio, Hideki Asai
Limited Memory Nesterov Momentum Quasi Newton Method Accelerated Gradient Quasi Newton

November 30, 2021

On reducing the order of arm-passes bandit streaming algorithms under memory bottleneck
Santanu Rathod
Practical Algorithm Bandit Algorithm O$ Regret Order Matter Major Challenge Bottleneck Limited Memory Multi Arm Bandit Memory Bottleneck