the latest in aiBeta

Memory Optimization

Memory optimization is crucial for improving the efficiency and scalability of various computational tasks, particularly in deep learning and related fields. Current research focuses on developing novel algorithms and architectures to reduce memory consumption in large language models, deep neural networks (including transformers and spiking neural networks), and recommendation systems, often employing techniques like tiling, balanced workload optimization, and efficient data structures. These advancements are vital for enabling the training and deployment of increasingly complex models on resource-constrained devices (like microcontrollers in TinyML) and for accelerating the performance of large-scale applications, such as those in space operations and industry-scale recommendation systems.

10papers

Papers

March 24, 2025

Mist: Efficient Distributed Training of Large Language Models via Memory-Parallelism Co-Optimization
Zhanda Zhu, Christina Giannoula, Muralidhar Andoorveedu, Qidong Su, Karttikeya Mangalam, Bojian Zheng, Gennady Pekhimenko
University of Toronto●Vector Institute●CentML●SigIQ.ai
Pipeline Parallelism Training Data Memory Optimization Thin Air High Efficiency Imbalanced Classification

November 3, 2024

Stochastic Communication Avoidance for Recommendation Systems
Lutfi Eren Erdogan, Vijay Anand Raghava Kanakagiri, Kurt Keutzer, Zhen Dong
Limited Memory Memory Optimization Recommendation System

September 1, 2024

Self-evolving Agents with reflective and memory-augmented abilities
Xuechen Liang, Meiling Tao, Yinghui Xia, Tianyu Shi, Jun Wang, JingSong Yang
Iterative Feedback Memory Augmentation Natural Language Processing Agent Self Evolution Large Language Model Memory Optimization

June 24, 2024

Vaporetto: Efficient Japanese Tokenization Based on Improved Pointwise Linear Classification
Koichi Akabe, Shunsuke Kanda, Yusuke Oda, Shinsuke Mori
Tokenization Algorithm Tokenization Matter Memory Optimization Linear Classifier

July 5, 2023

Improving Automatic Parallel Training via Balanced Memory Workload Optimization
Yujie Wang, Youhe Jiang, Xupeng Miao, Fangcheng Fu, Shenhan Zhu, Xiaonan Nie, Yaofeng Tu, Bin Cui
GPU Memory Transformer Model Parallel Training Memory Optimization Large Scale Deep Learning Expert Parallelism

March 31, 2023

Fused Depthwise Tiling for Memory Optimization in TinyML Deep Neural Network Inference
Rafael Stahl, Daniel Mueller-Gritschneder, Ulf Schlichtmann
Deep Neural Network Memory Optimization DNN Inference TinyML Model

March 26, 2023

An Evaluation of Memory Optimization Methods for Training Neural Networks
Xiaoxuan Liu, Siddharth Jha, Alvin Cheung
Memory Bottleneck Memory Optimization Large Model Evaluation Metric Neural Network

January 5, 2023

FireFly: A High-Throughput Hardware Accelerator for Spiking Neural Networks with Efficient DSP and Memory Optimization
Jindong Li, Guobin Shen, Dongcheng Zhao, Qian Zhang, Yi Zeng
State of the Art Memory Optimization Neural Network Field Programmable Gate Array FPGA Accelerator

February 14, 2022

An Application of Online Learning to Spacecraft Memory Dump Optimization
Tommaso Cesari, Jonathan Pergoli, Michele Maestrini, Pierluigi Di Lizia
Application Proficiency Memory Optimization Sentinel 1 Online Learning Follow the Regularized Leader

January 25, 2022

RecShard: Statistical Feature-Based Memory Optimization for Industry-Scale Neural Recommendation
Geet Sethi, Bilge Acun, Niket Agarwal, Christos Kozyrakis, Caroline Trippel, Carole-Jean Wu
Memory Hierarchy Recommendation Model Memory Optimization Feature Embeddings

January 13, 2022

Improved Multi-objective Data Stream Clustering with Time and Memory Optimization
Mohammed Oualid Attaoui, Hanene Azzag, Mustapha Lebbah, Nabil Keskes
Clustering Method Time Matter Streaming Algorithm Large Relevance Improvement Memory Optimization

January 5, 2022

Optimizing Memory in Reservoir Computers
Thomas L. Carroll
High Dimensional Reservoir Computer Memory Trace Memory Optimization Computation Method