the latest in aiBeta

Memorization Capacity

Memorization capacity in machine learning investigates how efficiently neural networks can store and retrieve information, impacting both model performance and resource efficiency. Current research focuses on understanding this capacity in various architectures, including transformers and recurrent networks, analyzing the influence of factors like network depth, parameter sharing, and training methods (e.g., fine-tuning, data augmentation). These investigations are crucial for optimizing model design, improving generalization, and enabling efficient deployment of increasingly complex models on resource-constrained devices.

15papers

Papers

February 16, 2025

Logarithmic Width Suffices for Robust Memorization
Amitsour Egosi, Gilad Yehudai, Ohad Shamir
Memorization Capacity ReLU Network Robustness Radius Robust Training Adversarial Perturbation

November 15, 2024

Memorization in Attention-only Transformers
Léo Dana, Muni Sreenivas Pydi, Yann Chevaleyre
D\'ej\`a Vu Memorization Language Transformer Memorization Capacity Limited Memorization

October 30, 2024

Provably Optimal Memory Capacity for Modern Hopfield Models: Transformer-Compatible Dense Associative Memories as Spherical Codes
Jerry Yao-Chieh Hu, Dennis Wu, Han Liu
Associative Memory Modern Hopfield Model Neural Kernel Memorization Capacity

October 25, 2024

Measuring memorization in language models via probabilistic extraction
Jamie Hayes, Marika Swanberg, Harsh Chaudhari, Itay Yona, Ilia Shumailov, Milad Nasr, Christopher A. Choquette-Choo, Katherine Lee, A. Feder Cooper
Unsupervised Extraction Large Language Model LLM Explanation Limited Memorization Memorization Capacity Automatic Extraction

October 1, 2024

Fine-Grained Gradient Restriction: A Simple Approach for Mitigating Catastrophic Forgetting
Bo Liu, Mao Ye, Peter Stone, Qiang Liu
Simple Approach Catastrophic Forgetting Gradient Episodic Memory Continual LEArning Memorization Capacity Core Challenge

September 26, 2024

On the Optimal Memorization Capacity of Transformers
Tokio Kajitsuka, Issei Sato
Transformer Megatron Decepticons Limited Memorization Input Sequence Memorization Capacity Next Token Prediction

September 17, 2024

Investigating Context-Faithfulness in Large Language Models: The Roles of Memory Strength and Evidence Style
Yuepei Li, Kang Zhou, Qiao Qiao, Bach Nguyen, Qing Wang, Qi Li
Memorization Capacity Multi Role Response Generation Contextual Integrity Retrieval Augmented Generation Evidence Piece Long Context Large Language Model

August 1, 2024

Memorization Capacity for Additive Fine-Tuning with Small ReLU Networks
Jy-yong Sohn, Dohyun Kwon, Seoyeon An, Kangwook Lee
Yonsei University●University of Seoul●Korea Institute for Advanced Study●University of Wisconsin-Madison
Small Sized Convolutional Neural Network Fine Tuning Memorization Capacity Efficient Fine Tuning

January 5, 2024

Uncovering the human motion pattern: Pattern Memory-based Diffusion Model for Trajectory Prediction
Yuxin Yang, Pengfei Zhu, Mengshi Qi, Huadong Ma
Memorization Capacity Motion Pattern Latent Motion Motion Memory State of the Art Trajectory Trajectory Prediction Human Trajectory

November 11, 2023

Minimum Description Length Hopfield Networks
Matan Abudy, Nur Lan, Emmanuel Chemla, Roni Katzir
Strong Generalization Associative Memory Memorization Capacity Limited Memorization

September 30, 2023

Memorization With Neural Nets: Going Beyond the Worst Case
Sjoerd Dirksen, Patrick Finke, Martin Genzel
Neural Network Memorization Capacity Three Layer Neural Network Neural Network Architecture Worst Case Limited Memorization Interpolation Regime

August 5, 2023

Edge of stability echo state networks
Andrea Ceni, Claudio Gallicchio
Echo State Network Extreme Edge Reservoir Dynamic Chaos Theory Memorization Capacity

July 14, 2023

Towards Model-Size Agnostic, Compute-Free, Memorization-based Inference of Deep Learning
Davide Giacomini, Maeesha Binte Hashem, Jeremiah Suarez, Swarup Bhunia, Amit Ranjan Trivedi
Compute in Memory Model Size MNIST Digit Memorization Capacity Deep Learning Recurrent Attention

June 14, 2023

Improving Generalization in Meta-Learning via Meta-Gradient Augmentation
Ren Wang, Haoliang Sun, Qi Wei, Xiushan Nie, Yuling Ma, Yilong Yin
Meta Gradient Shot Learning Benchmark Memorization Capacity Strong Generalization Meta Learning Gradient Regularization

June 3, 2023

Memorization Capacity of Multi-Head Attention in Transformers
Sadegh Mahdavi, Renjie Liao, Christos Thrampoulidis
Memorization Capability Human Attention Multi Head Attention Mechanism Transformer Megatron Decepticons Vision Transformer Memorization Capacity Attention Layer

May 12, 2023

A Memory Model for Question Answering from Streaming Data Supported by Rehearsal and Anticipation of Coreference Information
Vladimir Araujo, Alvaro Soto, Marie-Francine Moens
Memory Network Incremental Comprehension Memory Model Rehearsal Based Video Coreference Information Streaming Data Memorization Capacity

March 20, 2023

Memorization Capacity of Neural Networks with Conditional Computation
Erdem Koyuncu
Neural Network Conditional Computation Rectified Linear Unit Conditional Network Convolutional Conditional Neural Process Memorization Capacity

October 25, 2022

The Curious Case of Benign Memorization
Sotiris Anagnostidis, Gregor Bachmann, Lorenzo Noci, Thomas Hofmann
Generalization Memorization Memorization Capacity Deep Model Deep Learning Unintended Memorization

May 5, 2022

Accelerating Path Planning for Autonomous Driving with Hardware-Assisted Memoization
Mulong Luo, G. Edward Suh
Memorization Capacity Path Planning Dimensional Search Autonomous Driving Algorithm Hardware Co Design Dynamic Obstacle