Multiplicative Size Scaling

Multiplicative size scaling in machine learning investigates how model performance changes with increases in model parameters, training data, and other resources. Current research focuses on optimizing this scaling across various model architectures, including transformers, diffusion models, and graph neural networks, often employing techniques like parameter-efficient fine-tuning and improved data sampling strategies to enhance efficiency and generalization. These investigations are crucial for developing more powerful and resource-efficient AI systems, impacting fields ranging from natural language processing and computer vision to scientific computing and robotics. A key theme is moving beyond simple scaling to understand and optimize the interplay between model size, data quality, and training methodologies.

Papers

May 24, 2023

May 16, 2023

A Deep RL Approach on Task Placement and Scaling of Edge Resources for Cellular Vehicle-to-Network Service Provisioning
Cyril Shih-Huan Hsu, Jorge Martín-Pérez, Danny De Vleeschauwer, Luca Valcarenghi, Xi Li, Chrysa Papagianni
Multiplicative Size Scaling New Resource Deep RL Global Placement

May 13, 2023

Convergence and scaling of Boolean-weight optimization for hardware reservoirs
Louis Andreoli, Stéphane Chrétien, Xavier Porte, Daniel Brunner
Neural Network Early Stage Convergence Multiplicative Size Scaling Compute Node Photonic Reservoir Hardware Architecture Pseudo Boolean Optimization Physical Reservoir Computer

April 3, 2023

Pythia: A Suite for Analyzing Large Language Models Across Training and Scaling
Stella Biderman, Hailey Schoelkopf, Quentin Anthony, Herbie Bradley, Kyle O'Brien, Eric Hallahan, Mohammad Aflah Khan, Shivanshu Purohit, USVSN Sai Prashanth, Edward Raff, Aviya Skowron, Lintang Sutawika, Oskar van der Wal
Large Language Model Training Data Training Dynamic Multiplicative Size Scaling Software Suite

March 27, 2023

Scaling Pre-trained Language Models to Deeper via Parameter-efficient Architecture
Peiyu Liu, Ze-Feng Gao, Yushuo Chen, Wayne Xin Zhao, Ji-Rong Wen
Language Model Pre Trained Language Model Parameter Efficient Multiplicative Size Scaling Low Rank Tensor Efficient Architecture Deep Depth Deeper Model Matrix Product Operator

February 2, 2023

Scaling Up Computer Vision Neural Networks Using Fast Fourier Transform
Siddharth Agrawal
Convolutional Neural Network Vision Transformer Direct Convolution Vision Based Multiplicative Size Scaling Fast Fourier Transform

January 31, 2023

On the Initialisation of Wide Low-Rank Feedforward Neural Networks
Thiziri Nait Saada, Jared Tanner
Neural Network Low Rank Multiplicative Size Scaling New Initialization Chaotic Dynamic Jacobian Matrix

January 27, 2023

Robust variance-regularized risk minimization with concomitant scaling
Matthew J. Holland
Multiplicative Size Scaling Interest Loss Planning Loss Variance Regularization Robust Mean Estimation Gradient Based Solver

December 14, 2022

Scaling Marginalized Importance Sampling to High-Dimensional State-Spaces via State Abstraction
Brahma S. Pavse, Josiah P. Hanna
Policy Evaluation Importance Sampling Multiplicative Size Scaling Dimensional State Space State Abstraction State Action Distribution Policy Distribution

November 15, 2022

The scaling of goals via homeostasis: an evolutionary simulation, experiment and analysis
Leo Pio-Lopez, Johanna Bischof, Jennifer V. LaPalme, Michael Levin
Path Breaking Emergence Optical Experiment Multiplicative Size Scaling Pseudo Goal Microelectronic Morphogenesis Homeostatic Design Confers Quantum Cognition Evolutionary Developmental Biology

November 14, 2022

Aspects of scaling and scalability for flow-based sampling of lattice QCD
Ryan Abbott, Michael S. Albergo, Aleksandar Botev, Denis Boyda, Kyle Cranmer, Daniel C. Hackett, Alexander G. D. G. Matthews, Sébastien Racanière, Ali Razavi, Danilo J. Rezende, Fernando Romero-López, Phiala E. Shanahan, Julian M. Urban
Potential Scalability Scaling Law Multiplicative Size Scaling Elusive Aspect Scaling Behavior Adaptive Freezing Lattice Field Theory Flow Based Sampling Lattice QCD

October 20, 2022

Scaling Instruction-Finetuned Language Models
Hyung Won Chung, Le Hou, Shayne Longpre, Barret Zoph, Yi Tay, William Fedus, Yunxuan Li, Xuezhi Wang, Mostafa Dehghani, Siddhartha Brahma, Albert Webson, Shixiang Shane Gu, Zhuyun Dai, Mirac Suzgun, Xinyun Chen, Aakanksha Chowdhery, Alex Castro-Ros, Marie Pellat, Kevin Robinson, Dasha Valter, Sharan Narang, Gaurav Mishra, Adams Yu, Vincent Zhao, Yanping Huang, Andrew Dai, Hongkun Yu, Slav Petrov, Ed H. Chi, Jeff Dean, Jacob Devlin, Adam Roberts, Denny Zhou, Quoc V. Le, Jason Wei
Language Model Pretrained Language Model Model Performance Multiplicative Size Scaling Instruction Finetuning

October 17, 2022

Scaling & Shifting Your Features: A New Baseline for Efficient Model Tuning
Dongze Lian, Daquan Zhou, Jiashi Feng, Xinchao Wang
Fine Tuning Parameter Efficient Fine Tuning Feature Wise Multiplicative Size Scaling Parameter Efficient Tuning New Baseline

September 19, 2022

Scaling and compressing melodies using geometric similarity measures
Luis Evaristo Caraballo, José Miguel Díaz-Báñez, Fabio Rodríguez, Vanesa Sánchez-Canales, Inmaculada Ventura
High Similarity Multiplicative Size Scaling Music Information Retrieval Similarity Measure Music Similarity Geometric Based Matching Geometric Similarity

August 30, 2022

Embedding Functional Data: Multidimensional Scaling and Manifold Learning
Ery Arias-Castro, Wanli Qiao
Dimensionality Reduction Manifold Learning Multiplicative Size Scaling Functional Data Analysis Multidimensional Scaling

August 20, 2022

Combining Compressions for Multiplicative Size Scaling on Natural Language Tasks
Rajiv Movva, Jinhao Lei, Shayne Longpre, Ajay Gupta, Chris DuBois
Knowledge Distillation Multiplicative Size Scaling Neural Network Compression Model Size Natural Language Task Magnitude Pruning BERT Architecture Functional Compression

July 5, 2022

SESS: Saliency Enhancing with Scaling and Sliding
Osman Tursun, Simon Denman, Sridha Sridharan, Clinton Fookes
Saliency Map Multiplicative Size Scaling Human Saliency Saliency Map Generation

June 29, 2022

Beyond neural scaling laws: beating power law scaling via data pruning
Ben Sorscher, Robert Geirhos, Shashank Shekhar, Surya Ganguli, Ari S. Morcos
Large Scale Multiplicative Size Scaling Data Pruning Neural Scaling Law Power Law Scaling

June 21, 2022

Sensitivity of Average Precision to Bounding Box Perturbations
Ali Borji
Object Detector Bounding Box Multiplicative Size Scaling Network Sensitivity Small Perturbation Average Precision