New Initialization

New initialization techniques for neural networks aim to improve training efficiency, stability, and generalization performance by carefully selecting initial model parameters. Current research focuses on developing methods tailored to specific architectures like transformers and diffusion models, often leveraging techniques such as reparameterization, knowledge factorization, and adaptive segmentation to optimize initialization for various tasks, including image generation, natural language processing, and visual navigation. These advancements are significant because they can lead to faster training, reduced computational costs, and improved model accuracy across a wide range of applications.

Papers

June 23, 2022

On the Parameterization and Initialization of Diagonal State Space Models
Albert Gu, Ankit Gupta, Karan Goel, Christopher Ré
State Space Model State Space Sequence Model New Initialization State Vector Diagonal State Space

June 6, 2022

The Neural Covariance SDE: Shaped Infinite Depth-and-Width Networks at Initialization
Mufan Bill Li, Mihai Nica, Daniel M. Roy
Covariance Matrix Deeper Network New Initialization Shape Aware Neural SDEs Width Network

May 10, 2022

Neural Networks with Different Initialization Methods for Depression Detection
Tianle Yang
Neural Network Depression Detection Depression Symptom New Initialization Depression Recognition Better Initialization

April 15, 2022

Initialisation and Grammar Design in Grammar-Guided Evolutionary Computation
Grant Dick, Peter A. Whigham
Genetic Programming New Initialization Language Evolution Grammar Guided Genetic Programming Grammar Design

March 5, 2022

Tightly Coupled Optimization-based GPS-Visual-Inertial Odometry with Online Calibration and Initialization
Shihao Han, Feiyang Deng, Tao Li, Hailong Pei
New Initialization Drift Free Online Calibration Residual Frame

March 4, 2022

Structured Pruning is All You Need for Pruning CNNs at Initialization
Yaohui Cai, Weizhe Hua, Hongzheng Chen, G. Edward Suh, Christopher De Sa, Zhiru Zhang
CNN Architecture Structured Pruning New Initialization Neural Network Pruning Pruning Framework Weight Pruning

February 26, 2022

Initialization of Latent Space Coordinates via Random Linear Projections for Learning Robotic Sensory-Motor Sequences
Vsevolod Nikulin, Jun Tani
Latent Space New Initialization Motion Primitive Random Projection Robot Kinematics

February 24, 2022

Rare Gems: Finding Lottery Tickets at Initialization
Kartik Sreenivasan, Jy-yong Sohn, Liu Yang, Matthew Grinde, Alliot Nagle, Hongyi Wang, Eric Xing, Kangwook Lee, Dimitris Papailiopoulos
Neural Network New Initialization Lottery Ticket Sparse Subnetworks Magnitude Pruning Trainable Layer

February 16, 2022

Prospect Pruning: Finding Trainable Weights at Initialization using Meta-Gradients
Milad Alizadeh, Shyam A. Tailor, Luisa M Zintgraf, Joost van Amersfoort, Sebastian Farquhar, Nicholas Donald Lane, Yarin Gal
New Initialization Weight Freezing Meta Gradient Pruning Framework Visual Saliency Progressive Pruning Object to Environment Saliency

February 1, 2022

Neural Tangent Kernel Beyond the Infinite-Width Limit: Effects of Depth and Initialization
Mariia Seleznova, Gitta Kutyniok
Mixed Effect Neural Tangent Kernel Large Depth ReLU Network New Initialization Infinite Width Infinite Depth and Width Limit

January 28, 2022

On feedforward control using physics-guided neural networks: Training cost regularization and optimized initialization
Max Bolderman, Mircea Lazar, Hans Butler
New Initialization Feedforward Control Inverse Dynamic Model

January 27, 2022

Eigenvalues of Autoencoders in Training and at Initialization
Benjamin Dees, Susama Agarwala, Corey Lowman
Training Data Supervised Autoencoder New Initialization MNIST Dataset Random Matrix Smallest Eigenvalue Eigenvalue Distribution

January 5, 2022

Multi-layer VI-GNSS Global Positioning Framework with Numerical Solution aided MAP Initialization
Bing Han, Zhongyang Xiao, Shuai Huang, Tao Zhang
Visual Odometry Global Navigation Satellite System New Initialization Global Localization Numerical Solution

November 23, 2021

Critical Initialization of Wide and Deep Neural Networks through Partial Jacobians: General Theory and Applications
Darshil Doshi, Tianyu He, Andrey Gromov
Deep Neural Network Financial Application New Initialization Residual Connection Jacobian Matrix Criticality Ordered Spin Sequence Gaussian Approximation

New Initialization

Papers

On the Parameterization and Initialization of Diagonal State Space Models

The Neural Covariance SDE: Shaped Infinite Depth-and-Width Networks at Initialization

Neural Networks with Different Initialization Methods for Depression Detection

Initialisation and Grammar Design in Grammar-Guided Evolutionary Computation

Tightly Coupled Optimization-based GPS-Visual-Inertial Odometry with Online Calibration and Initialization

Structured Pruning is All You Need for Pruning CNNs at Initialization

Initialization of Latent Space Coordinates via Random Linear Projections for Learning Robotic Sensory-Motor Sequences

Rare Gems: Finding Lottery Tickets at Initialization

Prospect Pruning: Finding Trainable Weights at Initialization using Meta-Gradients

Neural Tangent Kernel Beyond the Infinite-Width Limit: Effects of Depth and Initialization

On feedforward control using physics-guided neural networks: Training cost regularization and optimized initialization

Eigenvalues of Autoencoders in Training and at Initialization

Multi-layer VI-GNSS Global Positioning Framework with Numerical Solution aided MAP Initialization

Critical Initialization of Wide and Deep Neural Networks through Partial Jacobians: General Theory and Applications