Two Layer Neural Network

Two-layer neural networks serve as a fundamental model for understanding the behavior of deeper networks, with research focusing on their optimization dynamics, generalization capabilities, and feature learning properties. Current investigations utilize stochastic gradient descent and related algorithms, often within the context of the neural tangent kernel approximation, to analyze convergence rates and the impact of hyperparameters like learning rate and network width. These studies provide crucial insights into the theoretical foundations of deep learning, informing the design of more efficient and robust algorithms and offering a clearer understanding of phenomena like spectral bias and the emergence of skills during training.

Papers

October 11, 2023

A Theory of Non-Linear Feature Learning with One Gradient Step in Two-Layer Neural Networks
Behrad Moniri, Donghwan Lee, Hamed Hassani, Edgar Dobriban
Gradient Descent Theoretical Understanding Low Rank Feature Learning Two Layer Neural Network Non Linear Fully Connected Neural Network Gradient Step

October 3, 2023

Benign Overfitting in Two-Layer ReLU Convolutional Neural Networks for XOR Data
Xuran Meng, Difan Zou, Yuan Cao
Two Layer Neural Network Benign Overfitting XOR Gate Modern Deep Learning Model

September 26, 2023

SGD Finds then Tunes Features in Two-Layer Neural Networks with near-Optimal Sample Complexity: A Case Study in the XOR problem
Margalit Glasgow
Gradient Descent Stochastic Gradient Descent Ground Truth Sample Complexity Two Layer Neural Network XOR Gate Minibatch Stochastic

September 14, 2023

How many Neurons do we need? A refined Analysis for Shallow Networks trained with Gradient Descent
Mike Nguyen, Nicole Mücke
Gradient Descent Neural Tangent Kernel Kernel Hilbert Space Two Layer Neural Network Generalization Property Shallow Network Improved Analysis Many Neuron

September 1, 2023

Local Recovery of Two-layer Neural Networks at Overparameterization
Leyang Zhang, Yaoyu Zhang, Tao Luo
Natural Gradient Loss Landscape Two Layer Neural Network Overparametrization Bound Global Minimum

July 13, 2023

Efficient SGD Neural Network Training via Sublinear Activated Neuron Identification
Lianke Qin, Zhao Song, Yuanyuan Yang
Neural Network Deep Learning Stochastic Gradient Descent Two Layer Neural Network Provable Convergence Neuron Identification

July 11, 2023

Fundamental limits of overparametrized shallow neural networks for supervised learning
Francesco Camilli, Daria Tieplova, Jean Barbier
Neural Network Supervised Learning Neural Network Model Information Theoretic Two Layer Neural Network Shallow Neural Network Fundamental Limit Optimal Generalization

July 3, 2023

Neural Hilbert Ladders: Multi-Layer Neural Networks in Function Space
Zhengdao Chen
Neural Network Kernel Hilbert Space Two Layer Neural Network Function Space Multi Layer Neural Network

June 29, 2023

Why Shallow Networks Struggle with Approximating and Learning High Frequency: A Numerical Study
Shijun Zhang, Hongkai Zhao, Yimin Zhong, Haomin Zhou
Average Approximation Two Layer Neural Network Low Precision Shallow Network Frequency Learning Numerical Result Computational Problem

June 28, 2023

Beyond NTK with Vanilla Gradient Descent: A Mean-Field Analysis of Neural Networks with Polynomial Width, Samples, and Time
Arvind Mahankali, Jeff Z. Haochen, Kefan Dong, Margalit Glasgow, Tengyu Ma
Neural Network Gradient Descent Gradient Flow Mean Field Two Layer Neural Network Vanilla Gradient Descent Polynomial Bound Layer NTK

May 29, 2023

May 26, 2023

Generalization Guarantees of Gradient Descent for Multi-Layer Neural Networks
Puyu Wang, Yunwen Lei, Di Wang, Yiming Ying, Ding-Xuan Zhou
Neural Network Gradient Descent Two Layer Neural Network Generalization Guarantee Multi Layer Neural Network Three Layer Neural Network

May 22, 2023

Fast Convergence in Learning Two-Layer Neural Networks with Separable Data
Hossein Taheri, Christos Thrampoulidis
Gradient Descent Generalization Bound Two Layer Neural Network Linear Classifier Separable Data Exponential Convergence Rate Tailed Loss

May 10, 2023

Phase transitions in the mini-batch size for sparse and dense two-layer neural networks
Raffaele Marino, Federico Ricci-Tersenghi
Two Layer Neural Network Phase Transition Mini Batch Two Layer

May 9, 2023

A duality framework for analyzing random feature and two-layer neural networks
Hongrui Chen, Jihao Long, Lei Wu
Kernel Hilbert Space Two Layer Neural Network Random Feature Function Space Dot Product Kernel

April 6, 2023

Training a Two Layer ReLU Network Analytically
Adrian Barbu
Gradient Descent Two Layer Neural Network Adam Optimizer ReLU Activation Two Layer ReLU

March 31, 2023

On the Effect of Initialization: The Scaling Path of 2-Layer Neural Networks
Sebastian Neumayer, Lénaïc Chizat, Michael Unser
Gradient Descent Mixed Effect Convex Set Two Layer Neural Network Root to Leaf Path New Initialization Two Layer ReLU Unbalanced Optimal Transport Regularization Path

March 29, 2023

Training Neural Networks is NP-Hard in Fixed Dimension
Vincent Froese, Christoph Hertrich
Neural Network Two Layer Neural Network Computational Complexity NP Complete Parameterized Complexity Threshold Activation

March 24, 2023

Online Learning for the Random Feature Model in the Student-Teacher Framework
Roman Worschech, Bernd Rosenow
Deep Neural Network Online Learning Two Layer Neural Network Random Feature Teacher Student Benign Over Parameterization