Weight Tied Model

Weight-tied models, which share weights across multiple layers, offer a computationally efficient approach to training very deep neural networks, including the popular Deep Equilibrium Models (DEQs). Current research focuses on understanding the optimization properties of these models, particularly concerning convergence guarantees and the trade-off between model capacity and sparsity. This line of research aims to improve the stability and efficiency of training extremely deep networks while maintaining or improving performance on various tasks, such as image recognition, ultimately leading to more practical and scalable deep learning solutions.

Papers

July 16, 2023

Revisiting Implicit Models: Sparsity Trade-offs Capability in Weight-tied Model for Vision Tasks
Haobo Song, Soumajit Majumder, Tao Lin
Vision Task Implicit Model Deep Equilibrium Model Sparsity Tradeoff Weight Tied Model

May 27, 2022

Global Convergence of Over-parameterized Deep Equilibrium Models
Zenan Ling, Xingyu Xie, Qiuhao Wang, Zongpeng Zhang, Zhouchen Lin
Gradient Descent Global Convergence Deep Equilibrium Model Equilibrium Point Weight Tied Model

Weight Tied Model

Papers

Revisiting Implicit Models: Sparsity Trade-offs Capability in Weight-tied Model for Vision Tasks

Global Convergence of Over-parameterized Deep Equilibrium Models