Attention Hypernetworks

Attention hypernetworks are meta-learning models that dynamically generate the weights of other neural networks, adapting them to specific tasks or data characteristics. Current research focuses on applying this approach to diverse areas, including federated learning, time series forecasting, image processing, and speech recognition, often employing architectures like MLP-Mixers, Graph Neural Networks, and Transformers within the hypernetwork framework. This technique offers advantages in parameter efficiency, improved generalization to unseen data, and faster inference times, impacting various fields by enabling more adaptable and resource-efficient AI models.

Papers

December 14, 2023

MotherNet: A Foundational Hypernetwork for Tabular Classification
Andreas Müller, Carlo Curino, Raghu Ramakrishnan
Neural Network Context Learning Attention Hypernetworks Non Graph Hypernetwork Baseline Tabular Classification

December 13, 2023

Principled Weight Initialization for Hypernetworks
Oscar Chang, Lampros Flokas, Hod Lipson
Attention Hypernetworks Weight Initialization Meta Similarity Correction Network

December 5, 2023

Generating Interpretable Networks using Hypernetworks
Isaac Liao, Ziming Liu, Max Tegmark
Mechanistic Interpretability Attention Hypernetworks Interpretable Algorithm Interpretable Network

November 14, 2023

Learning Physics-Inspired Regularization for Medical Image Registration with Hypernetworks
Anna Reithmeir, Julia A. Schnabel, Veronika A. Zimmer
LeArning Abstract Medical Image Registration Attention Hypernetworks Deep Learning Based Registration Physic Based Regularization Gradient Guided Diffusion

September 28, 2023

Parameter-Saving Adversarial Training: Reinforcing Multi-Perturbation Robustness via Hypernetworks
Huihui Gong, Minjing Dong, Siqi Ma, Seyit Camtepe, Surya Nepal, Chang Xu
Adversarial Attack Adversarial Training Adversarial Perturbation Attention Hypernetworks Perturbation Robustness

August 18, 2023

HyperLoRA for PDEs
Ritam Majumdar, Vishal Jadhav, Anirudh Deodhar, Shirish Karande, Lovekesh Vig, Venkataramana Runkana
Physic Informed Neural Network Attention Hypernetworks Physic Informed Loss

July 20, 2023

Fast Unsupervised Deep Outlier Model Selection with Hypernetworks
Xueying Ding, Yue Zhao, Leman Akoglu
Neural Network Deep Learning Deep Neural Network Outlier Detection Attention Hypernetworks Outlier Model Selection

July 13, 2023

HyperDreamBooth: HyperNetworks for Fast Personalization of Text-to-Image Models
Nataniel Ruiz, Yuanzhen Li, Varun Jampani, Wei Wei, Tingbo Hou, Yael Pritch, Neal Wadhwa, Michael Rubinstein, Kfir Aberman
Generative AI Text to Image Model Personalized Model Attention Hypernetworks Scalable Personalization Point Wise Weight

June 19, 2023

Partial Hypernetworks for Continual Learning
Hamed Hemati, Vincenzo Lomonaco, Davide Bacciu, Damian Borth
Continual LEArning Attention Hypernetworks Latent Replay Weight Generation

June 12, 2023

A Brief Review of Hypernetworks in Deep Learning
Vinod Kumar Chauhan, Jiandong Zhou, Ping Lu, Soheila Molaei, David A. Clifton
Deep Learning Deep Learning Model Attention Hypernetworks

May 10, 2023

HyperE2VID: Improving Event-Based Video Reconstruction via Hypernetworks
Burak Ercan, Onur Eker, Canberk Saglam, Aykut Erdem, Erkut Erdem
Attention Hypernetworks Dynamic Neural Network Event Based Video Pixel Wise Adaptive

April 19, 2023

HyperStyle3D: Text-Guided 3D Portrait Stylization via Hypernetworks
Zhuo Chen, Xudong Xu, Yichao Yan, Ye Pan, Wenhan Zhu, Wayne Wu, Bo Dai, Xiaokang Yang
Attention Hypernetworks Portrait Stylization 3D Portrait Stylization

April 15, 2023

Magnitude Invariant Parametrizations Improve Hypernetwork Learning
Jose Javier Gonzalez Ortiz, John Guttag, Adrian Dalca
Attention Hypernetworks Conditioned Hypernetwork Hypernetwork Approach

March 5, 2023

HyperPose: Camera Pose Localization using Attention Hypernetworks
Ron Ferens, Yosi Keller
Pose Regression Attention Hypernetworks Camera Localization Localization Network

March 4, 2023

MetaGrad: Adaptive Gradient Quantization with Hypernetworks
Kaixin Xu, Alina Hui Xiu Lee, Ziyuan Zhao, Zhe Wang, Min Wu, Weisi Lin
Quantization Operator CNN Architecture Attention Hypernetworks Network Compression Gradient Quantization

February 9, 2023

Hypernetworks build Implicit Neural Representations of Sounds
Filip Szatkowski, Karol J. Piczak, Przemysław Spurek, Jacek Tabor, Tomasz Trzciński
Audio Representation Audio Processing Attention Hypernetworks Real World Sound

December 20, 2022

November 28, 2022

Hypernetworks for Zero-shot Transfer in Reinforcement Learning
Sahand Rezaei-Shoshtari, Charlotte Morissette, Francois Robert Hogan, Gregory Dudek, David Meger
Reinforcement Learning Zero Shot Transfer Attention Hypernetworks DeepMind Control Suite Optimal Reinforcement Learning Meta RL

November 3, 2022

HyperSound: Generating Implicit Neural Representations of Audio Signals with Hypernetworks
Filip Szatkowski, Karol J. Piczak, Przemysław Spurek, Jacek Tabor, Tomasz Trzciński
Implicit Neural Representation Audio Signal Attention Hypernetworks Dimensional Signal