Activation Maximization

Activation maximization (AM) is a technique used to understand and interpret the internal workings of neural networks, primarily by identifying input patterns that maximally activate specific neurons or groups of neurons. Current research focuses on applying AM to diverse model architectures, including large language models (LLMs) and convolutional neural networks (CNNs), often employing gradient-based optimization or training-free methods to improve efficiency and interpretability. This work is significant for enhancing model transparency, improving the reliability of model explanations, and potentially addressing challenges like backdoor attacks and out-of-distribution generalization in various applications, from image analysis to time series prediction.

Papers

April 20, 2023

Optimal Activation of Halting Multi-Armed Bandit Models
Wesley Cowan, Michael N. Katehakis, Sheldon M. Ross
Multi Armed Bandit Bandit Identification Activation Maximization Index Decomposition Mathematical Proof Dynamic Token Halting

November 23, 2022

ActMAD: Activation Matching to Align Distributions for Test-Time-Training
Muhammad Jehanzeb Mirza, Pol Jané Soneira, Wei Lin, Mateusz Kozinski, Horst Possegger, Horst Bischof
Targeted Activation Penalty Distribution Alignment Activation Maximization

April 14, 2022

High-performance Evolutionary Algorithms for Online Neuron Control
Binxu Wang, Carlos R. Ponce
Optimization Purpose CMA E Activation Maximization Neural Code

January 10, 2022

Competing Mutual Information Constraints with Stochastic Competition-based Activations for Learning Diversified Representations
Konstantinos P. Panousis, Anastasios Antoniadis, Sotirios Chatzis
Representation Learning Stochastic Way Activation Maximization Diverse Representation

December 30, 2021

Two Instances of Interpretable Neural Network for Universal Approximations
Erico Tjoa, Guan Cuntai
Neural Network Universal Approximation Instance Query Interpretable Neural Network Activation Maximization

December 5, 2021

Stochastic Local Winner-Takes-All Networks Enable Profound Adversarial Robustness
Konstantinos P. Panousis, Sotirios Chatzis, Sergios Theodoridis
Adversarial Attack Adversarial Robustness Activation Maximization Competition Dynamic

November 29, 2021

First Power Linear Unit with Sign
Boxi Duan
Activation Function Activation Maximization Cultural Sign