Capturing Extreme Activation

Capturing extreme activations in neural networks aims to improve model efficiency, robustness, and controllability. Current research focuses on developing novel activation functions and dynamic activation techniques, applied to various architectures including CNNs, RNNs, LSTMs, and large language models, to enhance performance in tasks like intrusion detection and out-of-distribution detection. These advancements are significant because they offer ways to optimize model inference speed, mitigate overconfidence in predictions, and enable more effective control over model behavior without extensive retraining, leading to more efficient and reliable AI systems.

Papers

August 21, 2024

First Activations Matter: Training-Free Methods for Dynamic Activation in Large Language Models
Chi Ma, Mincong Huang, Ying Zhang, Chao Wang, Yujie Wang, Lei Yu, Chuan Liu, Wei Lin
Large Language Model NCD Method Activation Maximization Semantic Association Dynamic Activation Capturing Extreme Activation

May 30, 2024

Optimizing cnn-Bigru performance: Mish activation and comparative analysis with Relu
Asmaa Benchama, Khalid Zebbara
Neural Network Deep Learning Comparative Study Intrusion Detection System ReLU Layer CNN Performance Capturing Extreme Activation

May 21, 2024

Mitigating Overconfidence in Out-of-Distribution Detection by Capturing Extreme Activations
Mohammad Azizmalayeri, Ameen Abu-Hanna, Giovanni Cinà
Distribution Detection Overconfidence Problem Capturing Extreme Activation

February 14, 2024

Enhancing Sequential Model Performance with Squared Sigmoid TanH (SST) Activation Under Data Constraints
Barathi Subramanian, Rathinaraja Jeyaraj, Rakhmonov Akhrorjon Akhmadjon Ugli, Jeonghong Kim
Long Short Term Memory Activation Function Targeted Activation Penalty Sequential Model RNN Based Model Capturing Extreme Activation

November 10, 2023

1-Lipschitz Neural Networks are more expressive with N-Activations
Bernd Prach, Christoph H. Lampert
Neural Network Activation Function Lipschitz Network Capturing Extreme Activation

August 20, 2023

Steering Language Models With Activation Engineering
Alexander Matt Turner, Lisa Thiergart, Gavin Leech, David Udell, Juan J. Vazquez, Ulisse Mini, Monte MacDiarmid
Large Language Model Language Model Natural Language Optimization Purpose Sentiment Score Supervised Finetuning Advanced Activation Mechanism Capturing Extreme Activation

Capturing Extreme Activation

Papers

First Activations Matter: Training-Free Methods for Dynamic Activation in Large Language Models

Optimizing cnn-Bigru performance: Mish activation and comparative analysis with Relu

Mitigating Overconfidence in Out-of-Distribution Detection by Capturing Extreme Activations

Enhancing Sequential Model Performance with Squared Sigmoid TanH (SST) Activation Under Data Constraints

1-Lipschitz Neural Networks are more expressive with N-Activations

Steering Language Models With Activation Engineering