Traditional RNNs

Traditional recurrent neural networks (RNNs) process sequential data by maintaining an internal state that is updated at each time step, aiming to capture temporal dependencies. Current research focuses on improving RNN learnability, particularly for long sequences, exploring architectures like LSTMs and GRUs, and investigating novel designs such as Mamba and RWKV that address limitations in computational efficiency and long-term memory. These efforts are driven by the need for more robust and efficient sequence models with improved interpretability, impacting diverse fields including time series forecasting, natural language processing, and image analysis.

Papers

December 15, 2023

PAC-Bayes Generalisation Bounds for Dynamical Systems Including Stable RNNs
Deividas Eringis, John Leth, Zheng-Hua Tan, Rafal Wisniewski, Mihaly Petreczky
Dynamical System Discrete Time Traditional RNNs PAC Bayesian Probably Approximately Correct PAC Bayesian Generalization Bound

November 24, 2023

StableSSM: Alleviating the Curse of Memory in State-space Models through Stable Reparameterization
Shida Wang, Qianxiao Li
Long Short Term Memory State Space Model Memory Trace Traditional RNNs Reversal Curse Reparameterization Method Reparameterization Model

November 8, 2023

Hierarchically Gated Recurrent Neural Network for Sequence Modeling
Zhen Qin, Songlin Yang, Yiran Zhong
Sequence Modeling Traditional RNNs Linear RNN Linear Recurrent Hierarchical Recurrent

November 5, 2023

Nepali Video Captioning using CNN-RNN Architecture
Bipesh Subedi, Saugat Singh, Bal Krishna Bal
Traditional RNNs Video Captioning Video Content RNN Architecture Video Caption

November 3, 2023

ProSG: Using Prompt Synthetic Gradients to Alleviate Prompt Forgetting of RNN-like Language Models
Haotian Luo, Kunming Wu, Cheng Dai, Sixian Ding, Xinhao Chen
Language Model Complex Prompt Anti Forgetting Traditional RNNs Synthetic Gradient

September 26, 2023

On the Computational Complexity and Formal Hierarchy of Second Order Recurrent Neural Networks
Ankur Mali, Alexander Ororbia, Daniel Kifer, Lee Giles
Recurrent Neural Network Second Order Part Whole Hierarchy Computational Complexity Traditional RNNs

September 18, 2023

Graph-enabled Reinforcement Learning for Time Series Forecasting with Adaptive Intelligence
Thanveer Shaik, Xiaohui Tao, Haoran Xie, Lin Li, Jianming Yong, Yuefeng Li
Reinforcement Learning Time Series Forecasting Traditional RNNs Graph Reinforcement Learning Adaptive AI Graphical Neural Network

August 28, 2023

Kernel Limit of Recurrent Neural Networks Trained on Ergodic Data Sequences
Samuel Chun-Hei Lam, Justin Sirignano, Konstantinos Spiliopoulos
Recurrent Neural Network Convergence Analysis Traditional RNNs

August 22, 2023

SegRNN: Segment Recurrent Neural Network for Long-Term Time Series Forecasting
Shengsheng Lin, Weiwei Lin, Wentai Wu, Feiyu Zhao, Ruichao Mo, Haotong Zhang
Traditional RNNs Long Term Time Series Forecasting Multi Step RNN Model

June 24, 2023

Comparative Study of Predicting Stock Index Using Deep Learning Models
Harshal Patel, Bharath Kumar Bolla, Sabeesh E, Dinesh Reddy
Deep Learning Model Comparative Study Time Series Forecasting Traditional RNNs Mt RNN RNN Model Stock Index

June 1, 2023

Training-free Neural Architecture Search for RNNs and Transformers
Aaron Serianni, Jugal Kalita
Transformer Megatron Decepticons Neural Architecture Search BERT Model Traditional RNNs BERT Architecture Free Neural Architecture Search

May 22, 2023

May 18, 2023

TAPIR: Learning Adaptive Revision for Incremental Natural Language Understanding with a Two-Pass Model
Patrick Kahardipraja, Brielen Madureira, David Schlangen
Full Model Traditional RNNs Revision Process Supervision Signal Incremental Algorithm Recursive Transformer

April 7, 2023

Theoretical Conditions and Empirical Failure of Bracket Counting on Long Sequences with Linear Recurrent Networks
Nadine El-Naggar, Pranava Madhyastha, Tillman Weyde
Long Sequence Traditional RNNs Borda Counting Linear RNN Linear Recurrent

March 12, 2023

Global Optimality of Elman-type RNN in the Mean-Field Regime
Andrea Agazzi, Jianfeng Lu, Sayan Mukherjee
Mean Field Traditional RNNs \Sigma}{\Delta}$ Low Pas RNN Wide Neural Network Global Optimality Gradient Descent Dynamic

February 21, 2023

Analysis of Real-Time Hostile Activitiy Detection from Spatiotemporal Features Using Time Distributed Deep CNNs, RNNs and Attention-Based Mechanisms
Labib Ahmed Siddique, Rabita Junhai, Tanzim Reza, Salman Sayeed Khan, Tanvir Rahman
Attention Mechanism Real Time Traditional RNNs Video Classification Spatiotemporal Feature Surveillance System CCTV Camera

February 6, 2023

Memory-Based Meta-Learning on Non-Stationary Distributions
Tim Genewein, Grégoire Delétang, Anian Ruoss, Li Kevin Wenliang, Elliot Catt, Vincent Dutordoir, Jordi Grau-Moya, Laurent Orseau, Marcus Hutter, Joel Veness
Meta Learning Traditional RNNs

January 26, 2023

A benchmark for toxic comment classification on Civil Comments dataset
Corentin Duchene, Henri Jamet, Pierre Guillaume, Reda Dehak
New Benchmark Hate Speech Ticket BERT Traditional RNNs

January 11, 2023

Learnable Path in Neural Controlled Differential Equations
Sheo Yon Jhin, Minju Jo, Seungji Kook, Noseong Park, Sungpil Woo, Sunhwan Lim
Neural Ordinary Differential Equation Differential Equation Time Series Analysis Traditional RNNs Sampled Time Series Learning Path