Attention Based Architecture

Attention-based architectures, particularly transformer networks, are revolutionizing various fields by enabling models to selectively focus on relevant information within complex data. Current research emphasizes improving efficiency, addressing overfitting issues, and enhancing interpretability of these models, exploring variations like hybrid CNN-transformer designs and novel attention mechanisms such as focal and full-range attention. This focus is driven by the need for more efficient, robust, and explainable AI systems across diverse applications, including image processing, natural language processing, and time series forecasting.

Papers

April 20, 2023

Interpretability for Conditional Coordinated Behavior in Multi-Agent Reinforcement Learning
Yoshinari Motokawa, Toshiharu Sugawara
Multi Agent Reinforcement Learning Inherent Interpretability Attention Based Architecture Coordinated Behavior Conditional Attention

April 7, 2023

Attention: Marginal Probability is All You Need?
Ryan Singh, Christopher L. Buckley
Attention Mechanism Human Attention Attention Based Architecture Marginal Probability

April 6, 2023

EGA-Depth: Efficient Guided Attention for Self-Supervised Multi-Camera Depth Estimation
Yunxiao Shi, Hong Cai, Amin Ansari, Fatih Porikli
Autonomous Driving Self Supervised Monocular Depth Estimation Multi Camera Attention Based Architecture

March 22, 2023

Exploring Turkish Speech Recognition via Hybrid CTC/Attention Architecture and Multi-feature Fusion Network
Zeyu Ren, Nurmement Yolwas, Huiru Wang, Wushour Slamu
Automatic Speech Recognition Feature Fusion Feature Extractor Attention Based Architecture CTC Based Turkish Natural Language End to End Speech Recognition

February 7, 2023

Explainable Action Prediction through Self-Supervision on Scene Graphs
Pawit Kochakarn, Daniele De Martini, Daniel Omeiza, Lars Kunze
Autonomous Driving Scene Graph Self Supervision Attention Based Architecture Self Training Pipeline Driver Intention

February 1, 2023

Attention Link: An Efficient Attention-Based Low Resource Machine Translation Architecture
Zeping Min
Machine Translation Transformer Model Parallel Corpus Attention Head Attention Based Architecture NMT Model Low Resource Neural Machine Translation

January 17, 2023

Transformers as Algorithms: Generalization and Stability in In-context Learning
Yingcong Li, M. Emrullah Ildiz, Dimitris Papailiopoulos, Samet Oymak
Strong Generalization Transformer Megatron Decepticons Practical Algorithm Context Learning Core Stability Generalization Bound Multitask Learning Attention Based Architecture Online Inference

December 30, 2022

On the Interpretability of Attention Networks
Lakshmi Narayan Pandey, Rahul Vashisht, Harish G. Ramaswamy
Inherent Interpretability Attention Mechanism Attention Network CNN Architecture Attention Based Architecture

December 22, 2022

Scalable Adaptive Computation for Iterative Generation
Allan Jabri, David Fleet, Ting Chen
Self Attention Recurrent Network Attention Based Architecture Latent Token Efficient Generation Adaptive Computation

December 15, 2022

Temporal Saliency Detection Towards Explainable Transformer-based Timeseries Forecasting
Nghia Duong-Trung, Duc-Manh Nguyen, Danh Le-Phuoc
Saliency Map Attention Based Architecture Temporal Saliency

October 20, 2022

Play It Back: Iterative Attention for Audio Recognition
Alexandros Stergiou, Dima Damen
Fine Grained Attention Based Architecture Audio Recognition Audio Classification Benchmark Attention Trait Sequential Audio

October 13, 2022

Graph-based Neural Modules to Inspect Attention-based Architectures: A Position Paper
Breno W. Carvalho, Artur D'Avilla Garcez, Luis C. Lamb
Neuro Symbolic Encoder Decoder Encoder Decoder Model Symbolic Representation Attention Based Architecture Graph Based Representation

October 6, 2022

ThoraX-PriorNet: A Novel Attention-Based Architecture Using Anatomical Prior Probability Maps for Thoracic Disease Classification
Md. Iqbal Hossain, Mohammad Zunaed, Md. Kawsar Ahmed, S. M. Jawwad Hossain, Anwarul Hasan, Taufiq Hasan
Long Form Novel Attention Based Architecture Anatomical Prior ChestX Ray8 Dataset Thorax Disease

September 22, 2022

An Attention Matrix for Every Decision: Faithfulness-based Arbitration Among Multiple Attention-Based Interpretations of Transformers in Text Classification
Nikolaos Mylonas, Ioannis Mollas, Grigorios Tsoumakas
Natural Language Processing Transformer Megatron Decepticons Text Classification Transformer Model Interpretability Method Attention Based Architecture Attention Based Interpretation

July 18, 2022

Residual and Attentional Architectures for Vector-Symbols
Wilkie Olin-Ammentorp Maxim Bazhenov
Neuromorphic Hardware X Vector Attention Based Architecture Residual Stream Vector Symbolic Architecture Holographic Reduced Representation Fourier Attention

May 21, 2022

Equivariant Mesh Attention Networks
Sourya Basu, Jose Gallego-Posada, Francesco Viganò, James Rowbottom, Taco Cohen
Inter Part Equivariance Approximate Symmetry Attention Based Architecture Spatial Transformation Mesh Segmentation

May 19, 2022

Distributed Multi-Agent Deep Reinforcement Learning for Robust Coordination against Noise
Yoshinari Motokawa, Toshiharu Sugawara
Multi Agent System Industrial Disturbing Noise Autonomous Agent Multi Agent Deep Reinforcement Learning Attention Based Architecture

March 10, 2022

On Embeddings for Numerical Features in Tabular Deep Learning
Yury Gorishniy, Ivan Rubachev, Artem Babenko
Jina Embeddings Numerical Data Dimensional Embeddings Attention Based Architecture Tabular Deep Learning MLP Like Model

January 29, 2022

Learning Intuitive Policies Using Action Features
Mingwei Ma, Jizhou Liu, Samuel Sokota, Max Kleiman-Weiner, Jakob Foerster
AI Agent Action Feature Multi Agent Coordination Attention Based Architecture Heuristic Policy

December 31, 2021

Transformer Embeddings of Irregularly Spaced Events and Their Participants
Chenghao Yang, Hongyuan Mei, Jason Eisner
Neuro Symbolic Data Provenance Hawkes Process Attention Based Architecture Participant State Transformer Embeddings