Attention Based Transformer

Attention-based transformers are deep learning architectures designed to process sequential data by weighting the importance of different input elements, enabling the modeling of long-range dependencies. Current research focuses on improving efficiency (e.g., through sparse attention mechanisms and specialized hardware acceleration), enhancing interpretability (e.g., using PDEs and information theory), and applying transformers to diverse domains, including audio processing, image analysis, and even scientific simulations. These advancements are driving significant improvements in various applications, from speech enhancement and natural language processing to medical diagnosis and autonomous systems.

Papers

November 25, 2022

Learning General Audio Representations with Large-Scale Training of Patchout Audio Transformers
Khaled Koutini, Shahed Masoudian, Florian Schmid, Hamid Eghbal-zadeh, Jan Schlüter, Gerhard Widmer
Convolutional Neural Network Deep Neural Network Audio Representation Neural Network Representation Audio Transformer Attention Based Transformer Large Scale Training

August 3, 2022

Re-Attention Transformer for Weakly Supervised Object Localization
Hui Su, Yue Ye, Zhiwei Chen, Mingli Song, Lechao Cheng
Attention Mechanism Object Localization Attention Map Weakly Supervised Object Localization Attention Based Transformer Refinement Transformer

April 1, 2022

Consistency driven Sequential Transformers Attention Model for Partially Observable Scenes
Samrudhdhi B. Rangrej, Chetan L. Srinidhi, James J. Clark
Supervised ImageNet Strong Consistency Observable Environment Attention Based Transformer Training Objective Hard Attention

November 7, 2021

Theme Transformer: Symbolic Music Generation with Theme-Conditioned Transformer
Yi-Jen Shih, Shih-Lun Wu, Frank Zalkow, Meinard Müller, Yi-Hsuan Yang
Music Generation Symbolic Music Generation Attention Based Transformer Image Conditioning Conditional Transformer Intermediate Training

Attention Based Transformer

Papers

Learning General Audio Representations with Large-Scale Training of Patchout Audio Transformers

Re-Attention Transformer for Weakly Supervised Object Localization

Consistency driven Sequential Transformers Attention Model for Partially Observable Scenes

Theme Transformer: Symbolic Music Generation with Theme-Conditioned Transformer