Transformer Encoder Layer

Transformer encoder layers are fundamental building blocks in many deep learning models, aiming to efficiently process sequential data by capturing long-range dependencies. Current research focuses on improving their efficiency and adaptability, exploring techniques like parameter-efficient fine-tuning with adapters, learning specialized tokens for domain adaptation, and employing low-rank approximations and weight sharing to reduce model size. These advancements are crucial for deploying sophisticated models on resource-constrained devices and improving performance across diverse applications, including speech processing, image classification, and object tracking.

Papers

July 28, 2024

ELP-Adapters: Parameter Efficient Adapter Tuning for Various Speech Processing Tasks
Nakamasa Inoue, Shinta Otake, Takumi Hirose, Masanari Ohi, Rei Kawakami
Fine Grained Speech Recognition Speech Processing Task Adapter Tuning Transformer Encoder Layer

June 27, 2024

Learning Visual Conditioning Tokens to Correct Domain Shift for Fully Test-time Adaptation
Yushun Tang, Shuoshuo Chen, Zhehan Kan, Yi Zhang, Qinghai Guo, Zhihai He
Transformer Based Domain Shift Test Time Adaptation Test Time Visual Token Patch Embeddings Transformer Encoder Layer

October 3, 2023

ResidualTransformer: Residual Low-Rank Learning with Weight-Sharing for Transformer Layers
Yiming Wang, Jinyu Li
Speech Recognition Low Rank Transformer Encoders Transformer Layer Weight Sharing Residual Transformer Transformer Encoder Layer

November 9, 2022

Efficient Joint Detection and Multiple Object Tracking with Spatially Aware Transformer
Siddharth Sagar Nijhawan, Leo Hoshikawa, Atsushi Irie, Masakazu Yoshimura, Junji Otsuka, Takeshi Ohashi
Multi Object Tracking Multiple Object Joint Detection Depth Wise Convolution Full Transformer Transformer Encoder Layer

April 21, 2022

BTranspose: Bottleneck Transformers for Human Pose Estimation with Self-Supervised Pre-Training
Kaushik Balakrishnan, Devesh Upadhyay
Human Pose Estimation Self Supervised Pre Training Multi Head Self Attention 2 Dimensional Human Pose Estimation Robust Neural Architecture Bottleneck Transformer Transformer Encoder Layer

February 7, 2022

LwPosr: Lightweight Efficient Fine-Grained Head Pose Estimation
Naina Dhingra
Convolutional Neural Network Fine Grained Transformer Encoders Head Pose Estimation Head Pose Transformer Encoder Layer

Transformer Encoder Layer

Papers

ELP-Adapters: Parameter Efficient Adapter Tuning for Various Speech Processing Tasks

Learning Visual Conditioning Tokens to Correct Domain Shift for Fully Test-time Adaptation

ResidualTransformer: Residual Low-Rank Learning with Weight-Sharing for Transformer Layers

Efficient Joint Detection and Multiple Object Tracking with Spatially Aware Transformer

BTranspose: Bottleneck Transformers for Human Pose Estimation with Self-Supervised Pre-Training

LwPosr: Lightweight Efficient Fine-Grained Head Pose Estimation