Transformer Decoder

Transformer decoders are neural network components primarily used for sequence generation tasks, aiming to produce outputs conditioned on input sequences. Current research focuses on improving their efficiency and robustness through techniques like novel initialization methods, integrating them into other architectures (e.g., temporal graph neural networks), and optimizing decoding algorithms (e.g., incorporating planning or speculative execution). These advancements are significant because they enhance the performance and applicability of transformer-based models across diverse fields, including natural language processing, computer vision, and drug discovery, by enabling faster training, more accurate predictions, and efficient deployment on resource-constrained devices.

Papers

December 20, 2022

Future Sight: Dynamic Story Generation with Large Pretrained Language Models
Brian D. Zimmerman, Gaurav Sahu, Olga Vechtomova
Transformer Decoder Generative Transformer Story Generation Task Controllable Story Generation

December 9, 2022

TRBLLmaker -- Transformer Reads Between Lyrics Lines maker
Mor Ventura, Michael Toker
Sentiment Analysis Text to Text Implicit Knowledge Transformer Decoder Lyric Generation

November 25, 2022

MUSTER: A Multi-scale Transformer-based Decoder for Semantic Segmentation
Jing Xu, Wentao Shi, Pan Gao, Zhengwei Wang, Qizhu Li
Semantic Segmentation Transformer Based Multi Scale Segmentation Performance Transformer Decoder Transformer Based Decoder

November 19, 2022

DeepSolo: Let Transformer Decoder with Explicit Points Solo for Text Spotting
Maoyuan Ye, Jing Zhang, Shanshan Zhao, Juhua Liu, Tongliang Liu, Bo Du, Dacheng Tao
Text Detection Transformer Decoder Scene Text Detection Text Spotting Single Decoder Explicit Point Solo

November 18, 2022

Scaling Native Language Identification with Transformer Adapters
Ahmet Yavuz Uluslu, Gerold Schneider
Language Identification Transformer Decoder Transformer Adapter Native Language Identification

November 17, 2022

D$^3$ETR: Decoder Distillation for Detection Transformer
Xiaokang Chen, Jiahui Chen, Yan Liu, Gang Zeng
Knowledge Distillation Detection Transformer Transformer Decoder DETR Based Detector

November 16, 2022

Streaming Joint Speech Recognition and Disfluency Detection
Hayato Futami, Emiru Tsunoo, Kentaro Shibata, Yosuke Kashiwagi, Takao Okuda, Siddhant Arora, Shinji Watanabe
Speech Recognition Transformer Decoder Encoder Decoder Transformer Model Disfluency Detection Joint Audio BERT Like

November 9, 2022

Pure Transformer with Integrated Experts for Scene Text Recognition
Yew Lee Tan, Adams Wai-kin Kong, Jung-Jae Kim
Transformer Architecture Scene Text Recognition Transformer Decoder Hybrid CNN Transformer Scene Text Image Pure Transformer

November 3, 2022

Channel-Aware Pretraining of Joint Encoder-Decoder Self-Supervised Model for Telephonic-Speech ASR
Vrunda N. Sukhadia, A. Arunkumar, S. Umesh
Automatic Speech Recognition Speech Analysis Transformer Decoder Differentiable Channel Simple Pooling

October 31, 2022

Structured State Space Decoder for Speech Recognition and Synthesis
Koichi Miyazaki, Masato Murata, Tomoki Koriyama
Automatic Speech Recognition Speech Recognition Text to Speech Critical Synthesis State Space Transformer Decoder

October 22, 2022

P$^3$LM: Probabilistically Permuted Prophet Language Modeling for Generative Pre-Training
Junwei Bao, Yifan Wang, Jiangyong Ying, Yeyun Gong, Jing Zhao, Youzheng Wu, Xiaodong He
Question Generation Sequence Modeling Language Modeling Transformer Decoder Sequence Generation Generative Pre Training

July 10, 2022

CoMER: Modeling Coverage for Transformer-based Handwritten Mathematical Expression Recognition
Wenqi Zhao, Liangcai Gao
Encoder Decoder Transformer Decoder Higher Coverage Rate Handwritten Mathematical Expression Recognition Handwritten Mathematical Expression Attention Trait

June 10, 2022

StructCoder: Structure-Aware Transformer for Code Generation
Sindhu Tipirneni, Ming Zhu, Chandan K. Reddy
Code Generation Transformer Decoder Code Translation Structure Encoder Structure Aware Transformer

May 24, 2022

Garden-Path Traversal in GPT-2
William Jurayj, William Rudman, Carsten Eickhoff
Transformer Decoder Coherent Text GPT 2 Decoder Model

April 20, 2022

Transformer Decoders with MultiModal Regularization for Cross-Modal Food Retrieval
Mustafa Shukor, Guillaume Couairon, Asya Grechka, Matthieu Cord
Transformer Decoder Modal Embeddings Unimodal Encoders Image to Recipe Recipe Embeddings

April 19, 2022

DecBERT: Enhancing the Language Understanding of BERT with Causal Attention Masks
Ziyang Luo, Yadong Xi, Jing Ma, Zhiwei Yang, Xiaoxi Mao, Changjie Fan, Rongsheng Zhang
Language Understanding Ticket BERT Transformer Decoder Transformer Encoder Causal Attention Mask

March 2, 2022

DN-DETR: Accelerate DETR Training by Introducing Query DeNoising
Feng Li, Hao Zhang, Shilong Liu, Jian Guo, Lionel M. Ni, Lei Zhang
Detection Transformer Faster Convergence Transformer Decoder DETR Training Deformable DETR Query DeNoising

February 17, 2022

SGPT: GPT Sentence Embeddings for Semantic Search
Niklas Muennighoff
Sentence Embeddings Transformer Decoder Semantic Search High Quality Decoder

January 28, 2022

DAB-DETR: Dynamic Anchor Boxes are Better Queries for DETR
Shilong Liu, Feng Li, Hao Zhang, Xiao Yang, Xianbiao Qi, Hang Su, Jun Zhu, Lei Zhang
Detection Transformer Transformer Decoder Query Expansion Group DETR V2 DETR Based Detector Adaptive Sparse Anchor

December 10, 2021

Visual Transformers with Primal Object Queries for Multi-Label Image Classification
Vacit Oguz Yazici, Joost van de Weijer, Longlong Yu
Vision Transformer Multi Label Classification Detection Task Transformer Decoder Multi Label Image Classification Object Query