Transformer Network

Transformer networks are a class of deep learning models designed to process sequential data by leveraging self-attention mechanisms, enabling the capture of long-range dependencies within the data. Current research focuses on optimizing transformer architectures for efficiency and generalization, including exploring sparse connections, pruning techniques, and specialized hardware acceleration, as well as adapting them for diverse applications beyond natural language processing, such as image analysis, time series prediction, and signal processing. This versatility makes transformers a powerful tool across numerous scientific fields and practical applications, driving advancements in areas ranging from medical image analysis to autonomous driving and energy management.

Papers

October 7, 2023

TransCC: Transformer Network for Coronary Artery CCTA Segmentation
Chenchu Xu, Meng Li, Xue Wu
Convolutional Neural Network Transformer Network Medical Image Segmentation Task Coronary Artery Segmentation Coronary Ct Angiography

October 4, 2023

September 22, 2023

CINFormer: Transformer network with multi-stage CNN feature injection for surface defect segmentation
Xiaoheng Jiang, Kaiyi Guo, Yang Lu, Feng Yan, Hao Liu, Jiale Cao, Mingliang Xu, Dacheng Tao
Multi Stage Defect Detection Transformer Network Surface Inspection Steel Surface Defect

September 20, 2023

Automatic Bat Call Classification using Transformer Networks
Frank Fundel, Daniel A. Braun, Sebastian Gottwald
Multi Label Classification Transformer Network Bird Sound Specie Classification

July 16, 2023

A Survey of Techniques for Optimizing Transformer Inference
Krishna Teja Chitty-Venkata, Sparsh Mittal, Murali Emani, Venkatram Vishwanath, Arun K. Somani
Timely Survey Barzilai Borwein Technique Transformer Network Transformer Based Network Transformer Inference

July 7, 2023

ITA: An Energy-Efficient Attention and Softmax Accelerator for Quantized Transformers
Gamze İslamoğlu, Moritz Scherer, Gianna Paulin, Tim Fischer, Victor J. B. Jung, Angelo Garofalo, Luca Benini
Transformer Model Softmax Function Transformer Network Hardware Acceleration Accelerator Architecture Quantized Transformer Transformer Accelerator

June 30, 2023

SpATr: MoCap 3D Human Action Recognition based on Spiral Auto-encoder and Transformer Network
Hamza Bouzid, Lahoucine Ballihi
Action Recognition Transformer Network Human Action Recognition Auto Encoder Marker Less Mocap Circular Convolution View Action Recognition

June 21, 2023

Probing the limit of hydrologic predictability with the Transformer network
Jiangtao Liu, Yuchen Bian, Chaopeng Shen
Recurrent Neural Network Long Short Term Memory Continuum Limit Transformer Network Vanilla Transformer

June 9, 2023

Reconstructing Human Expressiveness in Piano Performances with a Transformer Network
Jingjing Tang, Geraint Wiggins, Gyorgy Fazekas
Transformer Network Expressive Speech Piano Performance Expressive Performance

June 2, 2023

Backchannel Detection and Agreement Estimation from Video with Transformer Networks
Ahmed Amer, Chirag Bhuvaneshwara, Gowtham K. Addluri, Mohammed M. Shaik, Vedant Bonde, Philipp Müller
Source Video Transformer Network Multi Modal Transformer Agreement Metric Conversation Understanding Backchannel Prediction

May 31, 2023

XTransCT: Ultra-Fast Volumetric CT Reconstruction using Two Orthogonal X-Ray Projections for Image-guided Radiation Therapy via a Transformer Network
Chulong Zhang, Lin Liu, Jingjing Dai, Xuan Liu, Wenfeng He, Yinping Chan, Yaoqin Xie, Feng Chi, Xiaokun Liang
X Ray Transformer Network Computed Tomography Reconstruction Radiation Oncology 2 Dimensional X Ray X Ray Projection

May 30, 2023

Approximation and Estimation Ability of Transformers for Sequence-to-Sequence Functions with Infinite Dimensional Input
Shokichi Takakura, Taiji Suzuki
Transformer Megatron Decepticons Feature Extraction Average Approximation Transformer Network Estimation Performance Output Space

May 25, 2023

Neural Machine Translation for Mathematical Formulae
Felix Petersen, Moritz Schubotz, Andre Greiner-Petter, Bela Gipp
Neural Machine Translation Transformer Network Mathematical Formula

May 24, 2023

P-vectors: A Parallel-Coupled TDNN/Transformer Network for Speaker Verification
Xiyuan Wang, Fangyuan Wang, Bo Xu, Liang Xu, Jing Xiao
Speaker Verification Transformer Network X Vector Time Delay Neural Network

May 22, 2023

Exploring Energy-based Language Models with Different Architectures and Training Methods for Speech Recognition
Hong Liu, Zhaobiao Lv, Zhijian Ou, Wenbo Zhao, Qing Xiao
Language Model Speech Recognition LSTM Network Transformer Network Training Method

May 18, 2023

Temporal Aware Mixed Attention-based Convolution and Transformer Network (MACTN) for EEG Emotion Recognition
Xiaopeng Si, Dong Huang, Yulin Sun, Dong Ming
Emotion Recognition Channel Attention Transformer Network Brain Computer Interface Competition

May 2, 2023

BrainNPT: Pre-training of Transformer networks for brain network classification
Jinlong Hu, Yangmin Huang, Nan Wang, Shoubin Dong
Pre Trained Model Brain Network Transformer Network Brain Network Analysis Unlabeled Graph

April 28, 2023

ResiDual: Transformer with Dual Residual Connections
Shufang Xie, Huishuai Zhang, Junliang Guo, Xu Tan, Jiang Bian, Hany Hassan Awadalla, Arul Menezes, Tao Qin, Rui Yan
Transformer Based Transformer Network Layer Normalization Deep Transformer Residual Connection Residual Stream Residual Transformer

April 20, 2023

DropDim: A Regularization Method for Transformer Networks
Hao Zhang, Dan Qu, Keji Shao, Xukui Yang
Structured Dropout Transformer Network Label Smoothing Dropout Method

Transformer Network

Papers

TransCC: Transformer Network for Coronary Artery CCTA Segmentation

Out-of-Distribution Detection by Leveraging Between-Layer Transformation Smoothness

Deformation-Invariant Neural Network and Its Applications in Distorted Image Restoration and Analysis

CINFormer: Transformer network with multi-stage CNN feature injection for surface defect segmentation

Automatic Bat Call Classification using Transformer Networks

A Survey of Techniques for Optimizing Transformer Inference

ITA: An Energy-Efficient Attention and Softmax Accelerator for Quantized Transformers

SpATr: MoCap 3D Human Action Recognition based on Spiral Auto-encoder and Transformer Network

Probing the limit of hydrologic predictability with the Transformer network

Reconstructing Human Expressiveness in Piano Performances with a Transformer Network

Backchannel Detection and Agreement Estimation from Video with Transformer Networks

XTransCT: Ultra-Fast Volumetric CT Reconstruction using Two Orthogonal X-Ray Projections for Image-guided Radiation Therapy via a Transformer Network

Approximation and Estimation Ability of Transformers for Sequence-to-Sequence Functions with Infinite Dimensional Input

Neural Machine Translation for Mathematical Formulae

P-vectors: A Parallel-Coupled TDNN/Transformer Network for Speaker Verification

Exploring Energy-based Language Models with Different Architectures and Training Methods for Speech Recognition

Temporal Aware Mixed Attention-based Convolution and Transformer Network (MACTN) for EEG Emotion Recognition

BrainNPT: Pre-training of Transformer networks for brain network classification

ResiDual: Transformer with Dual Residual Connections

DropDim: A Regularization Method for Transformer Networks