Transformer Based Model

Transformer-based models are a class of neural networks achieving state-of-the-art results across diverse fields by leveraging self-attention mechanisms to capture long-range dependencies in sequential data. Current research focuses on addressing limitations such as quadratic computational complexity for long sequences, leading to the development of alternative architectures like Mamba and modifications such as LoRA for efficient adaptation and inference. These advancements are significantly impacting various applications, from speech recognition and natural language processing to computer vision and time-series forecasting, by improving both accuracy and efficiency on resource-constrained devices.

352papers

Papers - Page 10

April 2, 2024

April 1, 2024

AISPACE at SemEval-2024 task 8: A Class-balanced Soft-voting System for Detecting Multi-generator Machine-generated Text
Renhua Gu, Xiangfeng Meng
Voting Method Knowledge Space Machine Generated Multi Layer Generator SemEval 2022 Task Transformer Based Model Text Classification

March 30, 2024

Jetsons at FinNLP 2024: Towards Understanding the ESG Impact of a News Article using Transformer-based Models
Parag Pravin Dakle, Alolika Gon, Sihan Zha, Liang Wang, SaiKrishna Rallabandi, Preethi Raghavan
Transformer Based Model Jetson Device XLM RoBERTa News Article

March 27, 2024

RankMamba: Benchmarking Mamba's Document Ranking Performance in the Era of Transformers
Zhichao Xu
Document Ranking Transformer Based Model Mamba in Mamba Transformer Megatron Decepticons New Era Query Attention Transformer Architecture

March 22, 2024

MasonTigers at SemEval-2024 Task 8: Performance Analysis of Transformer-based Models on Machine-Generated Text Detection
Sadiya Sayara Chowdhury Puspo, Md Nishat Raihan, Dhiman Goswami, Al Nahian Bin Emran, Amrita Ganguly, Ozlem Uzuner
Transformer Based Model Text Classification Text Detection Performance Analysis SemEval 2022 Task Discriminative Model Machine Generated Text

March 18, 2024

March 17, 2024

Is Mamba Effective for Time Series Forecasting?
Zihan Wang, Fanheng Kong, Shi Feng, Ming Wang, Xiaocui Yang, Han Zhao, Daling Wang, Yifei Zhang
Selective State Space Model Mamba Based Mamba in Mamba Time Series Forecasting Mamba Layer Transformer Based Model

March 15, 2024

Uni-SMART: Universal Science Multimodal Analysis and Research Transformer
Hengxing Cai, Xiaochen Cai, Shuwen Yang, Jiankun Wang, Lin Yao, Zhifeng Gao, Junhan Chang, Sihang Li, Mingjun Xu, Changxin Wang+7
Depth Analysis Transformer Based Model Multimodal Analysis Scientific Literature

March 14, 2024

Circuit Transformer: A Transformer That Preserves Logical Equivalence
Xihan Li, Xing Li, Lei Chen, Xing Zhang, Mingxuan Yuan, Jun Wang
Large Scale Circuit Deep Transformer Logic Synthesis Transformer Based Model Circuit Model Transformer Based Circuit Design

March 11, 2024

QuantTune: Optimizing Model Quantization with Adaptive Outlier-Driven Fine Tuning
Jiun-Man Chen, Yu-Hsuan Chao, Yu-Jie Wang, Ming-Der Shieh, Chih-Chung Hsu, Wei-Fen Lin
Transformer Based Model Quantization Error Fine Tuning Robust Fine Tuning Model Quantization Multiplier Free Quantization Adaptive Importance

March 10, 2024

March 8, 2024

March 4, 2024

Topic Aware Probing: From Sentence Length Prediction to Idiom Identification how reliant are Neural Language Models on Topic?
Vasudevan Nedumpozhimana, John D. Kelleher
Topic Analysis Transformer Based Language Model Length Extrapolation Neural Language Model Semantic Task Transformer Based Model

February 26, 2024

Beyond Self-learned Attention: Mitigating Attention Bias in Transformer-based Models Using Attention Guidance
Jiri Gesi, Iftekhar Ahmed
Transformer Based Model Code Representation Self Attention Attention Bias

February 15, 2024

Jack of All Trades, Master of Some, a Multi-Purpose Transformer Agent
Quentin Gallouédec, Edward Beeching, Clément Romac, Emmanuel Dellandréa
Expert Knowledge Fit All Approach Post Trade Allocation Transformer Based Model Transformer Agent Reinforcement Learning

February 8, 2024

Sparse-VQ Transformer: An FFN-Free Framework with Vector Quantization for Enhanced Time Series Forecasting
Yanjun Zhao, Tian Zhou, Chao Chen, Liang Sun, Yi Qian, Rong Jin
Vector Quantization Sparse Vector Free Transformer Transformer Based Model Time Series Forecasting

Transformer Based Model

Papers - Page 10

SPMamba: State-space model is all you need in speech separation

ASTRA: An Action Spotting TRAnsformer for Soccer Videos

AISPACE at SemEval-2024 task 8: A Class-balanced Soft-voting System for Detecting Multi-generator Machine-generated Text

Jetsons at FinNLP 2024: Towards Understanding the ESG Impact of a News Article using Transformer-based Models

RankMamba: Benchmarking Mamba's Document Ranking Performance in the Era of Transformers

MasonTigers at SemEval-2024 Task 8: Performance Analysis of Transformer-based Models on Machine-Generated Text Detection

Emotion Detection with Transformers: A Comparative Study

Crystalformer: Infinitely Connected Attention for Periodic Structure Encoding

Is Mamba Effective for Time Series Forecasting?

Uni-SMART: Universal Science Multimodal Analysis and Research Transformer

Circuit Transformer: A Transformer That Preserves Logical Equivalence

QuantTune: Optimizing Model Quantization with Adaptive Outlier-Driven Fine Tuning

Can Large Language Models Automatically Score Proficiency of Written Essays?

FrameQuant: Flexible Low-Bit Quantization for Transformers

tsGT: Stochastic Time Series Modeling With Transformer

The Impact of Quantization on the Robustness of Transformer-based Text Classifiers

Topic Aware Probing: From Sentence Length Prediction to Idiom Identification how reliant are Neural Language Models on Topic?

Beyond Self-learned Attention: Mitigating Attention Bias in Transformer-based Models Using Attention Guidance

Jack of All Trades, Master of Some, a Multi-Purpose Transformer Agent

Sparse-VQ Transformer: An FFN-Free Framework with Vector Quantization for Enhanced Time Series Forecasting