Transformer Based Language Model

Transformer-based language models are deep learning architectures designed to process and generate human language, aiming to understand and replicate the nuances of natural language understanding and generation. Current research focuses on improving model interpretability, addressing contextualization errors, and exploring the internal mechanisms responsible for tasks like reasoning and factual recall, often using models like BERT and GPT variants. These advancements are significant for both the scientific community, furthering our understanding of neural networks and language processing, and for practical applications, enabling improvements in machine translation, question answering, and other NLP tasks.

Papers

October 6, 2022

A Logic for Expressing Log-Precision Transformers
William Merrill, Ashish Sabharwal
Transformer Based Language Model Logic Reasoning Precision Transformer Transformer Variant

September 26, 2022

Fast-FNet: Accelerating Transformer Encoder Models via Efficient Fourier Layers
Nurullah Sevim, Ege Ozan Özyedek, Furkan Şahinuç, Aykut Koç
Transformer Based Transformer Based Model Transformer Based Language Model Transformer Encoder Model Fourier Layer

September 3, 2022

TransPolymer: a Transformer-based language model for polymer property predictions
Changwen Xu, Yuyang Wang, Amir Barati Farimani
Transformer Based Language Model Polymer Property

August 24, 2022

Addressing Token Uniformity in Transformers via Singular Value Transformation
Hanqi Yan, Lin Gui, Wenjie Li, Yulan He
Transformer Megatron Decepticons Transformer Based Model Transformer Based Language Model Semantic Textual Similarity Singular Value Token Alignment

July 24, 2022

A Transformer-based Neural Language Model that Synthesizes Brain Activation Maps from Free-Form Text Queries
Gia H. Ngo, Minh Nguyen, Nancy F. Chen, Mert R. Sabuncu
Transformer Based Language Model Natural Language Query Neuroscience Research Activation Pattern Activation Map

July 11, 2022

Exploring Length Generalization in Large Language Models
Cem Anil, Yuhuai Wu, Anders Andreassen, Aitor Lewkowycz, Vedant Misra, Vinay Ramasesh, Ambrose Slone, Guy Gur-Ari, Ethan Dyer, Behnam Neyshabur
Generalization Performance Transformer Based Language Model Length Generalization

July 6, 2022

Gender Biases and Where to Find Them: Exploring Gender Bias in Pre-Trained Transformer-based Language Models Using Movement Pruning
Przemyslaw Joniak, Akiko Aizawa
Language Model Pre Trained Gender Bias Transformer Based Language Model Debiasing Method Transformer Based Pre Trained Language Weight Pruning

July 1, 2022

Is neural language acquisition similar to natural? A chronological probing study
Ekaterina Voloshina, Oleg Serikov, Tatiana Shavrina
Language Model Language Understanding Language Generation Transformer Based Model Transformer Based Language Model Linear Probing Human Language Acquisition

June 29, 2022

Knowledge Distillation of Transformer-based Language Models Revisited
Chengqiang Lu, Jianwei Zhang, Yunfei Chu, Zhengyu Chen, Jingren Zhou, Fei Wu, Haiqing Chen, Hongxia Yang
Knowledge Distillation Transformer Based Model Transformer Based Language Model Low Temperature Distillation Transformer Based Pre Trained Language

June 7, 2022

OCHADAI at SemEval-2022 Task 2: Adversarial Training for Multilingual Idiomaticity Detection
Lis Kanashiro Pereira, Ichiro Kobayashi
Adversarial Training SemEval 2022 Task Transformer Based Language Model Multilingual BERT Idiomaticity Detection

May 23, 2022

Outliers Dimensions that Disrupt Transformers Are Driven by Frequency
Giovanni Puccetti, Anna Rogers, Aleksandr Drozd, Felice Dell'Orletta
Transformer Based Language Model High Frequency Token Prediction Global Outlier Outlier Dimension

May 20, 2022

Forecasting COVID-19 Caseloads Using Unsupervised Embedding Clusters of Social Media Posts
Felix Drinkall, Stefan Zohren, Janet B. Pierrehumbert
Social Medium Covid 19 Unsupervised Setting Sentence Level Transformer Based Language Model Different Cluster Time Series Transformer Model Epidemiological Modelling

May 19, 2022

Great Power, Great Responsibility: Recommendations for Reducing Energy for Training Language Models
Joseph McDonald, Baolin Li, Nathan Frey, Devesh Tiwari, Vijay Gadepally, Siddharth Samsi
Language Model Transformer Based Language Model Movie Recommendation Natural Language Processing Model Energy Policy Research Computational Efficiency NLP Application Higher Order Responsibility

May 12, 2022

Predicting Human Psychometric Properties Using Computational Language Models
Antonio Laverghetta, Animesh Nighojkar, Jamshidbek Mirzakhalov, John Licato
Language Model Transformer Based Language Model Psychometric Property

April 29, 2022

April 26, 2022

LM-Debugger: An Interactive Tool for Inspection and Intervention in Transformer-Based Language Models
Mor Geva, Avi Caciularu, Guy Dar, Paul Roit, Shoval Sadde, Micah Shlain, Bar Tamir, Yoav Goldberg
Transformer Based Language Model Visual Inspection Code Debugging Token Representation Early Intervention

April 23, 2022

Grad-SAM: Explaining Transformers via Gradient Self-Attention Maps
Oren Barkan, Edan Hauon, Avi Caciularu, Ori Katz, Itzik Malkiel, Omri Armstrong, Noam Koenigstein
Transformer Megatron Decepticons Self Attention Transformer Based Language Model NLP Community Language Task

April 14, 2022

Does BERT really agree ? Fine-grained Analysis of Lexical Dependence on a Syntactic Task
Karim Lasri, Alessandro Lenci, Thierry Poibeau
Ticket BERT Transformer Based Language Model Syntactic Dependency Subject Verb Agreement Syntactic Generalization

April 12, 2022

What do Toothbrushes do in the Kitchen? How Transformers Think our World is Structured
Alexander Henlein, Alexander Mehler
Language Model Transformer Megatron Decepticons Transformer Based Model NLP Field World Event Transformer Based Language Model Context Modeling Kitchen Environment

Transformer Based Language Model

Papers

A Logic for Expressing Log-Precision Transformers

Fast-FNet: Accelerating Transformer Encoder Models via Efficient Fourier Layers

TransPolymer: a Transformer-based language model for polymer property predictions

Addressing Token Uniformity in Transformers via Singular Value Transformation

A Transformer-based Neural Language Model that Synthesizes Brain Activation Maps from Free-Form Text Queries

Exploring Length Generalization in Large Language Models

Gender Biases and Where to Find Them: Exploring Gender Bias in Pre-Trained Transformer-based Language Models Using Movement Pruning

Is neural language acquisition similar to natural? A chronological probing study

Knowledge Distillation of Transformer-based Language Models Revisited

OCHADAI at SemEval-2022 Task 2: Adversarial Training for Multilingual Idiomaticity Detection

Outliers Dimensions that Disrupt Transformers Are Driven by Frequency

Forecasting COVID-19 Caseloads Using Unsupervised Embedding Clusters of Social Media Posts

Great Power, Great Responsibility: Recommendations for Reducing Energy for Training Language Models

Predicting Human Psychometric Properties Using Computational Language Models

Developmental Negation Processing in Transformer Language Models

KERMIT -- A Transformer-Based Approach for Knowledge Graph Matching

LM-Debugger: An Interactive Tool for Inspection and Intervention in Transformer-Based Language Models

Grad-SAM: Explaining Transformers via Gradient Self-Attention Maps

Does BERT really agree ? Fine-grained Analysis of Lexical Dependence on a Syntactic Task

What do Toothbrushes do in the Kitchen? How Transformers Think our World is Structured