Positional Encoding

Positional encoding methods aim to incorporate information about the order and relative positions of elements within data sequences into neural network architectures, particularly transformers, which are inherently order-agnostic. Current research focuses on developing more effective positional encodings for various data types, including sequences, graphs, and even higher-dimensional structures like cell complexes, often tailoring encoding schemes to specific tasks (e.g., arithmetic, visual grounding, or time series forecasting) and model architectures (e.g., graph transformers, diffusion models). These advancements are crucial for improving the performance and generalization capabilities of deep learning models across numerous applications, ranging from natural language processing and computer vision to scientific simulations and process monitoring.

72papers

Papers

May 22, 2025

Circle-RoPE: Cone-like Decoupled Rotary Positional Embedding for Large Vision-Language Models
Chengcheng Wang, Jianyuan Guo, Hongguang Li, Yuchuan Tian, Ying Nie, Chang Xu, Kai Han
Huawei Noah’s Ark Lab●City University of Hong Kong●University of Sydney●Peking University
Shadow Cone Large Vision Language Model Positional Encoding Rotary Position Vision Language Model

May 21, 2025

Set-LLM: A Permutation-Invariant LLM
Beni Egressy, Jan Stühmer
Heidelberg Institute for Theoretical Studies●Karlsruhe Institute of Technology
Large Language Model Positional Encoding Permutation Invariance State of the Art LLM

May 19, 2025

May 17, 2025

Understanding the Capabilities of Molecular Graph Neural Networks in Materials Science Through Multimodal Learning and Physical Context Encoding
Can Polat, Hasan Kurban, Erchin Serpedin, Mustafa Kurban
Texas A&M University●Hamad Bin Khalifa University●Ankara University
Positional Encoding Chemical Data Molecular Graph Neural Network Capability Evolution Material SCIence Multimodal Learning Molecular Graph

May 16, 2025

NoPE: The Counting Power of Transformers with No Positional Encodings
Chris Köcher, Alexander Kozachinskiy, Anthony Widjaja Lin, Marco Sälzer, Georg Zetzsche
MPI-SWS●Centro Nacional de Inteligencia Artificial●RPTU Kaiserslautern-Landau
Yes Yes Transformer Megatron Decepticons Circuit Complexity Based Counting Positional Encoding

May 14, 2025

A 2D Semantic-Aware Position Encoding for Vision Transformers
Xi Chen, Shiyang Zhou, Muqi Huang, Jiaxu Feng, Yun Xiong, Kun Zhou, Biao Yang, Yuhui Zhang, Huishuai Bao, Sijia Peng, Chuan Li, Feng Shi
Fudan University●Alibaba Group
Vision Transformer Position Encoding Semantic Relation Positional Encoding

April 29, 2025

Learning Laplacian Positional Encodings for Heterophilous Graphs
Michael Ito, Jiong Zhu, Dexiong Chen, Danai Koutra, Jenna Wiens
University of Michigan●Max Planck Institute of Biochemistry
Graph Laplacian Positional Encoding Heterophilic Graph Graph Distance Graph Transformer

April 11, 2025

SWAN-GPT: An Efficient and Scalable Approach for Long-Context Language Modeling
Krishna C. Puvvada, Faisal Ladhak, Santiago Akle Serrano, Cheng-Ping Hsieh, Shantanu Acharya, Somshubra Majumdar, Fei Jia, Samuel Kriman+3
NVIDIA
Positional Encoding Long Context Scalable Approach Decoder Only Model Input Context Language Model Encoder Only Transformer

April 3, 2025

Spline-based Transformers
Prashanth Chandran, Agon Serifi, Markus Gross, Moritz Bächer
DisneyResearch|Studios●Disney Research●ETH Zurich
Transformer Model Positional Encoding Spline Based

March 24, 2025

Boosting Resolution Generalization of Diffusion Transformers with Randomized Positional Encodings
Cong Liu, Liang Hou, Mingwu Zheng, Xin Tao, Pengfei Wan, Di Zhang, Kun Gai
Kuaishou Technology●Southeast University
Arbitrary Resolution Diffusion Transformer Training Resolution High Resolution Image Generation Positional Encoding

March 13, 2025

Target-aware Bidirectional Fusion Transformer for Aerial Object Tracking
Xinglong Sun, Haijiang Sun, Shan Jiang, Jiacheng Wang, Jiasong Wang
Chinese Academy of Science
Aerial Tracking Fusion Transformer Unmanned Aerial Vehicle Tracking Multi Stage Fusion Positional Encoding

March 6, 2025

March 3, 2025

Rotary Outliers and Rotary Offset Features in Large Language Models
André Jonasson
Annokvick
Positional Encoding Offset Building Model Rotary Position Transformer Based Large Language Model Attention Pattern

February 19, 2025

Herglotz-NET: Implicit Neural Representation of Spherical~Data with Harmonic Positional Encoding
Théo Hanon, Nicolas Mil-Homens Cavaco, John Kiely, Laurent Jacques
ULouvain●Yale University
Spherical Data Positional Encoding Implicit Neural Representation Spherical Harmonic Domain Parametric Representation

February 14, 2025

F-StrIPE: Fast Structure-Informed Positional Encoding for Symbolic Music Generation
Manvi Agarwal (IP Paris, LTCI, IDS), Changhong Wang (LTCI), Gael Richard (S2A, IDS)
Symbolic Music Melody Harmonization Generative Model Faithful Generation Positional Encoding

February 13, 2025

AttentionSmithy: A Modular Framework for Rapid Transformer Development and Customization
Caleb Cranney, Jesse G. Meyer
Modular Framework Prompt Customization Transformer Architecture Transformer Variant Attention Head Positional Encoding Attention Module Neural Architecture Search

February 4, 2025

Learning the RoPEs: Better 2D and 3D Position Encodings with STRING
Connor Schenck, Isaac Reid, Mithun George Jacob, Alex Bewley, Joshua Ainslie, David Rendleman, Deepali Jain, Mohit Sharma, Avinava Dubey+13
String Problem Large Language Model Synthetic Fibre Rope Point Encoding Positional Encoding 2 Dimensional

February 3, 2025

Learning Efficient Positional Encodings with Graph Neural Networks
Charilaos I. Kanatsoulis, Evelyn Choi, Stephanie Jegelka, Jure Leskovec, Alejandro Ribeiro
Positional Encoding Graph Representation Graph Neural Network

Positional Encoding

Papers

Circle-RoPE: Cone-like Decoupled Rotary Positional Embedding for Large Vision-Language Models

Set-LLM: A Permutation-Invariant LLM

Graph Alignment for Benchmarking Graph Neural Networks and Learning Positional Encodings

Unpacking Positional Encoding in Transformers: A Spectral Analysis of Content-Position Coupling

Understanding the Capabilities of Molecular Graph Neural Networks in Materials Science Through Multimodal Learning and Physical Context Encoding

NoPE: The Counting Power of Transformers with No Positional Encodings

A 2D Semantic-Aware Position Encoding for Vision Transformers

Learning Laplacian Positional Encodings for Heterophilous Graphs

SWAN-GPT: An Efficient and Scalable Approach for Long-Context Language Modeling

Spline-based Transformers

Boosting Resolution Generalization of Diffusion Transformers with Randomized Positional Encodings

Target-aware Bidirectional Fusion Transformer for Aerial Object Tracking

Layer-Specific Scaling of Positional Encodings for Superior Long-Context Modeling

LEDiT: Your Length-Extrapolatable Diffusion Transformer without Positional Encoding

Rotary Outliers and Rotary Offset Features in Large Language Models

Herglotz-NET: Implicit Neural Representation of Spherical~Data with Harmonic Positional Encoding

F-StrIPE: Fast Structure-Informed Positional Encoding for Symbolic Music Generation

AttentionSmithy: A Modular Framework for Rapid Transformer Development and Customization

Learning the RoPEs: Better 2D and 3D Position Encodings with STRING

Learning Efficient Positional Encodings with Graph Neural Networks