Point Cloud Transformer

Point cloud transformers leverage the power of transformer architectures to process unstructured 3D point cloud data, aiming to improve efficiency and accuracy in tasks like object detection, segmentation, and scene understanding. Current research focuses on optimizing transformer designs for point clouds, including developing more efficient attention mechanisms (e.g., sparse attention, linear attention), exploring hybrid models combining transformers with convolutional neural networks or voxel-based methods, and employing pre-training strategies to improve generalization. These advancements are significantly impacting various fields, enabling more robust and efficient 3D perception in applications such as autonomous driving, robotics, and virtual reality.

Papers

August 25, 2022

Pix4Point: Image Pretrained Standard Transformers for 3D Point Cloud Understanding
Guocheng Qian, Abdullah Hamdi, Xingdi Zhang, Bernard Ghanem
Vision Transformer Point Cloud Classification Point Cloud Understanding Point Cloud Transformer Patch Embeddings Standard Transformer

May 19, 2022

VNT-Net: Rotational Invariant Vector Neuron Transformers
Hedi Zisling, Andrei Sharf
Rotation Invariant Virtual Network Point Cloud Transformer Point Cloud Representation Learning Roto Translation Invariant

November 29, 2021

Point-BERT: Pre-training 3D Point Cloud Transformers with Masked Point Modeling
Xumin Yu, Lulu Tang, Yongming Rao, Tiejun Huang, Jie Zhou, Jiwen Lu
Masked Modeling Point Cloud Transformer

November 21, 2021

CpT: Convolutional Point Transformer for 3D Point Cloud Processing
Chaitanya Kaul, Joshua Mitton, Hang Dai, Roderick Murray-Smith
Point Cloud Data Point Transformer Point Cloud Processing Point Cloud Transformer

Point Cloud Transformer

Papers

Pix4Point: Image Pretrained Standard Transformers for 3D Point Cloud Understanding

VNT-Net: Rotational Invariant Vector Neuron Transformers

Point-BERT: Pre-training 3D Point Cloud Transformers with Masked Point Modeling

CpT: Convolutional Point Transformer for 3D Point Cloud Processing