3D Perception

3D perception aims to create comprehensive, accurate, and robust representations of the three-dimensional world from sensor data, primarily for applications like autonomous driving and robotics. Current research emphasizes developing efficient and robust models, often employing deep learning architectures such as transformers and convolutional neural networks, to handle diverse data sources (cameras, LiDAR, radar) and challenging conditions (occlusion, adverse weather). These advancements are crucial for improving the safety and reliability of autonomous systems and enabling more sophisticated human-computer interaction in various domains.

Papers

February 8, 2024

A versatile robotic hand with 3D perception, force sensing for autonomous manipulation
Nikolaus Correll, Dylan Kriegman, Stephen Otto, James Watson
Manipulation Task Robotic Hand 3D Perception External Human Force Robotic Gripper Tactile Input Autonomous Manipulation Manipulation Pipeline

January 23, 2024

Self-supervised Learning of LiDAR 3D Point Clouds via 2D-3D Neural Calibration
Yifan Zhang, Siyu Ren, Junhui Hou, Jinjian Wu, Yixuan Yuan, Guangming Shi
Self Supervised Learning 3D Perception Lidar Semantic Segmentation Neural Network Calibration Learning Transformation

January 13, 2024

UniVision: A Unified Framework for Vision-Centric 3D Perception
Yu Hong, Qian Liu, Huayuan Cheng, Danjiao Ma, Hang Dai, Yu Wang, Guangzhi Cao, Yong Ding
Unified Framework 3D Perception Vision Centric

January 9, 2024

Uni3D-LLM: Unifying Point Cloud Perception, Generation and Editing with Large Language Models
Dingning Liu, Xiaoshui Huang, Yuenan Hou, Zhihui Wang, Zhenfei Yin, Yongshun Gong, Peng Gao, Wanli Ouyang
Point Cloud Faithful Generation Human Editing 3D Perception Perception Module Point Cloud Map

January 4, 2024

ODIN: A Single Model for 2D and 3D Segmentation
Ayush Jain, Pushkal Katara, Nikolaos Gkanatsios, Adam W. Harley, Gabriel Sarch, Kriti Aggarwal, Vishrav Chaudhary, Katerina Fragkiadaki
Instance Segmentation 2 Dimensional 3D Perception 3D Segmentation Single Model

December 23, 2023

Self-Supervised Depth Completion Guided by 3D Perception and Geometry Consistency
Yu Cai, Tianyu Shen, Shi-Sheng Huang, Hua Huang
3D Perception Depth Completion Geometric Consistency Depth Completion Model

December 19, 2023

M-BEV: Masked BEV Perception for Robust Autonomous Driving
Siran Chen, Yue Ma, Yu Qiao, Yali Wang
3D Perception Eye View Masked Reconstruction Robust Autonomous Driving

November 30, 2023

Reconstructing the normal and shape at specularities in endoscopy
Karim Makki, Adrien Bartoli
Object Shape 3D Perception Endoscopic Image

October 23, 2023

MSFormer: A Skeleton-multiview Fusion Method For Tooth Instance Segmentation
Yuan Li, Huan Liu, Yubo Tao, Xiangyang He, Haifeng Li, Xiaohu Guo, Hai Lin
3D Perception Tooth Segmentation Tooth Instance Segmentation Prototype Contrastive Learning

September 28, 2023

HTC-DC Net: Monocular Height Estimation from Single Remote Sensing Images
Sining Chen, Yilei Shi, Zhitong Xiong, Xiao Xiang Zhu
3D Perception Optical Imaging Height Estimation

September 26, 2023

DistillBEV: Boosting Multi-Camera 3D Object Detection with Cross-Modal Knowledge Distillation
Zeyu Wang, Dingwen Li, Chenxu Luo, Cihang Xie, Xiaodong Yang
3D Object Detection 3D Perception Cross Modal Knowledge Distillation Multi Camera 3D Object Detection Bev Space Lidar Network

September 25, 2023

Unsupervised 3D Perception with 2D Vision-Language Distillation for Autonomous Driving
Mahyar Najibi, Jingwei Ji, Yin Zhou, Charles R. Qi, Xinchen Yan, Scott Ettinger, Dragomir Anguelov
Autonomous Driving Knowledge Distillation 2 Dimensional 3D Perception 3D Label Unsupervised 3D

September 24, 2023

Towards Robust Robot 3D Perception in Urban Environments: The UT Campus Object Dataset
Arthur Zhang, Chaitanya Eranki, Christina Zhang, Ji-Hwan Park, Raymond Hong, Pranav Kalyani, Lochana Kalyanaraman, Arsh Gamare, Arnav Bagad, Maria Esteva, Joydeep Biswas
3D Object Detection Urban Environment 3D Perception Smart Campus

September 19, 2023

Sample-adaptive Augmentation for Point Cloud Recognition Against Real-world Corruptions
Jie Wang, Lihe Ding, Tingfa Xu, Shaocong Dong, Xinli Xu, Long Bai, Jianan Li
Point Cloud 3D Perception Input Point Cloud Common Corruption Point Cloud Recognition Dataset Augmentation Sampling Based Data Augmentation

August 21, 2023

August 7, 2023

Screen-based 3D Subjective Experiment Software
Songlin Fan, Wei Gao
3D Perception Subjective Quality

July 25, 2023

Mini-PointNetPlus: a local feature descriptor in deep learning model for 3d environment perception
Chuanyu Luo, Nuo Cheng, Sikun Ma, Jun Xiang, Xiaohan Li, Shengguang Lei, Pu Li
Point Cloud Deep Learning Model 3D Perception PointNet Model 3d Scene Perception

June 8, 2023

ExtPerFC: An Efficient 2D and 3D Perception Hardware-Software Framework for Mobile Cobot
Tuan Dang, Khang Nguyen, Manfred Huber
Robot Person 2 Dimensional Robotic System 3D Perception Co Design Baxter Robot

May 11, 2023

Foundations of Spatial Perception for Robotics: Hierarchical Representations and Real-time Systems
Nathan Hughes, Yun Chang, Siyi Hu, Rajat Talak, Rumaisa Abdulhai, Jared Strader, Luca Carlone
Robotics Domain Real Time 3D Perception Flawed Foundation Robot Perception Hierarchical Representation 3D Scene Graph Hierarchical Feature Spatial Cognition

3D Perception

Papers

A versatile robotic hand with 3D perception, force sensing for autonomous manipulation

Self-supervised Learning of LiDAR 3D Point Clouds via 2D-3D Neural Calibration

UniVision: A Unified Framework for Vision-Centric 3D Perception

Uni3D-LLM: Unifying Point Cloud Perception, Generation and Editing with Large Language Models

ODIN: A Single Model for 2D and 3D Segmentation

Self-Supervised Depth Completion Guided by 3D Perception and Geometry Consistency

M-BEV: Masked BEV Perception for Robust Autonomous Driving

Reconstructing the normal and shape at specularities in endoscopy

MSFormer: A Skeleton-multiview Fusion Method For Tooth Instance Segmentation

HTC-DC Net: Monocular Height Estimation from Single Remote Sensing Images

DistillBEV: Boosting Multi-Camera 3D Object Detection with Cross-Modal Knowledge Distillation

Unsupervised 3D Perception with 2D Vision-Language Distillation for Autonomous Driving

Towards Robust Robot 3D Perception in Urban Environments: The UT Campus Object Dataset

Sample-adaptive Augmentation for Point Cloud Recognition Against Real-world Corruptions

Multi-Modal Dataset Acquisition for Photometrically Challenging Object

UniM$^2$AE: Multi-modal Masked Autoencoders with Unified 3D Representation for 3D Perception in Autonomous Driving

Screen-based 3D Subjective Experiment Software

Mini-PointNetPlus: a local feature descriptor in deep learning model for 3d environment perception

ExtPerFC: An Efficient 2D and 3D Perception Hardware-Software Framework for Mobile Cobot

Foundations of Spatial Perception for Robotics: Hierarchical Representations and Real-time Systems