Scene Fusion

Scene fusion integrates information from multiple data sources (e.g., infrared and visible light images, point clouds, multiple camera views) to create a more complete and robust representation of a scene. Current research emphasizes developing efficient fusion architectures, such as modular networks and transformer-based approaches, that effectively combine data at both the scene and instance levels, improving accuracy in tasks like 3D object detection and human pose estimation. These advancements are crucial for applications in autonomous driving, robotics, and computer vision, enabling more reliable and accurate perception in complex and challenging environments.

Papers

March 22, 2024

IS-Fusion: Instance-Scene Collaborative Fusion for Multimodal 3D Object Detection
Junbo Yin, Jianbing Shen, Runnan Chen, Wei Li, Ruigang Yang, Pascal Frossard, Wenguan Wang
3D Object Detection Hybrid Fusion Bird'S Eye View Bird'S Eye View Fusion Scene Fusion

February 3, 2024

Decomposition-based and Interference Perception for Infrared and Visible Image Fusion in Complex Scenes
Xilai Li, Xiaosong Li, Haishu Tan
Richer RGB Infrared Feature Complex Scene Visible Image Fusion Fusion Weight Scene Fusion

November 17, 2023

High-fidelity Person-centric Subject-to-Image Synthesis
Yibin Wang, Weizhong Zhang, Jianwei Zheng, Cheng Jin
Diffusion Model Image Synthesis Person Image Generation Subject Driven Image Scene Fusion

October 30, 2023

RGB-X Object Detection via Scene-Specific Fusion Modules
Sri Aditya Deevi, Connor Lee, Lu Gan, Sushruth Nagesh, Gaurav Pandey, Soon-Jo Chung
Multimodal Fusion RGB D Fusion Scene Fusion

February 22, 2023

View Consistency Aware Holistic Triangulation for 3D Human Pose Estimation
Xiaoyue Wan, Zhuo Chen, Xu Zhao
3D Pose 3D Human Pose Estimation Image Coherence Scene Fusion

Scene Fusion

Papers

IS-Fusion: Instance-Scene Collaborative Fusion for Multimodal 3D Object Detection

Decomposition-based and Interference Perception for Infrared and Visible Image Fusion in Complex Scenes

High-fidelity Person-centric Subject-to-Image Synthesis

RGB-X Object Detection via Scene-Specific Fusion Modules

View Consistency Aware Holistic Triangulation for 3D Human Pose Estimation