Multi View Video

Multi-view video research focuses on analyzing and synthesizing information from multiple synchronized or unsynchronized video streams to achieve richer scene understanding and more robust applications than single-view approaches. Current research emphasizes developing novel deep learning architectures, including transformers and diffusion models, to address challenges like view fusion, 3D reconstruction from uncalibrated cameras, and generating realistic multi-view videos from various inputs (e.g., text, single-view videos, 3D models). This field is significant for advancing computer vision, particularly in areas like autonomous driving, human-computer interaction, and virtual/augmented reality, by enabling more accurate and comprehensive scene representation and analysis.

Papers

July 14, 2023

MMSD2.0: Towards a Reliable Multi-modal Sarcasm Detection System
Libo Qin, Shijue Huang, Qiguang Chen, Chenran Cai, Yudi Zhang, Bin Liang, Wanxiang Che, Ruifeng Xu
Sarcasm Detection Multi View Video

March 9, 2023

3D Video Loops from Asynchronous Input
Li Ma, Xiaoyu Li, Jing Liao, Pedro V. Sander
Multi View Video Asynchronous Execution

December 14, 2022

BKinD-3D: Self-Supervised 3D Keypoint Discovery from Multi-View Videos
Jennifer J. Sun, Lili Karashchuk, Amil Dravid, Serim Ryou, Sonia Fereidooni, John Tuthill, Aggelos Katsaggelos, Bingni W. Brunton, Georgia Gkioxari, Ann Kennedy, Yisong Yue, Pietro Perona
Skeleton Representation Multi View Video 3D Keypoints Supervised Keypoint

December 13, 2022

PV3D: A 3D Generative Model for Portrait Video Generation
Zhongcong Xu, Jianfeng Zhang, Jun Hao Liew, Wenqing Zhang, Song Bai, Jiashi Feng, Mike Zheng Shou
3D Generative Multi View Video Portrait Synthesis

November 9, 2022

MEVID: Multi-view Extended Videos with Identities for Video Person Re-Identification
Daniel Davila, Dawei Du, Bryon Lewis, Christopher Funk, Joseph Van Pelt, Roderick Collins, Kellie Corona, Matt Brown, Scott McCloskey, Anthony Hoogs, Brian Clipp
Multi Object Tracking Person Re Identification Identity Generation Multi View Video Video Based Person Re Identification

September 13, 2022

Multiple View Performers for Shape Completion
David Watkins, Peter Allen, Krzysztof Choromanski, Jacob Varley, Nicholas Waytowich
Shape Completion Multi View Video

May 7, 2022

GAN-Based Multi-View Video Coding with Spatio-Temporal EPI Reconstruction
Chengdong Lan, Hao Yan, Cheng Luo, Tiesong Zhao
Generative Adversarial Network Multi View Image to Image Multi View Video Joint Encoder Epipolar Plane Image

March 24, 2022

Weakly-Supervised Online Action Segmentation in Multi-View Instructional Videos
Reza Ghoddoosian, Isht Dwivedi, Nakul Agarwal, Chiho Choi, Behzad Dariush
Multi View Segmentation Result Action Segmentation Multi View Video Semi Supervised Temporal Action Segmentation

November 5, 2021

Joint Learning of Visual-Audio Saliency Prediction and Sound Source Localization on Multi-face Videos
Minglang Qiao, Yufan Liu, Mai Xu, Xin Deng, Bing Li, Weiming Hu, Ali Borji
Audio Visual Joint Learning Human Saliency Sound Source Localization Multi View Video Audio Visual Saliency